Ciao,
sono Stefano Gatti e questo è il trentanovesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del trentanovesimo numero:
👃Investimenti in ambito dati e algoritmi. Unruly: investing in the crazy (to save the world), before it becomes normal. An Italian heart with an international gaze
Questa settimana è doveroso segnalarti un’iniziativa, anzi una sfida, molto importante che nasce in Italia da un venture capitalist italiano, Stefano Bernardi. La sfida ha una prospettiva internazionale e un obiettivo “planetario”: aiutare a salvare il mondo dalla minaccia attualmente più pericolosa: il cambiamento climatico. Il fondo si chiama Unruly e ha l’obiettivo di raccogliere 25 milioni di dollari (ne ha già raccolti 18) e di investire in 60 seed o pre-seed di 60 start-up.
Te lo segnalo per tre motivazioni principali:
Il manifesto di Unruly, che ti invito a leggere, contiene una visione del mondo e una filosofia di vita a cui credo molto. Compresa l’ode all’imprenditorialità che mi ricorda tanto l’idea di Taleb di istituire la Giornata Nazionale dell’Imprenditore, scritto nel suo capolavoro “Antifragile”.
I primi investimenti, che in maniera molto trasparente puoi vedere, sono stati fatti in aziende che fanno largo uso sia di dati che di strumenti di intelligenza artificiale. Dati e intelligenza artificiale che dovremmo utilizzare di più, rispetto a quello che stiamo facendo, per la lotta al cambiamento climatico.
Stefano Bernardi e gli altri principali investitori che ruotano intorno all’iniziativa hanno un’ottima esperienza nel settore e una storia statisticamente positiva. Uno di questi, Andrea Dusi è una persona che conosco e stimo molto!
Buona avventura Unruly: il tuo successo può essere d'aiuto a tutti noi e anche al nostro pianeta!
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. DAMA framework & DAMA Italy annual convention
DAMA International è un'associazione internazionale, senza scopo di lucro e indipendente da qualunque vendor, di professionisti dedicati a promuovere i concetti e le pratiche di gestione delle informazioni e dei dati. Le attività dell’associazione di estrinsecano in tre gruppi principali:
La definizione di standard sul mondo del data management con la pubblicazione del principale testo di riferimento che è il DMBOK, la guida al corpo di conoscenza del data management, giunta alla seconda edizione. Il DMBOK è un tomo di oltre 600 pagine che contiene suggerimenti e buone pratiche in 11 aree: dalla data governance alla data architecture passando attraverso la data security, per indicarne alcune. E’ un testo che ti consiglio leggere, magari a piccole dosi perché va “meditato”, soprattutto nella parte dei KPI suggeriti, per estrarne il giusto valore. Una sintesi “estrema” la puoi trovare qui se ti vuoi fare un’idea veloce degli argomenti trattati.
Attività di formazione su tutte le aree del data management.
Attività di certificazione delle figure professionali che ruotano attorno al data management stesso.
In molti momenti della mia vita lavorativa ho usato il DMBOK sia come check-list evoluta per essere sicuro di aver affrontato tutte le aree del data management sia per fare assessment più approfonditi a supporto della data strategy. Dama International ha una struttura che si decentralizza in capitoli nazionali e molto importante è il lavoro che il chapter italiano (Dama Italy) sta facendo sul territorio per divulgare le migliori metodologie del data management. Da qualche anno, come socio, partecipo alle attività dell’associazione cercando di non mancare alla convention di fine anno. Anche quest’anno ho avuto il piacere di partecipare e l’onore di essere premiato (come si vede in maniera palese dalla foto 🙂) per l’opera di divulgazione fatta con il libro “La Cultura del dato”. Ricevere il premio dalle mani di Douglas B. Laney (l’autore di Infonomics che ti suggerisco di leggere) ha reso il tutto decisamente più piacevole!
🖐️Tecnologia (data engineering). The data of our life.
Questa settimana, nella sezione dedicata alla tecnologia, ti consiglio un approfondimento solo apparentemente provocatorio, per un data-expert, vista l’importanza che dati e algoritmi hanno in un campo che sta rivoluzionando la medicina e la comprensione della nostra salute: la genetica. Introduction to Genomics for Engineers infatti è la guida che avrei voluto avere nelle mani qualche anno fa quando mi arrivò il file (formato TSV, tab separated) con il sequenziamento di una parte del mio DNA. La guida parte da zero con le nozioni fondamentali biologiche di DNA, RNA e mRNA per passare invece al dettaglio di quali sono i formati e la semantica dei dati che sono sequenziati da quasi tutte le aziende che fanno questo servizio in giro per il mondo. Mi sembra pura magia quando apro il file del mio DNA (si chiaramente parliamo di circa l’1% delle informazioni contenute effettivamente nel DNA ma sono i dati più importanti noti ad oggi) dove in circa 632000 righe e quattro colonne, 16 Mbyte, è descritto una parte del mio corpo e un pezzo, in senso probabilistico, di mio futuro. Quattro colonne, visto che siamo una community di data-lover, che rappresentano:
La chiave primaria (rsid) del singolo nucleotide: l’unità più piccola, perdonate la semplificazione, che ha una consistenza informativa.
Il genotipo del nucleotide, formato da due delle quattro le lettere della vita: A come Adenina, G come Guanina,T come Tiamina, e C come Citosina.
Il numero di cromosoma in cui è presente il nucleotide
Un numero che indica la posizione del nucleotide
Questo è il file di dati grezzi che si ottiene con meno di 100 dollari da 23 & Me, una delle aziende leader nel settore. Ma anche i file, risultato del sequenziamento del dna di altre aziende, sono molto simili. Sia che tu voglia lavorare nel settore (e le opportunità non mancano) sia che, come il sottoscritto, voglia provare di persona a capire qualcosa in questo ambito, il link che ti ho consigliato è buon punto di partenza. Se poi vuoi addentrarti, una volta che hai i dati del tuo dna, nel capire lo stato dell’arte delle ricerche ed avere informazioni utili e anche tanta formazione ti suggerisco il sito americano, indipendente, Genetic LifeHacks. Lo seguo da qualche anno e mi ha aiutato a capire molte cose in questo ambito complesso e anche qualcosa in più di me stesso …
👀 Data Science. Inside the Algorithm: a book and a way of thinking
Questa settimana non ti propongo nulla di tecnico nella sezione datascience della nostra newsletter ma non per questo credo sia meno importante soprattutto se sei un datascientist. Anzi. Ho letto l’ultimo libro, appena uscito, di Donata Columbro: “Dentro l’algoritmo”. Donata, di cui ti consiglio di seguire anche la newsletter, è una data-expert, e anche un’ottima divulgatrice degli argomenti che più ci appassionano. Ti fornisco cinque motivi per cui dovresti leggere “Dentro l’algoritmo”:
Fornisce una prospettiva differente sull’influenza e sull’importanza degli algoritmi nella nostra vita quotidiana. E per farlo ci ricorda, cito dal libro, che “non preoccuparsi dell’algoritmo, oltre quello che succede nelle tue bacheche è un privilegio […] se sei bianco, uomo, eterosessuale, con corpo conforme, è molto probabile che l’algoritmo governerà il mondo a tuo favore”.
Ripercorre la storia della parola algoritmo ma anche della sua semantica che, magari conosciamo, ma non con la precisione con cui viene affrontata nel libro.
Non fornisce una visione neo-luddista degli algoritmi che ho trovato, per esempio, in altri libri del genere. Ne fa una disamina equilibrata, concreta e costruttiva.
La ricchezza e la qualità delle fonti è veramente impressionante. Ti sfido a leggere le 138 pagine del libro e non trovare almeno 5 fonti che non conoscevi (anche se fai parte della nostra fantastica community de “LaCultura del dato”). Personalmente automating.nyc mi era ignoto ed è un progetto fantastico!
“Siamo tuttə algoritmistə”: tranquilli non è un typo. E’ il nome di un paragrafo del libro, uno dei miei preferiti, ma è anche una scelta linguistica che Donata usa e che è parte della filosofia del libro e non solo …
Il lavoro di Donata è ancora più importante vista l’evoluzione e la pervasività dei sistemi di intelligenza artificiale come puoi renderti conto personalmente chattando in inglese qualche minuto con ChatGPT!
👅Etica & regolamentazione & impatto sulla società. Planning or thinking to leave Twitter? have a look to your Twitter data with Observable
Se ti è passato per la testa in queste ultime settimana di bizzarra gestione Musk di lasciare Twitter o anche vuoi avere una copia della tua storia sulla piattaforma ti consiglio di fare due cose che uniscono l’utile al dilettevole. Scarica tutti i tuoi dati su Twitter, facendo una richiesta a questa pagina. Aspetta qualche ora (al massimo 24 ore) e avrai a disposizione un file zippato con tutti i tuoi dati diviso in differenti files. Già dopo averlo de-zippato avrai a disposizione aprendo il file “Your Archive.html” una buona versione navigabile sul tuo PC dei dati. Brava Twitter a dare, a differenza di altri social, un'interfaccia leggibile! Ma ti consiglio qualcosa in più. Prova ad andare su questo notebook (attento non è il solito notebook Jupyter) e seguire le dettagliate istruzioni presenti. Alla fine dovrai comunque solo caricare tre file, tutti presenti nello zip di cui ti parlavo prima, e avrai diverse visualizzazioni molto belle ed efficaci di tutta la tua storia su Twitter. Il tutto senza condividere i tuoi dati sul web perché i file sono conservati in locale sul tuo browser. Observable è infatti una comunità, ad oggi formata da più di 5 milioni di data-expert, che utilizzano notebook che alternano, come per Jupyter, codice e testo, ma che usano come linguaggio di programmazione una versione specifica di Javascript. Insieme a Javascript puoi usare anche tutte le sue librerie come D3, il cui creatore, Michael Bostock è proprio uno dei fondatori di Observable. La bellezza e la facilità di visualizzazione dei dati, più che la capacità di elaborarli e trasformarli, sono i punti di forza della piattaforma come puoi verificare di persone esplorando la galleria dei notebook pubblici.
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!
Suuuper utile e interessante la newsletter questa settimana Stefano! Grazie mille!