For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il centoseiesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del centoseiesimo numero:
👅Etica & regolamentazione & impatto sulla società. Isaia Invernizzi: La sfida dei dati inclusivi che raccontano le storie di tutti
Presentati.
Isaia Invernizzi, sono un giornalista. Ho iniziato a lavorare molto presto seguendo il classico cursus honorum giornalistico in alcuni giornali locali della provincia dove sono cresciuto e dove abito: Bergamo. Mi sono reso conto abbastanza presto che i dati potevano essermi d’aiuto nel lavoro quotidiano per verificare notizie, per contestualizzarle meglio e soprattutto per scoprirne di nuove. La caccia ai dati è da sempre una parte molto avvincente del lavoro, diventata una necessità durante la pandemia: per un anno intero ho dedicato quasi tutto il mio tempo a cercare dati e raccontare notizie, storie e persone nascoste dietro a quei dati. Dal 2020 lavoro in un giornale nazionale, il Post, dove tra le altre cose coordino un piccolo gruppo di giornalisti e giornaliste che si occupa di approfondimenti e reportage.
Il mio ruolo tra 10 anni sarà ... (continua la frase come fossi GPT-10).
Non mi immagino fuori dalla redazione di un giornale, anche se tutto può succedere. Mi piace lavorare con colleghi e colleghe più giovani, trasmettere un po’ della mia esperienza, evitare che facciano i miei errori. Da tempo al Post abbiamo diversi programmi per la formazione che coinvolgono sia studenti, sia persone più esperte: credo che mi concentrerò sempre di più sulla formazione, anche perché nelle redazioni dei giornali italiani i data journalist si contano sulle dita di due mani.
Quale è la sfida più importante che il mondo dei dati e algoritmi ha di fronte a sé oggi?
Si dice spesso che i dati sono ovunque, che sono intorno a noi, e che noi stessi siamo dati, eppure questi dati che potrebbero raccontare meglio le persone e il mondo che le circonda sono spesso inaccessibili. La sfida più importante è continuare a raccoglierli, organizzarli e soprattutto renderli disponibili a chiunque. Credo molto nell’open data come strumento di conoscenza, come mezzo per favorire un dibattito meglio informato. In questo senso la seconda sfida riguarda i dati stessi: spero che siano sempre più rappresentativi delle differenze e delle minoranze.
Segnalaci il progetto o la risorsa nel mondo dei dati di cui non potresti fare a meno.
Negli ultimi anni l’associazione Ondata ha liberato una quantità incredibile di dati essenziali. Dati delle elezioni, dati sui vaccini, dati sulla scuola, sull’ambiente, perfino i dati degli alberi monumentali italiani. È stato un lavoro utile ai giornalisti, ai ricercatori, in generale alle persone. Il loro esempio mi ha spronato a diffondere i dati trovati nelle mie ricerche e a condividere esperienze e metodo di lavoro.
PSS (Post Scriptum di Stefano): ho conosciuto il lavoro di Isaia la prima volta, purtroppo, nella primavera del 2020 grazie a questo articolo quando mostrò, usando dati a cui nessuno aveva ancora pensato, tutta la gravità dell’epidemia Covid che stavamo vivendo nell’Italia del nord. Poi ho seguito con molto piacere il suo trasferimento a “Il Post”, di cui sono fedele lettore e abbonato dalle sue origini. E’ la prima volta che “intervisto” un giornalista e farlo con un data-lover nonché data journalist come Isaia mi fa ancora più piacere!
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Creatività e decisioni strategiche: Il vero potere dell'AI generativa nelle aziende
Si pensa troppo spesso, specialmente all’interno delle aziende, che l'AI generativa sia solo un mezzo per rendere più efficienti i processi, puntando soprattutto sulla riduzione dei costi. E, senza dubbio, questo è un aspetto importante. Tuttavia, con una tale enfasi rischiamo di trascurare e continueremo a trascurare le vere potenzialità che l'AI generativa offre per accrescere la nostra creatività e perfezionare le decisioni strategiche a tutti i livelli aziendali. Per provare a convincerti, se hai ancora dei dubbi, ti suggerisco vivamente di leggere questo articolo della Harvard Business Review. L'articolo descrive un esperimento che confronta una strategia di business (l'apertura di una panetteria specializzata nella produzione dei bagel americani a Parigi) elaborata da un team di studenti MBA in modo tradizionale, con una sviluppata attraverso l'ausilio di un assistente virtuale AI. Questo strumento interattivo integra un toolkit di strategia collaudato come plugin nell'AI generativa alla base di Chat GPT. I risultati dei due approcci sono stati sorprendentemente simili, ma la strategia assistita dall'AI si è distinta per la sua originalità. La differenza principale? Gli studenti hanno impiegato una settimana, mentre l'AI solo 60 minuti.
Mi sarebbe piaciuto avere accesso ai risultati concreti, ma, purtroppo, non è possibile ☹️. Non dobbiamo comunque pensare alla sostituzione degli esseri umani, in quanto definitori di strategie e decisioni, ma piuttosto puntare sulla cooperazione tra umani e agenti intelligenti. È evidente che l'esperimento citato non riflette una situazione di complessità reale e organizzativa comparabile a quella che affrontiamo quotidianamente nelle nostre organizzazioni, e anche il contesto di un MBA non corrisponde precisamente alla realtà aziendale normale.
Credo, però, che la collaborazione tra umani e intelligenza artificiale possa essere estremamente efficace, in particolare in contesti dove la creatività, la strategia e la capacità decisionale sono fondamentali. Questo vale anche per la creazione di contenuti, come questa newsletter, dove l'uso che ne faccio, come ho illustrato nel numero 100, è molto più inclinato a supportare la creatività che non la mera efficienza operativa.
👀 Data Science. Medicina 3.0: Come i dati rivoluzionano la salute preventiva
Uno degli ambiti più entusiasmanti, dove la crescita esponenziale dei dati a nostra disposizione e i miglioramenti sia qualitativi che quantitativi nel loro processamento stanno facendo la differenza (e continueranno a farlo nel futuro), è senza dubbio quello della medicina, in particolare quella preventiva. È un campo che mi appassiona particolarmente perché abbiamo l'opportunità di sperimentarlo direttamente, grazie agli strumenti come smartwatch, anelli e altri dispositivi indossabili "intelligenti", che ci offrono sempre più informazioni in tempo reale sul nostro stato di salute.
Oggi, se sei appassionato di scienza dei dati applicata ai parametri fisiologici, ti consiglio vivamente di dare un'occhiata a questo interessante articolo sul blog di Peter Attia. Questo pezzo descrive come i dati raccolti dalla DEXA, se analizzati insieme ad altri dati e su lunghi periodi, possono fornire indicazioni preziose sullo stile di vita da adottare per mantenersi in salute più a lungo. “La DEXA utilizza raggi X a bassa dose per misurare come due diversi tipi di energia attraversano il corpo, fornendo una stima di come la massa totale del corpo sia divisa tra tre componenti: tessuto magro (muscoli e organi), massa grassa e contenuto minerale osseo. In questo modo, la DEXA va ben oltre la semplicità del BMI, offrendo metriche accurate o calcoli di densità minerale ossea, percentuale e distribuzione di grasso corporeo, massa magra totale … La ricerca segna un notevole passo avanti nell'integrazione dell'AI nella sanità. Il loro studio dimostra elegantemente la superiorità dei modelli longitudinali (protratti nel tempo n.d.r) rispetto a quelli che si basano su dati trasversali. Inoltre, sottolinea le preziose intuizioni ottenute dall'uso di immagini mediche grezze, rispetto ai dati estratti dalle immagini. Il miglioramento dei modelli predittivi per la mortalità per tutte le cause offre una comprensione più precisa e completa del percorso di salute di un paziente, consentendo ai clinici di adottare strategie di intervento più proattive.” Questo è un estratto dell’articolo che Peter Attia commenta per evidenziare l’importanza della convergenza di dati, algoritmi e strumenti intelligenti per il progresso verso quella medicina 3.0 raccontata benissimo da Peter nel suo super consigliato ultimo libro.
Anche se non sei un medico ma sei interessato a capire quanto i dati, gli algoritmi e i wearable sono importanti già oggi per la nostra prevenzione primaria (e lo saranno ancora di più in futuro) non perderti questa lunga ma interessante discussione di un grandissimo medico e professionista italiano Nicola Triglione con un suo collega circa il tema del russamento e delle apnee notturne.
Se poi sei interessato a scoprire come l'ultima generazione di intelligenza artificiale stia apportando significative innovazioni in tutto il settore sanitario, non perderti l'articolo di Ben Lorica, che fornisce una mappa molto dettagliata di questo fenomeno.
👃Investimenti in ambito dati e algoritmi. Seed, AI e Deep Tech: la “mappa del tesoro degli investitori visionari
Non è la prima volta che menziono articoli di Ryan Shannon in questa newsletter. Ryan è un investitore e talent scout di start-up in uno dei più interessanti venture capital americani specializzati in intelligenza artificiale, Radical Ventures. Oggi voglio suggerirti questo post di Ryan che, attraverso dieci grafici, riassume i fenomeni più rilevanti nel settore degli investimenti in start-up osservati nell'ultimo anno, collocandoli in una prospettiva storica degli ultimi dieci anni. Se sei già esperto nel settore, rappresenta una eccellente revisione visuale dei trend attuali; se invece sei alla ricerca di una migliore comprensione di questo ambito, la descrizione di ogni grafico costituisce un punto di partenza cruciale per approfondimenti successivi. In sintesi, si nota un ritorno ai volumi e alle valutazioni pre-covid dopo le anomalie del 2020-21, con una rinnovata attenzione verso valutazioni basate sui fondamentali. Le tre principali discontinuità rilevate sono: l'alto livello dei finanziamenti di tipo seed, l'importanza crescente dei Corporate VC e il grande trend degli investimenti in intelligenza artificiale.
Se sei già a conoscenza di questi fenomeni e desideri esplorare argomenti più complessi, ti consiglio questo approfondito report sul settore Deep Tech in Europa. Il Deep Tech rappresenta quel segmento di start-up caratterizzato da un elevato rischio tecnologico, la necessità di ingenti capitali e tempi di sviluppo più lunghi. Diversamente dalle start-up tradizionali, le imprese Deep Tech godono di una maggiore protezione dalla concorrenza grazie alle loro tecnologie all'avanguardia, al portfolio di proprietà intellettuale e a team di esperti altamente specializzati. Questo documento è estremamente formativo e merita una lettura approfondita. Dettaglia cinque degli otto settori tipici del Deep Tech: Novel AI (guida autonoma, tecnologie per la privacy, ecc.), Future of Compute, Space Tech, Novel Energy (tecnologie basate sull'idrogeno, fusione, ecc.) e Computational Biology & Chemistry. La descrizione dettagliata di tutto il ciclo di vita di questi investimenti, dallo sviluppo delle idee nelle università fino alle exit, rende il contenuto estremamente pratico e unico!
🖐️Tecnologia (data engineering). Percorsi e Segreti per Formarsi come Data Engineer: Guide, Risorse e le Librerie più Cool
È un momento fantastico per essere o diventare un software engineer, e ancor più, (ma forse questa è una visione di parte 🙂), per diventare un data engineer. Era già stimolante qualche anno fa, ma ora è entusiasmante! La generative AI e, più in generale, l'intelligenza artificiale stanno accelerando il percorso formativo di queste figure professionali. Allo stesso tempo, aprono sempre più le porte alla possibilità di dedicarsi a compiti che spaziano dalla progettazione alle architetture, non limitandosi alla mera scrittura di codice.
Per darti qualche esempio concreto e stimolare ulteriormente il tuo percorso di crescita, ecco alcuni approfondimenti e consigli che potresti trovare particolarmente utili:
- Ecco 6 notebook gratuiti per iniziare a costruire applicazioni che sfruttano i Large Language Models (LLM). I consigli provengono da Youssef Hosni, un machine learning engineer che ho già avuto occasione di menzionare in altre newsletter e che vale la pena seguire.
- Qui trovi "The Data Engineer Handbook": questo repository su GitHub raccoglie tutte le risorse necessarie per diventare un eccellente data engineer. Ci sono anche molti progetti interessanti dai quali imparare.
- E per finire un classico: il post di un blog di una società di consulenza che, ogni anno dal 2015, mette in luce le 10 migliori librerie dell’ecosistema Python. La fanno da padrone quelle legate alla generative AI, ma c'è anche spazio per altro.
Per finire sono stato ospite qualche settimana fa di
dove ho raccontato quello che ho imparato finora sulla leadership e sull’arte di prendere decisioni (non sempre sbagliate 🙂).
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!