For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il quarantasettesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Pur vivendo attualmente in un mondo alle prese con intelligenze artificiali "ingombranti" come Chat-GPT, sono ancora convinto che le persone siano il fattore più importante. E dal momento che la proposta ti è piaciuta, comincia, oggi, una nuova rubrica “Qualcuno di noi” che, almeno una volta al mese, ti racconterà un data-expert attraverso quattro veloci domande: spero ti piaccia! Se hai suggerimenti su questa nuova sezione ti prego di mandarmeli!
Ecco i cinque spunti del quarantasettesimo numero:
👀 Data Science. 🧑 One of Us - Cristiano De Nobili - Datascience for Social Good
Presentati:
Sono una persona curiosa che, con una laurea in Fisica Teorica e un PhD alla SISSA di Trieste, si occupa da sei anni di Deep Learning e più in generale di Intelligenza Artificiale. Ho lavorato a diversi progetti internazionali nell’ambito del riconoscimento vocale e del NLP come quello sulla versione italiana dell’assistente vocale Samsung Bixby. Attualmente sono Lead AI Scientist in Pi School, uno spin-off di Pi Campus, dove lavoro su progetti di Data Science sia in ambito educativo che in ambito ambientale. Sono anche docente a contratto di Deep Learning al Master in High-performance Computing della SISSA e del International Centre for Theoretical Physics, oltre che presso l’Università Bicocca. Recentemente sono stato ospite dello Svalbard Integrated Arctic Earth Observing System Centre, come docente per le applicazioni dell’intelligenza artificiale in ambito Earth Observation. La mia missione è riassunta in “Turning bits into dreams”, che è anche il titolo della mia Newsletter. Al di fuori dell’ambito Data Science, sono un viaggiatore e un pilota civile.
Il mio ruolo tra 10 anni sarà ... (continua la frase come fossi GPT-10)
In ambito “tech for climate”. Essendo appassionato sia di scienza di base, che di tecnologia e soprattutto della natura, mi piacerebbe fondare una mia azienda che possa usare l’intelligenza artificiale o anche le nuove tecnologie quantistiche per risolvere problemi ambientali. Più in generale credo molto nel ruolo chiave che può avere la tecnologia per affrontare problemi rilevanti, come le disuguaglianze sociali o la questione climatica.
Quale è la sfida più importante che il mondo dei dati e algoritmi ha di fronte a sé oggi?
La più grande sfida è probabilmente quella di essere credibili. Mi spiego meglio. Il veloce sviluppo tecnologico degli ultimi anni in ambito AI, ha fatto sì che venissero trascurati aspetti etici o per esempio venissero sottovalutati alcuni bias che gli algoritmi portavano con sé. Questo, unito al fatto che spesso le tecnologie emergenti sono state utilizzate in settori delicati, ha fatto sì che nell’opinione comune maturasse scetticismo o addirittura paura nei confronti di esse. Quindi spero che nei prossimi anni, dimostrando magari un uso saggio e calibrato degli algoritmi, questi possano tornare a essere considerati più alleati che nemici.
Segnalaci il progetto o la risorsa nel mondo dei dati di cui non potresti fare a meno …
Twitter, LinkedIn e le newsletter. Questi strumenti mi permettono di restare aggiornato sui trend, rimanere in contatto con diverse persone, stringere relazioni e soprattutto mi mantengono costantemente ispirato. Sul lato tecnico invece, se immagino questa domanda tra un anno, credo potrei rispondere Github Copilot e Github Codespaces.
Cristiano De Nobili - Lead AI Scientist
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. The Devil is in the Detail
In realtà il titolo dell’articolo, o meglio di una serie di articoli, che vi consiglio è: “i pixel fanno l'immagine: una visita guidata al mondo attraverso una vista di dettaglio”. Lo spirito di tutta la serie di post che ti propongo è proprio quella di evidenziare, attraverso dati socioeconomici a livello globale, come una loro lettura troppo aggregata, per esempio a livello di continente o anche di nazione, faccia perdere di vista le dinamiche a livello regionale o in generale micro-territoriale. La data visualization utilizzata nelle analisi, realizzata molto bene, fa largo uso di effetti dinamici che rendono molto chiare le spiegazioni dei fenomeni stessi. Ho trovato veramente efficace la rappresentazione del concetto di “tirannia della media” attraverso l’evidenza delle micro regioni mondiali a più alta crescita dal 2000 al 2019 così come attraverso la distribuzione del reddito in fasce di valore nelle diverse aree mondiali. Se poi ti appassioni ci sono gli altri 5 capitoli, altrettanto belli, della serie. Il tutto è stato realizzato da McKinsey Global Institute, non nuovo a usare i dati in maniera così efficace. Mi fa un po’ sorridere, permettetemi un filo di ironia, che le stesse società di consulenza, non solo McKinsey, quando sono all’opera all’interno delle organizzazioni cadano in quella stessa miope tirannia della media presentando, per semplificare la vita ai C-level, viste molto aggregate che tolgono troppo dettaglio alla vista di un fenomeno o dell’evoluzione di un mercato. Mi auguro che chi lavora in azienda e anche le stesse società di consulenza adottino, sempre di più, un approccio più granulare perché il diavolo, la conoscenza e gli errori si annidano sempre nei dettagli (dei dati) 🙂
👃Investimenti in ambito dati e algoritmi. Synthetic Data for a Real Fraud 🙂
Potremmo veramente dire che i dati sintetici possono creare grande valore anche al di fuori della datascience … Questa è la sintesi, usando molto sarcasmo, della frode di cui è stata vittima JPMorgan, dopo aver valutato e pagato 175 milioni di dollari per una fintech americana Frank, che operava nel ricco settore dei prestiti agli studenti negli Stati Uniti. Ma non vado oltre a raccontarti il tutto perché lo ha fatto molto bene Alberto Danese in questo post in cui descrive la vicenda con molti approfondimenti e “parallelismi” con altri casi, anche recenti, di frodi aventi come scopo gonfiare “esponenzialmente” il valore di una start-up.
Fare valutazioni aziendali e in particolare due-diligence non è facile: lo ho fatto diverse volte e si è spesso in equilibrio precario tra diverse “forze”: mantenere trust con i founders, fare tutto in tempi ristretti perché il timing è fondamentale in queste operazioni e non commettere errori grossolani. E soprattutto per non fare quest’ultimo errore un po’ di conoscenza e uso di statistica di base serve … forse un po’ prima di vedere un click-rate dello 0,026%. 🙂
🖐️Tecnologia (data engineering). Distilled Programming through the Zen of Proverbs
“Qualsiasi stupido può scrivere codice che un computer può capire. I bravi programmatori scrivono codice comprensibile agli esseri umani”. Questa citazione di Martin Fowler è una delle mie preferite tra quelle che hanno a che vedere con il mondo della programmazione.
Il contributo che ti propongo oggi, realizzato da un esperto programmatore come Lane Wagner, ha proprio a che vedere con la filosofia (della programmazione) che sta dietro a molti linguaggi di programmazione moderni, spesso esplicitata da chi ha contribuito a creare il linguaggio stesso. Lane fa una sintesi delle più importanti (filosofie) e le riassume in 20 regole empiriche per scrivere un software migliore. Da ex (mediocre)-programmatore e attualmente programmatore del week-end ho particolarmente apprezzato. Ti consiglio però di andare alla fonte e guardare anche i testi originali citati, tra i quali anche la frase di Martin Fowler. Il mio cuore, come forse sai batte forte per Python, e quindi se devi scegliere ti consiglio di andare allo Zen of Python o digitare “import this” nell’interprete Python e meditare 🙂.
👅Etica & regolamentazione & impatto sulla società. Talking AI with AI … in practice!
Ci sono tre motivi per cui ti consiglio di ascoltare questi 47 minuti di podcast in cui Reid Hoffman, fondatore di Linkedin e attualmente nel board di Open AI, parla di intelligenza artificiale con ChatGPT con un approccio più filosofico che tecnico.
Il primo motivo è per renderti conto sul campo del livello attuale di ChatGPT in una discussione reale e non banale. E ti assicuro, l’ho verificato riproponendo le stesse domande a ChatGPT, che il dialogo è tutto vero e puoi trovare, e verificare tu stesso se non ti fidi, la trascrizione del podcast qui. ChatGPT non ti risponderà con le stesse parole (del resto non è un sistema deterministico) pur ponendo le stesse domande ma il senso e il filo del discorso è quello che puoi ascoltare dal dialogo con Reid Hoffman.
Il secondo motivo è che ci sono considerazioni sulla obsolescenza del test di Turing che vanno tenute presente quanto più, da un lato le neuroscienze ci svelano i segreti del funzionamento della mente umana e dall’altra costruiamo oggetti che simulano il comportamento umano in diversi modi, siano essi robots o chatbot. Il test di Turing, che attraverso una serie di dialoghi con una persona umana, mira a definire se una macchina può essere definita intelligente, come un uomo, ha delle forti limitazioni che sono sviscerate bene da Hoffman e ChatGPT attraverso diversi esempi e anche attraverso approfondimenti filosofici che arrivano fino a una dissertazione sulla famosa frase di Wittgenstein "Se un leone potesse parlare, non potremmo capirlo".
Il terzo motivo per cui ti consiglio di ascoltarlo è che Hoffman evidenza esplicitamente attraverso diverse domande i punti critici di ChatGPT tra i quali lo spiacevole fatto che a volte inventa citazioni e riferimenti verosimili ma non reali. Il podcast evidenzia anche i punti di forza quali la capacità di sintesi di documenti, articoli e libri in maniera decisamente migliore rispetto a quanto finora esistente e anche (e questo mi ha stupito non poco) la capacità di scrivere anche brevi poesie.
In fondo credo sia un atteggiamento sterile avere paura di questi sistemi e di quello che porteranno, in positivo e in negativo, all'interno della società senza cercare di capirli fin da subito usandoli in prima persona, il tutto con un atteggiamento critico ma costruttivo!
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!