For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il settantatreesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del settantatreesimo numero:
👀 Data Science. Exploring the Data Frontier: An Interview with Carlo Torniai, Group Chief Data & Analytics Office
Presentati:
Carlo Torniai. “Atipico" è la parola che sceglierei per descrivermi. Sono un ingegnere che ha navigato attraverso un vasto spettro di esperienze, dal mondo accademico all'industria. Nel campo della ricerca, ho dato il mio contributo in ambiti come Computer Science e Biomedicina; in ambito industriale, ho maturato esperienze in vari settori: Pharma (Menarini), Tech (Tesla), Automotive (Pirelli), Grande Distribuzione (Esselunga). Oggi, ricopro il ruolo di Group Chief Data & Analytics Officer presso Angelini Industries. Mi muovo tra Dati e Intelligenza Artificiale, esplorando il loro impatto sul business, l'organizzazione e la cultura. Ma forse la mia bio su Twitter – a conferma dell’aggettivo dell’incipit -è la presentazione più efficace: “Avid learner, data geek, squash player, indie rock fan, pizza lover. Passionate about music, games, AI, and everything tech.”
Il mio ruolo tra 10 anni sarà ... (continua la frase come fossi GPT-10)
…difficile dirlo ma vorrei fosse in ambito innovazione/educazione. Sento la responsabilità di “give back” rispetto a tutto quello che ho ricevuto e alle tante esperienze fatte e credo che l’ambito educativo / innovativo (magari collaborando con qualche acceleratore / startup / ed-tech interessante o, perché no, anche con VC funds) sia il contesto migliore per impattare le nuove generazioni, ma soprattutto per lasciarsi provocare e mettere in discussione da loro, cosa che sento necessaria come l’aria. In Angelini Industries, da questo punto di vista, le possibilità sono davvero molteplici.
Quale è la sfida più importante che il mondo dei dati e algoritmi ha di fronte a sé oggi?
Credo che la sfida principale riguardi le importanti problematiche sollevate dai recenti sviluppi nell'AI. In particolare su due fronti. Da un lato, in un mondo dove diventa sempre più arduo distinguere il vero dal verosimile, dovremo ridefinire i percorsi educativi a tutti i livelli, puntando sul pensiero critico e sulla comprensione delle potenzialità e delle fallacie dei nuovi strumenti. Dall'altro, sarà necessario affrontare lo shift inevitabile nel contenuto proprio del lavoro che l'AI sta già introducendo.
Segnalaci il progetto o la risorsa nel mondo dei dati di cui non potresti fare a meno … Rispondo in maniera 'contestuale': in questo momento trovo assai impegnativo stare al passo con l'incessante flusso di novità e annunci nell'ambito dell'AI. Un utile riferimento è il substack di Michael Spencer, AI Supremacy. Sto anche usando la GenerativeAI per tenere il passo con l’AI stessa, utilizzandola per raccogliere, riassumere e trasformare in audio vari substacks e newsletter di mio interesse. Infatti, trovo più semplice ascoltare e, se necessario, approfondire, rispetto a leggere molteplici contenuti. Un 'riassunto dei riassunti' sotto forma di pillole giornaliere su AI & Tech lo trovate qui: www.owith.ai .
🖐️Tecnologia (data engineering). Andrej Karpathy's Vision: Unpacking the Complexity of Large Language Models
Uno degli interventi più interessanti che ho ascoltato di recente sulla tecnologia dei Large Language Models e del loro utilizzo è stato quello di Andrej Karpathy al Microsoft Build, la conferenza annuale organizzata da Microsoft, rivolta a ingegneri del software e sviluppatori Web. Andrej Karpathy è una delle figure più importanti degli ultimi 15 anni nella storia dell’intelligenza artificiale. Ha ricoperto il ruolo di direttore dell’AI di Tesla per 5 anni e più recentemente è tornato in OpenAI, organizzazione che aveva contribuito a fondare nel 2015. Prima di questo, ha avuto ruoli significativi nelle università americane, in primis Stanford, con studi importanti sulle reti neurali convoluzionali. Tornando al video, che ti consiglio di guardare integralmente nei suoi 43 minuti, Andrej illustra in termini tecnici ma in maniera semplice la pipeline di addestramento degli assistenti GPT come ChatGPT, dalla tokenizzazione al pre-addestramento, al fine-tuning supervisionato e al Reinforcement Learning from Human Feedback (RLHF). Il suo intervento offre anche spazio per tecniche pratiche per un uso efficace di questi modelli, in particolare sulle strategie di prompting. Nella parte finale, c'è un approfondimento che ho trovato entusiasmante, su come l'evoluzione di alcune metodologie come Tree of Thoughts (ToT) stia cercando di riprodurre il nostro Sistema 2 di pensare (lento e razionale, per citare Daniel Kahneman) nell’evoluzione degli assistenti AI. Da non perdere! E se ti sei perso qualche info guardando il video qui puoi trovare il deck di slide originale usato da Andrej.
Se sei in vacanza e riesci a trovare spazio per altre letture più profonde e complesse, ti consiglio, come integrazione all'intervento di Karpathy, questa sintesi sulle architetture emergenti per le applicazioni LLM, realizzata dal fondo a16z, frequentemente citato in questa newsletter. L'articolo si basa su conversazioni con fondatori e ingegneri di startup di intelligenza artificiale, tra cui, guarda caso, lo stesso Andrej Karpathy.
👃Investimenti in ambito dati e algoritmi. Exploring AI-Startups.org: An Unconventional Directory for AI Start-ups
La segnalazione di questa settimana, in questa area della newsletter, riguarda un sito molto particolare, https://www.ai-startups.org/. Questo sito ha la usabilità e il layout stile web directory alla Yahoo, molto comuni nel web 1.0 prima dell’avvento dei motori di ricerca come Google o meglio di Google stessa 🙂. Infatti, presenta una organizzazione gerarchica per tipo di applicazione, tecnologia e nazione, elencando in ordine di importanza le start-up che operano nel settore dell'intelligenza artificiale e che hanno ricevuto finanziamenti in tutto il mondo. Dato che l'aggiornamento del sito si basa su una logica di crowdsourcing e non esiste una chiara politica di moderazione, ti consiglio di prendere con cautela i dati delle start-up. Tuttavia, confrontando questi dati con quelli di Crunchbase e Dealroom, anche se con una granularità minore, sembrano accurati.
Il sito risulta particolarmente utile quando si desidera avere un'idea generale delle principali realtà operative in ciascuno dei trenta verticali presenti. Se riesci a ottenere informazioni più precise sul sito e sulla sua organizzazione, evitando le “allucinazioni” che mi hanno regalato alcuni LLMs e la non informazione presente nei motori di ricerca, te ne sarei molto grato.
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Casting Light on AI: Simplifying Machine Learning and ChatGPT with Parand Tony Darugar
Ci sono momenti nella vita di un'organizzazione, o anche quando sei identificato come Esperto, in cui a te, come data-expert, viene chiesto di spiegare in maniera semplice i meccanismi di funzionamento del Machine Learning e, ultimamente, sempre più spesso, degli LLMs o, per essere più precisi, di ChatGPT. Non è facile evitare di cadere nel semplicismo o in spiegazioni eccessivamente tecniche. Di recente, ho scoperto un blog realizzato da Parand Tony Darugar, un data architect americano, che può essere molto utile in queste situazioni. Ho trovato particolarmente adatti per questi contesti i suoi tre post "A Completely Non-Technical Explanation of AI and Deep Learning", "A Non-Technical Explanation of ChatGPT" e "A Non-Technical Explanation of ChatGPT: Deep Learning". Sono molto divertenti da leggere, sia che tu li usi a scopi didattici, sia che tu voglia comprendere in modo diverso alcuni dei passaggi che hanno recentemente trasformato il mondo dell'intelligenza artificiale.
Ho sempre nutrito grande stima per coloro che, pur avendo una profonda conoscenza tecnica, riescono a tradurre questi concetti in maniera semplice, ma non eccessivamente semplificata. Come (forse) disse Leonardo da Vinci, "La semplicità è la suprema sofisticazione". Per questo motivo, vale la pena leggere e seguire Parand Tony Darugar, anche quando scrive in maniera più complessa. 🙂
👅Etica & regolamentazione & impatto sulla società. Exploring Urban Accessibility and Social Impact: The Innovative CTwalk Map Project from the Netherlands
Quando si utilizzano dati e algoritmi per influire su un'organizzazione, sia essa un'azienda o un'intera nazione, è fondamentale considerare che realizzarlo al meglio è una condizione necessaria, ma non sufficiente, per influire sul processo decisionale dell'organizzazione stessa. Per questo motivo, è essenziale che il progetto sia anche comunicato in modo impeccabile e il più semplice possibile nelle sue varie forme, dalla visualizzazione dei dati alla formazione degli utenti. Questa è la lezione che si può trarre dal progetto olandese che ti suggerisco di approfondire in questa sezione della newsletter. Il CTwalk Map è uno strumento web interattivo sviluppato da Vasileios Milias nell'ambito della sua ricerca di dottorato presso l'Urban Analytics Lab del gruppo Knowledge and Intelligence Design della Delft University of Technology. Questo strumento utilizza dati dettagliati sulla popolazione, localizzazione e reti pedonali per evidenziare l'accessibilità pedonale e il potenziale di coesione sociale nei quartieri cittadini. Fornisce una comprensione dettagliata di come l'ambiente pedonale sia influenzato dalla rete stradale e identifica eventuali disparità di accesso locale. Si avvale di dati open, provenienti dall'Ufficio Demografico Olandese e da OpenStreetMap, e l'approccio algoritmico è basato su un metodo a grafi. Vista la complessità dell’argomento, l’utilizzo del tool necessita di un breve approfondimento del layer di visualizzazione, ma ti assicuro che bastano 5 minuti per navigarlo con profitto. La mia conoscenza e esperienza dell’urbanistica e della vivibilità olandese mi portano a pensare che strumenti come questo vengano utilizzati anche a livello politico dai decision-maker per guidare investimenti che possano migliorare la vita dei cittadini, promuovendo la mobilità sostenibile, l’integrazione sociale e, in generale, l’accessibilità dei servizi. Il progetto è stato implementato in cinque tra le principali città olandesi, ma si spera che tali approcci possano essere estesi su larga scala, almeno in tutta l'Unione Europea. 🙂
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!