For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il cinquantaseiesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Prima di cominciare un piccolo spazio per annunciarti una nuova tappa del progetto che sto portando avanti con Alberto Danese. Questa settimana è stata pubblicata la versione inglese e aggiornata del nostro libro, scritto un anno fa.
La nuova edizione si differenza dal libro in italiano per diversi aspetti:
Aggiornamenti di contenuti, visto che è passato un anno! Specialmente alcune domande sul futuro (nel capitolo 5) hanno avuto grandi evoluzioni di scenario.
Nuove interviste a data-executive di rilievo internazionale.
Lo speciale contributo di Abraham Thomas , eclettico fondatore di Quandl, una startup tecnologica di grande successo, focalizzata sui dati. Dopo aver venduto Quandl al Nasdaq, Abraham è diventato un investitore di successo.
Una conclusione rinnovata, che riflette l'accelerazione che il nostro mondo ha subito negli ultimi mesi.
Se sei interessato, puoi acquistare il libro in formato e-book o cartaceo su Amazon e farci sapere il tuo parere.
Ecco i cinque spunti del cinquantaseiesimo numero:
👃Investimenti in ambito dati e algoritmi. Not Every Entrepreneur Is for All Seasons: Why OpenAI's Success May Stem from Elon Musk's (Perhaps) Poor Decision
Ti suggerisco vivamente questo articolo di Semafor se sei curioso di conoscere un episodio del passato di OpenAi che potrebbe aver influenzato il nostro presente. Semafor è un eccellente esperimento di giornalismo d’oltreoceano che ti avevo già suggerito di seguire, insieme al Il Post, ma questa è un’altra storia :-). L’articolo descrive il momento in cui Elon Musk lasciò OpenAI nel 2018, in disaccordo con la linea seguita dalla maggior parte degli altri fondatori, guidati dall’attuale CEO Sam Altman.
Non c’è dubbio che Musk ha avuto sicuramente una grande importanza nell’evoluzione industriale di molti progetti rivoluzionari, come le auto elettriche, ma ha commesso numerosi errori, soprattutto di recente. Probabilmente la decisione del 2018 è stata uno di questi e personalmente, preferisco Sam Altman piuttosto che Musk a capo di un progetto ad alto impatto come ChatGpt. Se poi hai tempo a disposizione, ti consiglio di ascoltare il passaggio di Sam Altman al Lex Fridman Podcast, a sostegno della mia affermazione precedente: oltre due ore di contenuti decisamente rilevanti!
E se per caso vuoi vedere quanto si sta allargando l’impatto della generative AI sui nuovi business dai una occhiata a questa immagine che mostra i finanziamenti superiori a 5 milioni di dollari, ricevuti da aziende che ne fanno uso!
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. How to Land Your Dream AI Job or Recruit Top Data Experts
“... il segreto per ottenere il lavoro dei sogni nel campo dell'AI non è solo quello di riempire il vostro curriculum di competenze degne di nota. Il segreto sta anche nel modo in cui vi presentate. La vostra candidatura deve essere un riflesso onesto delle vostre esperienze. Non esagerate nel descrivere voi stessi, ma non trattenetevi nemmeno quando si tratta di enfatizzare tutte le cose interessanti che avete fatto … Soprattutto, sappiate che probabilmente fallirete almeno un paio di volte. Ma se vi impegnate a capire i motivi dei vostri insuccessi, nulla si frapporrà tra voi e il lavoro dei vostri sogni.” Queste sono le conclusioni dell’articolo che ti consiglio se stai cercando lavoro nell’AI o se ti occupi di selezione in questo ambito. Conclusioni che si possono applicare anche ad altre tipologie di lavori, sia chiaro, ma leggendolo avrai dettagli e approfondimenti molto specifici adatti al nostro settore. Del resto l’articolo è la sintesi di un webinar in cui DeepLearning.Ai ha portato attorno al tavolo quattro tra le persone più esperte a livello mondiale in questo ambito: sia technical senior recruiter di aziende come Uber, Google e Microsoft sia imprenditori che stanno innovando, proprio con l’AI, nell’ambito della selezione dei tale. Due aspetti dell'articolo mi sono sembrati particolarmente preziosi. Da un lato, vi è una chiara definizione dei ruoli più ricercati attualmente e una visione sui ruoli che saranno più richiesti nel prossimo futuro. Dall'altro, troviamo cinque consigli fondamentali per redigere un curriculum efficace, elemento cruciale - talvolta in senso negativo - nella fase iniziale di selezione. Personalizzare la candidatura prestando attenzione ai dettagli, fornire testimonianze verificabili dell'impatto del proprio lavoro passato e presente, e dare spazio ai progetti personali appaiono essere le chiavi del successo. Posso dire di condividere pienamente queste considerazioni, avendole vissute da entrambe le parti. 🙂
🖐️Tecnologia (data engineering). LangChain: Serving as a bridge connecting Language Models and SQL, too.
“LangChain è un framework per sviluppare applicazioni basate su modelli linguistici. Riteniamo che le applicazioni più potenti e differenziate non si limiteranno a richiamare un modello linguistico tramite un'API, ma applicheranno i seguenti principi:
Data-aware: collegare un modello linguistico ad altre fonti di dati esterne
Agentic: consentire a un modello linguistico di interagire con il suo ambiente
Il framework LangChain è stato progettato tenendo presente i due principi sopra elencati.”
Questa è la descrizione sintetica che fa di se stesso uno dei framework più interessanti operanti per facilitare la costruzione di applicazioni che utilizzano intensamente Large Language Models. In realtà, quello che ti suggerisco di leggere è il primo post del loro blog, in cui esplorano una delle frontiere più affascinanti delle interazioni tra LLMs e utenti, particolarmente rilevante per la nostra comunità di esperti di dati. Ti sto parlando di come interrogare una base dati in linguaggio naturale generando, tramite AI generativa, l’SQL e quindi il risultato. Il post illustra lo stato dell'arte nella gestione dell'interazione tra i database e i modelli generativi come ChatGPT, analizzando tutte le sfide e le strategie per superarle. Ciò che mi ha sorpreso, seppur fino a un certo punto, è che i passaggi cruciali necessari per rendere efficace l'interazione corrispondono esattamente a quelli che un data analyst compie per acquisire conoscenza di un nuovo contesto dati.
👀 Data Science. Exploring Algorithms & Artificial Intelligence: Stephen Wolfram's Insightful Article and Book
È davvero arduo riassumere in poche parole quello che rappresenta, per me e per alcuni lettori di questa newsletter che me lo hanno segnalato, l'articolo che descrive in modo eccellente il funzionamento dei modelli di intelligenze generative linguistiche attuali, utilizzando ChatGPT come esempio. L'autore, Stephen Wolfram, li confronta con gli approcci computazionali, facendo riferimento a Wolfram Alpha per spiegare le differenze tra i due metodi. Wolfram è una figura estremamente eclettica; ti invito a consultare la sua voce su Wikipedia in inglese per scoprire tutto ciò che ha realizzato e sta ancora portando avanti.
Di recente, l'articolo è stato trasformato in un libro disponibile su Amazon, con contenuti identici all'originale. La lettura richiede diverse ore, in base al tuo background sull'argomento e a quanto vuoi approfondire alcuni argomenti. Ti consiglio di non saltare la parte finale, in quanto è qui che Wolfram brilla di più, delineando scenari di integrazione tra i due approcci sia dal punto di vista filosofico che pratico, con esempi molto pertinenti.
Da notare che, solo pochi giorni fa, è stato annunciato il plugin di Wolfram Alpha per ChatGPT. Gli articoli di Stephen supportano tale evento, dimostrando la sua rilevanza pratica per gli utenti di entrambi i sistemi. A un recente evento alla Luiss, ho discusso di questi concetti insieme al mio amico e professore di algoritmi, Paolo Ferragina. Durante il suo intervento, Paolo ha sottolineato l'importanza di comprendere in profondità la differenza tra un approccio deterministico e basato sul simbolismo computazionale (e sui modelli), che lui definisce algoritmico, e un approccio più incentrato sui dati, tipico del moderno machine learning e delle reti neurali come ChatGPT.
👅Etica & regolamentazione & impatto sulla società. Italy is stuck in a European brain drain
Immigrazione netta di giovani, variazione del numero di laureati, numero di laureati in età lavorativa e variazione della popolazione in età lavorativa sono i quattro indicatori su cui si basa uno studio molto interessante della Direzione Generale delle Politiche regionali dell’UE da cui ne usciamo, come paese Italia, con le ossa rotte. Non siamo ancora sufficientemente consapevoli, anche a livello locale, della gravità di questi numeri e del loro peso sulla sostenibilità socio-economica del nostro futuro. Per questo ti consiglio di leggere con attenzione l’analisi che è stata fatta su questi dati da Lab 24 del Sole 24 ore. E’ chiara e dettagliata e fotografa la situazione italiana regione per regione. E anche regioni, che pensavo virtuose, come la Lombardia non se la passano così bene soprattutto se paragonate ad altre regioni europee. Non ci resta che piangere? Forse no … perché a fronte di questi dati la UE sta predisponendo un piano per “potenziare il talento”, Talent Booster Mechanism che viene descritto nell’articolo. Certo non può essere l’unica soluzione così come non può essere numericamente significativo attrarre talenti dalla Silicon Valley. Ripensare in maniera più intelligente le politiche sull’immigrazione sembrerebbe, dati alla mano, potrebbe avere effetti positivi su un ampio spettro!
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!