For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il sessantaquatresimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del sessantaquatresimo numero:
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Generative AI 101: A Comprehensive Guide for CEOs and Executives
"L'AI generativa si sta evolvendo a velocità record, mentre gli amministratori delegati stanno ancora imparando a conoscere il valore e i rischi aziendali di questa tecnologia. Qui vi proponiamo alcuni elementi essenziali dell'AI generativa.” Questo è l’inizio di quello che ti suggerisco di leggere questa settimana se devi spiegare al tuo Ceo o ad un C-level cosa è la generative AI: cosa può o potrà fare e soprattutto cosa non fa e non farà mai. Spesso la spiegazione di questo secondo aspetto è decisamente più ardua. Su questo tema il documento, realizzato dal McKinsey Technology Council insieme a Quantum Black, entrambe parti di McKinsey Digital, è molto chiaro e lo spiega in maniera molto esplicita: “L'AI generativa è attualmente inadatta ad analizzare direttamente grandi quantità di dati tabellari o a risolvere problemi avanzati di ottimizzazione numerica.” E forse l’aggettivo 'avanzati' è fin troppo ottimistico sulla base di quello che sto sperimentando. E’ facile infatti confondere, se non si hanno le basi e non ci si è sporcati un po’ le mani, l’AI generativa e i “suoi” fundamental models con tutte le altre aree dell’intelligenza artificiale, machine learning compreso. Questo è tanto più vero perché ormai, soprattutto nelle grandi aziende, si usano già diverse metodologie avanzate a scopi analitici e previsionali ed è possibile che il tuo CEO possa pensare che l’AI generativa abbia un impatto diretto o possa sostituirle. Il documento è anche molto ricco di utilissimi esempi e approfondimenti sui possibili casi d’uso e gli approcci da usare, tutti sintetizzati molto bene come in questa figura che ho tratto dall'analisi Mckinsey.
Ci sono poi diversi suggerimenti sulle strategie che in questa fase si possono tenere ma te le lascio leggere con il suggerimento di saperle scegliere anche sulla base della maturità e della cultura aziendale. Solo una cosa mi sento di raccomandarti, visto l’impatto trasversale e importante su molti processi aziendali, ed è quello di avere all’interno dell’azienda i giusti talenti che sappiano guidare affidandoti all’aiuto esterno più su aspetti tecnologici che organizzativi. Se invece il tuo CEO ama andare a capire la trasformazione in corso numeri alla mano ti consiglio di leggere e di proporgli almeno l’abstract di questo studio del MIT che ha provato a misurare gli effetti sulla produttività di una tecnologia di intelligenza artificiale generativa nel contesto di compiti di scrittura professionale di medio livello. I risultati dello studio sono molto interessanti e per certi versi sorprendenti non tanto per l’accresciuta produttività, che avrei dato per scontato. Infatti sembra che “l'esposizione a ChatGPT aumenti la soddisfazione lavorativa e l'autoefficacia e generi sia preoccupazione che entusiasmo per le tecnologie di automazione.” mentre “a livello aggregato, ChatGPT comprime sostanzialmente la distribuzione della produttività, riducendo la disuguaglianza (tra lavoratori).”. Ma sia il campione (limitato) su cui è stato realizzato sia la significatività statistica dello studio sono ben lontani da disegnare uno scenario preciso per il futuro!
🖐️Tecnologia (data engineering). Shaping Generative AI to Fit Your Needs: Discovering Lamini and Open Source Innovation
Te ne avevo già parlato in alcune newsletter precedenti: il mondo open source, pur essendo un po’ in ritardo rispetto ai due progetti proprietari di OpenAI e Google, non sta certo a guardare passivamente l’evoluzione della tecnologia relativa alla generative AI, ma anzi, è in gran fermento. Esistono infatti importanti modelli fondamentali che hanno scelto la via dello sviluppo open source, come il progetto Bloom e anche LLaMA, rilasciato in modalità open source dal team di Meta a Febbraio 2023. Sono proprio questi modelli quelli più interessanti in ottica di utilizzo e addestramento privato sul proprio dominio di business. Per favorire la fase di personalizzazione del modello e addestramento con i tuoi dati, stanno nascendo numerosi progetti volti a semplificare tutto questo processo. L’approfondimento che ti consiglio oggi, soprattutto se sei un machine learning engineer o se devi prendere decisioni in questo ambito, riguarda un progetto molto ambizioso e promettente che semplifica proprio tutta la fase di personalizzazione e deploy del modello, partendo da un modello open source. Questa azienda e il suo prodotto si chiamano Lamini ed ha il quartier generale a Stanford.
Lamini offre agli sviluppatori un ambiente di lavoro facile da usare, che consente loro di addestrare modelli linguistici di alto livello senza sforzo e con pochissimo codice, semplificando la creazione di modelli personalizzati sui propri dati e dando ai team la libertà di adattare le proprie soluzioni alle esigenze specifiche.
Ti consiglio di partire da questo articolo introduttivo sul loro blog per capire meglio quello che fanno e poi di provare direttamente questo codice Colab in Python, dove, usando come LLM proprio LLaMA di Meta, puoi provare a lavorare in ambito Marketing realizzando della ottima "Marketing Copy Generation".
👀 Data Science. Invisible Insights: Making Surveys Your Superpower
"I sondaggi rappresentano un approccio fondamentale per rilevare elementi altrimenti invisibili, quali percezioni, conoscenze, credenze, atteggiamenti e ragionamenti. Essi non sono meramente strumenti di ricerca o semplici metodi per raccogliere dati, ma implicano la creazione di un processo che genera tali dati. Questo documento fornisce una guida completa sul processo di indagine, spaziando dalla progettazione delle domande e degli esperimenti, al reclutamento dei partecipanti, dalla raccolta dei dati all'analisi delle risposte. Esplora questioni legate al processo di campionamento, alla selezione e all'abbandono, all'attenzione e alla distrazione, alla progettazione e alla misurazione delle domande del sondaggio, alle distorsioni nelle risposte e agli esperimenti di sondaggio.” Questo è parte dell’abstract di un eccellente studio dal titolo esplicito: “How to Run Surveys: A guide to creating your own identifying variation and revealing the invisible”. Non lasciarti ingannare dal formato del documento: pur essendo un articolo scientifico, è estremamente pratico e ricco di esempi e consigli operativi. Il lavoro è anche piuttosto voluminoso, con le sue 100 pagine, ma la sua struttura permette una lettura agevole a seconda dell'area di interesse. Ho letto alcune sezioni e ho trovato risposte a molte domande che mi sono spesso posto, sia come partecipante che come utilizzatore di dati provenienti da un sondaggio. Se sei un data-expert, ti consiglio di aggiungerlo ai tuoi preferiti: arriverà sicuramente un momento in cui ti sarà utile. Infine, una menzione speciale per l'autrice dell'articolo, Stefanie Stantcheva, Professoressa di Economia Politica ad Harvard, che ho avuto il piacere di ascoltare in diversi eventi. Stefanie è anche la fondatrice del Social Economics Labs, al quale ti suggerisco di dare un'occhiata!"
👃Investimenti in ambito dati e algoritmi. The Dark Side of a16z: An Inside Look at Andreessen Horowitz
Dal momento che ho citato più volte in questa newsletter Marc Andreessen e il suo fondo di investimento a16z per la grande capacità di comprendere la tecnologia e di investire in modo intelligente, ritengo sia giusto presentarti anche una prospettiva diversa, molto critica, forse eccessivamente, ma che va comunque presa in considerazione per avere una visione quanto più obiettiva possibile di questo momento particolare nel campo degli investimenti innovativi. L'articolo che ti suggerisco oggi, pubblicato sulla prestigiosa rivista digitale "The Verge", si interroga se la capacità di "vedere il futuro" del fondo di investimenti Andreessen Horowitz non sia rimasta intrappolata in un passato caratterizzato da bassi tassi di interesse e da un'abilità di influenzare l'opinione pubblica attraverso i media che non rappresenta più il presente né il futuro. Nell'articolo, per esempio, si legge che "L'analista e ex partner di a16z, Benedict Evans, ha definito la società un'azienda mediatica che monetizza attraverso il VC ... Andreessen ha anche organizzato feste con cocktail per i giornalisti prescelti - e ha escluso chiunque abbia scritto qualcosa di critico." Viene inoltre citata una serie di investimenti fallimentari insieme a una strategia di gonfiare artificialmente le quotazioni delle aziende in cui avevano investito attraverso una sorta di schema Ponzi, abilmente gestito a livello mediatico. Non voglio negare che l'operato del fondo non sia stato del tutto impeccabile, ma accostare, nell'articolo, Theranos a Marc Andreessen, su cui a16z non ha mai investito, mi sembra un po' pretestuoso. Tuttavia, ritengo che la critica sulla leggerezza con cui sono state e vengono ancora condotte molte due diligence nell'intera industria dei VC sia valida. Nonostante tutto, a16z rimane, a mio avviso, uno dei fondi più competenti a livello mondiale. L'articolo cita diversi episodi interessanti degli ultimi 15 anni di investimenti nelle tecnologie più innovative e credo che valga la pena di leggerlo anche solo per questa rilettura storica del passato. Se lo fai mi piacerebbe avere il tuo punto di vista …
👅Etica & regolamentazione & impatto sulla società. Closer Look at the Evolution of the European AI Regulation Act: Progress and Future Prospects
Dopo alcuni mesi, è importante fare un aggiornamento sull’AI Regulation Act Europeo che, tra maggio e giugno 2023, sta vivendo un momento molto importante della sua storia. Come riporta l’articolo più sintetico e completo che ho trovato su questo tema, "L’Artificial Intelligence Act europeo compie un nuovo passo avanti con l’approvazione della relazione del Parlamento europeo sulla proposta di Regolamento per stabilire un quadro normativo sull’intelligenza artificiale nell'Unione Europea. La relazione è stata approvata nel corso della riunione congiunta delle commissioni per il Mercato interno e la protezione dei consumatori (Imco) e per le Libertà civili, la giustizia e gli affari interni (Libe). La relazione, presentata dai co-relatori Brando Benifei (S&D) e Dragoş Tudorache (Renew Europe), dovrà ora essere votata alla prossima sessione plenaria dell’Eurocamera, in programma tra il 12 e il 15 giugno, in vista dei negoziati inter-istituzionali con il Consiglio dell’UE. L’obiettivo è approvare entro la fine della legislatura (nella primavera del 2024) la prima legislazione al mondo a livello orizzontale e di ampio respiro sull’intelligenza artificiale, che regolamenterà uno degli aspetti più cruciali della gestione della doppia transizione digitale e verde dell’Unione Europea." Se vuoi approfondire i contenuti e la relazione, ti consiglio di leggere o ascoltare questa intervista a Brando Benifei, eurodeputato e capo delegazione del Partito Democratico al Parlamento europeo dal 2019, tra i principali contributori dell'AI ACT. Se non sei convinto di quanto sia importante regolamentare questo ambito, seppure in modo più pragmatico rispetto a quanto fatto con il GDPR, dai un'occhiata e iscriviti agli aggiornamenti all'AI Incident Database, una preziosissima fonte informativa!
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!