For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è l'ottantanovesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Prima di cominciare, ti condivido una promozione speciale del libro “Data Culture” che ho scritto quest’anno insieme a
: da ieri, Venerdì 25 Novembre, fino a Lunedì 27 Novembre, in occasione del weekend Black Friday, l'ebook sarà disponibile con uno sconto del 50%, mentre per la versione cartacea abbiamo riservato uno sconto del 25%. Se non lo hai ancora letto e vuoi farlo, ecco il link per acquistarlo.
Ecco i cinque spunti dell'ottantanovesimo numero:
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Jacopo Perfetti: Bridging Creativity and AI - A Journey from Web Programming to AI Agency
Presentati.
Jacopo Perfetti. L'intelligenza Artificiale Generativa, dove sono approdato ai tempi di GPT-2, rappresenta per me la sintesi di un lungo percorso professionale iniziato nel 1999, ai tempi del liceo, come programmatore web e poi passato per lavori, settori e ruoli quanto più distanti tra loro. Cercando di riassumere gli ultimi vent'anni della mia vita professionale direi che sono partito dalla tecnologia, per poi dedicarmi alla creatività, e ora mi occupo di una tecnologia che genera creatività. Insegno imprenditoria agli Executive MBA della SDA Bocconi e sono co-fondatore dell'agenzia basata su Intelligenza Artificiale Oblique.AI e di "PromptDesign.it", il primo corso in Italia sull'Intelligenza Artificiale Generativa.
Il mio ruolo tra 10 anni sarà ... (continua la frase come fossi GPT-10).
Mi piace pensarmi come un verbo, non come un nome. Il nome è statico. Non muta mai. Un verbo invece è dinamico, cambia, si evolve, talvolta va avanti, altre volte torna indietro. Non so quale sarà il mio ruolo tra 10 anni. Negli ultimi venti ho cambiato lavoro così tante volte che è verosimile che nei prossimi continuerò a farlo. Sicuramente uno dei settori che più mi affascina è il binomio Educazione + Intelligenza Artificiale Generativa. Penso che la formazione, soprattutto dei bambini e delle bambine, vada ripensata completamente. Tanto in un'ottica tecnologica quanto in un'ottica umanistica. L'Intelligenza Artificiale cambierà radicalmente la nostra vita e non possiamo affrontare questa rivoluzione con la mentalità e gli strumenti del passato.
Quale è la sfida più importante che il mondo dei dati e algoritmi ha di fronte a sé oggi?
Innanzi tutto iniziare a parlare la stessa lingua. Algoritmi sofisticati senza dati di qualità sono inutili, se non dannosi. Dati di qualità senza algoritmi adeguatamente sofisticati rischiano di essere difficili da utilizzare. Oggi penso che ci sia un problema soprattutto con i dati. E questo è un grosso problema. Perché il dato è il futuro dell'algoritmo. Pensiamo a GPT, dove la "P" sta appunto per Pre-trained, una macchina in grado di generare testo, e quindi linguaggio, partendo da una base dati con cui sono state pre-allenate. Il tema delicato è dunque come queste macchine sono state allenate e da dove provengono i dati, perché la loro origine determinerà la qualità dell’output. In quest'ottica penso che l'Intelligenza Artificiale Generativa sia uno specchio della società che come esseri umani abbiamo creato negli ultimi secoli e, in quanto tale, il lavoro che stiamo facendo per renderla una tecnologia più inclusiva e meno discriminatoria sia un'ottima occasione per lavorare anche su di noi, sui nostri bias e sulle nostre logiche.
Segnalaci il progetto o la risorsa nel mondo dei dati di cui non potresti fare a meno.
Dipende molto dall'output o dal lavoro che devo generare. Sicuramente Kaggle è un posto utile dove trovare datasets. Poi ci sono tutti i database che creiamo apposta per sviluppare un tool o un chatbot. Come dicevamo, la qualità del dato è essenziale per avere un risultato di qualità (secondo la vecchia legge per cui "garbage in, garbage out"), ed è dunque fondamentale mettere la macchina nella condizione di avere i dati e le informazioni per elaborare output che siano in linea con le nostra aspettative. Con OpenAI possiamo allenare GPT con il Fine-tuning che ora è più accessibile di un tempo, oppure, in termini di Prompt Design, possiamo utilizzare la tecnica del Few-Shot Learning: già nel prompt diamo a GPT alcuni esempi o informazioni per elaborare una risposta che segua la struttura che ci serve. Bastano anche pochi esempi ma la differenza è notevole.
🖐️Tecnologia (data engineering). Animating Algorithms: The VisuAlgo Journey from Concept to Classroom
Ci sono storie di progetti di Open Science e Open Educational Resources che sono belle almeno quanto i progetti che ne nascono.
“Era il luglio 2011 a Pattaya, in Thailandia. Mentre guidava la squadra di Singapore alle Olimpiadi Internazionali di Informatica (IOI), il dottor Steven Halim fu colpito da un'idea per migliorare l'insegnamento degli algoritmi agli studenti, creando un sito web in cui molti algoritmi diversi possono essere appresi attraverso l'animazione.
A quel tempo, su Internet esistevano alcuni siti web contenenti animazioni di algoritmi. Tuttavia, la maggior parte di essi conteneva solo animazioni di alcuni algoritmi. Era quasi impossibile trovare animazioni di algoritmi più rari e "non classici" … Nei cinque mesi successivi, i quattro hanno lavorato instancabilmente per realizzare il sito web da zero utilizzando JavaScript … È così che è nato il sito web di visualizzazione degli algoritmi che hanno creato, ora noto come VisuAlgo.”
VisuAlgo, sviluppato nel tempo all’interno della facoltà di Computer Science dell'Università di Singapore, oggi contiene animazioni di 25 classi di algoritmi, da quelli di base come l'ordinamento a quelli più rari e complessi come l'attraversamento di grafi.
È un modo veramente efficace di imparare o ripassare i principali algoritmi presenti nel mondo della computer science in maniera assolutamente interattiva, anche grazie alla visualizzazione contestuale di animazione e codice step by step.
Un’altra peculiarità rilevante, dal punto di vista didattico, del progetto è “che l'introduzione di VisuAlgo ha cambiato la struttura e il formato delle lezioni del dottor Halim, soprattutto negli ultimi anni. Ora adotta il cosiddetto metodo della "flipped classroom" (classe capovolta), in cui gli studenti sono invitati a leggere le lezioni elettroniche e i quiz da soli per familiarizzare con gli algoritmi prima di venire in classe. Questo è in netto contrasto con l'approccio tradizionale all'apprendimento, in cui gli studenti imparano il materiale durante la lezione mentre l'insegnante spiega i contenuti.”
Puoi sperimentare anche tu questa modalità perché ci sono due modi per usare lo strumento. Oltre alla modalità tradizionale puoi usare l’e-lecture mode (selezionabile in alto a destra nel sito) che regola la modalità di utilizzo degli studenti in modalità “flipped classroom”. La mia personale esperienza di questa modalità di insegnamento come docente e come studente è decisamente positiva, ma richiede un alto e continuativo livello di coinvolgimento della classe (insegnante compreso).
👅Etica & regolamentazione & impatto sulla società. Visions of the Future: Calvino and Levi's Literary Machines
Italo Calvino e Primo Levi sono, senza dubbio, tra i più eminenti scrittori e pensatori italiani del Novecento. Devo confessare che sono anche i miei preferiti, insieme a Umberto Eco. Entrambi, sebbene in modi diversi, hanno tratto ispirazione dalla loro passione per la scienza: la chimica per Levi e, direi, la matematica per Calvino. Li menziono insieme in questa parte della newsletter perché ho recentemente scoperto che, negli anni sessanta, entrambi avevano riflettuto o scritto su argomenti sorprendentemente simili all'AI Generativa che stiamo sperimentando oggi.
Primo Levi, nel suo racconto "Il Versificatore" (1966), esplora un'idea avveniristica: una macchina che compone poesie. Pubblicato sotto lo pseudonimo di Damiano Malabaila e facente parte della raccolta "Storie naturali", descritta da Calvino come una serie di quindici "divertimenti", che trasportano il lettore in un futuro guidato dal progresso tecnologico, luogo di esperimenti utopistici e macchine straordinarie e imprevedibili. Il Versificatore, una macchina zeppa di ingranaggi, leve e bulloni, scrive poesie secondo specifici criteri di lunghezza, schema e rime. Se vuoi scoprire di più, puoi ascoltare il racconto su Audible (è il terzo al minuto 45’, ma anche i primi due racconti decisamente sono brillanti…) oppure guardare il cortometraggio trasmesso su Rai 1 nel 1971, ancora disponibile su YouTube. Kudos alla newsletter “TURING vs ASIMOV” per la segnalazione.
Più complesso è il contributo di Italo Calvino, in "Cibernetica e fantasmi (Appunti sulla narrativa come processo combinatorio)" (1967), incluso in "Una pietra sopra" (1980). Qui Calvino esplora il concetto di automa letterario, immaginando una macchina scrivente in grado di sostituire il poeta e lo scrittore. Riflette sulla letteratura come un processo combinatorio di linguaggio, emozioni ed esperienze, interrogandosi sulla possibilità di macchine capaci di ideare e comporre poesie e romanzi. Se interessato, puoi ascoltarlo su Audible (capitolo 19 del libro e 21 dell’audiolibro) o esplorare "Calvino Cibernetico", un percorso di lettura sui temi trattati nel saggio, prodotto da Treccani.
Ritengo che la grandezza di artisti e scrittori risieda non solo nel descrivere il loro tempo, ma anche nella capacità di immaginare futuri possibili, con tutti i problemi e le opportunità che ne derivano. In questo, Primo Levi e Italo Calvino sono veri maestri. L’effetto Lindy, descritto efficacemente da Nassim Taleb nel consigliare innanzitutto i libri che hanno resistito al passare del tempo, si conferma ancora una volta 🙂!
👃Investimenti in ambito dati e algoritmi. Start-up of the Month October 2023: CleanLab.ai
Come ogni mese, utilizzo una delle mie attività per esplorare il mercato dell'innovazione e degli investimenti, segnalandoti una startup internazionale che ha particolarmente colpito la mia attenzione e che ha ottenuto finanziamenti il mese precedente. Questa startup opera nel mondo dei dati e degli algoritmi, o ne fa un uso massiccio, vantando all'interno del suo team, o nelle selezioni attuali, un nutrito gruppo di esperti dati.
Gli investimenti globali nell'ambito Data & AI sono stati a ottobre leggermente più bassi rispetto ai livelli medi del 2023. Tra le 78 startup etichettate come "data & algorithms" ad ottobre (su un totale di 533, ovvero circa il 14.5%, un punto sotto alla media del 2023), ti segnalo CleanLab.io che cerca di mitigare uno dei colli di bottiglia più significativi dell’attuale sviluppo e utilizzo in produzione dell’AI “tradizionale” e di quella generativa, cioè la qualità dei dati, soprattutto quelli usati per il training dei modelli, i “labelled data”.
CleanLab ha chiuso un round da circa 25 milioni di dollari con investitori importanti quali Menlo Ventures, Bain Company Ventures e Databricks Ventures. Gli algoritmi di intelligenza artificiale usati da CleanLab sono stati sviluppati internamente dai tre fondatori, tutti PHD del MIT. L'approccio proprietario del team alla data curation automatizzata sembra aver permesso di lanciare un prodotto molto innovativo, pronto per le aziende, avendo tra i suoi clienti giganti del machine learning quali Amazon, Google e Tencent. Ho provato nel loro laboratorio il prodotto su dataset di prova (prendi con attenzione quello che scrivo, perché quello che si vede in ambiente di test non è sempre estensibile in qualità e impatto sulla produzione) e sembra veramente un prodotto interessante e duttile. Se sei interessato, Cleanlab.io ha anche una dettagliata libreria di esempi che ti consiglio di guardare, così come numerosi casi d’uso. Visto, come dice Andrew Ng e la “sua” data-centric AI, che le prossime evoluzioni dell’AI dipenderanno molto dai dati e dalla loro qualità, ecco che questa soluzione è da seguire con grande attenzione.
👀 Data Science. Statistical Insights for Everyday Life: A Podcast Guide
“La statistica è uno strumento fondamentale per capire il mondo di oggi eppure in molti - se non la temono – la ignorano del tutto. In questo podcast settimanale tenterò di farvi passare la paura dimostrandovi che la statistica potrebbe addirittura migliorarvi la vita. Sempre e solo senza formule, ben inteso!” Questa è la descrizione che Paola Tellaroli dà del suo podcast “Statfulness”, una vera gemma sia per gli esperti di dati sia per i neofiti. Paola, una biostatistica di talento, crea contenuti che sono non solo informativi, ma anche piacevoli all'ascolto, guidandoci verso un approccio statistico alla vita. Questo, secondo me, può veramente apportare un miglioramento nella vita di tutti, portando anche una maggiore serenità. Paola tiene fede alla sua promessa di evitare le formule, almeno fino al ventesimo episodio, senza per questo perdere in efficacia e concretezza. Il podcast esce settimanalmente, seguendo una distribuzione casuale del giorno di pubblicazione 🙂. Non devi per forza partire dalla prima puntata perché ognuna è autoconsistente e anche l’ultima che ho sentito, la ventesima, “a non lasciarsi travolgere dalle coincidenze” è particolarmente ben riuscita!
Per chi cerca ancora più spunti e non disdegna l'uso di qualche formula in più, suggerisco “La Logica del rischio” di Pasquale Cirillo, che collabora tra le altre cose con Nassim Taleb. L'unica pecca è che si è interrotto nel 2022 al diciannovesimo episodio. Entrambi questi podcast offrono modi straordinari di immergersi nella statistica, guidati da professionisti estremamente competenti.
Come ogni tanto ti ricordo questa newsletter è nella community di Newsletterati, un network di newsletter belle da leggere (e da condividere). Se vuoi dare un’occhiata alle altre eccovi il link.
Per concludere, ricorda che nel numero 87 abbiamo avuto come ospite Eric Enge, con cui abbiamo parlato del futuro del SEO nell'era della Generative AI. Questo argomento ha suscitato un grande interesse nella nostra community, quindi voglio segnalarti la 17ª edizione di SMConnect, che si terrà al Bologna Congress Center dal 5 al 7 Dicembre. L'evento si concentrerà su come l'AI sta trasformando il mondo del Search Marketing, con approfondimenti su temi come SEO, Web Analytics e PPC.
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!