For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il cinquantanovesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del cinquantanovesimo numero:
👃Investimenti in ambito dati e algoritmi. From Startup to Impact: AI and Data Pioneer Michele Barbera on Steering Social and Economic Change
Presentati
Ho iniziato la mia carriera nel mondo dei dati più di 20 anni fa, costruendo sistemi software di knowledge management per la ricostruzione e l’analisi della genesi del pensiero filosofico a partire dall’analisi di manoscritti del settecento e ottocento. Lì è nato il mio amore per i grafi, per l’incertezza e per la complessità. Ho fondato diverse aziende, tutte in qualche modo legate ai dati e all’AI; l’ultima delle quali, dove lavoro, è SpazioDati, che assieme ai colleghi del gruppo ION e Cerved, aiuta le aziende a crescere e sviluppare il proprio business grazie all’utilizzo consapevole dei dati e dell’AI.
Il mio ruolo tra 10 anni sarà ... (continua la frase come fossi GPT-10)
…se ne fossi capace in agricoltura o in cucina, visto che il mio lavoro, così come quello di tanti intellectual workers (e in primis dei manager) sarà in gran parte sostituito dall’AI. A parte gli scherzi, credo che il mio lavoro sarà a supporto di questa grande transizione (o forse sarebbe più appropriato chiamarla rivoluzione), per fare in modo che sia efficace e il più possibile indolore dal punto di vista sociale e industriale. Questo vuol dire concentrarsi sull’educazione (non solo dei giovani), sulle regole e sull’etica. Mi spaventa la parola “politica”, ma credo non si possa fare a meno di usarla.
Quale è la sfida più importante che il mondo dei dati e algoritmi ha di fronte a sé oggi?
Ho avuto la fortuna di “vedere” entrambe le diverse visioni del mondo dei dati e dell’AI, dai sistemi puramente simbolici o di rappresentazione della conoscenza (noti anche come GOFAI: Good Old-Fashioned AI) che ancora dominavano fino a 10 anni fa, fino alla attuale frenesia sui sistemi generativi. Credo che dal punto di vista tecnico e scientifico, la prossima grande sfida che abbiamo di fronte siano i cosiddetti sistemi ibridi (Hybrid AI), che combinano entrambi gli approcci. Dal punto di vista politico e sociale, dovremo invece urgentemente occuparci di come gestire la transizione. Come aggiornare il sistema educativo a partire dai gradi più bassi per arrivare all’istruzione universitaria? Come gestire il cambio generazionale nelle aziende private e pubbliche per abbracciare dati e AI non più come mera tecnica ma come elemento fondante del sistema al pari del capitale e del lavoro?
Segnalaci il progetto o la risorsa nel mondo dei dati di cui non potresti fare a meno …
Ce ne sono tantissime, ma se mi punti una pistola alla tempia ne scelgo due (una proprio non ce la faccio): da una parte HuggingFace, forse la più importante tra le community (anche se gestita da una singola azienda, cosa che evidentemente comporta dei rischi) che aggregano risorse, algoritmi, dati, aziende, ricercatori e, non ultimo, ospitano anche tanti approcci Open Source ai temi più caldi, tra cui i Large Language Models. E dall’altra wikipedia e wikidata, che restano uno dei più grandi knowledge-graph (a proposito di GOFAI!) pubblicamente accessibili e utilizzabili, nonché fondamentali per l’addestramento di molti dei modelli di cui sopra.
Nessuna organizzazione, inclusi i “tech giants” sarà in grado di portare avanti da solo le sfide dell’AI (e aggiungo: per fortuna!) e credo quindi che community come queste (e altre che ne nasceranno) siano e resteranno una risorsa fondamentale.
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Murphy's Law Meets Algorithms: No More Excuses for Things Going Wrong!
“La Legge di Murphy”, cito da Wikipedia in lingua italiana ”è un insieme di paradossi pseudoscientifici a carattere ironico e caricaturale. Si possono idealmente riassumere nel primo assioma, che è in realtà la "Legge di Murphy" vera e propria, che ha dato il titolo a tutto il pensiero "murphologico": «Se qualcosa può andare storto, lo farà» L'autore e stilatore della "summa" sulla "murphologia" è Arthur Bloch.” I diversamente giovani, come il sottoscritto, se la ricorderanno perché una serie di libri, ancora reperibili, ne decretarono un discreto successo sia in ambiente universitario che aziendale. La cosa che mi ha fatto rispolverare la memoria è il fatto che mi sono imbattuto recentemente nella formulazione algoritmica della legge di Murphy:
Prendo sempre a prestito la voce di wikipedia che la spiega anche sottolineando che “la formula esamina cinque fattori relativi a qualsiasi evento o azione: urgenza (U), complessità (C), importanza (I), abilità (S) e frequenza (F).Un punteggio compreso tra uno e nove viene applicato a ciascuno di questi fattori, con un punteggio di 0,7 per l'aggravamento (A), comunemente considerato una costante.” Il tutto è stato studiato e realizzato, veramente, all’interno di un progetto di British Gas nel 2008. Qui potete trovare, grazie al Web Archive, la fonte originale. Quando si dice portare all’estremo la cultura del dato e degli algoritmi in azienda! E da domani non avrai più scuse per non avere a disposizione algoritmi in grado di prevedere se le cose andranno male, anche senza ChatGPT, con buona pace del Garante per la Privacy 🙂.
🖐️Tecnologia (data engineering). Exploring the Boundaries of Artificial Intelligence: Auto-GPT and the Sociology of AI
"Auto-GPT è un'applicazione sperimentale open-source che mette in mostra le capacità del modello linguistico GPT-4. Questo programma, guidato da GPT-4, collega i "pensieri" del LLM (Large Language Model) per raggiungere autonomamente qualsiasi obiettivo prefissato. Come uno dei primi esempi di funzionamento completamente autonomo di GPT-4, Auto-GPT spinge i limiti di ciò che è possibile fare con l'intelligenza artificiale." Questa è la descrizione che fa di sé uno dei più interessanti progetti che sfruttano l'intelligenza artificiale generativa in maniera avanzata. Per capire cos'è effettivamente e avere esempi concreti di utilizzo di questo progetto, ti consiglio di leggere questo articolo dell'ottimo sito di formazione e informazione tecnica Finxter e, soprattutto, di provarlo: è stata ed è per me un'esperienza molto utile. Ci sono molti esperimenti emergenti nel campo della Generative AI e, in particolare, quello che l'amico Cristiano De Nobili ci ha raccontato in un lunch seminar qualche giorno fa in Nexi e che va sotto il nome di Sociology of AI è uno dei più affascinanti. Cosa succede se facciamo interagire 10/100 agenti GPT insieme? Qualcuno ci sta provando…
👀 Data Science. Key Insights from the 2022 Data Visualization State of the Industry Survey: Trends, Tools, and Challenges
Se ami i dati, e in particolare la data-visualization non puoi non dare un’occhiata all'edizione 2022 della “DataVisualization State of the Industry Survey” non fosse altro per le bellissime e per certi versi innovative visualizzazioni presenti. Non si può certo dire che la Data Visualization Society (DVS), che ha realizzato questo report, manchi di coerenza. Ci sono però tanti spunti interessanti che vanno oltre gli aspetti grafici e ci fanno capire l’evoluzione di questo mondo e di tutta la scienza dell’analisi dei dati. Provo a evidenziarti alcuni aspetti che mi hanno particolarmente colpito tenendo conto comunque che la survey ha una “polarizzazione” negli Stati Uniti e su professionisti più maturi della media (6-10 anni di esperienza per la moda e direi anche la mediana) della popolazione:
Gli ingegneri e gli scienziati sono tre volte più propensi a fare della visualizzazione dei dati il loro obiettivo principale quando sono liberi professionisti rispetto a quando sono dipendenti. Intrigante anche dal punto di vista socio-economico questa cosa, vero? (figura 6)
Anche per i data-viz expert l’assetto lavorativo ibrido è il migliore. Una ulteriore conferma per il nostro mondo! (figura 8)
Anche per i data-vizzer la data-preparation e la data-analysis è una parte molto importante del loro lavoro. Anche questa non è una sorpresa. (figura 10)
A livello di tool, dal 2019, assistiamo a due fenomeni significativi: da una parte la crescita di strumenti low-code a sfavore dei linguaggi di programmazione (Python e soprattutto R in discesa) e dall’altra Power Bi che cresce più del 50% nel 2022 rispetto al 2019. (figura 13)
La mancanza di tempo e l’impiego del tempo in attività non specificatamente di dataviz sono le lamentele più importanti dal mondo della dataviz nel 2022. Il 2023 ha portato grandi novità per lenire questo problema come potete toccare con mano leggendo questo interessante post che si focalizza su come i Large Language Models possano aiutare (molto) anche in questo ambito.
👅Etica & regolamentazione & impatto sulla società. From ABC to GPT
Un personaggio più famoso di me aveva detto che “Gli illetterati del XXI secolo non saranno coloro che non sapranno leggere e scrivere, ma chi non saprà imparare, disimparare, e reimparare”. Non capisco, quindi, tutta questa improvvisa disperazione di fronte all’uso di ChatGPT in ambito educativo!. Per questo ti invito a leggere questo approfondito articolo del MIT review che racconta come i modelli di AI generativa stiano trasformando e non distruggendo il sistema educativo e come applicazioni di ultima generazione come Quizlet stiano adattandosi a questi cambiamenti. Certo, ci sono anche reazioni, citate dall’articolo, molto drastiche di insegnanti che gettano la spugna e pensano alla pensione come istintiva reazione alle recenti innovazioni tecnologiche …
Tre sono a mio parere le opportunità che abbiamo di fronte, come educatori, in questo momento di discontinuità. Ma abbiamo anche una grossa sfida. Cominciamo dalle opportunità:
Sviluppare molto meglio, rispetto al passato, il pensiero critico e creativo tutte le volte che insegniamo o apprendiamo.
Dare più spazio alle verifiche delle fonti (e dei dati)
Incrementare l’apprendimento interattivo e pro-attivo poiché modelli generativi ben allenati su corpi di conoscenza validati sono un moltiplicatore di molte parti del lavoro del docente, senza sostituirlo in quelle più specifiche e di valore.
La sfida sarà però enorme e cioè fare finalmente in modo che la tecnologia possa avvantaggiare molti, se non tutti! Come minimo, non accentuare quel gap tra i migliori e la media degli studenti che è uno dei più grossi problemi della società moderna ad alto impatto sulla sostenibilità del nostro modello socio-economico.
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!
favolosa questa edizione di "LaCulturaDelDato", la legge di murphy me la sono spacchettata - divertentissima.
Ottime anche le altre notizie e le sorgenti esterne, grande Stefano!