For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il cinquantacinquesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Prima di iniziare, vorrei menzionare un evento a cui ho preso parte, tenutosi nella suggestiva cornice dell'Università LUISS e di fronte a un pubblico di studenti molto interessati. In questo contesto ho avuto l'opportunità di discutere con l'amico e professor Paolo Ferragina riguardo a dati, algoritmi e intelligenza artificiale, con il coordinamento della professoressa Irene Finocchi. L'evento è proseguito con il coinvolgente racconto della storia di LinkedIn, narrata dall'innovativa azienda italiana Companies Talks. Companies Talks presenta storie di business interpretate da attori, arricchite da momenti musicali. Avevo già ascoltato quella di Adriano Olivetti, ma la storia di Reid Hoffman e della nascita di LinkedIn è risultata ancora più attuale ed avvincente!
Ecco i cinque spunti del cinquantacinquesimo numero:
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Diversity in Practice through Data!
“Mapping Diversity è una piattaforma che mira a scoprire i fatti chiave sulla diversità e la rappresentanza nei nomi delle strade in Europa … abbiamo esaminato i nomi di 145.933 strade in 30 grandi città europee, situate in 17 Paesi diversi. Oltre il 90% delle strade intitolate a persone sono dedicate a uomini bianchi. Ma che fine hanno fatto tutti gli altri abitanti dell'Europa? La mancanza di diversità nella toponomastica è indicativa del nostro passato e contribuisce a plasmare il presente e il futuro dell'Europa.” Questa è la descrizione del progetto, molto figo, che ti segnalo questa settimana il quale adotta un approccio quantitativo, molto particolare ma assolutamente interessante, di misurazione della diversità di genere attraverso la quantificazione del numero di uomini e donne a cui sono intitolate le strade nelle città d’Europa. Mi piace per due motivi. Il primo è la grafica che è accattivante e adatta a favorire una lettura chiara dei dati e uno storytelling efficace. Il secondo è perché, attraverso varie dimensioni di lettura dei dati, riesce a descrivere molto bene il fenomeno su scala geografica, storica e culturale. Purtroppo, se si considerano i numeri italiani, la situazione è preoccupante. La presenza femminile è in media del 5%, nettamente inferiore della media europea che si attesta attorno al 10%. Una consolazione parziale è sapere che proprio dall’Italia è emerso il prototipo di questo progetto, dove puoi scoprire che più di un terzo delle donne italiane a cui è dedicata una via sono sante! 🙂
🖐️Tecnologia (data engineering). Andrea Gioia: A Data-Expert with Organizations and People at his Heart
Presentati
Dopo la laurea in informatica, presa ormai quasi 20 anni fa (sig!), ho deciso che il settore dell’AI in cui mi ero specializzato durante il percorso di studi non avrebbe avuto futuro nel breve (altri tempi) e mi sono buttato nel mondo dei dati. Al di là della mia opinabile lungimiranza non mi sono mai pentito della scelta. In questi anni ho seguito tutte le evoluzioni e rivoluzioni legate alla gestione del dato. Prima in Engineering Ingegneria Informatica come solution architect e community manager di SpagoBI, una suite di BI open source, poi in Quantyca, società di consulenza specializzata in data e metadata management, come partner e CTO. Da qualche anno sono infine co-founder di Blindata, un prodotto SaaS per la gestione dei processi di governance e compliance. Nel tempo libero, tra le altre cose, gestisco con alcuni colleghi il Data Engineering Milano Meetup e il PIE&AI Italian Meetup.
Il mio ruolo tra 10 anni sarà ... (continua la frase come fossi GPT-10)
… ancora legato al mondo dei dati, sempre che GPT-10 non mi costringa ad un pensionamenti anticipato :) Scherzi a parte direi che tra dieci anni mi piacerebbe, in continuità con la direzione intrapresa a livello professionale negli ultimi anni, occuparmi di modelli organizzativi e change management. Cosa c'entra con il mondo dei dati? Diciamo che le iniziative di data management già oggi non mietono grandi successi non certo per problemi di natura tecnologica. Occuparsi di dati in futuro vorrà sempre più dire occuparsi di persone, processi ed organizzazione.
Quale è la sfida più importante che il mondo dei dati e algoritmi ha di fronte a sé oggi?
Ad oggi i modelli organizzativi prevalenti per la gestione dei dati hanno portato ad una continua crescita dei costi di gestione non sostenibile nel tempo, spesso anche con ROI discutibili. La sfida più grande è quindi ripensare i modelli operativi in essere e promuovere un cambio di paradigma che metta i dati al centro delle organizzazioni e non li releghi ad essere dei by-product. E’ essenziale che i nuovi modelli siano scalabili, sostenibili e diffusi all’interno delle organizzazioni, promuovendo la diffusione di una cultura del dato che riduca la distanza tra chi produce e chi consuma dati, tra IT e business.
Segnalaci il progetto o la risorsa nel mondo dei dati di cui non potresti fare a meno …
Sicuramente Linkedin. Dimmi chi segui e ti dirò cosa pensi :) Poi direi i podcast e le community online. Tra i podcast i miei preferiti sono Catalog & Cocktails e Data Engineering Podcast. Tra le community online invece le mie preferite sono Data Mesh Learning Community e Data Quality Camp Community. Infine i meetup, perchè è bello vedersi e fare quattro chiacchiere in presenza con persone che condividono la tua stessa passione. Tra i tool invece ChatGPT sta scalando la classifica che vede però ancora al vertice Excel, croce e delizia di tutti i data lovers. Chi non si è sentito dire almeno una volta se il frutto del suo duro lavoro potesse essere esportato in Excel ;)
👀 Data Science. Census GPT to Try Out “Text to SQL State of Art”
Se sei un data-expert che conosci un minimo di SQL ti consiglio di provare questo progetto, realizzato da un team di data-expert, che risponde a domande su dati censuari americani fornendo oltre al risultato e alla sua visualizzazione su mappa anche la query SQL utilizzata. Le domande in linguaggio naturale vengono convertite in SQL utilizzando GPT-3.5 e quindi utilizzate per interrogare il database stesso. Naturalmente puoi scrivere la domanda anche in Italiano. La precisione con cui scrive l’SQL mi ha sorpreso! Se poi vuoi avere qualche dettaglio tecnico in più su questo progetto molto bello ti consiglio la loro area su Github. Andremo verso un futuro immaginato da Asimov in “nove volte sette"? Sembra comunque che uomini e intelligenze artificiali debbano collaborare ancora un po’ per visualizzare molto bene grosse moli dati stante a questa notizia che arriva dalla Finlandia!
👃Investimenti in ambito dati e algoritmi. The 10 most innovative companies in artificial intelligence of 2023
Non sempre gli elenchi di persone o aziende migliori in uno specifico ambito si dimostrano resilienti nel corso del tempo. Ne abbiamo avuto recenti esempi. Ti consiglio comunque di dare un’occhiata a questo elenco di aziende più innovative nel campo dell’intelligenza artificiale perché ho potuto sperimentare, nel corso del tempo, che FastCompany li realizza con molta cura. Non tengono conto solo dell’attributo legato all’innovazione ma anche alla scala che questa innovazione sta avendo ed è anche interessante la descrizione che danno del perché sono state inserite in classifica. Così troverai ai primi due posti Open.Ai e DeepMind, per due motivi diversi ma entrambi di largo impatto. Quella, tra le dieci, che ti consiglio di seguire e di approfondire è Unlearn, che utilizza la i dati per creare studi clinici più rapidi facilitando la messa in commercio di trattamenti efficaci per molti tipi di malattie.
👅Etica & regolamentazione & impatto sulla società. The Difficult Paths to Regulate AI All Over the World
Il 21 Aprile 2021, quando fu proposta ufficialmente la prima bozza dell’ EU AI Regulation Act, OpenAI aveva appena presentato la sua seconda versione di DALL-E e pochi avrebbero pensato che meno di due anni dopo ChatGPT avrebbe avuto un impatto così dirompente su milioni di persone. Nel frattempo l’Eu Ai Regulation Act non è stato ancora approvato. Sembra in fase di finalizzazione … “ma una volta che il Consiglio, il Parlamento e la Commissione europea ("Commissione") finalizzeranno la legge, questa sarà direttamente applicabile in tutti gli Stati membri dell'UE e i suoi obblighi si applicheranno probabilmente tre anni dopo l'entrata in vigore della legge sull'AI.” Quindi parliamo di seconda parte del 2026. Nel frattempo a che versione di ChatGPT saremo arrivati? E saranno queste nuove forme di intelligenze artificiali che chiamiamo generative inserite, all’ultimo momento, fra i sistemi classificati ad alto rischio dal Regolamento? Secondo Politico se ne sta parlando ma le opinioni sono discordanti. Nel frattempo, dall’altra parte del globo la Cina sembra regolamentare in maniera sempre più centralizzata e “dirigista” il mondo dei dati e sembra analizzare, classificare e controllare gli algoritmi delle “sue” big tech.
A volte mi sembra di vivere già immerso in un multiverso 🙂
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!