LaCulturaDelDato #190
Dati & algoritmi attraverso i nostri 5 sensi
For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il centonovantesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del centonovantesimo numero:
👃Investimenti in ambito dati e algoritmi. Costruttore di AI: come Andrew Ng lancia start-up con il suo Venture Studio (e cosa è un Venture Studio)
Diverse volte ho citato Andrew Ng e ho suggerito approfondimenti, in varie sezioni della newsletter, che provenivano da quello che lui scrive e divulga attraverso diversi media. Lo considero una, se non la persona con le competenze più vaste nel campo dell’intelligenza artificiale. Parliamo di qualcuno che va dall’esperienza diretta nell’aver contribuito a progressi significativi del settore (per esempio, il suo gruppo a Stanford è stato tra i primi, nel 2008, a usare le GPU nel Deep Learning), alla guida della ricerca sull’AI in Big Tech (Google e Baidu), fino alla fondazione di start-up importanti nel settore educativo (Coursera e, più recentemente, deeplearning.ai). Ma Andrew Ng è stato ed è anche un investitore di peso nel settore AI, avendo fondato fin dal 2018 un fondo dedicato ad investimento nell’intelligenza artificiale con una dotazione iniziale, per niente banale per quei tempi , di 175 milioni di dollari. Proprio per tutto questo background non è stato difficile, nel libro che ho scritto insieme ad Alberto Danese “Intelligenza artificiale in 4D”, sceglierlo tra i 4 protagonisti da conoscere assolutamente se vuoi capire in modo equilibrato e senza hype l’evoluzione del mondo AI.
Ed è proprio il suo AI Fund l’approfondimento che ti voglio suggerire questa settimana. Perché non è proprio un fondo VC tradizionale, ma un Venture Studio. La mia esperienza personale è che non è affatto facile creare valore con un Venture Studio, che è un oggetto un po’ particolare nel mondo degli investimenti. Uso direttamente le loro parole, dalla sezione FAQ del sito, perché spiegano bene cosa fanno e perché:
“Un venture studio differisce da un tipico fondo VC in quanto si concentra sulla creazione di aziende da zero, piuttosto che sull’investimento in aziende già in crescita. All’AI Fund, ricaviamo idee dalla nostra organizzazione, dalla nostra rete di partner industriali e accademici e da imprenditori come te. Valideremo insieme la tua idea attraverso il nostro programma Founder in Residence e ti supporteremo nel trasformarla in un’attività imprenditoriale finanziabile, inclusi il reclutamento del tuo team, lo sviluppo del proof of concept del prodotto e l’acquisizione dei primi clienti. Siamo più che semplici investitori. In qualità di venture studio, siamo co-fondatori insieme a te.”
Credo che, se sei un investitore o vuoi creare una start-up, valga davvero la pena dare un’occhiata al sito dell’AI Fund di Andrew Ng e alle start-up in cui ha investito. E, per tutti, consiglio di leggere questo editoriale, scritto da Ng in una delle sue ultime newsletter, dove descrive in modo molto chiaro le due caratteristiche fondamentali che devono avere oggi le start-up nel mondo AI per avere successo: velocità e profonda conoscenza della tecnologia. Ma Ng spiega anche molto bene perché queste due leve siano così determinanti. E visto che in quella newsletter annuncia anche il lancio di un secondo fondo da altri 190 milioni di dollari, forse possiamo anche fidarci di lui 😉
🖐️Tecnologia (data engineering). Oumi e la sfida open source: il “Linux dell’IA” secondo Manos Koukoumidis
L’idea di LLM open source, cioè rendere disponibili codice, pesi del modello, pipeline e dati di addestramento, non è un vezzo ideologico, ma una condizione quasi necessaria per un’IA davvero democratica ed efficiente. Oggi i modelli open source hanno ancora un gap importante rispetto a quelli closed, anche, a mio parere, per la capacità di questi ultimi di integrarsi con strumenti e funzionalità che rendono la loro intelligenza ibrida e decisamente efficace. Detto questo, credo sia fondamentale supportare e far evolvere sempre meglio l’ecosistema open source. Per diversi motivi
🔍 Controllo e auditabilità
Se un modello genera risposte errate, biased o comportamenti imprevisti, solo con accesso completo possiamo capire “cosa c’è sotto” e intervenire. In ambienti chiusi, si dipende totalmente dall’azienda che lo gestisce.
🧩 Personalizzazione e domini specifici
Le applicazioni reali (aziende, medicina, legale, finanza) richiedono spesso adattamenti molto fini che un modello generico non sa gestire. L’open source permette più facilmente il fine tuning, gli adattamenti per domini specifici e la riduzione delle “allucinazioni” su casi unici.
🌍 Innovazione collaborativa
Comunità e ricercatori in tutto il mondo possono contribuire, migliorare e costruire su basi comuni: la somma delle menti è più potente
🔄 Sostenibilità e trasparenza
L’IA evolve in fretta, e i modelli chiusi rischiano di invecchiare o diventare opachi. L’open source mantiene una linea evolutiva più trasparente e sostenibile.
Alla luce di tutto questo, l’approfondimento di oggi è un’intervista molto interessante che Ben Lorica ha pubblicato nella sua newsletter Gradient Flow, con protagonista Manos Koukoumidis, CEO di Oumi.
Oumi è un progetto (o azienda) ambizioso che cerca di colmare diversi vuoti nel panorama attuale dell’IA. Nasce da un team di ricercatori e ingegneri esperti (ex Google, Apple), che hanno osservato le crescenti tensioni tra chiusura, centralizzazione e controllo da un lato, e apertura e collaborazione dall’altro. Il progetto si propone quasi come un “Linux dell’IA”: un’infrastruttura di base su cui chiunque può costruire. La piattaforma, ancora in fase di sviluppo ma già disponibile, non è solo un wrapper o un modulo. È una suite completa: dalla preparazione dei dati all’addestramento, alla valutazione e al deployment, tutto pensato per essere open source. Oumi dichiara supporto per modelli che vanno da pochi milioni a centinaia di miliardi di parametri (fino a 405B), sia testuali che multimodali (vision + testo), e integra ricette per tecniche moderne (SFT, LoRA, QLoRA, DPO). Offre gestione automatica dei job su cloud, valutazioni benchmark, pipeline che abbassano la barriera tecnica. È compatibile con motori di inferenza esistenti e può integrarsi con API commerciali (OpenAI, Anthropic, Vertex, ecc.).
Non l’ho ancora provata, ma se qualcuno la usa o la sta esplorando... sono super curioso di avere il tuo feedback! Sembra un progetto davvero promettente 🚀
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Non serve (solo) correre più veloce. Serve cambiare (anche) strada.
“In un mondo in cui possiamo esternalizzare la produttività alla tecnologia, le persone che ne traggono i maggiori benefici non sono quelle che lavorano più velocemente. Sono quelle che creano cose meravigliose, originali, eccentriche, emotivamente coinvolgenti e autentiche. Man mano che i nostri feed si riempiono di contenuti istantanei generati dall’intelligenza artificiale, la cosa più pericolosa che si possa fare è giocare sul sicuro. Viviamo in una cultura che venera la produttività sopra ogni altra cosa. Per secoli, il successo, soprattutto in Occidente, si è basato su un principio semplice: “Fai di più, più in fretta.” Ma mentre l’IA trasforma la velocità e la produzione in una merce, questa corsa perderà di valore
. …
In definitiva, allontanarsi dalla produttività per avvicinarsi alla creatività non è solo una necessità economica, qualcosa che dobbiamo fare per distinguerci sul mercato; è un modo per riconquistare la nostra umanità e costruire vite più appaganti. L’obiettivo non può essere semplicemente “fare di più”. Deve essere creare qualcosa di meraviglioso.”
Questo è l’inizio e la fine di un articolo che ho trovato molto bello, visionario di un futuro preferibile, per rubare ancora l’aggettivo a due amici, e di grande ispirazione anche sul piano personale, ma molto lontano ancora dal presente.
Infatti, in un mondo che fa fatica a trovare un ROI ai progetti di generative AI e a misurare i miglioramenti di produttività portati da decenni di tecnologia, risulta difficile parlare della fine della produttività. Piuttosto, credo sia più corretto chiederci se la stiamo misurando nel modo giusto, e quanto sia davvero facile farlo.
Per esempio, nel mondo del software, che tradizionalmente è un passo avanti su questi temi, i dibattiti sono molto accesi, e si è ormai capito che anche i migliori la misurano ciascuno a modo loro. ( Leggi questo bellissimo articolo per fartene un’idea.)
Forse allora la domanda più utile è: questi strumenti generano davvero un miglioramento della produttività solo se li usiamo in modo creativo, cambiando i processi alla radice, mentre cerchiamo di fare cose nuove che siano utili per tutti? Ma questa domanda, o meglio, il tentativo di cambiare i processi in maniera creativa, non è affatto banale come potrebbe sembrare. Perché non è (solo) un tema di tecnologia o di intelligenze artificiali.
È, soprattutto, un tema di intelligenze umane 🙂
👀 Data Science. Dataviz spettacolo o utile? Due esempi pratici per capirlo
Mostrare le intuizioni o mettersi in mostra? Questo è il titolo di un contributo che vi era piaciuto molto nel numero sessantanove di questa newsletter e che ti ripropongo, arricchito da un altro esempio sempre in linea con lo stesso tema e sempre da uno dei miei siti preferiti quando si parla di presentare i dati in modo efficace. Il sito te l’ho già segnalato diverse volte: Storytelling with Data, che negli anni è diventato una vera community di appassionati di dataviz 🎯
Il primo contributo, che avevo già condiviso con te, è di Mike Cisneros e mette l’accento su un punto molto interessante: chi lavora con i dati spesso rimane affascinato da grafici e diagrammi insoliti o visivamente accattivanti, con il desiderio (più o meno consapevole) di creare visualizzazioni altrettanto vivaci e attraenti.
Il rischio? Perdere di vista ciò che davvero conta nella comunicazione, soprattutto in contesti professionali, dove l’audience e il messaggio sono fondamentali.
➡️ Passare da questa visualizzazione
a questa
utilizzando esattamente gli stessi dati … significa rinunciare a qualche effetto speciale di dataviz, ma guidare meglio il pubblico verso una lettura chiara e diretta. Non è sempre la soluzione giusta, ma più il grafico serve a supportare una presentazione di fronte a un’audience ampia, più questa scelta si rivela efficace 💡
A rafforzare questo concetto (che eliminare il superfluo non basta sempre), ti segnalo un altro post utile, stavolta di Simon Rowe, anche lui membro della community di Storytelling with Data. Il suo esempio è super pratico e dimostra che per comunicare davvero in modo chiaro serve:
✅ scegliere il giusto tipo di visualizzazione
✅ mettere in evidenza il messaggio principale
… così da rendere i dati immediatamente leggibili e interpretabili.
👅Etica & regolamentazione & impatto sulla società. Google, ReportAId e robot chirurghi: l’AI medica apre il codice (e accelera?)
“Il settore sanitario sta adottando sempre più l’intelligenza artificiale per migliorare la gestione dei flussi di lavoro, la comunicazione con i pazienti e il supporto alla diagnosi e al trattamento. È fondamentale che questi sistemi basati su AI non siano solo altamente performanti, ma anche efficienti e rispettosi della privacy. Con queste considerazioni in mente, Google ha sviluppato e recentemente rilasciato Health AI Developer Foundations (HAI-DEF): una raccolta di modelli aperti e leggeri, pensata per offrire agli sviluppatori solide basi di partenza per la ricerca e lo sviluppo di applicazioni nel campo della salute. Poiché i modelli HAI-DEF sono open, gli sviluppatori mantengono il pieno controllo su privacy, infrastruttura e possibilità di modificare i modelli stessi. Nel maggio di quest’anno, la collezione HAI-DEF si è ampliata con MedGemma, una serie di modelli generativi basati su Gemma 3, progettati per accelerare lo sviluppo di soluzioni di intelligenza artificiale nel settore sanitario e nelle scienze della vita.”
Questo è l’inizio di un annuncio fatto lo scorso luglio da Google, ed è sicuramente un passo importante per il potenziale impatto che l’AI generativa può avere su tutto il settore sanitario, un settore sotto pressione da anni, in ogni parte del mondo. La notizia è significativa sia perché Google è tra i player più avanzati negli LLM in ambito medico-sanitario, sia perché il rilascio di questi modelli in modalità open source può rappresentare un forte acceleratore di innovazione in un ambito particolarmente sensibile ai temi della privacy.
Sempre in questo ambito, segnalo un’altra ottima notizia , e, una volta tanto, arriva da casa nostra 😊: il team ReportAId, start-up di cui è founder e presidente del consiglio di amministrazione Luca Foresti (nostro ospite qui), ha lanciato il primo modello di speech-to-text medico open source in Italia: MedWhisper Large ITA. Perché è importante? Lo spiegano molto bene in questo post, dove forniscono anche dettagli tecnici su come ci sono arrivati, attraverso un fine-tuning molto specifico di un modello open source: Whisper-large-v3-turbo di OpenAI.
Su un altro fronte medico molto rilevante, quello della chirurgia robotica , ti segnalo infine che la Johns Hopkins University ha annunciato “che un robot, addestrato su video di interventi chirurgici, ha eseguito una lunga fase di un’operazione di rimozione della cistifellea senza alcun aiuto umano. Il robot ha operato per la prima volta su un paziente simulato con caratteristiche realistiche. Durante l’intervento, ha risposto ai comandi vocali del team e appreso da essi, proprio come farebbe un chirurgo alle prime armi guidato da un mentore.”
Riuscire a portare tutte queste innovazioni dentro il maggior numero possibile di ospedali, in sicurezza, credo sia una delle sfide più grandi che tutto il mondo sanitario ha davanti. E riguarda più le intelligenze umane che quelle artificiali 🙂
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!





Per una volta commento la newsletter. Premetto che non sono un professionista e nemmeno un esperto del campo ma per mestiere e per diletto ho sempre maneggiato dati e ho lottato per trovare la chiave per andare più a fondo nella comprensione e poi, per trovare la rappresentazione più adatta. Il nuovo mondo dell'AI mi affascina prima di spaventarmi e capirne i meccanismi, anche economici, è un antidoto all'irrazionale, anche se comprensibile, paura.
I tanti suggerimenti che la sua newsletter propone non mi serviranno quasi sicuramente mai, considerando anche l'età avanzata.
In ogni caso ogni volta trovo alimentazione per il mio stupore, stimoli alla mia curiosità, ispirazione per qualche piccolo progetto personale.
Quindi scrivo per ringraziarla.
Fantastic piece! Andrew Ng's influence across AI, from deep learning to education, is truely incredible. Couldn't agree more with your perspective.