For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il centoquarantacinquesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del centoquarantacinquesimo numero:
👃Investimenti in ambito dati e algoritmi. AI e Venture Capital: 3 report da non perdere per capire il futuro dell'intelligenza artificiale
I report che arrivano da società che investono, specialmente i Venture Capital che puntano sulle start-up, hanno un valore superiore, a mio parere, rispetto a quelli prodotti dalle società di consulenza. Perché? Sono decisamente “skin in the game”: hanno investito soldi veri, loro e dei loro investitori. Certo, hanno dei bias, perché tendono a rafforzare le loro tesi di investimento, ma questo si può bilanciare andando a guardare il portfolio delle loro partecipazioni. Proprio per questo leggo con più attenzione i loro report e segnalo quelli che mi colpiscono di più. Forse perché spesso riflettono il mio pensiero 🙂 (sì, un altro bias, ma almeno ci metto la disclosure!).
Oggi ti segnalo tre report che, per motivi diversi, vale davvero la pena leggere. Che tu sia un investitore o semplicemente voglia capire come l’AI stia plasmando il mondo e come sia, a sua volta, plasmata. Troverai spunti utili. Partiamo in ordine inverso per dimensione del fondo che ha pubblicato il report o l’articolo: un criterio che, nel mio caso, si allinea anche con la rilevanza.
1. Angular Ventures
Il primo è tratto dal blog di Angular Ventures, un piccolo venture capital specializzato in investimenti early-stage in aziende tecnologiche con radici tra Europa e Israele. L’articolo, dal titolo “Motori o plastica? Come parliamo di LLM e come li usiamo”, utilizza una splendida analogia tra la plastica e la generative AI rispetto all’AI nel suo complesso. È breve, merita la lettura, ma non posso non condividere questa frase che, secondo me, centra il cuore del problema e dell’opportunità che abbia di fronte a noi ma anche la scarsa comprensione della GenAI che abbiamo spesso nelle (grandi) organizzazioni:
"Quando è richiesta una capacità di ragionamento avanzata e verificabile dall'uomo, un approccio basato esclusivamente sugli LLM tende a fallire. Non sorprende che molte delle applicazioni più interessanti viste di recente utilizzino gli LLM come 'collante' tra tecniche più tradizionali. Questa non è ancora la visione dominante, ma potrebbe diventare il modo principale per sfruttare gli LLM nelle applicazioni aziendali: non come motore principale, ma come tecnologia abilitante che conferisce superpoteri ai sistemi esistenti."
Questa riflessione si collega al concetto di Hybrid AI, che cito spesso (forse troppo!) in questa newsletter.
2. Menlo Ventures
Il secondo report arriva da Menlo Ventures e si intitola “2024: The State of Generative AI in the Enterprise”. È il miglior approfondimento su questo tema che ho letto di recente. Tra i tanti spunti interessanti, ne evidenzio due. Il primo riguarda i casi d’uso dominanti della generative AI in azienda, accompagnato da un’immagine chiave che ti condivido.
Il secondo è più “contrarian” rispetto al pensiero dominante e ai dati attuali sul mercato del lavoro. Fa parte di tre previsioni finali (anche le altre due sono da leggere). Questa, in particolare, si intitola (tradotta con l’aiuto di un’AI 😉): “Nessun sollievo in vista: la siccità di talenti dell'IA si intensifica.”
3. Accel
Il terzo e ultimo è un report del fondo Accel dal titolo “AI eating software”. Il titolo non rende giustizia all’ampiezza dei temi trattati: un quadro unico degli investimenti, partendo dai dati Nasdaq, che poi evolve in scenari futuri interessanti per i software SaaS, strumenti che utilizziamo ogni giorno nelle nostre organizzazioni. Anche qui, condivido un’immagine particolarmente significativa della loro analisi.
Se poi sei interessato a discuterne anche dei tanti spunti che ho trovato interessanti in questi report scrivimi (o commenta la newsletter). Sono curioso di sentire il tuo parere!
🖐️Tecnologia (data engineering). Marimo: Il futuro dei notebook Python che ogni data scientist deve conoscere
Se vuoi migliorare la tua esperienza con Jupyter Notebook, uno degli strumenti più usati dai data scientist (e non solo) per scrivere codice e fare analisi, devi assolutamente provare Marimo. Questo progetto open-source si presenta, con buone ragioni, come "il futuro dei notebook Python".
Marimo è un notebook reattivo per Python, progettato per rendere lo sviluppo più interattivo e migliorare la gestione dei dati. Una delle sue caratteristiche principali è il salvataggio dei file in puro formato Python (.py), il che facilita l'integrazione con sistemi di controllo versione come Git e consente di eseguire i file come script indipendenti.
L’esecuzione reattiva è un vero game-changer: quando modifichi una cella, Marimo aggiorna automaticamente tutte le celle dipendenti, mantenendo coerenza tra codice e output. Questo riduce drasticamente gli errori legati allo stato del notebook. Inoltre, rispetto ai notebook tradizionali, Marimo offre componenti UI come slider, tabelle e grafici interattivi, rendendo l’esplorazione dei dati più intuitiva e dinamica.
Dalle mie prove, ho trovato Marimo particolarmente utile per chi scrive molto codice, grazie a funzionalità avanzate come:
Integrazione con GitHub Copilot.
Completamento automatico e tooltip.
Keybindings in stile Vim.
Formattazione del codice più simile a quella di un vero IDE.
Anche la gestione delle librerie è stata migliorata rispetto a Jupyter Notebook. Marimo supporta i principali gestori di pacchetti e può serializzare i requisiti direttamente nei file del notebook, permettendo la creazione di ambienti virtuali isolati per garantire la riproducibilità.
Nonostante la sua versatilità, credo che Marimo sia più adatto a utenti esperti, già abituati a lavorare con notebook, piuttosto che a chi è alle prime armi. Per questi ultimi, consiglio ancora di partire con Jupyter Notebook o con la versione cloud offerta da Google Colab.
A novembre 2024, Marimo Inc. ha annunciato un finanziamento seed di 5 milioni di dollari, guidato da AIX Ventures, con il supporto di nomi illustri come Jeff Dean (Google), Clement Delangue (Hugging Face) e Anthony Goldbloom (ex-Kaggle, Sumble).
Rimanendo sulla tecnologia e sulle sfide che la Generative AI pone nella gestione delle pipeline di dati, ti segnalo un interessante articolo che analizza come i sistemi tradizionali di elaborazione dati siano spesso inadeguati per i carichi di lavoro del machine learning moderno. Questo vale soprattutto quando si tratta di dati multimodali come testo, immagini, audio e video. Lorica e Wampler, nell’articolo, evidenziano le criticità osservate in molte aziende. Il futuro dell'AI Generativa non dipenderà solo dal miglioramento dei modelli, ma anche dalla nostra capacità di costruire infrastrutture dati robuste e adattabili. Per le aziende che investono nell’AI, affrontare questa sfida infrastrutturale è cruciale per il successo dei progetti.
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Product Manager, l’AI non ti sostituirà (ma chi la sa usare sì)
Un product manager, secondo una definizione che condivido, è un ruolo aziendale il cui obiettivo è “fornire un impatto sul business, mettendo insieme le risorse del proprio team per identificare e risolvere i problemi più importanti per i clienti”. Mi piace (di più) il termine product owner, ma so che, insieme alle metodologie agili, non è più così trendy. In molte realtà, i due ruoli coesistono: il primo con una connotazione più strategica e orientata al mercato, il secondo più tattico e operativo verso il team.
Non è però questo il focus di questa sezione, quanto piuttosto una riflessione su come l’intelligenza artificiale stia diventando sempre più di supporto anche per questa funzione aziendale. L’articolo che ti consiglio di leggere per approfondire l’argomento in modo pragmatico ha un titolo un po’ “markettaro” e poco in linea con il contenuto effettivo: “How close is AI to replacing product managers?”. In realtà, non si parla affatto di sostituzione, ma di quanto l’AI possa già ora essere utile al ruolo del product manager in tre delle sue attività più strategiche: sviluppare una strategia di prodotto, definire i KPI, stimare il ROI di un’iniziativa.
L’articolo racconta come è stata realizzata una simulazione e il confronto su queste tre attività. In due casi su tre, una giuria di umani, pur sapendo distinguere chi aveva svolto il lavoro, ha decretato migliore il risultato ottenuto da un’AI generativa. Anche se non è un’analisi esaustiva, la trasparenza e il dettaglio del processo con cui è stata realizzata lo rendono molto utile per chi si occupa di sviluppo prodotti: un’opportunità per comprendere lo stato dell’arte del supporto AI alle attività quotidiane.
Particolarmente apprezzabile è la parte finale dell’articolo, dove vengono spiegati e riportati i prompt utilizzati, con dettagli su come sono stati costruiti e migliorati. Se sei un product manager, non finirai questa lettura terrorizzato all’idea di essere sostituito da una macchina. Forse, però, comincerai a preoccuparti di chi saprà usare l’intelligenza artificiale meglio di te… 😉
👀 Data Science. La magia della data visualization: Florence Nightingale e altre meraviglie storiche
Back to 24
Tre anni fa avevo condiviso il link a questa mostra virtuale, ospitata dal sito della Stanford University e organizzata dal talentuoso data-storyteller americano RJ Andrews. All’epoca aveva riscosso un enorme successo, diventando di gran lunga l’argomento più apprezzato nella puntata 24 della newsletter.
Dato che la mostra è ancora online, voglio riproportela oggi, mettendo in evidenza alcune infografiche dell'infermiera e statistica britannica Florence Nightingale.
Grazie al celebre diagramma a rosa (te ne riporto uno dei tre presenti nella mostra), Nightingale illustrava l’efficacia di alcune misure sanitarie confrontando i dati di mortalità negli ospedali prima e dopo un determinato intervento. Se vuoi sapere qualcosa in più di Florence Nightingale ti consiglio di ascoltare il bellissimo contributo di
Come scrivevo tre anni fa, questa mostra è un promemoria importante: la data visualization, cioè l’arte di presentare i dati in modo visuale, non è certo nata di recente. Esplorando le opere, puoi renderti conto di come questa disciplina affondi le radici nel passato e scoprire che molte tecniche moderne derivano da esperienze storiche.
La mostra raccoglie infografiche straordinarie, realizzate in tutto il mondo tra il 1730 e il 1900, organizzate e narrate magistralmente in sei sezioni monografiche. Non voglio rubarti altro tempo: ti consiglio di immergerti nella visita e lasciarti ispirare!
👅Etica & regolamentazione & impatto sulla società. Dall’overload informativo alla crescita personale: i consigli di Anne-Laure Le Cunff
Siamo inondati di dati e informazioni in modo sempre più intenso. Addirittura, Brain Rot è diventata la parola che descrive il risultato più estremo (o forse il lato più negativo) di questa situazione. Secondo l’ormai ventennale scelta della Oxford University Press, Brain Rot è la parola che più di tutte riassume l’anno che sta finendo. Come spiega Il Post, nella definizione data dai linguisti di Oxford, Brain Rot è «il presunto deterioramento dello stato mentale o intellettuale di una persona, specificatamente come risultato di un consumo eccessivo di materiale (in particolare contenuti online) considerato superficiale o poco stimolante».
Per evitare proprio il brain rot :-) ti suggerisco la lettura di un post delle mie neuroscienziate preferite, Anne-Laure Le Cunff, che parla di come praticare al meglio la lettura attiva. Come scrive la Le Cunff:
“La lettura attiva non serve solo a migliorare la comprensione, ma a trasformare il modo in cui interagiamo con la conoscenza. Leggendo non solo con gli occhi, ma anche con la mente, possiamo trasformare ogni volta che leggiamo in un'opportunità di crescita.”
I dieci consigli che fornisce nel suo articolo sono tutti molto pratici. Nel mio percorso di miglioramento dell’apprendimento, li ho provati tutti, e devo dire che, a seconda del tipo di materiale (libro, articolo, post sui social…), ognuno si è rivelato utile. Tra questi, il numero sette (Organize the information visually) e il numero dieci (Summarize the ideas) sono i miei preferiti, quelli che uso con maggiore costanza. Inoltre, molti di questi dieci consigli possono essere agevolati dall’intelligenza artificiale generativa.
Ognuno, poi, sviluppa le proprie tecniche in base ai propri processi di apprendimento e inclinazioni personali. Per me, ad esempio, scrivere questa newsletter è un modo fondamentale per esercitare la lettura attiva. Ne ho parlato in modo più approfondito nel numero 100.
E tu? Quali sono le tue tecniche personali, diverse dalle mie o da quelle descritte da Anne-Laure Le Cunff? Se ti va, condividile nei commenti o scrivimi direttamente: sono davvero curioso di scoprirle! 🙂
Dal momento che è l’ultima newsletter prima di Natale: Auguri!
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!
l'analogia con la plastica è meravigliosa
Intanto buone feste Stefano. Riguardo ai report citati volevo chiedere se secondo te sono applicabili alla realtà italiana, e poi ero curioso di capire se effettivamente tutte le applicazioni citate nel report di Accel sono usate anche da noi.