For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il centoventunesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del centoventunesimo numero:
🖐️Tecnologia (data engineering). Le sfide del possibile futuro “decennio robotico”
Ti parlo spesso di quanto sia ottimista sul futuro della robotica e di come scommetta su una sua evoluzione rapida nei prossimi 10 anni, grazie anche all’intelligenza artificiale generativa. Ne ho parlato, dal punto di vista degli investimenti e delle start-up che stanno cercando di innovare, in una recente edizione proprio di questa newsletter.
Oggi, però, ti suggerisco alcuni approfondimenti più tecnici su alcune sfide che chi lavora in quest'area deve affrontare per realizzare l’evoluzione rapida che credo possa avvenire.
In primis, ti consiglio questo articolo di Nature che descrive queste sfide, con riferimenti a chi le sta affrontando con maggior successo. Non sorprende che il tema dei dati di addestramento sia centrale, poiché a differenza dei large language model, la quantità di dati disponibili è decisamente più bassa. Tuttavia, sembra che i dati relativi a video e a realtà virtuale possano attenuare il problema.
Il secondo approfondimento riguarda l’evoluzione delle piattaforme di sviluppo dell’hardware necessario a supportare questa crescita. In particolare, l’articolo parla dell’annuncio di NVIDIA della nuova piattaforma informatica chiamata Jetson Thor, basata sul sistema su chip (SoC) Thor di NVIDIA, parte della nuova architettura GPU Blackwell, che dovrebbe alimentare la prossima generazione di robot umanoidi. Inoltre, Nvidia sta lavorando anche al Progetto GR00T (acronimo di "Generalist Robot 00 Technology"), che mira a creare una mente “intelligente” per i robot, consentendo loro di apprendere abilità e risolvere vari compiti velocemente.
Ti lascio con un dubbio, che peraltro è discusso anche nei due approfondimenti che ti ho suggerito: sarà la robotica umanoide il futuro “prevalente”? Non lo darei per scontato, ma se useremo l’approccio di simulare il comportamento umano, come abbiamo fatto con gli LLM, questa strada sembra la più probabile. Cosa ne pensi?
👃Investimenti in ambito dati e algoritmi. Dai big data al Nasdaq: Abraham Thomas e e i data businesses
Per la parte dedicata a rispolverare le sezioni più interessanti dei passati numeri de “LaCulturaDelDato”, basandomi sui clic ai link che avete fatto e che ritengo ancora significative, questa volta, per il numero 2 de “LaCulturaDelDato”, vince a mani basse “The Economics of Data Business” di
. ha creato Quandl, diventata leader mondiale degli “alternative data” e poi venduta al Nasdaq, l’azienda che gestisce l’omonimo mercato borsistico. Ma ha fatto anche il manager in Hedge Fund e oggi fa prevalentemente l’investitore. Nessuno meglio di lui ha saputo descrivere in un articolo cos'è veramente un'azienda che basa il suo core business sui dati (un data business) e in che cosa è differente questa tipologia di azienda da altre che pur usano dati in maniera molto importante nei loro prodotti e servizi.Abraham scrive poco ma tutto quello che scrive va letto: è un po’ una sorta di produttore di distillati rispetto ai tanti vignaioli in circolazione 🙂. Tra l’altro, abbiamo avuto anche la fortuna di averlo come ospite, per una chiacchierata, all’interno dell’edizione inglese del libro che ho scritto insieme ad
ed è stato molto bello!👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Culture artificiali o meglio ibride …
"Utilizzando il caso di studio dei computer nel gioco degli scacchi, esaminiamo il legame tra la simulazione supportata dall'IA e l'apprendimento nelle interazioni ad alto contenuto strategico. È plausibile che l'IA democratizzi le opportunità di apprendimento delle interazioni strategiche e, potenzialmente, più ampiamente sociali. Se così fosse, l'IA potrebbe cambiare le carte in tavola ben oltre il gioco degli scacchi. Sebbene ci si sia spesso chiesti se l'IA sostituirà gli esseri umani, il nostro studio suggerisce che un cambiamento più imminente potrebbe essere che gli esseri umani con l'IA sostituiranno gli esseri umani senza IA."
Lo studio che ti consiglio di leggere oggi propone una lettura, molto guidata da dati e dai modelli, della recente evoluzione del gioco degli scacchi da una prospettiva molto umana. Infatti, se sei diversamente giovane come me, ricordi che alla fine dello scorso millennio, dopo la famosa vittoria nel 1997 nella sesta partita della sfida Uomo Vs Computer da parte di Deep Blue contro l’allora campione del mondo Kasparov, molti decretarono la fine del gioco degli scacchi. Ciò non avvenne non solo grazie alla più recente serie Netflix “La regina degli scacchi", ma soprattutto perché i “giocatori artificiali” hanno “effettivamente aiutato i giocatori di scacchi a migliorare, sostituendo, quando non era possibile averli, i compagni di allenamento umani... pur non essendo un sostituto perfetto, poiché i giocatori che si allenavano con loro non erano esposti e quindi non imparavano a sfruttare gli errori idiosincratici ("umani")”.
In questo senso, quello che stiamo incominciando a vivere all’interno delle nostre organizzazioni è proprio la convivenza con un numero sempre maggiore di intelligenze non umane, e quindi una cultura aziendale che sarà un ibrido tra quella umana e quella delle macchine. Il tutto in un mondo dove sarà sempre più vera, come sostiene anche l’approfondimento che ti ho segnalato oggi, la “mia” disequazione del futuro 🙂
👀 Data Science. Da Pandas a Calamine: il benchmark che aiuta il caricamento dei tuoi dati Excel in Python
Caricare i dati il più velocemente possibile e nel miglior modo possibile è un aspetto importante e troppo spesso trascurato. È cruciale per molti motivi, a seconda della tipologia del progetto che stai realizzando. Nei progetti complessi, dove il caricamento dei dati è ripetitivo, questa fase è delicata e fondamentale per rendere efficaci e tempestive le fasi successive. Quante volte ti è capitato di avere analisi o azioni bloccate in attesa del caricamento dati che non è andato a buon fine? Anche nei progetti meno complessi e ripetitivi, su cui magari lavori da solo, questa fase è comunque delicata perché devi ripeterla più volte. Soprattutto se ti trovi o ti sei trovato in questo secondo caso, l’approfondimento di oggi ti può essere molto utile perché potrebbe ridurre di quasi 10 volte l’attività di caricamento dei tuoi dati se stai usando un formato Excel.
Infatti, Haki Benita, un data-expert che ti consiglio di seguire, in questo post che ti suggerisco, fa un benchmark molto dettagliato e preciso di 8 modi diversi per caricare dati Excel in Python. Tra Pandas e Calamine, rispettivamente il meno e il più performante, esiste una differenza di quasi 10 volte in termini temporali su un file di 500 mila record. Il benchmark non riporta solo le tempistiche, ma fa un’analisi importante della qualità dell'importazione, soprattutto sul tema del riconoscimento del formato dei dati e delle funzionalità non solo di lettura che le diverse librerie possono garantire.
Se ti trovi più spesso nel primo caso (progetti complessi e ripetitivi), ti suggerisco di guardare quello che avevo scritto nell’edizione 76 della newsletter, dove commentavo un interessante talk di
👅Etica & regolamentazione & impatto sulla società. Time management (non solo) nell'era dell'AI: consigli di Anne-Laure Le Cunff
Con l’utilizzo sempre maggiore di assistenti personali, in graduale e inesorabile miglioramento grazie alla generative AI, la produttività personale diventa un tema sempre più delicato per tutti noi. Infatti, tutto questo già comporta, e lo sarà sempre più in futuro, un ribilanciamento delle attività che facciamo. E questo non è sempre e solo una cosa positiva, come sembra scontato a prima vista. Per esempio, fare cose noiose o comunque non ad alto impatto strategico può essere anche paradossalmente qualcosa di più rilassante per la mente, da un lato, e più “serendipico” dall’altro. L’approfondimento che ti suggerisco oggi è proprio relativo alla gestione del tempo, cioè al time management, che è qualcosa che va tenuto ancora in maggiore considerazione oggi per non essere totalmente “travolti” dal fatto che, riuscendo a fare più cose, arriviamo senza energia o non troviamo tempo per fare le cose importanti per il nostro benessere presente e futuro.
Anne-Laure Le Cunff, la neuroscienziata autrice dell’articolo, suggerisce tre importanti principi per proteggere (un poco) il nostro tempo e fare (veramente) le cose che vogliamo fare. Il più difficile ma anche, per mia esperienza personale, il più importante è il terzo e cioè te lo cito direttamente:
“Gestite la vostra energia, non il vostro tempo.
Ciò significa che, invece di cercare di riempire il calendario di compiti per sentirsi produttivi, cercate di mantenere il calendario il più libero possibile per consentire un approccio fluido al lavoro. Spostate le cose in base ai vostri livelli di energia. Se sentite uno slancio di energia, potete decidere di usare la prossima ora per fare progressi in un progetto creativo. Se sentite poca energia, potete rispondere ad alcune e-mail non importanti. Questo è possibile solo se c'è abbastanza spazio nel calendario.”
Lo so che cosa starai pensando... e cioè che non sei certo completamente proprietario del tuo calendario e non è certo colpa tua se te lo riempiono di riunioni Teams 🙂. Ma incominciare a usare la produttività guadagnata (o che guadagneremo) grazie agli assistenti AI per seguire questo consiglio è qualcosa su cui, almeno a livello personale, dobbiamo cominciare a riflettere e a lavorare.
L’articolo merita comunque la lettura anche per tutti gli altri approcci che l’autrice suggerisce di usare e che ha sperimentato a livello personale.
La gestione del tempo è qualcosa che diamo troppo per scontato e su cui dobbiamo ritornare periodicamente nella vita per ripensarla anche sulla base delle variazioni intervenute. E questo approfondimento può essere un’ottima scusa anche a prescindere dalla generative AI.
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!
"...se useremo l’approccio di simulare il comportamento umano, come abbiamo fatto con gli LLM, questa strada sembra la più probabile. Cosa ne pensi?"
Da buon "flaianista" ("fare previsioni è difficile perché riguardano il futuro") e dopo 45 anni in fabbrica credo molto nei robot e nell'AI applicata a loro, ma credo molto meno all'antropizzazione. Le applicazioni di successo, at least so far, hanno seguito la strada della riformulazione del task. Perché la nostra capacità di fare sintesi della conoscenza procedurale basilare (camminare, nuotare, mangiare...) creata in qualche milione di anni di evoluzione resta modesta. Nelle scienze cognitive alla fine il modello del cervello come computer è stato abbandonato a favore della embodied mind. Quando un robot saprà vedere, toccare, annusare una pelle come un conciatore di Santa Croce dell'Arno o di Arzignano...ne riparliamo