LaCulturaDelDato #018

Dati & algoritmi attraverso i nostri 5 sensi

Jul 16, 2022

Ciao,

sono Stefano Gatti e questo è il diciottesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.

Ecco i cinque spunti del diciottesimo numero:

👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Data & Algorithms & Innovation: not so different twins
Questa settimana vi propongo un mio articolo appena uscito per il magazine bimestrale italiano Agile Italia. Il titolo “Dati & Algoritmi & Innovazione: gemelli vincenti, spesso falliti, ma non troppo diversi!” introduce il tema del fallimento come comun denominatore di progetti che hanno al centro dati, algoritmi e progetti di innovazione. Nell’articolo approfondisco anche come in realtà il tema centrale non sia il fallimento in sé ma tre suoi attributi ed in particolare: il momento in cui si fallisce, la velocità con cui si fallisce e quanto si riesce ad imparare da questa esperienza. Ma c’è anche altro: soprattutto l’esperienza dei miei fallimenti. Se riuscite a leggerlo (ci vogliono 7 minuti!) fatemi sapere cosa ne pensate!

👃Investimenti in ambito dati e algoritmi. Start of the month: June 2022: Multiverse.io
Da questo mese, mensilmente, sfruttando un’attività che sto facendo per studiare il mercato dell’innovazione e degli investimenti, vi segnalerò la start-up internazionale che più mi ha più colpito e che ha avuto un funding nel mese. Ovviamente questa start-up deve lavorare in ambito dati e algoritmi o farne largo uso (avere al suo interno o nelle selezioni in corso un numero significativo di data-expert). Tra le 74 start-up classificate come “data & algorithms” a Giugno 2022 (sulle 506 visionate cioè circa il 15%) vi segnalo Multiverse.io. In realtà Multiverse.io è una start-up edtech ma i numerosi percorsi di formazione su dati e algoritmi e la massiccia presenza di data-expert nel suo team e nelle posizioni aperte la rendono eligibile e vincitrice della segnalazione di questo mese. Il fatto che sia diventata un unicorno (circa 2 miliardi di valutazione nell'ultimo serie D da 200 milioni di $), il founder sia uno dei figli di Tony Blair e abbia un obiettivo molto ambizioso di andare oltre la formazione accademica con una impostazione molto pratica e inclusiva, tutto questo credo sia sufficiente per dare un’occhiata a quello che sta facendo e soprattutto l’offerta che può offrire ad ogni ambizioso data-lover.

🖐️Tecnologia (data engineering). - The complete guide to the modern AI stack
La gestione del ciclo di vita di un sistema di AI/ML è qualcosa di relativamente recente all’interno delle organizzazioni perché solo negli ultimi anni alcuni di questi progetti hanno superato lo stato di proof of concept e sono entrati in produzione. Per questo molti concetti, in primis MLOps, sono spesso più nelle slide dei vendor e dei system integrator che nella pratica dei data-expert. L’articolo di Ayush Patel, founder di una start-up che opera nel settore, descrive tutte le componenti di uno stack moderno di sistemi di machine learning partendo dai troppo trascurati sistemi di data management, che gestiscono tutta la fase di raccolta, trasformazione e analisi del dato, fino alla parte del model management e per finire ai sistemi che supportano la fase di deployment e monitoraggio dei sistemi in produzione. Post essenziale ma completo e ricco di possibili approfondimenti!

👀 Data Science. Deep learning as ‘representation learning’
Se, come scrivevo nel #14, il futuro dell’AI sarà “datacentrico”, il mio amico Ajit Jaokar, professore di un corso di AI all'università di Oxford, ci racconta in questo breve ma denso post su linkedin come, anche nel recente passato, i dati hanno avuto un ruolo fondamentale. Ajit infatti spiega infatti ai suoi studenti il deep learning “as representation learning and characterise it by automatic feature detection” (perdonate la mancata traduzione ma in rari casi credo sia controproducente). E la scelta e la rappresentazione dei dati sono al centro di tutto questo. Ajit ci suggerisce anche la lettura , e ne vale la pena credimi, del famoso “Representation Learning: A Review and New Perspectives”, uno storico ma attualissimo paper di Yoshua Bengio, Aaron Courville, and Pascal Vincent del 2012 che ha contribuito alla rivoluzione degli ultimi 10 anni prodotta dal deep learning in molti ambiti della data science.

👅Etica & regolamentazione & impatto sulla società. Sustainable AI
“La discussione sulla sostenibilità dell'AI merita più accuratezza, più approfondimenti, più controlli e più prove! I costi della sostenibilità ambientale, sociale ed economica dell'AI devono essere affrontati con urgenza dal mondo accademico, dall'industria, dalla società civile e dai responsabili politici, sulla base di prove. Con la prima edizione della nostra rivista SustAIn, speriamo di alimentare questo dibattito.” Questo è l’incipit e le dichiarazioni di intento del primo numero di un Magazine tutto dedicato alla sostenibilità dei progetti e sistemi di intelligenza artificiale. Sostenibilità in senso sociale, ambientale e economico. Gli articoli sono pratici, spiegati in maniera semplice ma non semplicistica e con una grafica molto gradevole (e ci sono anche fumetti!). Viste le molte banalità lette sul tema il progetto è degno di tutta la tua attenzione di data-lover.

Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.

Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!

Alla prossima!

LaCulturaDelDato

LaCulturaDelDato #018

Dati & algoritmi attraverso i nostri 5 sensi

Discussion about this post