Ciao,
io sono Stefano Gatti e questo è il nono numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Se avete letto il libro “La cultura del dato”, scritto insieme ad Alberto Danese, ci lasciate una recensione su Amazon? Potete farlo anche se avete comprato il libro su altri siti o in libreria.
Ecco i cinque spunti del nono numero:
👃Investimenti in ambito dati e algoritmi. - Unicorni che volano
Mi piace molto la definizione di Pegacorn (un unicorno che sa volare) espresso da Ben Lorica in questo post. In un mondo di unicorni sopravvalutati (ce ne sono alcuni che valgono più di un miliardo di dollari ma hanno ricavi per meno di 5 milioni) il Pegacorno è in sintesi un’azienda che ha più di 100 milioni di ricavi e che ha il machine learning, come componente importante, nella sua offerta di prodotto/servizio. Le aziende presenti in lista, in corso arricchimento da parte di Ben su Github, sono sicuramente da tenere d’occhio e se volete contribuire a segnalarne lo potete fare direttamente dal post.
👅Etica & regolamentazione & impatto sulla società. - Un linguaggio tra uomo e AI?
È un tema molto affascinante e centrale per il futuro (non distopico) dell'umanità: l’allineamento tra la sfera di comprensione degli uomini e di quella che definiamo intelligenza artificiale. In questo articolo Been Kim, scientific researcher in Google Brain, prova a spiegare anche in maniera visuale questo problema in modo abbastanza semplice. Oltre ad auspicare la creazione di un linguaggio che possa far comunicare meglio uomini e intelligenze artificiali (un concetto che trovo ancora troppo astratto) Kim racconta quelli che possono i principali strumenti per arrivarci. Scegliere al meglio le metriche (funzioni obiettivo) e migliorare l’interpretabilità degli attuali e futuri algoritmi sono quelli più promettenti ma sicuramente non esaustivi. Il lavoro della Been tra l’altro è alla base di uno dei libri più interessanti usciti negli ultimi anni sull'argomento “The Alignment Problem: Machine Learning and Human Values” di Brian Christian. Warning: quest’ultimo libro non l’ho ancora letto personalmente ma ho solo ottime recensioni. Confido che qualcuno di questa community lo abbia fatto e mi possa ritornare una recensione completa :-)
🖐️Tecnologia (data engineering) - Thread & Process
In molti meeting, anche tecnici, mi è capitato di sentire confondere il termine thread con processo specialmente quando si parla di multithread e multiprocessing (e anche per la verità l’aggettivo parallelo e concorrente). Limitandoci a Python questa è una guida molto approfondita che spiega bene cos'è un thread, cosa è un processo e soprattutto descrive in dettaglio e con consigli pratici e tanto codice il multi-threading che è molto utile se non vogliamo far aspettare troppo i nostri utenti. Anche solo leggendo i paragrafi 1.1. e 1.2 (ci vogliono 3 minuti) vi potete chiarire, per chi non è un data-engineer, i concetti di base.
👀 Data Science - Vedere senza supervisione!
Sembra un passo importante negli algoritmi di visione non supervisionati: si tratta di STEGO (Self-supervised Transformer with Energy-based Graph Optimization). In questo articolo, con la giusta dose di astrazione ma con tutti i link per diverse chiavi di approfondimento, l’MIT lo presenta bene. L’obiettivo dell’algoritmo, semplificando un minimo, è di assegnare un’etichetta ad ogni pixel di una immagine senza usare immagini etichettate da un uomo ma con un meccanismo di autoapprendimento da una libreria di immagini qualunque (ovviamente il più grande possibile …). In alcune applicazioni ad alta criticità (veicoli a guida autonoma) o molto complesse (esplorazioni spaziali) questo miglioramento potrebbe fare la differenza.
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni - Tech leadership
Parlare di leadership non è semplice! Negli ultimi 10 anni nelle discussioni sulle organizzazioni abbiamo assistito ad un passaggio di terminologia da manager a leader che in molti casi è stato più un cambio di parola che di sostanza. Poi entrare nel merito dell’importanza delle hard skill e delle soft skill per un leader è ancora più complesso. Alberto Danese in questo post lo fa molto bene con esempi concreti e con un punto di vista molto preciso, che va oltre la posizione (un po' estremista!) espressa recentemente in un tweet da Elon Musk. Avere hard skill (sul tema della leadership) è una condizione necessaria ma non sufficiente per essere un ottimo leader: le soft skill contano! Ma senza conoscere bene, non necessariamente meglio del team che si guida, il contesto tecnico non si va molto lontano, soprattutto nel mondo dei dati e degli algoritmi!
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!
PS: grazie ai tanti di voi che mi hanno fornito un feedback per come migliorare questo viaggio. Se non lo avete ancora fatto lascio aperta la possibilità ancora qualche giorno! A breve vi farò una sintesi delle indicazioni emerse.