Ciao,
sono Stefano Gatti e questo è il trentatreesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del trentatreesimo numero:
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Where AI can - and can’t - help Talent Management
Il tema della gestione dei talenti è più che mai vivo in tutte le aziende del mondo. Semplificando un minimo, il processo si articola in tre fasi distinte: la loro selezione e attrazione, il loro sviluppo e la loro fidelizzazione all’azienda. Negli ultimi due anni si è assistito ad un incremento di aziende, start-up o aziende innovative, che hanno sviluppato software data and ai-driven per aiutare tutte e tre queste fasi. Nell’articolo che ti propongo dell'Harvard Business Review si entra in dettaglio su come questi software lo stanno facendo con esempi concreti e molto chiari. Inoltre si approfondiscono sia le principali problematiche che HR o chi usa questi software all’interno delle aziende si trova a dover affrontare: il tutto con preziosi consigli di come superare questi ostacoli. Tre brevissime che ti lascio su questo argomento:
1) Se sei curioso di vedere start-up che stanno innovando in giro per il mondo in questo ambito scrivimi (st.gatti@gmail.com) e ti mando una lista curata delle principali aziende che hanno avuto un funding importante in questo ultimo anno.
2) Sugli argomenti più cool del momento inerenti le tematiche dei cambiamenti nel mondo del lavoro e anche del processo di Talent Management ti consiglio di ascoltare questa puntata del fighissimo podcast Hacking Creativity con una bellissima intervista a Silvia Zanella, una delle persone che conosce meglio questi argomenti in Italia
3) La mia esperienza personale di alcuni di questi tool mi fanno essere positivo su quelli che cercano di migliorare e facilitare alcuni processi decisionali in fase di hiring mentre sono più scettico su quelli più generalisti e troppo “rivoluzionari”.
🖐️Tecnologia (data engineering). Almost everything you ever wanted to know about HASH ... at a glance
Una funzione di hash mappa dati di dimensioni arbitrarie in dati di dimensioni fisse. Questa è la definizione più semplice e generale che si possa fornire. Ma il tutto diventa molto più complesso quando questa funzione viene utilizzata per risolvere i numerosi casi d’uso: dalla gestione delle password alla firma di un documento digitale, dalla crittografia applicata ad un database alla mascheratura o tokenizzazione di specifici flussi dati. E l’articolo che ti propongo “the many flavours of hashing” spiega molto bene, da un punto di vista tecnico, i molti tipi di funzioni hash e i relativi casi d'uso, entrando nel dettaglio sulle cose da fare e da non fare, con suggerimenti relativamente agli algoritmi attualmente utilizzati.
Dal momento che la sicurezza dei nostri amati dati si basa sulla corretta scelta e sulla relativa robustezza di queste funzioni se sei un data-expert, magari un data-engineer, non puoi ignorare questi concetti e anche periodicamente aggiornare la tua conoscenza perché è un ambito molto dinamico e critico.
https://xkcd.com/936/
👀 Data Science. Pandas-profiling: quick and easy statistical analysis with Python
Dopo aver caricato un dataset di qualunque tipo la prima cosa che fai è sicuramente analizzare la qualità dei dati e scoprire le relative dimensioni statistiche. Uno degli strumenti migliori e più veloci per farlo, se non la conosci, è una libreria, Pandas-profiling, che in un comando (due considerando la sua importazione) ti fornisce un report di analisi statistica e di qualità di ciascuna variabile e anche le correlazioni esistenti tra loro. Lo trovo uno strumento molto compatto e agile che ti evita molte righe di codice ed è molto più completo del classico comando Pandas describe(). Unica avvertenza se usi Google Colab: al momento attuale devi re-installarla seguendo queste istruzioni.
👃Investimenti in ambito dati e algoritmi. The State of AI 2022
The State of AI è un documento di 114 pagine (slide per la verità) che analizza gli sviluppi più interessanti dell’intelligenza artificiale nell’ultimo anno. È giunto alla quinta edizione essendo nato nel 2018. È realizzato dagli investitori, nell’ambito dell’intelligenza artificiale, Nathan Benaich (di Air Street Capital) e Ian Hogarth (di Plural) che sono anche profondi conoscitori della tecnologia più avanzata legata agli algoritmi. E’ documento fantastico perché collega in maniera unica dati di natura economica sui trend a evoluzioni tecnologiche molto recenti del nostro settore. Ti avverto che non è di facile lettura e molto più sbilanciato sui trend di modelli algoritmici evoluti (deep learning) e all’hardware utilizzato dai sistemi di intelligenza artificiale piuttosto che al mondo dei dati più esteso. La sua lettura (ci vogliono almeno due ore) è un mini corso di formazione unico nel suo genere. Se lo “affronti”, fatti anche aiutare da Google e Wikipedia per non perderti le sfumature tecniche che sono decisamente importanti. Introduzione a parte, è diviso in cinque aree. Provo a darti, nel caso non riuscissi a leggerlo, una super-sintesi di quello che mi ha più colpito con il numero di pagina specifico come possibile tuo puntamento:
Area Ricerca: in una frase “Grande crescita dei modelli di deep learning di tipo Transformer in tutti i settori”. Slide 42 spiega bene il fenomeno. Interessante anche slide 47 che mostra come la ricerca cinese, rispetto a quella americana è più focalizzata sui modelli che hanno come casi d’uso la sorveglianza …
Area Industriale: Largo spazio all’analisi del mercato dei chip per AI in una gara “Nvidia contro resto del mondo” (slide 51-56). Mentre in slide 75 c’è un’interessante analisi delle aree di mercato a più alto uso di AI: Software per le imprese in testa.
Area di Politiche sociali per AI: Un segnale curioso e importante è la crescita di importanza, a discapito di Accademia e Privati come interlocutori stand-alone, dei “decentralized research collectives” che uniscono pubblico, privato e fondazioni in una sorta di consorzi. Strutture che ottengono ottimi risultati come Big Science, Eleuther e in Cina Tsinghua. Vedi slide 84.
Area Sicurezza (dell’AI): tanti spunti! Su tutti la crescita dei talenti che si occupano di questo argomento (slide 98), l’evoluzione dei modelli di Reinforcement Learning from Human Feedback (RLHF - slide 100) e grande focus sull’interpretabilità (slide 103).
Previsioni: si! ne fanno una decina ogni anno e le verificano (e ci prendono abbastanza …). Su questo punto non voglio spoilerarti nulla per il prossimo anno perché se sei un investitore o un amante dell’AI non posso credere che non dedichi qualche minuto a slide 108 dove le raccontano. Io punto sulle previsioni 4,5,9 e tu?
👅Etica & regolamentazione & impatto sulla società. Robots and employment: the eternal and quite predictable dilemma!
L’impatto netto sull’occupazione della robotizzazione delle industrie è qualcosa su cui ci si interroga da decenni e su cui ho letto sia libri che articoli anche recentemente. Non ho certo la risposta definitiva nè tanto meno penso che l’abbia qualcuno oggi sulla terra. Però da data-lover amo chi ne parla con dati alla mano e con un approccio molto socratico. Per questo ti consiglio di leggere questo articolo che fa il punto su cosa sappiamo degli effetti dei robot sull’occupazione e lo fa in maniera precisa selezionando in maniera scientifica i principali studi su questo argomento. Giuditta Mosca, tra l’altro è una giornalista molto preparata sul tema e il progetto guerre di rete è il miglior punto di riferimento in Italia su tematiche di cybersecurity (con al suo interno la meravigliosa newsletter di Carola Frediani).
La mia opinione su questo scottante tema è che non sarà così centrale il bilancio dei posti di lavoro persi (negativo sicuramente) ma quanto saremo bravi a fornire nuovi skill, spendibili in maniera autorevole e dignitosa, a chi perderà il lavoro a favore dei robot. E il tema va allargato a qualunque attività anche non di tipo industriale, argomento molto caldo viste la crescita di importanza dei modelli generativi di cui ho parlato diffusamente nella numero 31 di questa newsletter.
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!
Grazie Stefano per il link!
Mi ha interessato molto lo spunto sull'occupazione, ed anche un po' rasserenato rispetto alle mie personali sensazioni. Vorrei però capire se in questi studi si tiene conto del fatto che i nuovi posti di lavoro generati siano in genere di qualificazione alta, cose che già sta determinando, mi pare, una notevole difficoltà di reperimento. Non è se il tasso di robotizzazione complessiva si alzasse si potrebbe andare incontro a grossi problemi?