For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il quarantatreesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Come ti avevo preannunciato a fine anno ti incomincio a chiedere un parere su qualche novità da introdurre in questa newsletter. Ecco il primo.
Ti piacerebbe che periodicamente, una o due volte al mese, una sezione della newsletter fosse trasformata in un’intervista flash (3/4 domande con risposte brevi) ad un data-lover? Ad una persona, cioè, che lavora, con passione, in una delle cinque aree di in cui è divisa la newsletter. Potremmo chiamarla “Qualcuno di noi …”
Nel caso ti piacesse l’idea e avessi qualche tipologia di domanda da inserire nell’intervista. O volessi “esplicitare” il tuo dipende . Oppure se fossi così entusiasta da voler essere tra i primi a farsi intervistare scrivimi a st.gatti@gmail.com
Se non hai letto le ultime newsletter perché eri in vacanza eccoti i link del numero natalizio e dell’edizione speciale 42 di fine anno.
Ed ora ecco i cinque spunti del quarantatreesimo numero:
👅Etica & regolamentazione & impatto sulla società. Six*2 memos for the next data-visualization times by two Italian Data-Viz Super Stars
Il primo approfondimento di questa settimana è qualcosa che i due autori hanno definito come un “riassunto di ciò che abbiamo osservato e appuntato, una check-list per contribuire ad un futuro più trasparente e aperto della visualizzazione dei dati”. Ma è molto di più di questo! Nel titolo, giocando un po’ con le parole, ho voluto paragonare questo breve saggio, per il mondo dei dati, a quello che è stato “Lezioni americane” di Italo Calvino nel 1985 per la letteratura e per lo scrivere più in generale. Innanzitutto Data memos, così si chiama il saggio, ha tutte le caratteristiche indicate da Calvino: leggerezza, rapidità e visibilità nelle meravigliose immagini che accompagnano le 12 note, e esattezza, molteplicità e coerenza nel testo che accompagna ciascuna immagine. E nelle tesi ci sono tanti spunti su cui riflettere per il futuro di chi lavora con i dati anche in ambiti non strettamente legati alla data-visualization. Del resto Giorgia Lupi e Paolo Ciuccarelli sono due icone (italianissime) del design legato ai dati riconosciute a livello internazionale. Ho avuto il piacere di conoscere Giorgia, il cui sito devi assolutamente visitare, in azione in Italia e conservo gelosamente i suoi libri nella mia biblioteca. In primis il meraviglioso Dear Data, i cui carteggi originali sono stati acquisiti e sono in esposizione al Moma di New York. Paolo, dopo essere stato il fondatore e Direttore scientifico del mitico DensityDesign Research Lab del Politecnico di Milano, sta proseguendo la sua carriera in Università negli Stati Uniti. La ricerca di Paolo si concentra invece su come il design riesce a dare un senso ai dati e alle informazioni per migliorare i processi decisionali, soprattutto nei confronti di persone non esperte e relativamente a questioni sociali complesse e controverse. Buona lettura!
Immagine tratta dal memo numero 9 di “Data Memos”
👃Investimenti in ambito dati e algoritmi. Start of the month - December 2022. Beamery: Talent Lifecycle Management
Come ogni mese, sfruttando un’attività che sto facendo per studiare il mercato dell’innovazione e degli investimenti, ti segnalo la start-up internazionale che più mi ha colpito e che ha avuto un funding nel mese. Questa start-up deve lavorare in ambito dati e algoritmi o farne largo uso (avere al suo interno o nelle selezioni in corso un numero significativo di data-expert). Tra le 53 start-up classificate come “data & algorithms” in Dicembre (sulle 425 visionate cioè circa il 12,5%) ti segnalo Beamery, una piattaforma per gestire tutto il ciclo di vita HR per la gestione dei talenti all’interno delle organizzazioni, che con i 50 milioni di finanziamento del round D è diventata un unicorno. In questo round ha anche aumentato la sua recente valutazione del 25%, cosa non così frequente, in questi ultimi mesi, e tangibile dimostrazione di salute.
Te la segnalo per due motivi:
1) I software che gestiscono processi HR, all’interno delle organizzazioni, sono fra i più frammentati e difficili da usare in assoluto. E’ quindi un’area che ha grande bisogno di innovazione, di integrazione dei vari sistemi e di efficienza. In questo senso i dati e i sistemi intelligenti di integrazione sono il cuore di questa trasformazione di cui si incominciano a vedere i primi segnali. Settore, quello di gestione del ciclo di vita delle risorse umane in azienda, che a causa della pandemia e della crescente difficoltà di trovare e fidelizzare i talenti è sempre più strategico.
2) Beamery sembra fare tutto questo molto bene, non solo in termini di sviluppo del proprio business, ma anche per come usa dati e algoritmi per suggerire azioni, arricchire profili e consigliare candidati. Li conoscevo già per i contenuti che pubblicano regolamente su tematiche legate all’uso di dati e algoritmi in ambito HR, a cui ti consiglio di dare un occhio soprattutto se hai a che fare con queste problematiche in azienda.
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Decoding Data Mesh
Zhamak Dehghani, la creatrice del paradigma data-mesh, “definisce il data-mesh come un cambiamento socio-tecnologico, un nuovo approccio al modo in cui raccogliamo, gestiamo e condividiamo i dati per fini analitici. Data-mesh NON è una soluzione tecnica o un sottoinsieme di tecnologie: è un paradigma organizzativo per la gestione e l'operatività dei dati, composto da diverse tecnologie, sia open source che SaaS.”
Questo è l’inizio dell’articolo che ti propongo oggi e che ho trovato veramente interessante perché chiarisce in maniera semplice alcuni concetti chiave di cosa è e cosa non non è data-mesh direttamente dalle parole di chi lo ha creato.
Se vuoi cogliere tutti i dettagli puoi anche ascoltare l’ora di gradevolissima conversazione da cui è tratto l’articolo, dove tre grandi esperte di dati, Zhamak Dehghani, Lena Hall di Microsoft e Barr Moses di Monte Carlo Data, parlano del nostro mondo e non solo di Data-Mesh.
Quello che mi piace di Data-mesh, lo si evidenzia bene alla fine dell’articolo, è la spinta verso la decentralizzazione e la democratizzazione del dato e delle relative piattaforme che si sposa molto bene con quella cultura del dato che deve aiutare a superare quei contrasti, presenti nelle organizzazioni, tra team diversi e anche tra ruoli diversi all’interno degli stessi data-experts. E per finire un concetto importante che emerge nella discussione e che ti chiedo di non dimenticare: data-mesh non ha nulla a che vedere con la data-virtualization e non è legato a nessuna tecnologia in particolare anche se l’impostazione che, recentemente, alcune tecnologie hanno adottato può facilitarne l’adozione.
🖐️Tecnologia (data engineering). Learn by playing but mind the addiction! 😀
Uno dei modi migliori per imparare è attraverso il gioco e il divertimento. Anche per la tecnologia e in particolare per imparare a programmare, o a stare in allenamento, vale lo stesso principio. Per questo, dopo il riposo festivo, ti propongo tre sfide a colpi di codice.
La prima e la più popolare è Advent of Code, una serie annuale di sfide a tema natalizio, quest’anno si parla di elfi, che coprono crescenti di livelli di competenza e che possono essere risolti utilizzando qualsiasi linguaggio di programmazione.Ciascuna sfida viene messa in linea durante i giorni dell’avvento e i partecipanti competono anche in base alla velocità di risoluzione su una classifica globale.I partecipanti guadagnano una stella d'oro per ogni parte completata, per un totale possibile di due stelle al giorno e cinquanta stelle all'anno. Mi raccomando 🙂 non usare GitHub Copilot o ChatGPT perché queste sfide servono per divertirsi & imparare! In realtà vengono utilizzate anche per selezionare i migliori programmatori, come racconta MIT Technology Review in questo articolo pieno di storie e spunti gustosi proprio su Advent of Code.
La seconda sfida che ti suggerisco, proprio perché molto allineata allo spirito della nostra newsletter, è Hanukkah of Data. Ci spostiamo in questo caso nel mondo ebraico perchè la parola hanukkah significa «inaugurazione»: infatti la festa commemora la consacrazione di un nuovo altare nel Tempio di Gerusalemme a seguito della conquistata libertà dagli Elleni nel II secolo a.C. La festività dura 8 giorni e la prima sera inizia al tramonto del 24 dicembre. Tornando alla sfida, formata proprio da 8 enigmi, è molto incentrata sulla capacità di lavorare nel mondo dei dati e il tutto è anche risolvibile usando solo SQL e un database. Non ha la stessa gradualità di complessità che è invece presente in Advent of code (anche la sfida numero 1 non è banale) e bisogna stare anche molto più attenti agli indizi presenti nel racconto della storia in cui si è immersi.
Come terza sfida , visto che ti è piaciuto molto CalmCode.io, ti segnalo che all’interno di questo sito è presente un’area dedicata a sfide, a difficoltà crescente che ti mettono alla prova per vedere se hai capito come utilizzare al meglio gli strumenti oggetto delle micro-pillole di apprendimento.
E per finire un avvertimento esperienziale 🙂: questi “prodotti” possono avere effetti collaterali causando dipendenza e notti svegli passate davanti al computer: tienili fuori dalla tua portata se è un periodo in cui soffri di insonnia!
👀 Data Science. Open Learning Algorithms
Non so se sia la più grande libreria open-source di algoritmi esistente ma sicuramente è un progetto che merita la tua attenzione. Si chiama The Algorithms e, come scritto nella pagina principale del progetto, è stato creato da “un gruppo di programmatori che si aiutano nello sviluppare nuovi progetti, che siano complessi programmi di criptazione o semplici cifrari … con l’obiettivo di lavorare assieme per documentare e modellizzare algoritmi belli, utili ed interessanti … assicurando che il codice segua le ultime linee guida di programmazione.” Effettivamente di algoritmi ne trovate veramente tanti dal cifrario baconiano a regressione lineare e logistica. Le implementazioni sono fatte in diversi linguaggi (ce ne sono più di 30) ma Python la fa da padrone. La cosa molto bella è che non è presente solo il codice dell’algoritmo ma anche la spiegazione della logica, il tutto in diverse modalità: da contributi video a esempi pratici commentati. Guarda il mitico algoritmo di ordinamento bubble sort per farti un’idea.
Se non te le senti di andare diritto al codice di come sono fatti gli algoritmi ma vuoi entrare comunque in questo mondo ti consiglio vivamente di dare un’occhiata allo stupendo MOOC (corso on-line) gratuito che la community della libreria scikit-learm ti ha messo a disposizione. Ha proprio l'obiettivo di insegnare il machine learning con scikit-learn ai principianti, anche senza un forte background tecnico!
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!