Ciao,
sono Stefano Gatti e questo è il trentaduesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del trentaduesimo numero:
🖐️Tecnologia (data engineering). Data lakehouse: the present and future of data architectures
Non sempre “in medio stat virtus” ma in questo caso sembra proprio di sì. Una delle principali evoluzioni architetturali del mondo dei dati nelle grandi organizzazioni, probabilmente anche in quelle non grandissime, è proprio il data lakehouse. Questa tecnologia coglie gli aspetti migliori delle più tradizionali architetture dei datawarehouse integrandole con la maggiore duttilità dei data lake, per gli utilizzi più algoritmici. Ormai ci sono tantissime offerte e relative descrizioni, lato vendor, che illustrano questo nuovo paradigma tecnologico ma ti consiglio un semplice e completo articolo di Bernard Marr che spiega bene il perché della trasformazione in corso. Non deve sorprendere, ma è importante sottolineare, che ancora una volta alla base di un’importante evoluzione dell’informatica c’è una libreria sviluppata dall’ecosistema open source: Delta Lake. Questa libreria ha facilitato, tra le altre cose, l’alimentazione incrementale dei data lake, in maniera simile a quello che si fa con i data warehouse, riuscendo ad unificare in un’unica piattaforma elaborazione dati in streaming e in modalità batch.
👀 Data Science. Advanced SQL for Datascientists
Se Python è il coltellino svizzero dei linguaggi di programmazione e ormai il linguaggio di gran lunga più diffuso nel mondo del machine learning il linguaggio SQL è quello più usato quando si parla di analisi dei dati, di estrazione dati e di strumenti di business intelligence. In realtà è molto utile anche nella datascience soprattutto se si conoscono una serie di funzionalità evolute che sono state aggiunte nei suoi ormai quasi cinquant'anni di vita. È questo il tema principale del post di Alberto Danese ma c’è anche altro. Si perchè Alberto oltre a mostrarci alcune funzionalità ai più ignote , me compreso, come cube o max-by o le windows functions per citarne alcune, ci fornisce risorse tecniche e didattiche utilissime per aiutarci a impararle. Il tutto non solo per stupire i tuoi colleghi ma anche per risparmiare tanto tempo!
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Hiring: why more is often less (especially with data teams)
Ravi Gupta non è un HR Manager ma ha scritto un post che tutte le persone che lavorano in HR (e quelle che si occupano di selezionare talenti) dovrebbero leggere. Ravi Gupta è un partner di Sequoia, una delle società di venture capital più importanti al mondo ma è stato anche COO e CFO di Instacart, una delle piattaforme di vendita di alimentari online più grandi in America. Il concetto principale che Ravi esprime nell’articolo è che non sempre assumere tante persone, per un’organizzazione, è una strategia intelligente se non si ha una struttura in grado di facilitare l’ingresso di queste persone e soprattutto se non si è sicuri che i talenti già presenti in azienda siano utilizzati nei progetti a più alto impatto. Gli eccessivi e improduttivi hiring nel nostro mondo di dati e algoritmi che non hanno (sempre) portato ai risultati sperati per quei problemi strutturali di cui si parla nell’articolo ne sono la testimonianza. Cinque sono i consigli che Ravi fornisce. Alcuni, soprattutto il secondo e il terzo, sono di impostazione culturale molto americana. Il quinto, in particolare, lo condivido talmente tanto che mi permetto di farti una traduzione sintetica perché racchiude anche la mia personale esperienza in questo ambito: “ … prendetevi del tempo per andare a caccia di persone eccellenti. Quanti di noi hanno fatto una ricerca di talenti con una società di recruiting e si sono lamentati dopo i primi incontri che i candidati facevano schifo? A me è capitato. Sapete cosa ho imparato? Non era colpa loro! Era colpa mia. Gli head hunter spesso cercano la persona migliore disponibile. Ma le persone migliori sono raramente disponibili. Perché dovrebbero esserlo? Probabilmente sono delle superstar anche nel loro lavoro attuale. Non ci saranno semplicemente nella vostra lista. Dovete andare a cercarle. Chiedete al vostro selezionatore (e a tutti quelli che conoscete) chi sono le persone migliori. Poi incontratele e guadagnatevi il loro interesse per la vostra azienda.” Ma nel post ci sono anche altre esperienze “gustose” che ti consiglio di non perdere.
👃Investimenti in ambito dati e algoritmi. 10 topics for Italian economics and digital development by an Italian Maker (and data and AI matter!) .
Se ti sei perso l’articolo di Vincenzo Di Nicola, uscito il 12 Ottobre su Repubblica, con i 10 consigli suggeriti per uno sviluppo significativo del sistema economico e digitale italiano ti consiglio di recuperarlo. Vincenzo ha una storia importante che ti consiglio di leggere in dettaglio qui. È stato un cervello in fuga e poi è tornato e sta “restituendo” tanto al nostro paese. Ha venduto la sua start-up ad Amazon ed ora è responsabile per l’Innovazione Tecnologica e la Trasformazione Digitale dell’INPS: una storia come dovrebbero essercene molte … Nell’articolo, a cui dovete dedicare almeno 15 minuti, Vincenzo parla di talenti, di istruzione, di industria, di divulgazione e anche di tecnologie fondanti. E tra queste ultime un ruolo centrale lo riserva all’intelligenza artificiale e parlandone fa un buon riassunto degli investimenti che il sistema paese ha fatto in questo ambito negli ultimi anni. Investimenti che seppur non ancora sufficienti è importante conoscere con attenzione e consapevolezza. In particolare Vincenzo cita nell’articolo come vada “promossa la collaborazione con compagnie o startup innovative. È questo quello che abbiamo fatto in INPS …sinergie pubblico-privato in questo settore sono vincenti per il Paese, e vanno incentivate.” E la ricetta che propone non è facile, come scrive nel finale: “Ci si può arrendere al fatalismo, o si può lottare come Arditi con il coltello tra i denti. Io preferisco la seconda: qui ho voluto dare il mio contributo da Italiano ed evidenziare 10 punti su cui intervenire concretamente per innovare e rinnovare l’Italia come un Paese digitale. È facile? Assolutamente no. Si può realizzare? Certo che sì.”
Disclaimer: Vincenzo ha scritto la postfazione del nostro (mio e di Alberto Danese) libro “La cultura del dato” e la mia ammirazione per lui ha anticipato l’uscita dell’articolo :-)
👅Etica & regolamentazione & impatto sulla società. What is AgTech and Why is it important … and something more
AgTech è l'uso della tecnologia e dell’intelligenza artificiale in agricoltura, orticoltura e acquacoltura con l'obiettivo di migliorare la resa, l'efficienza e la redditività per i gestori e i coltivatori delle aziende agricole con attenzione alla sostenibilità climatica di queste attività. È qualcosa su cui dovremmo investire di più non solo economicamente ma anche dal punto di vista dell'educazione all’uso di dati e algoritmi nel settore. Non tutti e non sempre gli agricoltori hanno avuto o possono avere una preparazione a queste nuove discipline ed è un fattore che dovrebbe essere tenuto soprattutto da chi guida gli investimenti pubblici in questo ambito. Ma qualcosa si sta muovendo in giro per il mondo … e a questo proposito per approfondire in che modo l’uso dei dati e dell’intelligenza artificiale concretamente stanno cambiando l’agricoltura vi consiglio questo numero della newsletter del mio amico Ajit Joakar, tra le altre cose direttore di diversi corsi all’Università di Oxford, dove presenta il prossimo suo corso, completamente remoto, “Artificial Intelligence for Agriculture Technology and Climate Change”. Se poi volete fare un approfondimento ancora più tech sul tema vi consiglio di dare un’occhiata alla piattaforma Microsoft dedicata a queste tematiche Farmbives.io: decisamente interessante!
Come ogni quattro puntate della newsletter ho aggiornato, nella mia casa digitale, i link finora condivisi, nel caso te ne sia perso qualcuno!
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!