Ciao,
io sono Stefano Gatti e questo è il quattordicesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del quattordicesimo numero:
🖐️Tecnologia (data engineering). Data-centric AI
Gli ultimi 10 anni di evoluzione dell’AI sono stati sicuramente caratterizzati dal Deep Learning. I prossimi 10, secondo Andrew Ng, uno dei più importanti esperti mondiali, saranno caratterizzati dall’attenzione al dato e alle tecniche di miglioramento della sua qualità soprattutto dal punto di vista ingegneristico. Per questo ha creato il movimento “data-centric AI” e nel sito in 2 minuti spiega molto bene cosa intende in concreto. Sono fortemente d’accordo con lui e credo che se sei un data-engineer (o un data-lover) sia molto importante conoscere il tutto e in particolare le tre aree che sono descritte come strategiche: il data labelling & crowdsourcing, la data-augmentation e il data-deployment, ovvero il debito tecnico visto dalla prospettiva dei dati e non solo, come siamo abituati, del software. Ognuna di queste aree è spiegata molto bene e in maniera pratica, da tre esperti che le cose le hanno fatte!
👀 Data Science. Data Science in context by four giants
E’ l’ultima bozza prima della stampa, da parte della Cambridge University Press, di un libro sulla data science applicata nei diversi ambiti settoriali. E’ scritto da quattro giganti (Alfred Z. Spector, Peter Norvig, Chris Wiggins, Jeannette M. Wing) che hanno avuto e continuano ad avere posizioni di rilievo sia in ambito accademico (Stanford, Columbia University, Berkeley) che in ambito aziendale (Google, New York Times, IBM e diverse start-up). Unisce informazioni di carattere generalista sulla data science (definizioni e storia) a informazioni di implementazione nei vari ambiti industriali non dimenticando approfondimenti tecnici e check-list utili in concreto in qualunque progetto di data science. Ne ho lette alcune parti e ha tutte le possibilità di diventare un riferimento e un best-seller nel settore. Non mi farei sfuggire l’occasione di scaricarlo gratis e dare un’occhiata alla parte iniziale in cui si dettaglia molto bene la struttura e consente una lettura mirata per argomenti di interesse.
👃Investimenti in ambito dati e algoritmi. AI: Artificial Investment Framework
Questa settimana nella mia casa digitale ho pubblicato un articolo che cerca di inquadrare il tema degli investimenti sul tema intelligenza artificiale andando oltre la vista dei soli investimenti di tipo economico. In estrema sintesi non ci sono solo i fondi di investimento a dedicare tempo e denaro ma ci sono anche imprenditori, privati cittadini e istituzioni che hanno un ruolo primario in questo ambito. Forse l’ho presa troppo alla larga ma se mi dite cosa ne pensate (scrivetemi senza timore!) ho modo di modulare al meglio gli altri capitoli sul tema!
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Tech-Layoffs 2022
Non sono più momenti d’oro per chi lavora nella parte tech (& data) negli unicorni o delle aziende che hanno avuto grossi finanziamenti o IPO importanti negli ultimi anni. In questo articolo crunchbase parla proprio dei tagli di personale in queste aziende e condivide un piccolo database di dati sui tagli stessi. Credo sia utile vederlo e leggere i nomi di queste aziende per farci un’idea della estensione del fenomeno. Non è facile gestire i momenti di crisi allo stesso modo dei momenti dei mirabolanti funding frutto di valutazioni forse eccessive!
👅Etica & regolamentazione & impatto sulla società. Visualizing data breaches
Se non conoscete VisualCapitalist, una delle testate migliori al mondo nel visualizzare e spiegare molto bene con dati fenomeni complessi e ad alto impatto sulla società: solo per questo dovete cliccare il link che vi propongo!. Poi il tema data breaches è un tema critico a cui ci siamo “troppo” abituati come utenti. Tra l’altro leggendo al volo le infografiche e il testo che le accompagna si scopre che nel 2021 si è raggiunto il triste primato di quasi un dato rubato per ogni abitante della terra (sono stati circa 6 miliardi di record) e che i dati classificati come Web-data (principalmente le nostre tracce digitali nella rete) rappresentano più del 50% dei volumi dei data breaches. Non è molto strano anche perché sono quelli più difficili da proteggere!
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!