Ciao,
io sono Stefano Gatti e questo è il quarto numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del quarto numero;
🖐️Tecnologia (data engineering). E’ la più importante classifica di diffusione di database. Db-Engines, come ogni classifica si basa su metriche soggettive ma che trovo trasparenti e condivisibili. Spesso mi ha aiutato a seguire i trend e fare scelte strategiche. Vi suggerisco di non limitarvi alla sola classifica ma esplorate il sito guardando gli approfondimenti per categoria e per tipo di licenza e anche le evoluzioni temporali di lungo periodo di ogni database.
👀 Data Science. Pochi ancora li conoscono. Diventeranno probabilmente molto interessanti soprattutto per datascientist e machine learning engineer: parlo dei Vector Databases. Se andate su Db-Engines non li troverete come categoria a sé ma all’interno dei search-engine e ancora piuttosto indietro in classifica. Il miglior link per approfondirli, se non li conoscete, è quello del sito di Pinecome, un vector database che ha ricevuto da poco 10 milioni di dollari di funding. Esistono anche altre versioni open source anche più diffuse come Milvus e Weaviate. Se state cominciando progetti che hanno a che vedere con ricerca semantica, sistemi di raccomandazione ma anche se state cercando anomalie in basi dati complesse forse è il caso di darci un occhio!
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Uno dei problemi quando si vuole investire nel mondo dei dati, all’interno delle organizzazioni, è come far scalare i team che si occupano di dati. In questo articolo Rob Dearbon propone una sua via che ritiene particolarmente adatta alle start-up. Condividendo molto di quello che scrive e avendo lavorato prevalentemente in grandi organizzazioni penso che questi consigli valgono a prescindere dal tipo di azienda, piuttosto conti lo stadio di maturità dell’azienda stessa relativamente al mondo dei dati. La progressione di crescita 1,2,4,8,16,32 del team, di cui si parla nell’articolo, è molto nerd ;-) ma anche decisamente pragmatica!
👃Investimenti in ambito dati e algoritmi. Non mi colgono totalmente di sorpresa i segnali di rallentamento degli investimenti in start-up che arrivano dalla chiusura del primo quarto dell’anno. Rallentamento significativo (-13%) rispetto a Q4 2021 ma non rispetto alla media del 2021 (sostanzialmente in linea). Quello che, da analisi personali in corso, mi colpisce sono la continuità degli investimenti in due ambiti attigui: l’Edutech e le Applicazioni per la selezione e retention di risorse umane che stimo essere cumulativamente tra il 4% e il 5% degli investimenti totali del primo trimestre 2022. Ed in entrambi i settori dati, algoritmi e data-expert sono decisamente centrali!
👅Etica & regolamentazione & impatto sulla società. Si sente sempre più parlare, per l’impatto crescente sulla società, del problema dei bias nei sistemi che usano algoritmi di intelligenza artificiale. A volte però l’approccio di questi articoli e saggi è troppo astratto e poco tecnico. Il documento appena rilasciato dal NIST, National Institute of Standards and Technology, un'agenzia del governo degli Stati Uniti d'America che si occupa della gestione delle tecnologie, si distingue per buona concretezza. Identifica tre categorie di bias: sistemici, statistici e umani. Oltre a farne, finalmente, una buona classificazione descrive anche le categorie di azioni per mitigarli con esempi pratici. Probabilmente solo dando un’occhiata alla figura 2 del documento vi verrà voglia di approfondirlo. Se poi avete ancora due minuti leggete (pagina 29/77) un esempio pratico dei limiti della trasparenza degli algoritmi nell’eliminazione dei bias …
E per ultima una notizia personale che mi emoziona. E’ uscito ieri il mio secondo libro, scritto con un amico con cui ho condiviso le recenti sfide in ambito lavorativo e non solo: Alberto Danese. Il libro di cui vi lascio sotto l’immagine di copertina, si chiama proprio come questa newsletter. Lo spirito del libro e una sintesi dei contenuti li trovate scritti molto bene in questo post di Alberto di cui condivido anche la punteggiatura :-).
Per finire un piccolo passaggio del libro: l’inizio dei ringraziamenti perché è la cosa che mi emoziona sempre di più!
“Scrivere per me è un viaggio.
Nel passato, nel presente e nel futuro.
Nel passato perché mi consente di metabolizzare le esperienze fatte, esorcizza la paura di perderle e fornisce ulteriore valore ad esse nel presente e nel futuro.
Nel presente perché lo arricchisce e mi consente di capirlo meglio.
Nel futuro perché mi aiuta a provare a ipotizzare scenari e mitigare le ansie del futuro che ci aspetta … “
Se siete arrivati fin qui probabilmente siete molto motivati … e per premiarvi, se volete acquistare il libro, vi condivido un coupon, valido fino a Pasqua, per averlo con un piccolo sconto. Per farlo potete usare questo link e, per la versione cartacea, inserite CDD-DELIVERY ( spedizione gratuita del cartaceo) mentre CDD-EBOOK per lo sconto del 15% sulla versione eBook. Lo trovate comunque online su tutti i siti più noti e “nelle migliori librerie”
e un po’ tutte le altre!
Se hai suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!