For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il quarantesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del quarantesimo numero:
👃Investimenti in ambito dati e algoritmi. Start of the month - November 2022. Empatica: health monitoring with an Italian heart
Come ogni mese, sfruttando un’attività che sto facendo per studiare il mercato dell’innovazione e degli investimenti, ti segnalo la start-up internazionale che più mi ha colpito e che ha avuto un funding nel mese. Questa start-up deve lavorare in ambito dati e algoritmi o farne largo uso (avere al suo interno o nelle selezioni in corso un numero significativo di data-expert). Tra le 81 start-up classificate come “data & algorithms” in Novembre (sulle 606 visionate cioè circa il 13,4%) ti segnalo, con doppio “orgoglio” Empatica, un’azienda fondata nel 2011 come spin-off del MIT. Empatica, nel corso di questi anni è riuscita a creare un braccialetto che, grazie ad un algoritmo capace di analizzare in tempo reale dati fisiologici del corpo umano, rileva (non prevede!) un attacco di epilessia in corso avvertendo un parente ed un medico, salvando così molte vite umane. In tempi più recenti Empatica è riuscita a costruire, sfruttando la conoscenza in questo ambito e la sua tecnologia medica indossabile, una piattaforma di monitoraggio di molti parametri biomedici utilizzata oggi dai più importanti istituti di ricerca in ambito medico per il monitoraggio dei loro studi (tra questi anche la Nasa stessa).
Il primo motivo di orgoglio è che tre dei quattro founders sono italianissimi cervelli, non così tanto in fuga visto che una delle tre sedi di Empatica è proprio Milano dove è presente una parte significativa della ricerca e sviluppo. I tre fondatori sono Matteo Lai, Ceo, Simone Tognetti, CTO, Maurizio Garbarino, Chief Software Architect.
Il secondo motivo di orgoglio è che li avevo citati, facendo una chiacchierata con Simone, come caso italiano di successo di utilizzo di dati e algoritmi, nel mio primo libro #AI Expert, che scrissi con Alessandro Giaume nel 2019.
I 26 milioni di dollari dell’attuale round B serviranno a Empatica a fare altra strada e contribuiranno a migliorare la nostra salute e la qualità della nostra vita!
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. AI Play, explained simple!
“L’Intelligenza Artificiale Spiegata Semplice” è una community italiana decisamente grande, più di 25.000 iscritti che operano e/o vogliono approfondire tematiche legate all’intelligenza artificiale. E’ soprattutto dedicata a imprenditori, manager e studenti che vogliono comprendere le tante sfaccettature del nostro mondo, non solo quelle tecniche. Qualche giorno fa è uscito un mio contributo che ho registrato chiacchierando con i due fondatori: Pasquale Viscanti e Giacinto Fiore. Nella chiacchierata ho espresso alcune considerazioni sul presente e sul futuro del mondo dei dati e degli algoritmi visto da una prospettiva aziendale ma con sempre nel cuore i protagonisti di questa lenta e inesorabile rivoluzione: i data-expert. Il materiale a disposizione della community è veramente molto ampio e di assoluta qualità con alcuni contributi eccellenti come quelli di Federico Faggin, Luciano Floridi, Massimo Chiriatti, Stefano Quintarelli e di altri che potete scoprire navigando il catalogo. Se sei interessato ad entrare nella community puoi usare questo coupon, 10GATTI di sconto del 10% sull’abbonamento annuale utilizzabile, ovviamente 🙂, solo con pagamento con carta di credito.
🖐️Tecnologia (data engineering). How to scale using Google Trends with Pytrends
Google Trends è uno strumento molto potente che attraverso informazioni provenienti dal motore di ricerca Google ti può aiutare a misurare la popolarità di determinati argomenti in un determinato momento o luogo. Ma se vuoi ottenere molti dati su un numero grande di parole chiave, il tutto può diventare complicato. Fortunatamente puoi utilizzare una libreria chiamata Pytrends che ti aiuta a ottenere informazioni da Google Trends in maniera automatica. Pytrend è infatti una API non ufficiale per Google Trends e ti permette di velocizzare drasticamente il lavoro di comparazione che viene eseguito solitamente attraverso l’interfaccia web di Google Trends.
Per vedere come funziona in dettaglio ti rimando al contributo di un lettore della nostra newsletter Luca Troso che ha scritto un post molto pratico su questo argomento. Luca ha realizzato, per la nostra community, anche alcuni notebook Colab che ti permettono di vedere il codice e di lanciarlo direttamente dal tuo PC sul cloud di Google.
👀 Data Science. How to visualize our dear data in a simple way
Ci sono tanti modi per visualizzare i dati: come si fa a sapere quale scegliere? Questa è la domanda a cui risponde il primo link di approfondimento di questa settimana nel nostro spazio datascience, dedicato questa settimana alla dataviz. Infatti in Visual Vocabulary puoi partire dal tipo di dato che devi visualizzare (o l’attributo del dato a cui vuoi dare enfasi) e il sito ti suggerisce graficamente il tipo di grafico da usare con alcuni esempi. Ho provato ad usarlo nelle ultime settimane e mi è sembrato molto efficace. Il tutto parte da un progetto ancora più ambizioso di Jon Schwabish e Severino Ribecca, chiamato Graphic Continuum, molto figo!
Il secondo che ti propongo invece, se hai deciso di usare una visualizzazione ad albero, è un’enorme bibliografia visuale di 333 tipologie diverse. La visualizzazione ad albero è una delle aree più studiate della dataviz. Il progetto treevis.net si propone di fornire un riferimento bibliografico, fatto molto bene, a questa ricchezza di tecniche in continua crescita. Offre una panoramica visiva che puoi filtrare per ottenere il sottoinsieme desiderato secondo i criteri di dimensionalità, tipo di rappresentazione e allineamento dei nodi. I dettagli, compresi i link alle pubblicazioni originali, possono essere visualizzati su richiesta. Treevis.net è un progetto di una community che ruota attorno al professor Hans-Jörg Schulz, professore al dipartimento di Computer Science dell’Università di Aarhus in Danimarca.
👅Etica & regolamentazione & impatto sulla società. Jupyter Book a tool to “build” books and to foster open knowledge
Jupyter Notebook, che forse già conosci, è uno strumento basato su un browser che consente agli utenti di creare e condividere documenti che contengono codice, immagini e testo. Il codice in particolare può essere eseguito in tempo reale ormai in quasi tutti i linguaggi di programmazione, originariamente solo in Python. Lo considero un modo straordinario sia per fare esplorazione di dati e di algoritmi, a livello individuale, sia per condividere risultati raggiunti con un pubblico molto eterogeneo, non necessariamente tecnico. Questo strumento ha contribuito alla diffusione rapida della datascience e all’evoluzione del mondo dei dati nell’ultimo decennio. Quello che ti suggerisco oggi è uno strumento, Jupyter Book, anche lui open source che serve per consolidare i tuoi contenuti, scritti in Jupyter Notebook o in un file markdown, in un libro interattivo sul web o in un PDF. Se mi segui da un po' alcuni progetti che ho suggerito sono realizzati con questo strumento come il meraviglioso Coding for Economists. Se hai contenuti, soprattutto se alternano codice e testo, e vuoi pubblicare per avere un maggiore impatto sulla società questo è uno strumento sicuramente a cui pensare! La sua caratteristica principale è la semplicità con cui puoi andare on-line e facilità di accesso di contenuti a tante persone in giro per il mondo. E se anche non hai nulla da pubblicare, come continuous-learner, ti consiglio di guardare la galleria dei progetti già pubblicati perché troverai sicuramente qualcosa di tuo interesse!
Ci sono, per esempio, i materiali di piccoli corsi universitari come questo sulla network datascience, corsi universitari in partenza, manuali per fare buona ricerca, manuali di python per Quants e tanto altro, tutto gratuitamente condiviso in pieno spirito open-science!
Come ogni quattro puntate della newsletter ho aggiornato, nella mia casa digitale, i link finora condivisi, nel caso te ne sia perso qualcuno!
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!