Ciao,
sono Stefano Gatti e questo è il ventiquattresimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del ventiquattresimo numero:
🖐️Tecnologia (data engineering). Bloom: a Open-Source GPT-3 competitor!
È stata rilasciata da poco la prima versione di Bloom, acronimo di BigScience Large Open-science Open-access Multilingual Language Model. È un modello linguistico, simile al più famoso GPT-3 per funzionalità e struttura, sviluppato da una collaborazione aperta promossa da HuggingFace, azienda famosa per la sua community dove è possibile sviluppare, addestrare e ospitare modelli di machine learning, alcune istituzioni francesi e ricercatori indipendenti. Al di là delle sue performance, che andranno valutate nei prossimi mesi, ma che puoi già provare in anteprima qui, sono tre le dimensioni più interessanti del progetto: il tipo di collaborazione aperta tra pubblico e privato che ha coinvolto anche l’uso di ingenti risorse hardware per l’addestramento del modello, il tipo di licenza che impedisce il suo utilizzo per attività di polizia, giustizia e in generale per processi che possano impattare i diritti individuali e il rilascio open source del modello stesso.
👀 Data Science. Data Visualization and the modern imagination
“There is a magic in information graphics …” così cominciava uno dei libri più importanti, scritto nel 1939, da Willard Cope Brinton pioniere americano della visualizzazione di dati. Non esistevano ancora i moderni computer eppure la data-visualization già esisteva e si intuiva la sua importanza per capire e raccontare i fenomeni del tempo. Per renderti conto di quanto questa arte abbia origini nel passato e scoprire che alcune tecniche usate oggi derivano da esperienze pregresse ti consiglio di perdere qualche minuto nel visitare questa mostra virtuale, ospitata dal sito della Stanford University e organizzata dal bravissimo data-storyteller americano RJ Andrews. La mostra ospita pezzi meravigliosi di quelle che oggi chiamiamo infografiche realizzate, in tutto il mondo, tra il 1730 e il 1900, il tutto organizzato e raccontato benissimo in sei sezioni monografiche. Non voglio rubare nessun secondo in più del tuo tempo perché ti consiglio di dedicarlo solo alla visita!
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Almost entirely good news (for Italy) from DESI2022.
Il Desi, Digital Economy and Society Index, è un report redatto ogni anno, dal 2014 che monitora i progressi degli stati membri nella trasformazione digitale. Gli indicatori sono strutturati su quattro ambiti: Competenze (Capitale umano), Infrastrutture digitali (Connettività), Trasformazione digitale delle imprese (Integrazione delle tecnologie digitali), Digitalizzazione dei servizi pubblici (Servizi pubblici digitali). Complessivamente l’Italia, pur rimanendo nella parte bassa della classifica, è il paese che, negli ultimi 5 anni è migliorato di più, portandosi dalla ventitreesima posizione del 2017 alla diciottesima di quest’anno. Ti consiglio, se non vuoi leggere tutte le 88 pagine del report, di navigare questo grafico che riporta il posizionamento di ciascuna nazione sia per indicatori primari che per sotto-indicatori con una profondità di cinque anni. La notizia più negativa per il nostro paese è che non è migliorata nel primo ambito delle competenze, quelle umane, e in particolare è fanalino di coda nella dimensione degli skills avanzati: purtroppo la cosa non mi sorprende! Interessanti sono anche le sottodimensioni Big Data e Intelligenza artificiale dove si possono scoprire sorprendenti posizionamenti in classifica come quello di Malta, prima in area Big Data, e il Portogallo, secondo in area intelligenza artificiale. Ma lo sappiamo a volte è anche una questione di metrica :-) In questo caso vi invito a verificarla perché, a mio parere, non è di facile e oggettiva misurazione (pag.53 e 54 del report).
👃Investimenti in ambito dati e algoritmi. An italian insurtech start-up for data and technology risks
Non so se Wallife avrà successo ma in un ecosistema, quello italiano, molto complesso per l’innovazione, il fatto stesso che sia riuscita a raccogliere 12 milioni di euro in un Round A è una notizia importante. La cosa ancora più interessante che sta provando a fare Wallife è creare prodotti assicurativi che proteggano dai rischi derivanti dall’innovazione tecnologica e dal progresso scientifico nelle tre aree di genetics, biometrics e biohacking: quindi dal furto di dati che hanno a che vedere con la nostra identità “digitalizzata”. Il primo prodotto che sta per uscire è relativo alla protezione dei dati biometrici (impronte digitali e riconoscimento facciale). Ne usciranno a breve altri … e credo che sia una storia tutta da seguire!
👅Etica & regolamentazione & impatto sulla società. True artificial intelligence for Italian tax checks?
Sarà Vera intelligenza artificiale? Ve.R.A. (Verifica dei rapporti finanziari) è il nome del nuovo software che dovrebbe essere usato a breve dall’Agenzia delle Entrate per rafforzare i controlli sull’evasione fiscale in Italia. I commenti entusiasti di alcune testate giornalistiche parlano di super algoritmo che ci controllerà tutti e che utilizzerà dati non solo di Facebook ed Instagram ma anche di Google Street View. Premesso che non ho trovato queste ultime informazioni nella circolare di Giugno dell’Agenzia delle Entrate rimango comunque perplesso, come cittadino, di quanta poca attenzione venga data ad un tema molto critico e delicato che ci tocca tutti da vicino. Se fossero vere queste informazioni sarebbe interessante capire almeno tre cose: 1) chi ha progettato e programmato Vera, 2) tutti i dati che utilizzerà veramente e 3) un livello minimo (ma sufficientemente tecnico) di trasparenza sull’algoritmo che utilizzerà. Anche il miglior articolo che ho trovato e che vi consiglio di leggere sul tema non è a mio giudizio sufficiente per una tematica così delicata.
Se esiste documentazione ufficiale più approfondita e di dominio pubblico sui miei tre quesiti segnalamela per mia lettura e futura pubblicazione in questa newsletter.
Come ogni quattro puntate della newsletter ho aggiornato, nella mia casa digitale, i link finora condivisi, nel caso te ne sia perso qualcuno!
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!