For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il cinquantatreesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Prima di cominciare un momento celebrativo “visual” visto che tre bravissime professioniste del graphic recording (a me piace chiamarlo, forse impropriamente, sketchnoting) hanno descritto un mio breve intervento ad un evento molto figo organizzato da Smartive.
Ed ora i cinque spunti del cinquantatreesimo numero:
👃Investimenti in ambito dati e algoritmi. Start of the month - February 2023. Magic.dev: when generative-ai makes magic happen …
Come ogni mese, sfruttando un’attività che sto facendo per studiare il mercato dell’innovazione e degli investimenti, ti segnalo la start-up internazionale che più mi ha colpito e che ha avuto un funding nel mese. Questa start-up deve lavorare in ambito dati e algoritmi o farne largo uso (avere al suo interno o nelle selezioni in corso un numero significativo di data expert). Tra le 77 start-up classificate come “data & algorithms” in Febbraio (sulle 595 visionate cioè circa il 13%, dato stabile rispetto ai mesi precedenti) ti segnalo Magic, una start-up che sta creando un sistema di supporto allo sviluppo software simile a Copilot. Te la segnalo per tre motivi:
Il funding di start-up che fanno leva sulla generative AI è uno dei trend più forti in corso. In una situazione, a livello globale in forte decrescita, (dai miei dati, rilevo feb 23/feb 22 un -50% con il settore dati e algoritmi allineato alla tendenza generale), il sottoambito “generative AI” viaggia sostenuto con crescite mensili importanti.
Il principale finanziatore di Magic è Alphabet tramite CapitalG e questo testimonia come anche in questo ambito il testa a testa tra Microsoft e Google sulla generative AI.
L’obiettivo dell’azienda, cioè il supporto allo sviluppo software, è un tema molto interessante per noi data-lover. Inoltre il funding generoso (23 milioni di dollari per un serie A) e l’autorevolezza del team rendono il progetto sicuramente da seguire.
👅Etica & regolamentazione & impatto sulla società. Massimiliano Nicotra: a Nerd Lawyer
Presentati
Sono un avvocato, un docente universitario e un data protection officer. In realtà mi piace definirmi un avvocato “nerd” perché mi sono avvicinato al mondo dell’informatica sin da bambino con il mio ZX Spectrum e poi con i computer Commodore che amavo smontare e rimontare. Nel mio percorso professionale sono riuscito ad unire la passione per l’informatica alla professione legale, occupandomi sin dall’inizio della mia carriera di materie quali la privacy, la firma digitale e i contratti informatici. L’esperienza in una grossa società informatica pubblica italiana, in un momento, erano gli anni 2000, in cui si stava cercando di costruire la pubblica amministrazione digitale mi ha consentito di essere in prima linea su varie tematiche: dalle banche dati pubbliche all’attività dei certificatori di firma elettronica. Il fatto di riuscire a comprendere il linguaggio tecnico mi ha facilitato molto nel trovare le soluzioni giuridiche per queste nuove sfide. Oggi sono senior partner di Qubit Law Firm, uno studio che si occupa in maniera verticale di diritto e tecnologia e continuo a cimentarmi con curiosità con i linguaggi di programmazione, con qualche slancio anche nell’ambito del project management. Da buon avvocato nerd, da qualche settimana, ho anche una newsletter, the sunday prompt, che ogni domenica fornisce suggerimenti, trucchi e indicazioni per prompt efficaci su ChatGpt
Il mio ruolo tra 10 anni sarà ... (continua la frase come fossi GPT-10) Nell'ambito della consulenza strategica tecnico-legale. Ritengo che il mio ruolo di avvocato debba necessariamente evolvere e che molte delle attività a poco valore aggiunto possano essere automatizzate con strumenti legal tech. Penso infatti che il ruolo dei legali sarà più legato alla creazione di framework metodologici che consentano alle aziende di minimizzare i rischi valorizzando le proprie attività ed alle persone di poter accedere in maniera più semplice alla giustizia.
Quale è la sfida più importante che il mondo dei dati e algoritmi ha di fronte a sé oggi?
A mio parere stiamo vivendo un momento molto particolare, dal punto di vista tecnologico e normativo. La Commissione Europea sembra essersi accorta improvvisamente che esiste il settore digitale e propone regolamenti e direttive per cercare di regolare tutto (MiCA, GDPR, DMA, DSA, AI Act, DGA, Data Act, etc.) mentre, dall’altra parte, le soluzioni evolvono in maniera molto più rapida di quanto possa solo immaginare il legislatore europeo (si pensi solo all’exploit di Chat GPT ed alla reazione, quasi compulsiva, dei relatori dell’AI Act che subito hanno proposto di inserire i modelli generativi tra quelli ad alto rischio). Ecco forse la sfida più grande che abbiamo davanti, intendo come sistema europeo, è quella di trovare un giusto compromesso tra regolazione ed incentivazione all’innovazione, perché come sappiamo tutti l’eccesso di regole può rivelarsi un freno all’evoluzione tecnologica.
Segnalaci il progetto o la risorsa nel mondo dei dati di cui non potresti fare a meno …
Github, Coursera e BigQuery. Github per me è come un luna park educativo, perché imparo tantissimo guardando il codice degli altri e ci sono alcuni repository che forniscono corsi ed informazioni che non si trovano nel resto del web. Coursera è il mio istruttore personale e trovo che i MOOC siano la vera democratizzazione del settore educational: puoi seguire corsi di prestigiose università del mondo quasi gratuitamente rimanendo a casa. BigQuery è una scoperta che ho fatto seguendo il corso di Data Analyst di Google su Coursera: sono rimasto impressionato dalla quantità di dati disponibili, dalle possibilità di integrazione con gli altri servizi Google e da come rende facile l’approccio a SQL e all’analisi dei dati.
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. NIST AI Risk Management Framework: a tool that's overly high level …
Il 23 Gennaio 2023 il Nist, l'agenzia del governo degli Stati Uniti d'America che si occupa di sviluppare standard, tecnologie e metodologie che favoriscano la produzione e il commercio, ha emesso la prima versione dell’AI Risk Management Framework. Non è un regolamento, come l’EU AI Regulation Act, e quindi ha un obiettivo meno prescrittivo e più di supporto alle aziende come orientamento per chi progetta, sviluppa, implementa o utilizza sistemi di intelligenza artificiale ai fini di gestire al meglio i numerosi rischi delle tecnologie AI. Il documento è fatto molto bene e affiancato anche da un ottimo playbook ma soffre del problema tipico dei framework per discipline molto tecniche. E’ molta forma e poca sostanza. Rimane troppo ad alto livello sui contenuti finendo per diventare quasi inutile se non come check-list organizzativa. Come molti documenti di questo tipo acquistano valore se usati da persone che hanno una profonda conoscenza tecnica ed esperienza di dominio. Altrimenti diventano uno strumento inutile anzi quasi dannoso se in mano a chi conosce poco il contesto. E spesso è quello che succede nelle complesse organizzazioni di oggi …
E’ invece piuttosto curioso che, come scrive questo articolo del MIT Technology Review, “un gruppo di 10 aziende, tra cui OpenAI, TikTok, Adobe, la BBC e l'app di incontri Bumble, ha sottoscritto una nuova serie di linee guida su come costruire, creare e condividere contenuti generati dall'intelligenza artificiale in modo responsabile”. Sorprende solo parzialmente se pensiamo che il successo sul mercato delle nuove iniziative che si basano sulla generative AI è anche correlata con il tema reputazionale delle aziende, che li erogano, e dei loro prodotti.
👀 Data Science. A Soccer Analytics Guru and other interesting stuff
Se sei un data-lover e ti piace lo sport ed in particolare il calcio non puoi ignorare Jan Van Haaren, head of data & technology del Brugge, squadra di calcio della serie A belga. Jan è uno dei pionieri europei nell'utilizzo di dati e machine learning nel calcio avendo ricoperto anche diversi ruoli di prestigio in SciSports, una start-up olandese decisamente all'avanguardia nel settore. Ogni anno, sul suo sito, Jan raccoglie una serie incredibilmente vasta di risorse, legate al mondo del soccer analytics: paper di ricerca, blog post, news, podcast, libri, eventi e anche code repository. Non perderti quello di fine 2022 perché è particolarmente ricco di spunti!
Se poi ti piace mettere le mani sui dati relativi allo sport devi dare un’occhio a Pysport, una collezione di librerie open source che ti aiutano ad estrarre valore più velocemente dalle analisi sportive che ti stanno più a cuore. Molte librerie sono scritte per Python ma ve ne sono molte anche per R e per altri linguaggi di programmazione.
🖐️Tecnologia (data engineering).A Database of Programming Languages
PLDB è un database completo dei linguaggi di programmazione e delle loro caratteristiche.
Direi il più completo che conosca visto che ne contiene ben 3477 da Java a Search: un linguaggio per il reperimento e l'analisi statistica delle cartelle cliniche creato negli Stati Uniti nel 1973. Quello che mi ha colpito è però la ricchezza di informazioni che sono associate ad ogni linguaggio: link a tantissime risorse esterne molto formative e informative, una finestra dove si può provare il linguaggio stesso e una dettagliate lista delle sue caratteristiche. Il progetto ha anche un ranking di tutti i linguaggi presentati con una logica di costruzione esposta in maniera trasparente. Su questo ultimo aspetto preferisco però usare il Tiobe index che ti avevo presentato nel numero 5 di questa newsletter. Ultima curiosità, se mai ti servisse 🙂, il gruppo di progetto di PLDB può aiutarti a costruire un linguaggio specifico per il dominio di tua scelta!
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!