For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il sessantottesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del sessantottesimo numero:
🖐️Tecnologia (data engineering). Redefining Python Learning: A Unique Blend of Computational Thinking and Grammar
"Imparare un linguaggio di programmazione è come apprendere una lingua. Quando si studia una nuova lingua (come il francese, il coreano, ecc.), di solito ci si concentra su due componenti chiave: un modo di pensare - spesso legato a una cultura - e la grammatica, ovvero come organizzare gli elementi del discorso (verbi, nomi, ecc.) per creare frasi coerenti. Generalmente, ciascuno di questi aspetti ha un proprio libro dedicato… I manuali per apprendere i linguaggi di programmazione solitamente seguono la struttura di un libro di grammatica… “Learn Python with Jupyter” è un testo che supporta lo sviluppo del pensiero computazionale mentre si impara a programmare in Python… Cosa rende questo libro unico? La progressione degli argomenti è progettata per sviluppare il pensiero computazionale, focalizzandosi sulla sintassi e sulle strategie, invece di elencare caratteristiche linguistiche non correlate tra loro con esempi isolati.” Questa è la presentazione del nuovo ed interessante progetto/libro che ti condivido questa settimana . “Learn Python with Jupyter” mira a insegnare Python da zero in un modo diverso, in una modalità che ho sempre considerato fondamentale per imparare i diversi linguaggi di programmazione e non solo. Serena Bonaretti, una ricercatrice italiana al Balgrist Campus, ha integrato in ogni capitolo la componente del pensiero computazionale con quella della grammatica di Python. E lo sta facendo, dato che il lavoro è in corso e i capitoli vengono rilasciati periodicamente, molto bene. Il tutto in modo aperto, mettendo a disposizione del lettore contestualmente il codice in formato Notebook delle varie sezioni del libro. Un lavoro didattico e sociale assolutamente lodevole!
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Cultivating Communities: A Data Expert's Journey into the Heart of Shared Knowledge
“Un insieme di individui che condividono uno stesso ambiente - sia esso fisico e/o tecnologico - formando un gruppo riconoscibile, unito da vincoli organizzativi, linguistici, religiosi, economici e da interessi comuni.” Questa è la definizione che fornisce Wikipedia del concetto di community, uno strumento che ho usato, con il ruolo di facilitatore, diverse volte nella mia vita professionale. L'ho trovata sempre molto efficace per aggregare gruppi anche diversi di data-expert che hanno trovato nella community diversi vantaggi in termini sia di condivisione di conoscenza ma anche di problemi (e soluzioni) affrontati e da affrontare (insieme).
Se faciliti una community o vuoi farlo, e desideri avere consigli pratici e concreti, ti consiglio di seguire la newsletter di Alessio Fattorini, un esperto nel settore. Se poi la stai progettando, ti consiglio di non perdere questo post di Alessio perché contiene veramente tutti i passaggi fondamentali per crearla e sostenerla. Mi sono veramente ritrovato in quello che scrive anche se, come disse Yogi Berra, “in teoria non c’è differenza tra teoria e pratica: in pratica c’è”… quindi studia e documentati, ma non pretendere di fare tutto corretto al primo tentativo. E se, da buon data-expert, sei appassionato di metriche, Alessio nel suo ultimo numero consiglia una lettura che approfondisce proprio i KPI più importanti per una community: una lettura non scontata e di assoluto valore!
👀 Data Science. AI Odyssey: A Curated Collection of Links to Navigate the Realm of Modern AI
Anche per gli esperti è difficile tenere il passo con tutte le novità pubblicate e per i principianti è ancora più complicato sapere da dove cominciare. La FOMO (paura di rimanere esclusi da informazioni o eventi importanti) sta colpendo impietosamente tutti, me compreso. Per mitigare questa pericolosissima sindrome, ti condivido l'elenco curato delle migliori risorse su cui fare affidamento per diventare più competenti soprattutto sui progressi più recenti del IA. E’ stato chiamato "Canone dell'IA" perché questi articoli, blog post, corsi e guide hanno avuto un impatto notevole sul settore negli ultimi anni. È stato pubblicato, tanto per cambiare, da a16z, un fondo di investimento specializzato anche nel settore dell'IA, e contiene alcuni dei consigli che, se mi segui dall'inizio, ho condiviso per orientarci nel dinamico e complesso mondo della generative AI.
Per completare questo imperdibile elenco, condivido due link molto interessanti e visuali che forniscono una vista sintetica sul passato e sul presente dei modelli di LLMs:
1. Il primo è un resoconto temporale dell'evoluzione del numero di parametri dei più importanti modelli LLMs, con una suddivisione anche per famiglia di LLM.
2. Il secondo è invece una classifica aggiornata periodicamente delle performance dei vari modelli LLMs. Mi sembra fatta molto bene, con una certa trasparenza sugli algoritmi usati per la valutazione. E devo dire che, basandomi sulla mia esperienza personale, è anche decisamente realistica.
👃Investimenti in ambito dati e algoritmi. Investing in the Future of Fitness: Top 5 Emerging Trends in Wellness Tech
Non vorrei cadere nella polarizzazione dell'early adopter e dell'appassionato, quindi ti confesso che faccio ampio uso di strumenti che utilizzano tecnologia avanzata per monitorare vari parametri fisiologici, al fine di ottimizzare i miei programmi di allenamento e fitness. Se mi hai seguito dall'inizio, avrai notato che ho proposto diversi spunti su questo tema. In questo contesto, ti suggerisco di approfondire i cinque trend più rilevanti nell'ambito del fitness e della wellness technology. Oltre a descrivere brevemente ciascuno dei trend ci sono anche pratici suggerimenti per andare oltre. Questi trend sono strettamente integrati con l'uso di dati e algoritmi, e credo possano interessarti anche se non sei un investitore diretto, ma ti incuriosiscono i settori in cui i data expert saranno sempre più protagonisti. Infine, se desideri riflettere con un framework strutturato su dove e come investire in IA, troverai molto utile il modello proposto da Deepwater, un'azienda che gestisce fondi d'investimento azionari focalizzati su tecnologie fortemente trasformative.
👅Etica & regolamentazione & impatto sulla società. Navigating the EU Artificial Intelligence Act: What Data Experts Need to Know
Il 14 Giugno 2023, come forse saprai, il Parlamento europeo ha approvato l'Artificial Intelligence Act (AI Act) dell'UE. Attualmente, il Parlamento, la Commissione e il Consiglio dell'UE sono impegnati in un processo di trialogo finale per negoziare la versione finale della legge. Questo processo richiederà probabilmente alcuni mesi prima che l'atto diventi ufficialmente legge. L'entrata in vigore dell'AI Act dell'UE è prevista per l'inizio del 2024, con una piena applicazione nel 2026. Nonostante persista un'incertezza sulla versione finale dell'AI Act, è fondamentale, soprattutto se sei un data-expert, conoscere la versione attuale, poiché non si prevedono stravolgimenti significativi. Per aiutarti, condivido due link, entrambi segnalatimi da due affezionati lettori di questa newsletter:
Il primo è un complesso, ma non poteva essere diversamente 🙂, diagramma di flusso realizzato da Burges Salmon, uno studio legale indipendente del Regno Unito, molto utile per comprendere a fondo l'AI Act. Questo risulta particolarmente accessibile e più facile da leggere se sei abituato a ragionare più in termini di codice che in "legalese".
Il secondo link conduce invece a un'analisi effettuata dall'HAI, un centro di ricerca specializzato in intelligenza artificiale dell'Università di Stanford, che valuta quantitativamente i principali Language Models (LLMs) sulla base dei requisiti di trasparenza e sicurezza previsti dall'AI Act. Tutti, compreso il GPT-4, sono stati bocciati, ad eccezione di Bloom, che non a caso è un modello Open Source.
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!
Molto interessante la parte sull'AI ACT. Ho visto lo scoring fatto da Stanford, non mi sembra che l'AI ACT ponga dei blockers irrisolvibili a modelli come GPT 3.5 e PALM, al più dovranno rendere trasparenti le fonti e le risorse computazionale. Nel complesso, bene aver messo in chiaro cosa NON si può assolutamente fare in Europa con l'AI.