For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il centoventitreesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
🚀 Questa puntata è sponsorizzata da “Dati365”
Sai quanto credo nella formazione continua, soprattutto quando è stimolata dalle sfide e dal divertimento. Inoltre, sono convinto che, presi dall’hype della generative AI, abbiamo tutti dimenticato l’importanza dell’analisi dei dati, pensando che gli LLM faranno tutto per noi. La mia esperienza degli ultimi mesi mi rende molto scettico su questa visione. Penso che il futuro sia nell'uso ottimale degli strumenti avanzati di analisi dei dati, come PowerBi e SQL, con l'aiuto di strumenti come ChatGPT.
Ho trovato tutti questi ingredienti nell’iniziativa formativa di Fabiano Sileo e della sua Dati365 Academy.
Se vuoi provare il suo approccio pragmatico e moderno all'apprendimento, ho ottenuto per tutti i lettori di “LaCulturaDelDato” uno sconto del 20%. Per usare lo sconto e vedere in dettaglio l’iniziativa, vai direttamente a questa pagina e fammi sapere cosa ne pensi!
Ed ora ecco i cinque spunti del centoventitreesimo numero:
👅Etica & regolamentazione & impatto sulla società. Bambini e intelligenza artificiale: opportunità e sfide da affrontare
L’interazione dei bambini e degli adolescenti con i nuovi sistemi di intelligenza artificiale è e sarà sempre più importante e delicata. Non è qualcosa di scontato. A livello globale, abbiamo gestito in maniera non ottimale l’avvento del web e dei social media, e la situazione diventa ancora più complessa con l’uso su scala globale di queste nuove intelligenze. A fine maggio è uscito un paper decisamente rilevante che non fornisce soluzioni definitive ma apre diversi scenari di discussione e offre raccomandazioni utili, anche se non lavori strettamente nel settore educativo.
Il paper ha un titolo che di per sé induce un po’ di timore 🙂: “The Future of Child Development in the AI Era: Cross-Disciplinary Perspectives Between AI and Child Development Experts”. Tuttavia, è veramente completo, lungo ma di facile lettura. Ecco l’’abstract:
“Questo rapporto esplora le potenziali implicazioni di una rapida integrazione delle applicazioni di intelligenza artificiale (IA) negli ambienti dei bambini. L'introduzione dell'IA nella nostra vita quotidiana richiede un'analisi che tenga conto del ruolo significativo dell'ambiente nel plasmare la cognizione, le competenze socio-emotive e i comportamenti, soprattutto durante i primi 25 anni di sviluppo cerebrale. Man mano che l'IA diventa prevalente nelle attività educative e di svago, essa tenderà a modificare in modo significativo le esperienze di bambini e adolescenti, presentando sia sfide che opportunità per le loro traiettorie di sviluppo. Questa analisi è stata realizzata consultando 15 esperti di discipline pertinenti (IA, sviluppo di nuovi prodotti, sviluppo infantile e neuroscienze), oltre che da una revisione completa della letteratura scientifica sullo sviluppo dei bambini e le interazioni bambino-tecnologia. Nel complesso, gli esperti di IA prevedono che l'IA trasformerà le attività del tempo libero, rivoluzionerà l'istruzione e ridefinirà le interazioni uomo-macchina. Sebbene l'IA offra vantaggi sostanziali nell'impegno interattivo, essa presenta anche dei rischi che richiedono un'attenta considerazione, soprattutto durante i periodi di sviluppo più delicati. Il rapporto auspica una collaborazione internazionale proattiva tra più discipline e ricerca su come le innovazioni tecnologiche influenzeranno lo sviluppo dei bambini. Tali sforzi sono fondamentali per progettare un futuro sostenibile ed etico per la prossima generazione attraverso regolamenti specifici incentrati sull'infanzia e aiutando a educare tutte le potenziali parti interessate (autorità di regolamentazione, sviluppatori, genitori ed educatori, bambini) sull'uso responsabile dell'IA e del suo potenziale impatto sullo sviluppo dei bambini.”
Immagine generata con Chat-GPT4o usando come prompt il testo del post
Se vuoi leggerne una sintesi ragionata e arricchita dal parere di un esperto del settore, Nick Potkalitsky, ti suggerisco il suo post-commento del paper.
Se a questo punto ti sei, o sei già, appassionato molto al tema, ti segnalo altri tre approfondimenti che affrontano l’argomento in modo diverso e su scala diversa:
1. Questo documento ha più di un anno ma è ancora molto attuale: “Artificial Intelligence and the Future of Teaching and Learning Insights and Recommendations” realizzato dal dipartimento di tecnologia didattica degli Stati Uniti. È lungo ma molto completo.
2. Il documento “Costruire il futuro - Linee guida sull’utilizzo dell’IA in ambito scolastico”, generato "dal basso", frutto del lavoro di 55 scuole del Friuli Venezia-Giulia, con il supporto di esperti del settore. Il link che ti consiglio è al commento al documento di mia moglie, un’insegnante impegnata anche in questo ambito, che scrive in maniera molto pratica all’incrocio tra digitale, AI e mondo della scuola.
3. Il racconto di Bill Gates su come una scuola di Newark stia integrando l’intelligenza artificiale a supporto di insegnanti e studenti
👃Investimenti in ambito dati e algoritmi. L'istruzione dei founders: un vantaggio per le start-up?
Se, come me, ti sei chiesto se esiste una correlazione tra il titolo di studio dei founders di una start-up e il suo successo, l'articolo che ti suggerisco oggi di Andre Retterath fa al caso tuo. Come scrive Retterath: “l'intricata domanda tra formazione dei fondatori e successo delle startup rivela una correlazione sfumata ma innegabile. L'istruzione, soprattutto se diversificata e specializzata, funge da leva cruciale nelle fasi iniziali e di crescita di una startup, migliorando la sua capacità di innovare e di ottenere finanziamenti. Tuttavia, non è scontato. Il percorso dal finanziamento all'uscita è irto di variabili, dove il prestigio di un MBA può essere determinante nell'attrarre gli investitori ma non garantisce il successo dell'uscita. Ciò che risalta è il valore multiforme dell'istruzione: non si tratta solo delle conoscenze acquisite, ma delle porte che apre. Le reti che si formano e gli incontri fortuiti all'interno delle aule accademiche possono essere determinanti quanto il curriculum stesso.” Se sei curioso e vuoi andare più a fondo, nell’articolo sono citati studi empirici che coprono diverse geografie e diverse fasce temporali. I segnali non sono fortissimi ma sono concordi. Il mio personale e più che empirico parere è: quanto più tecnico e innovativo è il prodotto/servizio che sviluppa la start-up, più conta il background accademico dei fondatori. Invece, quanto più questo prodotto/servizio risolve problemi noti e esistenti, meno conta il passato educativo.
🖐️Tecnologia (data engineering). Database in Evoluzione: Cosa ci Dice Db-Engines
Back to #004
Ritornando al numero 4 della newsletter, questo è stato il link più cliccato e lo considero uno dei siti più importanti per chi si occupa di tecnologia legata ai dati e vuole seguire in maniera oggettiva i trend di uno dei componenti più cruciali, ovvero i database. Infatti, come scrivevo, Db-Engines è la classifica più rilevante sulla diffusione dei database, almeno nel mondo occidentale. Come ogni classifica, si basa su metriche soggettive, ma le trovo trasparenti e condivisibili. Personalmente, ogni 3 mesi mi prendo qualche minuto per analizzare classifiche, variazioni e trend. Ecco una sintesi dei trend degli ultimi 2 anni:
Si osserva, tra i database più diffusi, una certa stabilità con una crescita importante di Snowflake e Databricks e meno sostenuta ma costante di PostgreSQL. Di contraltare si vede una decrescita di Teradata, Db2, Hive e Access.
Per quanto riguarda la popolarità delle tipologie di database, i Vector DB, grazie a Generative Ai e architetture Rag, hanno avuto un deciso incremento di popolarità, mentre si è decisamente smorzato il trend positivo dei GraphDB che durava da molti anni.
Se osserviamo il mercato dal punto di vista della licenza (Open Source vs Closed Source), sembra essersi trovato un punto di equilibrio tra i due modelli, con i database open source che si sono conquistati una buona fetta del mercato ma non hanno più il forte trend di crescita iniziato nel decennio scorso.
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. AI e Business Intelligence: automatizzazione o semplice assistente?
Incomincio segnalando che l’approfondimento di oggi potrebbe essere stato scritto non da un umano ma da un'AI. Non ne ho la certezza, ma sia il nome dell’autore su Medium, “Anna Zykina AI”, sia il testo mi fanno sospettare questa possibilità. Te lo segnalo comunque sia come punto di attenzione, dato che sto notando una crescita di questo fenomeno su Medium, sia perché l’articolo è anche una buona lista di prodotti da considerare, che mirano ad automatizzare la business intelligence in azienda, ma che non mantengono ancora le promesse. Se fosse davvero scritto da un'AI, sarebbe curioso notare come parli male di (quasi) se stessa: “Nonostante i progressi e le innovazioni, il valore dell'esperienza e della conoscenza umana nell'analisi dei dati rimane invariato. Le capacità delle moderne tecnologie sono davvero impressionanti, ma sono solo strumenti nelle mani di un maestro. Per quanto avanzate possano essere, senza le profonde conoscenze e competenze degli analisti non possono sprigionare tutto il loro potenziale.” Essendo l’azienda da cui proviene l’articolo attiva nella consulenza proprio della business intelligence, qualche conflitto di interesse potrebbe anche esserci.
Nonostante questo, te lo segnalo, soprattutto se lavori in azienda e molti ti fanno la domanda se la business intelligence può essere completamente automatizzata, per due motivi:
1. Le cinque soluzioni segnalate dall’articolo sono buoni esempi di dove arriva oggi l’intelligenza artificiale nella business intelligence. Provali, come ho fatto io, e renditi conto in concreto del livello.
2. Spesso in azienda si perdono di vista i punti critici della business intelligence a vero valore aggiunto, che non è la sola creazione di un bel report, ma le parti che ti consentono di arrivare a crearlo, ovvero:
- Conoscere la semantica del dato
- Capire e misurare la qualità del dato
- Integrare i dati correttamente
- Avere chiaro il problema e disporre di tutti i dati interni ed esterni per migliorare l’analisi
E su tutti e quattro i punti, l’intelligenza artificiale è un'assistente (ancora) molto, ma molto junior ma con cui lavorare perché è destinata a diventare senior. 🙂
👀 Data Science. Meta scommette su LLama3: azzardo o investimento?
Ad aprile, Meta ha rilasciato le prime due versioni di LLama3: quella “piccola” da 8 miliardi di parametri e quella “media” da 70 miliardi, annunciando il rilascio verso fine anno di quella “grande” da 400 miliardi, ancora in fase di training. Subito dopo, si è creato molto hype, ma il rilascio a maggio di Chat-GPTo e a giugno di Claude Sonnet 3.5 ha rapidamente mandato nel dimenticatoio mediatico i modelli di Meta.
Sai che amo riflettere sugli eventi non necessariamente in tempo reale, perché per avere informazioni fresche hai strumenti più efficienti di questa newsletter. Tuttavia, è giusto fare alcune osservazioni a quasi tre mesi dal rilascio e fornirti qualche strumento di approfondimento per provarlo, se non l’hai già fatto, e capire l’impatto che sta avendo.
Ecco alcuni approfondimenti e considerazioni:
1. Per vedere benchmark qualitativi e tecnici, questo è un ottimo sito. Come puoi vedere, il modello medio di LLama3 si pone in testa ai modelli open source più diffusi nel mondo occidentale, posizionandosi a cavallo tra i modelli closed (di OpenAI, Google e Anthropic) di ultima generazione e quelli del 2023.
2. Se vuoi provarlo, con una VPN o se sei negli USA puoi usare il sito di Meta.ai, altrimenti puoi utilizzare questo servizio.
3. Se desideri una recensione video italiana curata, puoi vedere il video del mitico Vincenzo Cosenza. Oppure, se vuoi approfondire nei dettagli più tecnici, il solito post di Data Machina è molto utile.
Personalmente, credo che l’investimento nei modelli LLama sia per Meta una grossa scommessa, in un tentativo simile a quello di Google con Android negli anni 2000, di diventare centrale nello sviluppo di prodotti e servizi orientati all’uso di modelli LLM open source.
La suggestiva analogia, però, potrebbe essere fragile per diversi motivi:
1. I modelli LLama non hanno una vera licenza Apache 2.0, e questo potrebbe generare nel medio periodo più di un interrogativo in chi li usa.
2. L’evoluzione di un modello LLM è più veloce e meno difendibile di un sistema operativo legato a un hardware (come quello dello smartphone).
Non ci resta che vedere soprattutto la qualità del prossimo modello LLama 3 per capire se e quanto sarà distante dai modelli di punta e se setterà un nuovo standard per gli LLM open source su cui costruire servizi e prodotti nel medio periodo.
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!
Grazie del mitico! 😃