For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il centoundicesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del centoundicesimo numero:
👅Etica & regolamentazione & impatto sulla società. Quando un Filosofo Mette Ordine tra Umano e Artificiale
Ti confesso che ho riflettuto tanto tempo in questi quasi due anni di “generative-ai mania” circa il concetto di intelligenza artificiale e di intelligenza umana, leggendo l’opinione di molti pensatori appartenenti a differenti fazioni o scuole di pensiero. Nessuno mi aveva convinto pienamente. Poi, un mese fa, quasi per caso, ho letto questo paper del filosofo torinese Maurizio Ferraris, "Intelligenza come forma di vita umana": cinque pagine in inglese. E tutto, quasi per magia... è andato (quasi) al suo posto. Ti riporto quasi tutto l’abstract del paper perché c’è tutto il necessario per convincerti a leggerlo.
“Questo testo si propone di contrastare le ansie generate dalla recente comparsa dell'IA ‘generativa’ e le critiche che le sono state rivolte, chiedendone la moralizzazione. Lo fa dimostrando che l'IA non è né una novità né una vera intelligenza, ma piuttosto uno strumento, simile a molti altri che da tempo sono al servizio dell'intelligenza umana e dei suoi obiettivi. Di seguito propongo una riflessione più ampia sulla tecnologia, che mira a contestualizzare la novità e la singolarità attribuite all'IA all'interno della storia degli sviluppi tecnologici. Il mio obiettivo finale è quello di relativizzare la novità dell'IA, cercando di alleviare le ansie morali che attualmente suscita e incoraggiando una visione più normale e ottimistica. Il primo passo per comprendere l'IA è infatti rendersi conto che la sua novità è solo relativa e che l'IA ha molti antenati che, a un esame più attento, si rivelano strettamente correlati.”
Francamente, non credo che avremo un chief philosopher officer in tutte le aziende, come qualcuno sostiene, ma riconosco che ci voleva un filosofo a mettere (quasi) tutte le cose a posto nella testa di un ingegnere come me.
Ferraris parte, giustamente lontano, ricordandoci che anche la scrittura, nell'antica Grecia di Platone e dallo stesso Platone, venne criticata duramente quando fu introdotta nelle scuole dell'Attica, affiancandosi e in parte sostituendosi alla tradizione orale. Infatti, nella favola egiziana raccontata da Socrate a Fedro, la scrittura viene vista come un veleno per la memoria piuttosto che un suo supporto. E Platone critica la scrittura usando la stessa scrittura come mezzo! Vi ricorda qualcosa? Ma c'è molto di più nelle cinque pagine del paper di Maurizio Ferraris, per esempio il concetto di intelligenza umana che è "incarnata" e quindi differente da quella che chiamiamo artificiale. Insomma... leggilo :-) e fammi sapere nei commenti o direttamente a me via mail cosa ne pensi... sono molto curioso!
🖐️Tecnologia (data engineering). SQL: il linguaggio che piace anche a Chat GPT!
Gli attuali Large Language Models (LLM) sono addestrati con i dati e le conoscenze prodotte finora dall'umanità, inclusi i principali strumenti e tecnologie. Questo fenomeno potrebbe portare a un ulteriore rafforzamento e diffusione degli strumenti e delle tecnologie più utilizzati. Non a caso, gli LLM tendono a esprimersi più efficacemente in inglese, la lingua più diffusa nel mondo occidentale, specie a livello di conoscenza. Lo stesso vale nel mondo dei linguaggi di programmazione: Python è il più usato e, per esempio, OpenAI con il suo Open Interpreter, lo utilizza per generare parte delle sue risposte. I migliori risultati negli assistenti alla scrittura di codice si ottengono usando Python. Anche nell'ambito dei dati, specialmente nell'estrazione di dati da database, SQL è il linguaggio più diffuso. Ho sperimentato personalmente quanto ChatGPT4 sia efficace nello scrivere SQL, anche se non è (ancora) infallibile. Fino a quando gli LLM non svilupperanno strumenti più efficienti di quelli attualmente creati dall'uomo, conoscere gli strumenti più diffusi aumenterà la nostra capacità di utilizzare efficacemente l'AI generativa. Questo conferma, a mio giudizio, la disequazione del futuro: (Human + AI) > (Human or AI), come ho raccontato in un breve intervento durante un premio ricevuto all'AI Week.
Quindi, 😊, gli approfondimenti di oggi sono dedicati a imparare, ripassare o migliorare il tuo SQL, perché questo linguaggio rimarrà importante a lungo e non puoi permetterti di non comprendere ciò che scrive il tuo code assistant, specialmente in situazioni il cui uso è critico. Ecco gli approfondimenti:
Se vuoi imparare le basi, ti consiglio di consultare gli approfondimenti condivisi nelle precedenti newsletter: qui, qui e qui.
Se cerchi qualcosa di più avanzato ma che parta dalle basi ti suggerisco di andare direttamente a The Querynomicon: “An Introduction to SQL for Weary Data Scientists”.
Se desideri verificare se una specifica funzione SQL è supportata dal “dialetto” SQL del database che stai utilizzando, il progetto “SQL Polyglot” è quello che fa per te 😊.
Se ti affascinano gli usi più estremi dell’SQL, scoprirai che qualcuno ha persino tentato di implementare un LLM in SQL!
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. AI e Lavoro: Non Solo Automazione, Ma Quando e a Che Costo?
La velocità con cui l'intelligenza artificiale può sostituire o ridurre le attività umane all'interno delle nostre organizzazioni è un tema dibattuto da anni, ma ha avuto una forte accelerazione a partire da novembre 2022, con il rilascio di ChatGPT 3.5. Questo evento ha allargato il numero di persone che hanno sperimentato direttamente il nuovo trend di AI generativa. Ho letto molti articoli e opinioni su quali sono, secondo gli esperti, i lavori e le attività a rischio e devo dire che alcuni di questi sono molto analitici e accurati. Però, con un po' di supponenza, ti confesso che queste analisi rappresentano la parte più facile delle risposte che, nel medio periodo, dobbiamo fornire all'interno delle organizzazioni. La parte più complessa è cercare di capire la velocità con cui questo avverrà e la convenienza economica (e in alcuni casi, reputazionale) per le aziende di procedere in tal senso. Entrambe le risposte sono complesse e dipendono, a mio giudizio, da variabili legate al progresso della tecnologia relativamente alla classe di attività specifica e, di conseguenza, al rapporto tra il costo del lavoro umano rispetto al costo totale della soluzione tecnologica. Ho trovato pochissimo di altamente qualitativo che cercasse di rispondere a queste ultime due domande. Recentemente, però, ho letto qualcosa che mi ha decisamente convinto riguardo a una classe di attività, specificamente legate alla visione artificiale, che ha una profondità storica non solo legato all’ultimo trend della Generative AI. Ti avevo già segnalato un articolo che ne parlava in una sezione della newsletter qualche puntata fa, ma ora ho letto il paper originale “Beyond AI Exposure: Which Tasks are Cost-Effective to Automate with Computer Vision?” di Svanberg et al., pubblicato a gennaio 2024, e soprattutto un articolo di Michael Spencer Tobias Mark Jensen, che è il mio personale consiglio in questa sezione, che commenta il paper integrando ulteriori approfondimenti. Se sei interessato all'argomento, vale assolutamente la pena leggere l'articolo di Spencer & Jensen per avere chiare almeno le domande che devi farti quando discuterai del tema nella tua organizzazione. Valutare tutti gli aspetti è fondamentale per non farsi travolgere da euforismi di chi non conosce bene la tua organizzazione e per cercare di guidare attivamente il tutto. Quello che emerge da questa analisi sull'automazione di attività legate alla visione è che solo il 23% ha attualmente un ritorno economico positivo (il rapporto di cui ti parlavo sopra è maggiore di uno), ma non per tutti ha senso farlo perché questa attività rappresenta solo una piccola parte del lavoro di una persona all'interno dell'organizzazione. Il paper cerca anche di rispondere, disegnando giustamente scenari, al tema della velocità con cui avverrà la transizione e, per fortuna aggiungo io, questa velocità sembra decisamente più lenta, in quasi tutti gli scenari, rispetto a quanto il marketing dei vendor e le società di consulenza ci vogliono far credere. E questo, per la capacità di adattamento del nostro sistema economico-sociale, è un bene. Non scambiarmi per un neo-luddista: dobbiamo studiare fin da oggi molto bene per un futuro che succederà, ma dobbiamo prepararci e preparare i lavoratori di oggi e di domani a un cambiamento che sarà sicuramente molto grande, probabilmente il più grande della storia dell'umanità!
👀 Data Science. Preparati al futuro: come l'AI Generativa sta cambiando la data science e il ruolo del data scientist
Non ho dubbi che l'AI generativa cambierà profondamente il modo in cui realizziamo i progetti di data science nelle nostre organizzazioni e, con essi, anche il ruolo del data scientist. La direzione di questo cambiamento sta diventando sempre più chiara. Più complesso è prevedere la velocità con cui si verificherà, poiché coinvolge dinamiche di formazione e adeguamenti organizzativi molto complessi. Per questo è fondamentale prepararsi a questo cambiamento in modo pratico, iniziando a integrare questi strumenti nella nostra routine lavorativa e esplorando opinioni ed esperienze di chi già misura empiricamente le loro performance.
Per aiutarti a compiere questo passaggio, sia che tu sia un data scientist, un esperto di dati o voglia iniziare in questo campo, ti raccomando vivamente di leggere il paper "What Should Data Science Education Do with Large Language Models?", pubblicato a luglio 2023 ma ancora estremamente attuale. Ti invito a leggerlo per intero: sono 22 pagine che includono esperienze pratiche come l'utilizzo di ChatGPT4 per partecipare a una competizione Kaggle o testare la capacità degli LLM nel risolvere gli esercizi del libro "Introduction to Statistical Thinking", che ti consiglio a prescindere 😊. Troverai molti esempi sull'intero ciclo di vita dei progetti di data science, inclusi il tema dei bias, corredati dai prompt utilizzati dal team di ricerca per redigere il paper. Se sei un insegnante, in particolare di tematiche legate alla data science, il paper è utile anche per te. Infatti, come indicato nell'abstract, "gli LLMs hanno il potenziale per ridefinire non solo la pipeline della data science, ma anche l'essenza stessa della formazione in questo campo. In questa nuova era, gli studenti devono imparare a vedersi non solo come ingegneri del software, ma anche come manager di prodotto, con una focalizzazione su pianificazione strategica, coordinamento delle risorse e supervisione dell'intero ciclo di vita del prodotto, oltre che sulla pipeline di analisi dei dati." Ne sono fermamente convinto e, coerentemente, ho incluso questo paper tra i materiali di approfondimento per i miei studenti del corso "Laboratorio di decisioni aziendali" che tengo alla Cattolica nel corso di Laurea Magistrale di Economia e Commercio. Come ho già scritto, quest'anno ho integrato nel corso suggerimenti su come gli studenti possono sfruttare l'AI generativa nel loro percorso di apprendimento, il cui obiettivo non è (solo) superare l'esame.
Prima di chiudere questa sezione, voglio anche segnalarti, se sei un data scientist e stai preparando un colloquio per un primo o un nuovo lavoro, l'articolo di Kerry Parker che offre ottimi consigli su come affrontarlo e renderlo soprattutto un'esperienza formativa. In particolare, non dimenticare il primo consiglio: “Find a CV buddy”, perché il confronto con una persona del tuo ambito può aiutarti a scrivere e metabolizzare al meglio le tue esperienze. E in questo momento storico, il buddy può trasformarsi anche in un Cyborg-Buddy: oltre all'indispensabile importanza di una persona reale, anche un LLM può offrirti spunti utili per migliorare il tuo CV e il tuo colloquio!
👃Investimenti in ambito dati e algoritmi. Come sfruttare al meglio il tuo tempo anche con la 'Big Presentation' di Benedict Evans
Il tempo è senza dubbio la nostra risorsa più scarsa. Considerando il sovraccarico informativo offerto dai media moderni, è essenziale sviluppare pratiche personali per gestire al meglio il tempo che investiamo in informazione e formazione, ambiti che sempre più spesso tendono a sovrapporsi. Nel tempo, anche io ho sviluppato la mia strategia basata su alcuni pilastri fondamentali:
1) Selezione delle fonti. Nel numero 100 di questa newsletter, ti ho descritto il metodo che utilizzo per creare questi contenuti, che costituiscono una parte significativa della mia informazione e formazione personale.
2) Focalizzazione. È cruciale evitare il multitasking e le interruzioni, specialmente quando si leggono articoli lunghi.
3) Diversità. Non limitarti solo a letture brevi; dedica tempo anche a letture più approfondite, che superino i 15 minuti, e ai libri.
4) Atteggiamento attivo. Impara ad usare gli algoritmi di suggerimento a tuo favore, senza farti dominare da essi. Anche questo richiede disciplina e pratica.
Questo preambolo serve per introdurre Benedict Evans, un analista che devi assolutamente seguire se operi nel settore degli investimenti. Almeno una volta all'anno, Evans pubblica la sua "Big Presentation", che solitamente comprende oltre 75 slide. La lettura attenta di queste, approfondimenti inclusi, richiede un impegno notevole. La presentazione di quest'anno, 2024, è dedicata quasi interamente all'AI, con il tema "AI & everything else". Benedict Evans è uno dei miei pensatori preferiti perché non ti fornisce mai risposte sui trend in corso ma usa la bellissima triade: dati, domanda e scenari possibili che (intra)-vede per farti riflettere al meglio. Non perdere neanche una delle sue 87 slide e, se sei curioso, dai un'occhiata anche a quelle degli anni precedenti: la prima risale al 2013 e ti permetterà di comprendere meglio come si costruiscono gli scenari, il miglior modo per prevedere il futuro!
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!