For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il cinquantesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del cinquantesimo numero:
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. How to Build a Career in AI by a Pragmatic Giant
Andrew Ng è uno dei più importanti esperti mondiali di Intelligenza Artificiale e, tra questi, uno dei pochi con una carriera professionale veramente eclettica. E’ stato a capo di Google Brain e Chief Scientist di Baidu ed è professore a Stanford e capo degli AI Lab. Non si è fatto però mancare l’esperienza imprenditoriale diretta, essendo il fondatore della piattaforma Coursera ed ora dell’iniziativa Deeplearning.ai. Per questo, il contributo che arriva da lui e che ti suggerisco oggi è particolarmente significativo e ti assicuro che offre consigli unici a chi vuole costruirsi una carriera in ambito AI.
Innanzitutto sfata un mito che invece vedo proliferare in molti corsi nel nostro ambito: saper programmare conta! Lo spiega chiaramente nell’introduzione: “Coding AI is the New Literacy”. Il libro si snoda poi in maniera lineare raccontando i tre step principali nel percorso di costruzione della propria carriera professionale:
Acquisire competenze tecniche chiave
Lavorare e farsi esperienza su progetti
Trovare un (nuovo) lavoro più adatto all’esperienza raggiunta
Nel fare tutto questo nei vari capitoli Andrew Ng non lesina consigli molto pratici, effettivamente fondamentali, per la continuità del proprio progetto di cambiamento:
La partecipazione a comunità (soprattutto di pratica) per sostenere i due primi step
L’importanza di affinare le proprie capacità e fare molta pratica nella analisi esplorativa dei dati (EDA), fondamentale nell’evoluzione sempre più data-centrica del mondo dei dati e dell’intelligenza artificiale
L’apprendimento di tecniche metodologiche che consentono di dare continuità di studio e di pratica al proprio percorso. Il tutto guidato dalla curiosità personale che può essere il vero driver anche nella fase di scelta del nuovo lavoro.
Ma c’è tanto altro nelle 41 pagine del libro che ti invito a leggere, approfondimenti e link compresi, se vuoi direzionare la tua carriera nel mondo dei dati e dell’intelligenza artificiale.
👀 Data Science. The Definitive Visual Guide to Pandas
“Pandas è uno standard per l'analisi dei dati in Python. Con pochi comandi è possibile caricare, filtrare, ristrutturare e visualizzare gigabyte di dati eterogenei. Costruito sulla base della libreria NumPy, ne prende in prestito molti concetti e convenzioni di sintassi, per cui se vi trovate bene con NumPy, troverete Pandas uno strumento piuttosto familiare … un'ottima opportunità per risolvere i problemi di analisi dei dati con un background di programmazione minimo. Polars, la recente reincarnazione di Pandas (scritta in Rust, quindi più veloce) non usa più NumPy, ma la sintassi è abbastanza simile, quindi imparare Pandas vi permetterà di sentirvi a vostro agio anche con Polars.” Questo, in sintesi, è l’incipit del consiglio di lettura di oggi. Non so se sarà la guida visuale “definitiva” a Pandas anche in futuro ma oggi lo è sicuramente! Ti consiglio di metterla tra i preferiti anche se non hai tutti i 49 minuti che servono per leggerla. Come solo le guide migliori riescono a fare è indicata sia per i principianti, sia per chi, più esperto, vuole capire come funziona Pandas (anche con interessanti paralleli con Numpy) e quali sono in dettaglio le prestazioni delle sue singole operazioni per poter rendere più efficiente il tuo codice. I rimandi alla teoria della complessità del codice, attraverso la big O notation, sono imperdibili. Affiancare al codice anche un'ottima visualizzazione, in forma tabellare, delle operazioni principali rende la comprensione molto più semplice di tutte le quattro parti in cui è divisa la guida. Lev Maximov, l’autore, ha realizzato la stessa cosa per Numpy con un risultato della stessa gradevolezza e utilità. Ti consiglio inoltre di seguire i link e gli approfondimenti che suggerisce perché sono ricchi di altri “Aha moment” anche per i più esperti!
👃Investimenti in ambito dati e algoritmi. Meta Trends 2023 by a Quant Futurist
Confesso di segnalarti solo a fine Febbraio questo contributo relativo ai Meta Trends del 2023 di Matt Klein per due motivi. Klein stesso lo pubblica a fine Gennaio perché si basa sulla lettura e l’analisi di molti trend report usciti a fine anno e questo processo è lungo e articolato. Il secondo motivo è dovuto al fatto che il documento non è facile da leggere per come è strutturato dal punto di vista grafico e semantico. Nonostante questo, tutti gli anni, superato lo scoramento iniziale, la sua lettura acquista valore nel corso del tempo.
“Accettare il caos non significa rinunciare al controllo”: questa è la filosofia che permea tutto il lavoro di Klein, che si definisce uno studioso delle culture, un cyber-psicologo, un quant futurist, uno stratega e uno scrittore. La saggezza popolare dice che “chi si loda s’imbroda” ma in questo caso il risultato non è affatto da buttare e Klein nella sua analisi, molto guidata dai dati, aggiunge valore sia in termini di contenuti sia nella capacità di connettere e collegare l’evoluzione di questi trend nel corso del tempo. La sua mission, cito dal suo sito, è quella “di analizzare la CULTURA con le implicazioni psicosociali della TECNOLOGIA per indirizzare le decisioni di BUSINESS.”
Il documento, che ti ho suggerito è di fatto un distillato delle tendenze in corso, una meta-analisi annuale fatta sulla base di oltre 50 previsioni globali: per farti un esempio trend report quali We Are Social, Accenture Song, BOF McKinsey, Deloitte Tech, Klarna, a16z, Economist, HBR etc.
Klein partendo da questi report, con una metodologia ben dettagliata nel documento, arriva ad individuare 16 trend socio-culturali che stanno permeando il presente e che trasformeranno le nostre vite, trasformandosi a loro volta come è evidente dalla connessione con i trend del passato.
Quello che ti consiglio di fare, se non ti sei ancora stufato e ti ho incuriosito, è partire da questa immagine che riporto sotto e che sintetizza i trend in corso. Fatti guidare dalla tua curiosità o comunque scegli l’area più vicina a te in termini lavorativi o di investimenti e leggi lo specifico trend che è sintetizzato, in ordine di importanza, nella parte finale del documento.
Se devo poi confessarti, tra i 16 trend, i miei preferiti eccoli:
One of Us: “Alone and over the mainstream, niche and tight communities flourish”. Il tema forte delle community di nicchia che si cementano, sempre di più, attorno a tematiche e passioni molto specifiche, grazie alla tecnologia.
AI Plural Perception: “Creativity and humanism are put into question as AI raises and lowers bars”. E’ un po’ il trend del momento ma descritto con creatività e facendo domande più che suggerendo risposte.
Del resto come scrive Klein: “I bordi sono i più nitidi e le frange sono il futuro.” Come dargli torto?
🖐️Tecnologia (data engineering). AI Research Experiences at Harvard
Il contributo che ti segnalo nella sezione più tecnica della newsletter è un corso di Harward su come diventare ricercatore nel settore dell’Intelligenza Artificiale con competenze a 360°. Cito dalla prefazione del professor Pranav Rajpurkar: “Imparerete a leggere sistematicamente i documenti di ricerca, a generare nuove idee e a presentarle in slides o documenti. Potrete anche apprendere preziose tecniche di gestione dei progetti e di comunicazione di gruppo utilizzate dai migliori ricercatori dell’ AI.“
Te lo segnalo in realtà per diversi motivi sia che tu sia un machine learning engineer, un data scientist o anche un data-lover che vuole continuare ad imparare in maniera molto pratica. Ecco le 5 cose che ho trovato più interessanti:
Il professore ha rilasciato in modalità aperta, come e-book, l’intero libro usato nel corso con tutte le note di approfondimento delle 21 lezioni.
E’ fatto molto bene dal punto di vista dei contenuti verticali e si offre anche ad una lettura di singole lezioni che possono essere di tuo specifico interesse.
La parte tecnica sull’intelligenza artificiale si concentra sull'area di deep learning di più recente sviluppo utilizzando e insegnando a farlo attraverso l’uso dei Large Language Model protagonisti della Generative AI.
Ha un taglio molto pratico insegnando, praticamente da zero, ad usare gli strumenti di software engineering utili per Python e del cloud stesso. Presuppone solo una conoscenza di Python non avanzata.
Il corso non dimentica anche quelli che potrebbero sembrare “solo” soft skill, cioè per esempio come leggere “wide & deep” i paper di ricerca sull’AI oppure come comunicare efficacemente con slides. La cosa che mi ha impressionato è che tutti questi contenuti sono solidamente ancorati all’insegnamento degli skill più tecnici.
Ti consiglio per questo di leggere l’indice, selezionare le lezioni che ti possono interessare e provare a seguirne una leggendo il testo: potresti rimanere veramente sorpreso!
Se poi ti interessa capire il mondo del deep learning con approfondimenti matematici importanti ti consiglio di dare un'occhiata alla preview di un libro in uscita, “Understanding Deep Learning” molto interessante di Simon Prince. Professore di Computer Science all’Università di Bath
👅Etica & regolamentazione & impatto sulla società. ChatGPT & the Future of Search: Some Pragmatic Questions & Insights ..
Un dibattito molto presente all’interno di diverse community di data-expert è su quanto i Large Language Models ed in particolare gli strumenti che si basano su essi, come ChatGPT, influenzeranno il modo in cui oggi cerchiamo informazioni in Rete. La stessa Google, si dice, abbia alzato il livello di attenzione per monitorare quanto possa essere messo in discussione il suo monopolio in questo ambito. Non ho naturalmente una previsione semplice e corretta te lo anticipo. Voglio però condividere alcune osservazioni e approfondimenti per consentirti di poter disegnare scenari possibili.
Eccoli:
Affiancare, cioè aggiungere, alla ricerca tradizionale un sistema come ChatGPT non è al momento sostenibile dal punto di vista economico. Oggi una ricerca di Google ha un costo di 1,06 cent e genera ricavi per 1,61 cent. La stima di costo di una interazione (query) con ChatGPT è stimata in 0,36 cent. Quindi la cosa eroderebbe i margini di Google in maniera drammatica. Tutti questi dati sono tratti da questo articolo che ti suggerisco di leggere perché ha anche tanti altri dettagli interessanti sul tema.
Dal punto precedente ne deriva che Google non può essere incentivata ad aggiungere la funzionalità senza alcun cambiamento del suo modello di business anche se, come suggerisce Giorgio Taverniti nella sua ottima newsletter, Google ha probabilmente un vantaggio competitivo tecnologico in questo ambito. Ma come scrive Vincezio Tiani: Google ha quasi tutto da perdere e Microsoft quasi tutto da vincere!
Da più di 20 anni siamo abituati a cercare sul web attraverso un box dove inseriamo parole rilevanti e abbiamo istantaneamente un risultato con rimandi deterministici alle fonti, aggiornate real time, che possiamo verificare. L’esperienza di ChatGPT è a mio parere profondamente diversa: molto più lenta, meno deterministica ma con capacità di creare un risultato più strutturato. E’ adatta a fare cose diverse che oggi non sono possibili o per lo meno non così bene da una ricerca. Aiutarci a scrivere codice ne è un esempio. Con una ricerca oggi andiamo, tipicamente, sulla pagina più vicina al nostro problema o argomento su Stackoverflow e l’esperienza e il risultato è molto diverso. Così come la UX dei sistemi che sfruttano i Large Language Model è molto differente rispetto a quella di una ricerca. Per esempio, se devo scrivere codice, avere l’intelligenza artificiale dentro il mio ambiente di sviluppo è molto più comodo di usare Chat GPT. Quindi, a differenza della ricerca, questi sistemi avranno UX molto più diversificate, a seconda dei contesti. E i siti web e la ricerca di oggi avranno una vita più lunga rispetto a quello che pensiamo come scrive, meglio del sottoscritto, sempre Giorgio Taverniti in questo post.
Se vuoi comunque provare una ricerca che integra i due sistemi, ricerca Google-like e ChatGPT, ti consiglio questo sito You.com. Non mi ha impressionato ma l’esperienza per alcuni tipi di ricerca è gradevole.
Se vuoi avere un parere di una persona molto creativa che li sta usando e che sta insegnando anche ad altre persone creative come usarlo al meglio ti consiglio questo articolo della mia amica Mafe De Baggis. Mafe, nel post, spiega il suo punto di vista su quanto sistemi come ChatGPT siano diversi dai motori di ricerca e ci ricorda come in fondo “anche noi umani generiamo testi a partire dalla probabilità di distribuzione di parole o sequenze di parole, applicando regole grammaticali, sintattiche, stilistiche, semantiche”.
Per ritornare al presente, dopo avere provato a capire quale può essere il futuro della ricerca, ti consiglio di fare la cosa più pragmatica possibile per capire questi nuovi sistemi e cioè imparare a interagire efficacemente con loro. Per farlo ti consiglio una newsletter di un amico, Massimiliano Nicotra, che da buon avvocato nerd ci fornisce ogni domenica suggerimenti, trucchi e indicazioni per prompt efficaci!
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!