For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il centoquarantatreesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del centoquarantatreesimo numero:
🖐️Tecnologia (data engineering). Perché Python è ovunque, anche nei fogli Excel!
Non sono mai stato un software engineer né un data engineer, anche perché, quando ho iniziato a lavorare, questo ruolo non esisteva ancora. O meglio, era una specializzazione di chi lavorava a stretto contatto con i database. Ho però scritto codice in diversi progetti, quasi tutti legati ai dati. Quando Python ha iniziato a diffondersi nel nostro settore, a metà degli anni 2000, ho cominciato a usarlo con una certa regolarità, puntando subito sulla sua crescita. Questo, fin dall’inizio dell’era Big Data. Non sono un esperto, ma un appassionato di lunga data che aveva intuito che Python sarebbe diventato uno dei linguaggi più diffusi al mondo. Ora possiamo dire il linguaggio più diffuso.
Ti dico tutto questo per mettere in chiaro il mio bias positivo verso Python, il linguaggio che conosco "meno peggio" 🙂. Oggi voglio condividere due caratteristiche di questo linguaggio che spesso fanno discutere ma che, per me, sono anche alla base del suo successo.
Python è davvero il coltellino svizzero dei linguaggi di programmazione: si adatta a tantissimi scenari d’uso. Uno degli ultimi è stato – e te lo avevo accennato tempo fa – la sua integrazione con Excel. Ho provato questa integrazione recentemente e, sinceramente, l’ho trovata ancora macchinosa e un po’ acerba. Sono molto d’accordo con Felix Zumstein, il creatore della libreria xlwings (magari la conosci: integra, di fatto, Excel in Python, facendo praticamente il contrario). Zumstein, in un suo post, analizza in dettaglio lo stato dell’arte di Python in Excel, evidenziandone pregi e difetti. Se non hai ancora provato questa integrazione e lo vuoi fare, ti consiglio di leggere il suo articolo.
La seconda caratteristica che voglio evidenziare è la lentezza di Python, dovuta anche al fatto che sia un linguaggio interpretato e non compilato come, ad esempio, Java. Personalmente, nella stragrande maggioranza dei casi d’uso, questa lentezza non mi ha mai creato problemi. Anzi, il fatto che sia interpretato ha sempre facilitato la portabilità tra sistemi operativi diversi. Se vuoi un punto di vista simile al mio, ma molto più tecnico e data-driven, ti consiglio un articolo di Miguel Grimberg. In questo articolo, Grimberg confronta varie versioni di Python con linguaggi più recenti (e oggettivamente più performanti) come Rust, ma con l’ecosistema (di librerie), almeno per il mondo dei dei dati e dell’AI, decisamente più limitato. E questo non è da trascurare!
👃Investimenti in ambito dati e algoritmi. Dall’exploit ai dubbi: come l’AI sta riscrivendo le regole dell’EdTech
L'EdTech (Educational Technology) è l'applicazione di strumenti tecnologici, piattaforme e metodologie digitali al mondo dell'educazione e della formazione. 🚀
È un ambito che mi appassiona molto, perché amo e pratico da anni entrambe le discipline 🙂. Inoltre, sono Magister (supporter e piccolo investitore) di un’iniziativa di 12Venture, guidata da Alberto Giusti e Fabrizio Gallante, che stanno portando avanti progetti davvero interessanti in Italia.
Durante la pandemia da Covid, il settore EdTech ha visto un boom di investimenti, seguito però, dalla seconda metà del 2022, da una drastica contrazione. Molte startup si sono trovate in difficoltà nel mantenere le promesse fatte durante i round di finanziamento. Questo calo è stato causato sia dagli eccessi di investimenti in epoca Covid, sia dalla rapida diffusione della AI generativa e di strumenti come ChatGPT, che hanno reso meno attrattive alcune soluzioni proposte da queste startup. Rimane comunque un settore in rapida evoluzione, con una vasta gamma di soluzioni che mirano a rendere l'istruzione più inclusiva e scalabile. L'EdTech sta rivoluzionando il modo in cui impariamo e insegniamo, favorendo un apprendimento continuo e personalizzato in un mondo sempre più digitale. 🌐
Se vuoi approfondire lo stato di salute e i trend in questo ambito, ti consiglio di leggere questo post di Brighteye, il principale fondo europeo di investimento nell’EdTech. Nel post vengono analizzati i dati globali e europei del primo semestre 2024 (i cui dati più sintetici ti riporto nell’immagine sotto tratta proprio dal post) e identificati i quattro ambiti più promettenti nel settore:
Apprendimento e (con) strumenti per il supporto della ricerca (non quella di Google! 😉) con l’aiuto dell’AI;
Formazione in ambito HealthTech;
Strumenti SaaS e cloud per potenziare collaborazione e innovazione;
Formazione continua e micro-learning.
Ti suggerisco anche di esplorare alcuni strumenti che stanno guidando l’evoluzione del settore:
ChatGPT, con un corso specifico per educatori e guide pratiche per sfruttarlo al meglio nel campo educativo;
Google, con i suoi strumenti NoteBookLM e il nuovissimo Learn About (accessibile tramite VPN, dato che non è ancora disponibile in Italia), entrambi particolarmente avanzati;
Perplexity, che con la versione Pro sta collaborando con alcune delle più importanti università americane.
Naturalmente, il rapido avanzamento delle grandi aziende nell’AI generativa può rappresentare una sfida per le startup EdTech, come dimostra il caso di Chegg. Tuttavia, la capacità di adattarsi e innovare rimane la chiave per competere in questo settore così dinamico.
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Decidere insieme: gli algoritmi che rendono i team più forti
Quando si è più di uno — e, per fortuna, nella maggior parte delle nostre organizzazioni è così — prendere una decisione non è mai semplice. Non solo è difficile prenderla, ma è cruciale farlo al momento giusto e nel modo giusto. Queste difficoltà, che abbiamo sicuramente sperimentato tutti almeno una volta, sono il motivo per cui voglio riproporti un contributo che era stato il più cliccato nella puntata 22 della nostra newsletter.
Come scrivevo quasi tre anni fa, il contenuto arriva da Jurgen Appelo, un esperto di agile management, ma non solo. È anche un profondo conoscitore delle organizzazioni, in particolare quelle innovative, che integrano sviluppo software, dati e algoritmi nei loro processi. Ha scritto libri molto pratici come Management 3.0 e Management for Happiness , oltre a essere un ottimo illustratore. Appelo ha anche fondato una community chiamata Unfix, dove si esplorano e condividono idee sul design di organizzazioni innovative. Il nome stesso, Unfix, suggerisce molto sull’obiettivo del progetto: scardinare modelli organizzativi rigidi.
Nel contributo che ti consiglio di leggere, Appelo affronta in modo visuale e data-driven i vari algoritmi decisionali utilizzabili nei gruppi. Li presenta in maniera semplice e con grafici chiari e gradevoli. Un contenuto essenziale se stai pensando di migliorare il processo decisionale nei gruppi con cui lavori.
Personalmente, ho avuto modo di provare quasi tutti gli algoritmi descritti nelle mie esperienze lavorative. Tra questi, penso che quello chiamato consensus sia uno dei più sottovalutati, soprattutto quando si tratta di prendere decisioni importanti e con implicazioni a lungo termine. Questo approccio decisionale non solo è efficace, ma favorisce anche una maggiore coesione del team nel medio-lungo periodo.
👀 Data Science. The Orange Book of machine learning: il manuale essenziale per la data science (tabellare)
Se dovessi consigliare un libro a chi ha una base, anche datata, di statistica e matematica, e cerca una guida pratica alla data science, senza esitazione suggerirei “The Orange Book of Machine Learning” di Carl McBride Ellis. Lo consiglio per diversi motivi:
Rispetta pienamente il sottotitolo: “The essentials of making predictions using supervised regression and classification for tabular data”. Il libro è essenziale e conciso, con approfondimenti tramite notebook che illustrano in Python la teoria spiegata, ed è ricco di rimandi a libri e articoli per esplorare nel dettaglio i vari argomenti trattati.
Focus sui dati tabulari: Si concentra sui dati strutturati, che rappresentano ancora una fetta consistente dei problemi aziendali. Copre tutti i passaggi del ciclo di data science, dall’analisi esplorativa dei dati ai modelli di regressione, classificazione e “ensemble estimators”. Non affronta le reti neurali, se non in un breve capitolo finale dal titolo molto esplicativo: “Why no neural networks/deep learning?”.
Carl McBride Ellis ha dato al libro un’impostazione molto pratica. Di fatto, il contenuto è basato su corsi intensivi di cinque giorni che ha tenuto in diverse città spagnole come consulente.
Non dimenticare che Carl McBride Ellis è anche un membro molto attivo della community di Kaggle: tre volte Grandmaster in tre aree diverse! Ti consiglio di non perderti la selezione dei suoi migliori notebook, che rappresentano un’estensione pratica e curata dei concetti spiegati nel libro.
Il libro è disponibile gratuitamente su Leanpub, ma se lo trovi utile e lo utilizzi frequentemente, potresti valutare di acquistarlo lasciando un contributo.
👅Etica & regolamentazione & impatto sulla società. Da Dartmouth a oggi: la lunga storia di cosa chiamiamo AI
“Nomen omen” dicevano i latini, e non so se sia un buon inizio per una sezione che oggi vuole, come ogni tanto faccio, occuparsi anche di semantica, cioè di come chiamiamo le cose. In questo caso giochiamo in casa, ma la posta in gioco è alta 😊, perché l’articolo, molto lungo ma completo e interessante, cerca di rispondere a una domanda tutt’altro che semplice: “What is AI?”.
Il post, pubblicato qualche mese fa su MIT Technology Review e scritto dal senior editor Will Douglas Heaven, parte dall’attuale dibattito su cosa sia veramente ciò che chiamiamo Intelligenza Artificiale. Racconta tutta la storia di questo termine e della sua evoluzione semantica, a partire dal lontano 1955, quando il computer scientist John McCarthy coniò la parola in occasione del lancio di un programma di ricerca estivo al Dartmouth College.
Ma l’articolo non si ferma all’Intelligenza Artificiale. Parla anche di termini ad essa associati e altrettanto abusati, come AGI (Artificial General Intelligence). Will Douglas Heaven ci ricorda che l’acronimo AGI fu citato per la prima volta da Shane Legg, cofondatore di Google DeepMind, nel 2007, senza che avesse in mente una definizione particolarmente chiara 🙂.
L’articolo – non il libro 😉 – è strutturato in quattro capitoli molto intriganti. Sebbene non seguano un filo cronologico preciso, nei capitoli si citano diversi articoli interessanti (alcuni che ti ho segnalato negli ultimi mesi) e vengono offerti punti di vista decisamente interessanti sul tema.
Alla fine, come onestamente ammette Will Douglas Heaven nell’incipit, non emerge una definizione chiara e univoca di ciò che comunemente intendiamo per intelligenza artificiale. Sono molto d’accordo con ciò che afferma Ellie Pavlick, ricercatrice della Brown University: “La verità è che queste parole – intelligenza, ragionamento, comprensione e altro – sono state definite prima che ci fosse la necessità di essere davvero precisi al riguardo. [...] Non mi piace molto quando la domanda diventa 'Il modello capisce – sì o no?' perché, beh, non lo so. Le parole vengono ridefinite e i concetti si evolvono continuamente.”
Will Douglas Heaven conclude l’articolo sposando la posizione di Pavlick: “Credo che sia giusto. E prima riusciamo tutti a fare un passo indietro, a concordare su ciò che non sappiamo e ad accettare che niente di tutto questo è ancora definitivo, prima potremo... non so, magari non prenderci per mano e cantare kumbaya. Ma almeno potremo smettere di insultarci a vicenda.”
Buona lettura! E se alcuni passaggi risultano troppo tecnici, fai affidamento su un’intelligenza artificiale (o come preferisci chiamarla): può essere davvero utile ed efficace 😉.
📅 Nel Mio Calendario (passato, presente e futuro)
Sabato 14 Dicembre 2024 sarò a Roma per una giornata di lezione del corso di Data Driven and Business Transformation all’interno del MBA organizzato dalla John Cabot University con il Politecnico di Milano
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!