For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il centrotrentacinquesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del centrotrentacinquesimo numero:
👃Investimenti in ambito dati e algoritmi. Come valutare il valore di una startup azienda: tra metriche finanziarie e scenari futuri
Una delle domande più difficili a cui rispondere, quando si parla di un’azienda, riguarda il suo valore economico. Questo vale sia per un'azienda matura, quotata e con una serie di bilanci consolidati, sia per una start-up appena nata. Lapalissiano? Forse. Certo, quando si valuta una start-up, non si dispone di informazioni economiche certe come per un’azienda più matura, ma è tutta una questione di previsione di futuri scenari e di come attualizzare nel presente o “normalizzare” nel futuro i dati disponibili.
Uno degli articoli più interessanti che ho letto, e che spiega questo concetto in maniera relativamente semplice, è quello che ti propongo oggi, scritto da Doug Clinton di DeepWater Asset Management. Nell’articolo, Clinton illustra le 6 regole alla base delle valutazioni che il fondo utilizza per stimare il valore delle aziende. In pratica, consiglia di scegliere la metrica (vedi figura sotto) più adatta allo stato di maturità dell’azienda e al momento di mercato, per poi attualizzarla nel presente o nel futuro (alla data di presunta fine vita dell'azienda). Essendo queste valutazioni legate a futuri, anche non così prossimi, è chiaro che parlare di scenari futuri senza avere certezze assolute sia un atteggiamento molto saggio.
È altrettanto saggio, quando ci si trova in situazioni di assenza di metriche economiche consistenti, evitare di inventarsele o di lavorare troppo con la fantasia, come spesso accade nell'early stage fund raising. In questi casi, è meglio basarsi su metriche più astratte o non strettamente finanziarie, che permettono una valutazione più accurata del valore della transazione in corso.
A questo proposito, ti segnalo un paper pubblicato a inizio settembre, dal titolo accattivante "A Fused Large Language Model for Predicting Startup Success". In questo studio, attraverso l’analisi di dati non strutturati (principalmente i profili aziendali su Crunchbase), sembra essere migliorata la previsione del successo o meno di circa 20.000 start-up. E l'incremento nell’accuratezza della previsione sembra decisamente rilevante (più del 2%). Per i più nerd, sotto una sintesi fatta da Shap sulle variabili più importanti del modello.
Resta tutto da vedere la robustezza del modello nel futuro (o meglio nei futuri) in un momento di alta dinamicità degli scenari mondiali …
🖐️Tecnologia (data engineering). Daniel Shiffman e l'arte del codice: un viaggio tra open source, natura e algoritmi
Sai quanto amo i progetti open source che hanno come obiettivo l’apprendimento delle nuove tecnologie, in particolare del pensiero computazionale e logico. Non solo per i giovani, ma per chiunque abbia il desiderio di acquisire nuova conoscenza. Ho dedicato e dedico tuttora molto tempo alla formazione, sia in ambito universitario che con i più giovani, ad esempio attraverso Coderdojo, una fondazione internazionale senza scopo di lucro.
Il progetto di cui ti parlo oggi segue proprio questa linea ed è assolutamente multidisciplinare. Si sviluppa intorno alla figura eclettica di Daniel Shiffman, un esperto di programmazione, professore associato di arte presso l'Interactive Telecommunications Program (ITP) della New York University Tisch School of the Arts.
Il libro online (e completamente gratuito) “The nature of Code” di Shiffman è ben riassunto da una frase nella sua introduzione: “Il mio obiettivo per questo libro è semplice: voglio dare un'occhiata ai fenomeni che si verificano nel mondo fisico e capire come scrivere codice per simularli.” Questi fenomeni sono particolarmente interessanti per chi programma, soprattutto per chi usa tanto dati e algoritmi. Le dodici parti che compongono il libro sono navigabili e fruibili in maniera indipendente. Ad esempio, ho ripassato i concetti di causalità (capitolo 0) e degli algoritmi genetici (capitolo 9), trovando il tutto estremamente ben fatto!
Il tutto è realizzato non in Python (so che forse storcerai un po' il naso), ma in JavaScript con la libreria p5.js. Però fidati, Shiffman ha creato tantissimo materiale liberamente accessibile che ti può aiutare a colmare eventuali lacune.
E a proposito di conoscenza, voglio segnalarti un libro che ho quasi finito di leggere e che sto trovando davvero affascinante: “Perché le macchine imparano - L'eleganza della matematica dietro all’AI" di Anil Ananthaswamy, giornalista scientifico e autore noto per i suoi libri che esplorano temi complessi di fisica e neuroscienze. La bellezza di questo libro è che risulta leggibile per tutti, con diversi piani di lettura a seconda del livello di familiarità con i concetti matematici. Il tutto senza risultare mai banale. Racconta la storia delle reti neurali e dei loro meccanismi di apprendimento, che sono alla base della AI generativa, partendo dalle origini: dal percettrone di Warren McCulloch e Walter Pitts e della sua prima implementazione da parte di Frank Rosenblatt. Affascinante!
Il libro è pubblicato da Apogeo, così come "In principio era ChatGPT" di
e , di cui ho scritto orgogliosamente la prefazione. A distanza di oltre un anno, continuo a considerarlo (In principio era ChatGPT) uno strumento utilissimo per comprendere meglio il contesto in cui si sta sviluppando (e utilizzando) l'AI generativa.Disclosure: Periodicamente alcune case editrici mi inviano libri omaggio. "Perché le macchine imparano" è uno di questi. Te lo segnalo per essere trasparente riguardo a possibili conflitti di interesse. Consiglio comunque solo i libri che leggo e che ritengo interessanti per te lettore di questa newsletter!
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Addio NPS? Ecco perché l'Earned Growth Rate è (forse) la metrica del futuro
Quando una metrica diventa troppo diffusa nel tempo e nello spazio, bisogna sempre chiedersi quanto il merito della sua diffusione sia dovuto alla semplicità della sua misurazione o se, invece, la popolarità stessa abbia creato un "effetto valanga", portando alla sua diffusione anche quando non lo merita o è diventata obsoleta. Per farti un'analogia in campo medico, la misurazione del colesterolo LDL non è il miglior indicatore per valutare la parte dannosa dei lipidi per le nostre arterie, e non è nemmeno l'unico parametro da considerare. Tuttavia, è ancora la metrica più diffusa, anche se le cose stanno cambiando.
Questa lunga introduzione mi serve per giustificare l'approfondimento di oggi, che prende di mira l'NPS (Net Promoter Score), una metrica che ho trovato e usato in decine di progetti, anche di data science, ma che considero assolutamente sopravvalutata.
Come spiega la voce italiana di Wikipedia: "Il Net Promoter o Net Promoter Score, abbreviato NPS, è uno strumento di gestione che può essere utilizzato per valutare la fedeltà in una relazione impresa-cliente. È un'alternativa alla tradizionale ricerca di soddisfazione del cliente ed è talvolta correlato con la crescita dei ricavi. Questo strumento è una metrica sviluppata (e protetta da marchio registrato) da Fred Reichheld, Bain & Company e Satmetrix. Fu introdotto da Reichheld nell'articolo di Harvard Business Review del 2003, intitolato 'One Number You Need to Grow'. L'NPS può assumere valori tra -100 e +100; a -100 indica che tutti sono detrattori, mentre a +100 che tutti sono promotori dell'azienda."
Per calcolare l'NPS, bisogna sottrarre la percentuale di detrattori da quella dei promotori. I detrattori sono coloro che danno un voto da 0 a 6, i neutrali danno 7 o 8 (e non vengono considerati nel calcolo finale), mentre i promotori danno 9 o 10.
L'approfondimento che ti suggerisco oggi spiega in modo pratico e basato sui dati (nel senso letterale, dato che l'esempio riportato è più illuminante dello "spiegone") come l'NPS sia superato in molti casi, e propone l'Earned Growth Rate come metrica che potrebbe sostituirlo in molte situazioni.
Non ti faccio una sintesi, perché l'approfondimento è già schematico e rapido da leggere, e poi chi lo ha scritto,
, merita almeno 10 minuti della tua attenzione!👀 Data Science. Data Science applicata: un punto di riferimento firmato dai migliori esperti
È stato di gran lunga il link più cliccato dell’edizione #14 di questa newsletter. Si tratta (uso il presente perché fortunatamente è ancora disponibile) dell'ultima bozza prima della stampa, pubblicata dalla Cambridge University Press, di un libro sulla data science applicata in diversi ambiti settoriali. È scritto da quattro giganti del settore (Alfred Z. Spector, Peter Norvig, Chris Wiggins, Jeannette M. Wing), che hanno avuto e continuano ad avere posizioni di rilievo sia in ambito accademico (Stanford, Columbia University, Berkeley) che in ambito aziendale (Google, New York Times, IBM e diverse start-up).
Il libro combina informazioni di carattere generale sulla data science (definizioni e storia) con dettagli sull'implementazione nei vari ambiti industriali, senza dimenticare approfondimenti tecnici e check-list utili per qualunque progetto di data science.
Quasi tre anni fa avevo scritto che aveva tutte le carte in regola per diventare un punto di riferimento e un best-seller nel settore. In realtà, ho azzeccato a metà la mia previsione: è diventato un punto di riferimento, ma non un best-seller, perché, a mio avviso, ha avuto la sfortuna di essere pubblicato qualche settimana prima della prima versione di Chat-GPT. L'intelligenza artificiale generativa ha rubato gran parte dello spazio mediatico, pur essendo discussi nel libro diversi casi d’uso di AI generativa, senza però citarla esplicitamente.
Nel frattempo, il sito del progetto si è arricchito di molto materiale interessante, inclusi paper sugli argomenti trattati nel libro. Personalmente lo trovo molto in linea con il tema della data science come scienza di comprensione del contesto, che ti avevo ri-condiviso nel numero scorso.
Se hai letto il libro, o almeno alcune parti, mi piacerebbe che mi/ci condividessi le tue opinioni! 😊
👅Etica & regolamentazione & impatto sulla società. AI e prospettive diverse: Sam Altman, Mafe De Baggis e un podcast tutto italiano
In questa sezione della newsletter, ogni tanto ti segnalo punti di vista anche culturalmente distanti fra loro, che a volte non condivido, ma che credo sia importante conoscere e valutare, perché stanno guidando l’evoluzione delle intelligenze artificiali o animando la discussione pubblica. Oggi ti consiglio tre approfondimenti che mi hanno particolarmente colpito nelle ultime settimane e che credo possano essere di valore anche per te.
Il primo è quasi “provocatorio”, intriso di tecno-ottimismo, ma non puoi non leggerlo perché lo ha scritto Sam Altman, la persona più importante (non è solo il CEO 🙂) della più importante azienda nell’ambito dell’AI generativa. “Ecco un modo ristretto di guardare alla storia dell'umanità: dopo migliaia di anni di scoperte scientifiche e progressi tecnologici, abbiamo capito come fondere la sabbia, aggiungere alcune impurità, disporla con sorprendente precisione su scala straordinariamente minuscola in chip per computer, fargli passare attraverso l'energia e finire con sistemi in grado di creare intelligenze artificiali sempre più capaci.”
Questa è la parte più semplicistica (e non uso questo termine a caso) di un post sul suo blog, dove declina tutto il suo (eccessivo) ottimismo. Per essere imprenditori bisogna essere ottimisti, e a lui l’ottimismo non manca.
“E se avessimo sbagliato tutto nel guardare e raccontare le Intelligenze Artificiali generative, come ChatGPT o Midjourney? E se non servissero a chi, di lavoro, scrive testi o codice, disegna fumetti o fotografa, ma a chi non riesce a farlo, pur avendo ottime idee?”. Questo, invece, è l’incipit di un articolo, il secondo approfondimenti di questa sezione, che per serendipità ho riletto questa settimana e che ha scritto
qualche mese fa su un bellissimo blog collettivo con finalità sociali, Lenius. Si può essere ottimisti e anche imprenditori (anche Mafe lo è) senza esserlo in maniera semplicistica, fornendo una chiave di lettura diversa della realtà che stiamo vivendo.Last but not least, GenIAle: un nuovo podcast in 10 puntate, che stanno gradualmente uscendo, fatto da il Post in collaborazione con un progetto molto figo italiano chiamato FAIR (Future Artificial Intelligence Research) sostenuto dai fondi europei.
Matteo Bordone, giornalista di IlPost, intervista alcuni tra i migliori esperti italiani sul tema AI per esplorare vari aspetti dell’intelligenza artificiale, affrontando argomenti di grande attualità. Super consigliato, qualunque sia il livello di conoscenza che hai su questo tema. Anche solo per conoscere, se non lo conosci già, Matteo Bordone stesso, che è, per ora, meglio di qualunque intelligenza artificiale esistente 🙂.
📅 Nel Mio Calendario
Lunedì 14 Ottobre 2024 alle 15.00 farò una chiacchierata con Santina Giannone, che è stata ospite della nostra newsletter qualche mese fa, e parleremo di come comunicare (con) i dati e di tanto altro …
Mercoledì 16 Ottobre 2024 alle 9.30 sarò presente (da remoto) al Mini Digital Festival di Parma dove parleremo (insieme a Alessandro Giaume, Pietro Leo e Alessia Canfarini) di intelligenza artificiale, di competenze umane, di leadership e di futuri.
Mercoledì 16 Ottobre 2024 alle 18.15 parlerò (dal vivo) di innovazione e strategia (ma anche di dati e algoritmi) presso il Talent Garden Calabiana in Via Arcivescovo Calabiana, 6 in un evento organizzato da tech.STARS Milano
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!
La tua newsletter è sempre fonte di stimoli interessanti. Mi occupo di valutazione d'azienda e sono molto interessato all'impatto dell'AI. Spero ne scriverai con maggior frequenza.