For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il centoventisettesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del centoventisettesimo numero:
👅Etica & regolamentazione & impatto sulla società. UBS Report: L'evoluzione dei patrimoni dal 2008 a oggi
È arrivato puntualmente alla sua quindicesima edizione uno dei report con i dati economici più importanti a livello mondiale. Sto parlando del Global Wealth Report 2024 realizzato da UBS. Il report è la fotografia mondiale dello stato e della distribuzione dei patrimoni. È una lettura che ritengo indispensabile per monitorare e capire i trend di lungo periodo che avvengono nelle diverse aree economiche mondiali. Il report quest’anno è più breve, solo 33 pagine, e privilegia una lettura rapida ma fin troppo aggregata. La maggior parte delle analisi sono infatti divise in tre aree: EMEA, APAC e Americas, a mio giudizio non sufficientemente omogenee. Nonostante questo, alcuni dati sono presenti anche a livello di singola nazione, il che rende il tutto più comprensibile e utile. Anche quest’anno il report ha una solida consistenza statistica perché copre quasi il 93% dei patrimoni mondiali. In aggiunta, questa edizione ha una sezione dedicata all’analisi dell’andamento dei patrimoni dal 2008, anno dell’ultima grande recessione, al 2023, riuscendo a fornire una prospettiva storica unica. Vale veramente la pena leggerlo integralmente, non dimenticando di dedicare del tempo, come ti ricordo sempre, alle note metodologiche e alle fonti dei dati che sono serviti per realizzarlo. Ti segnalo le tre cose e l’immagine che ritengo più significative che potrebbero tornare utili da usare in altri contesti o per leggere con maggior consapevolezza alcune parti del report stesso:
1. Le ricchezze a livello globale sono cresciute del 4,2% nel 2023, riprendendosi dal calo del 3% nel 2022, che insieme al 2015 è l’unica annualità che ha avuto il segno negativo dal 2008.
2. Le ricchezze sono contabilizzate in dollari e sono la somma degli asset finanziari (azioni, obbligazioni e denaro liquido in estrema sintesi) e degli asset non finanziari (principalmente case e terreni) meno i debiti privati (non considerando quelli nazionali). Questa misura in dollari rende il calcolo molto fluttuante e dipendente dal cambio dollaro verso la valuta locale. L’andamento è anche fortemente dipendente dal rapporto tra asset finanziari e non finanziari che, per esempio, è profondamente diverso in Europa rispetto agli Stati Uniti (con più asset finanziari nei patrimoni).
3. Guardando il trend di lungo periodo dal 2000 ad oggi, la percentuale di adulti con patrimoni molto bassi (minori di 10k dollari) si dimezza, passando dal 75% dell’umanità a meno del 40%, ma la distribuzione rimane fortemente disomogenea se consideri che i 14 uomini con i maggiori patrimoni sulla terra posseggono la ricchezza di circa un miliardo e mezzo degli adulti più poveri.
Ma ci sono tantissime altre informazioni interessanti nel report, soprattutto su scala nazionale. L’Italia è una delle 56 nazioni presenti nel report e i trend relativi al nostro paese si possono leggere in chiaroscuro, a partire da un indice di Gini (che misura le disuguaglianze) basso in assoluto ma purtroppo in crescita significativa negli ultimi 15 anni.
👃Investimenti in ambito dati e algoritmi. Start-up del mese Giugno 2024: Enveda
Come ogni mese, grazie alla mia attività di monitoraggio dell'innovazione e degli investimenti a livello mondiale, ho l'occasione di presentarti una startup che ha catturato particolarmente la mia attenzione, distinguendosi per aver ottenuto finanziamenti significativi a giugno 2024. Questa startup opera nell'ambito dei dati e degli algoritmi, integrando queste tecnologie in modo sostanziale nei suoi prodotti destinati al mercato.
Iniziamo, come sempre, con qualche dato su giugno 2024 a livello globale: il numero e i valori degli investimenti si mantengono, come a maggio 2024, sopra la media dei primi quattro mesi dell’anno. Ho inserito nel mio database 490 investimenti a livello globale, di cui circa 99 associabili al settore Data & AI, con una crescita sia in termini di numero che di volumi di investimenti. Se vuoi avere una panoramica dettagliata dell'andamento globale dei primi sei mesi dell’anno con un andamento per trimestre, ti suggerisco questo post di Crunchbase. In estrema sintesi, i volumi degli investimenti sembrano stabili dopo il brusco ridimensionamento avvenuto tra il secondo e il terzo trimestre 2022, con investimenti in intelligenza artificiale e biotech sempre sugli scudi.
E infatti, la startup del mese è Enveda Biosciences, che si dedica alla scoperta di nuovi farmaci attraverso l'esplorazione dello spazio chimico dei prodotti naturali. Utilizzando tecnologie avanzate come il machine learning e la metabolomica, Enveda cerca di trasformare la chimica naturale in soluzioni terapeutiche innovative, migliorando la velocità e la scala della scoperta di farmaci.
Il loro focus è principalmente sull'uso del machine learning per l'indicizzazione e l'analisi delle strutture chimiche e delle attività biologiche, per identificare rapidamente potenziali candidati farmaci. La tecnologia sviluppata da Enveda consente di analizzare complessi set di dati per scoprire nuovi composti medicinali, rendendo il processo di scoperta più rapido ed efficiente.
I 54 milioni di dollari ricevuti a giugno completano un round B iniziato nel 2023, dove hanno raccolto complessivamente 119 milioni di dollari. Questi fondi potrebbero aiutare a mettere sul mercato ancora più velocemente i farmaci che sono già in sperimentazione e che cercano di indirizzare la cura della dermatite atopica e, in generale, delle malattie infiammatorie intestinali.
🖐️Tecnologia (data engineering). Data Flow is the New Cash Flow: Perché il Data Lineage è Cruciale
Era stato il link più cliccato dai lettori del numero 6 di questa newsletter ormai più di due anni fa, e credo sia rimasto ancora un argomento importante a cui dedicare la tua attenzione.
“Il data lineage è il processo di comprensione, registrazione e visualizzazione dei dati nel momento in cui questi passano dalle fonti al consumo … Le organizzazioni che investono nell'adozione di una cultura del dato investono molto nel data lineage, perché questo consente ai membri dei team aziendali di ogni livello di comprendere e fidarsi delle pipeline di dati e, auspicabilmente, di prendere decisioni più rapide basate sui dati.” L’approfondimento che ti consiglio oggi ti spiega perché è così importante ed entra un minimo in dettaglio nelle varie tipologie di data lineage e su alcuni strumenti utili per renderlo efficace. Come scrivevo due anni fa “Nella crescente complessità dei flussi dati, velocità e “trasparenza” sono un fattore strategico di successo. Qualcuno più famoso di me disse che “data flow is the new cash flow”. Invecchiando all’interno di aziende … sono sempre più d’accordo con questo concetto. Per questo il data lineage, che per semplicità definirei la scienza di gestire al meglio il flusso dei dati, è sempre più rilevante.
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Ricerca Online 2.0: Google e l'intelligenza artificiale alla conquista (forse) del futuro
Se mi segui da un po’ di tempo, sai che uno dei temi che più mi appassiona è come sta cambiando e cambierà il modo in cui cerchiamo le informazioni online grazie (o a causa) dell’intelligenza artificiale. In questo ambito, almeno nel mondo occidentale, Google la fa da padrone.
Per questo l’approfondimento che ti suggerisco oggi è un articolo di Wired uscito appena dopo l’evento annuale per sviluppatori organizzato da Google. L’evento si è tenuto a metà maggio e, come tutti gli anni, è anche il momento in cui Google presenta le sue novità tecnologiche e i suoi sviluppi futuri. Il titolo dell’articolo è chiaro: “È la fine della ricerca su Google così come la conosciamo”. L’articolo evidenzia molto bene come, in maniera graduale settimana dopo settimana e anche su base geografica, Google Search stia “cambiando radicalmente per allinearsi alla visione dell'intelligenza artificiale di Google e per rispondere alla concorrenza di aziende emergenti nel campo dell'intelligenza artificiale come ChatGPT. Il prodotto principale dell'azienda sta per essere riorganizzato, più personalizzato e molto più sintetizzato dall'intelligenza artificiale.”
Ti avevo parlato più volte, anche con esperti di settore, degli esperimenti che Google chiama SGE (Search Generative Experience). Essendo le modifiche alla ricerca molto graduali e lente, non è facile accorgersene, ma se spendi qualche decina di minuti a fare ricerche di tipo diverso (dalla ricerca più tradizionale di un link a una domanda più interattiva) puoi toccare con mano come stia cambiando. Semplificando molto i concetti raccontati nell’articolo, la ricerca di Google è sempre più divisa in due fasi: la prima è la comprensione, da parte di uno strumento molto vicino a Gemini ma più specializzato, della tipologia di domanda richiesta. La seconda fase, a seconda del risultato della prima, indirizza a un risultato molto diverso che può andare dalla “storica” lista di link a quella che viene chiamata “AI Overview", molto simile a quello che fanno oggi gli LLM, oppure a funzioni specifiche come per esempio il supporto per pianificare in anticipo un'attività.
Del resto, tutto questo avviene soprattutto sotto la spinta di early users che forse stanno iniziando ad abbandonare, almeno parzialmente, la ricerca di Google e io sono uno di questi. Se confronti i dati di giugno 2023 con quelli di giugno 2024, si nota già una discesa media di 1,5-2 punti percentuali in quasi tutte le geografie, pur rimanendo su scala mondiale sopra il 90%.
E questi dati, per Google, potrebbero anche peggiorare se risulteranno vere le stime di Gartner, che “ha previsto all'inizio di quest'anno che, entro il 2026, il volume dei motori di ricerca tradizionali diminuirà del 25% a causa dell'affermarsi di un approccio alla ricerca più ‘agent’, in cui i modelli di intelligenza artificiale recuperano e generano risposte più dirette”.
E se non ti basta, sull’argomento ricerca, l’articolo di Wired che ti ho segnalato e il mio parere (e faresti benissimo 🙂), ti consiglio caldamente questa intervista a Luciano Floridi, che parla anche tanto di ricerca e del suo futuro con la sua solita lucidità.
👀 Data Science. Ferragosto e Datascience: Impara i concetti base degli LLM senza un PhD 🙂
Come lettura per il weekend di Ferragosto, nella parte data science della newsletter, ti suggerisco una combo di due articoli a difficoltà decisamente crescente che ti spiegano, il primo senza far uso di matematica, i concetti principali di funzionamento dei Large Language Model senza banalizzarli ma senza necessariamente avere un PhD in Data Science.
Il primo, da cui ti consiglio di partire, è scritto da un software engineer, Miguel Grinberg, e ti fa toccare con mano, usando poche righe di Python, il concetto di embedding, di token e dei miliardi di parametri frutto dell’allenamento delle reti neurali.
Il secondo, decisamente più complesso, riesce comunque a trasferire, secondo me, molto bene il meccanismo dell’“attenzione” alla base dell’architettura dei transformers su cui si basa l’ultima generazione di LLM.
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!