For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il centoquarantesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del centoquarantesimo numero:
👅Etica & regolamentazione & impatto sulla società. Giorgio Taverniti: dalla trasformazione digitale alla formazione delle nuove generazioni
Presentati
Giorgio Taverniti. Sono co-fondatore di Search On Media Group, dove dal 2004 mi occupo di supportare aziende e professionisti nella trasformazione digitale attraverso consulenze e formazione. Ho fondato nel 2003 il sito Giorgiotave.it da cui nasce il forum gt, oggi connect.gt. Nel 2010 ho scritto il libro “SEO Power” e ho creato il primo corso online SEO in Italia. Insieme al mio team, ho creato il WMF - We Make Future, il più grande festival sull’innovazione digitale. Gestisco il canale YouTube “FastForward” e la newsletter “FastLetter”, offrendo aggiornamenti continui su SEO e innovazione, compreso l’ultimo libro “Google Liquido”. Al centro del mio lavoro c’è la condivisione di idee e conoscenza per promuovere la crescita del digitale.
Il mio ruolo tra 10 anni sarà ... (continua la frase come fossi GPT-10)
Il mio ruolo tra 10 anni sarà sempre più focalizzato su educazione, divulgazione e innovazione nel settore digitale e dell'intelligenza artificiale. Sarà cruciale formare le nuove generazioni e chi muove i primi passi nel digitale, aiutandoli a comprendere e sfruttare al meglio le tecnologie emergenti. La capacità di lavorare con i dati e l'intelligenza artificiale sarà essenziale, e la formazione continua diventerà ancora più centrale. La mia missione sarà quella di creare spazi dove condividere conoscenza e rendere l’innovazione accessibile a tutti.
Quale è la sfida più importante che il mondo dei dati e algoritmi ha di fronte a sé oggi?
La sfida più importante che il mondo dei dati e degli algoritmi ha di fronte oggi riguarda l'etica, la verità e la dignità delle persone. Con l'aumento dell'uso dei dati e dell'intelligenza artificiale, è essenziale garantire che queste tecnologie siano utilizzate in modo trasparente e rispettoso. Gli algoritmi non devono distorcere la verità o ledere la dignità umana, ma piuttosto promuovere giustizia e equità. La vera sfida è bilanciare il progresso tecnologico con la responsabilità etica, assicurandosi che i dati siano al servizio delle persone, senza sfruttarle o manipolarle.
Segnalaci il progetto o la risorsa nel mondo dei dati di cui non potresti fare a meno
Il progetto di cui non potrei fare a meno è senza dubbio Google Search Console. È una risorsa indispensabile per chi lavora con i dati, poiché fornisce informazioni cruciali su come un sito web viene trovato e interpretato dagli utenti e dai motori di ricerca. Offre accesso diretto alle query di ricerca, permettendo di capire quali parole chiave portano traffico, e fornisce dati fondamentali per ottimizzare le prestazioni. Search Console è la chiave per migliorare la visibilità online, aiutando a prendere decisioni basate su dati reali e a garantire risultati tangibili nel digital marketing.
PSS (Post Scriptum di Stefano): La ricerca di informazioni sul web è diventata un processo centrale per le nostre vite professionali e personali, sempre più importante negli ultimi 25 anni. Abbiamo esplorato questo tema forse troppo poco, considerando l’impatto che ha sul presente e sul futuro di milioni di organizzazioni nel mondo. In questo momento storico, il modo in cui cerchiamo informazioni sta probabilmente subendo un’ulteriore trasformazione, anche grazie all’intelligenza artificiale. Giorgio è uno dei massimi esperti di questi processi, grazie a un’esperienza pratica pluriennale e quotidiana. Con il suo lavoro di meticolosa divulgazione, è stato (e continua a essere) una risorsa preziosa per il mio percorso di conoscenza e consapevolezza su questi temi. Oggi, nel giorno della pubblicazione di questo numero, è anche il suo compleanno e, oltre a fargli gli auguri a nome di tutti i lettori 🎂, sono doppiamente felice di ospitare la sua intervista!
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Leadership, cultura e opportunità formative: le chiavi per trattenere i talenti in azienda?
All’interno delle nostre organizzazioni, soprattutto quelle di grandi dimensioni, facilitare in modo efficace le persone che ci lavorano è diventato una sfida tanto complessa quanto fondamentale. Questa complessità è il risultato di vari fattori che si sono gradualmente sommati: i cambiamenti indotti dal periodo COVID, l’aumento delle differenze generazionali, di genere e culturali, oltre ai rapidi avanzamenti tecnologici, inclusa la diffusione delle intelligenze artificiali generative.
L’approfondimento che ti propongo oggi è un articolo che commenta uno studio ben strutturato, dal titolo esplicativo: “Predicting Attrition among Software Professionals: Antecedents and Consequences of Burnout and Engagement”. Anche se ben condotto, va interpretato con le dovute cautele: resta comunque “solo uno studio” e, pur avendo un campione significativo di circa 13.000 persone, è stato condotto su una sola azienda, seppur distribuita globalmente. Lo studio analizza in concreto come tre variabili — capacità di leadership, cultura aziendale e opportunità di apprendimento — influenzano altre tre variabili chiave: il tasso di abbandono (attrition), lo stress (burnout) e il coinvolgimento (engagement).
Ecco i principali spunti emersi, come riportato nell’articolo che sintetizza molto bene il paper:
1. Una leadership efficace riduce lo stress, ma non aumenta il coinvolgimento come sperato.
2. La cultura aziendale influisce sia sullo stress sia sul coinvolgimento.
3. Lo stress e il coinvolgimento sono predittori significativi delle dimissioni.
4. La prevenzione dello stress è una strategia chiave per ridurre le dimissioni dei talenti .
5. L’opportunità di apprendimento è un fattore predittivo importante per abbassare l’attrition.
Per esperienza personale degli ultimi dieci anni, mi ritrovo con i punti 2, 3 e 5, mentre ho qualche riserva sui punti 1 e 4. Secondo me, infatti, la leadership ha un impatto forte anche sul coinvolgimento, e la prevenzione dello stress, pur importante, non è la strategia più decisiva per ridurre l’abbandono. Tu cosa ne pensi?
Prima di concludere, ecco tre ulteriori spunti, legati al modo in cui le persone vivono l’azienda in questo periodo:
a) La prospettiva di crescita e sviluppo di carriera è particolarmente sentita, soprattutto dalle nuove generazioni. In questo sito puoi trovare vari spunti utili se lavori nel mondo tech.
b) I licenziamenti nel settore tech degli ultimi anni non sono stati equamente distribuiti tra i ruoli. Un'analisi approfondita mostra che i lavoratori in ricerca, product management e design sono stati più colpiti rispetto a quelli in software engineering e dati. Personalmente, l’ho trovato piuttosto sorprendente.
c) Infine, vorrei citare un’osservazione tratta da un post dell’ottima newsletter di
, che suggerisce una strategia per affrontare i cambiamenti in atto, particolarmente utile per chi lavora con tecnologie e dati:“Cominciate da un esercizio semplice: se dovete svolgere un compito, fatelo fare a uno strumento di AI. Ma non solo per usare il suo output: studiate come lavora, come pensa, cosa fa. Capite quindi quanto dovrete cambiare il vostro modo di lavorare per somigliargli il meno possibile. Cosa dovete smettere di fare, perché lo fa meglio lui. Cosa invece dovete approfondire o imparare a fare, perché il robot non saprà farlo senza di voi. Cosa potreste fare di diverso, tra le tante cose che non immaginavate di poter fare.”
👃Investimenti in ambito dati e algoritmi. Sanità digitale e intelligenza artificiale: il futuro del supporto ai medici e ai pazienti è già qui ma non equamente distribuito …
Come ti ripeto da diversi mesi, il settore healthcare assorbe, da solo, circa il 25% degli investimenti dei Venture Capitalist a livello globale. Una parte significativa di questo 25% (alcune stime parlano di quasi il 50%) va al settore Biotech/Pharma, focalizzato principalmente sulla ricerca di nuovi medicinali e terapie. L'altra parte, invece, viene investita in ambiti legati alla prevenzione e, in generale, ai servizi di erogazione sanitaria.
Se entriamo ulteriormente nel dettaglio, possiamo individuare almeno tre trend specifici molto rilevanti in quest'ultima categoria:
1) La ricerca di esami e biomarcatori per la diagnosi precoce delle patologie, con approcci sempre meno invasivi. Sangue e saliva (ma non solo) sono i bio-liquidi su cui si stanno concentrando maggiormente gli studi.
2) Strumenti (inclusi i wearable) pensati per supportare la salute in maniera digitale dal punto di vista dell’utente finale.
3) Strumenti a supporto dei professionisti della salute per rendere il loro lavoro più efficiente ed efficace.
L'approfondimento che ti propongo oggi riguarda un aspetto specifico del terzo punto: l'affidabilità di alcuni LLMs (Large Language Models) nel supportare i medici nel sintetizzare le informazioni emerse durante visite e colloqui con i pazienti. È particolarmente interessante notare che i risultati di queste applicazioni, ottenuti a inizio 2024, si basano su modelli non di ultima generazione, quindi ci si aspetta miglioramenti ulteriori con i modelli attuali.
Ma qui arriva il punto critico: affinché questi strumenti siano realmente efficaci, devono essere fortemente integrati con i sistemi informatici già in uso dai medici e, allo stesso tempo, devono risultare facili da utilizzare, riducendo al minimo gli errori e facilitando la formazione del personale sanitario. Questo implica, per esempio, un basso numero di "allucinazioni" (errori significativi) e un’interazione intuitiva per i medici, che dovrebbero essere "aumentati" e non sostituiti da queste tecnologie. Purtroppo, queste tematiche, pur essendo fondamentali, sono scarsamente tenute in considerazione, rendendo difficile una soluzione rapida.
Personalmente, continuo a sognare di vivere in una nazione, o addirittura in un continente, in cui ogni cittadino possa ricevere i risultati degli esami del sangue in un formato dati realmente aperto e interoperabile, con l'obbligo per ogni laboratorio di rispettare questi standard. Ricevo ancora oggi i risultati in documenti PDF, memorizzati centralmente come documenti e non come dati, con l'impossibilità di avere serie storiche facilmente analizzabili, persino a livello individuale. Certo, gli LLM stanno migliorando nella trasformazione dei PDF in dati strutturati e interoperabili, ma la strada è lunga e i risultati di questo sforzo sono parziali.
🖐️Tecnologia (data engineering). Airtable vs. Baserow: La sfida dei database user-friendly tra Cloud e Open Source
Vi era piaciuto molto quando, quasi tre anni fa, vi avevo segnalato il primo investimento in Baserow, una tecnologia di database online simile al più celebre Airtable, ma disponibile anche in versione Open Source. Uso Airtable per progetti personali da diversi anni e lo considero un prodotto eccellente: supera i limiti di Excel nell’archiviazione di collezioni di dati, anche piccole, e offre funzionalità che lo rendono simile a un vero database. Ho avuto modo di utilizzare anche Baserow per un progetto specifico e, pur non avendo tutte le funzionalità avanzate di Airtable, offre caratteristiche interessanti, come la possibilità di essere installato sui propri server e non solo in Cloud. Se vuoi avere un aggiornamento sulle differenze, trovi qui un confronto decisamente approfondito.
Nel frattempo, entrambe le aziende hanno significativamente aumentato il numero dei propri utenti. C’è ancora un ordine di grandezza di differenza: Airtable dichiara oltre 200.000 utenti del suo servizio, mentre Baserow ne conta circa 20.000. Airtable, a differenza di molte altre start-up tech, è diventata profittevole nel 2023, anche grazie a un round di finanziamento di Serie F da circa 735 milioni di dollari nel 2021, che ha portato la sua valutazione a circa 11,7 miliardi di dollari. Se sei interessato agli aspetti più finanziari di Airtable, trovi qui (quasi) tutti i dettagli.
Data Science. Modelli linguistici per la finanza (e non solo): il presente e il (prossimo) futuro in un paper
Se pensi di diventare ricco o di scoprire il prossimo unicorno leggendo l’approfondimento di oggi, mi dispiace deluderti 🙂. Ma se sei un data scientist che lavora nel settore finanziario o, più in generale, sei interessato allo stato dell’arte nell’uso della generative AI o dei modelli linguistici in generale nella finanza, non puoi assolutamente perderti questo paper dal titolo esplicativo: A Survey of Large Language Models for Financial Applications: Progress, Prospects, and Challenges. È strutturato in modo molto chiaro in quattro parti, che ti riporto di seguito:
Si parte dalla prima sezione (in realtà il secondo paragrafo) con un’analisi dei modelli specializzati per il settore finanziario. Ti segnalo in particolare un progetto ancora in fase di ricerca, Ploutos, che adotta un approccio ibrido e multimodale davvero interessante.
Nella seconda parte si approfondiscono le applicazioni più diffuse nelle organizzazioni finanziarie di tutto il mondo. Avendo lavorato per diversi anni in questo ambito e facilitato progetti di analisi di testi non strutturati, posso dire che le attuali tecnologie di generative AI hanno decisamente migliorato alcune tipologie di funzionalità/applicazioni come la Name Entity Recognition (NER), la Sentiment Analysis e, in generale, la Text Classification.
Infine, nella terza e quarta parte si analizzano i temi legati ai dati, con un focus speciale sui benchmark (un aspetto molto interessante ed esaustivo) e sulle sfide e opportunità in questo ambito.
📅 Nel Mio Calendario (passato, presente e futuro)
18 novembre 2024: fornirò la mia testimonianza all’interno del corso di “Ethics for Artificial Intelligence” tenuto dalla amico Massimo Chiriatti all’interno della Laurea magistrale in “Data Science & Management” della Luiss.
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!
"Personalmente, continuo a sognare di vivere in una nazione, o addirittura in un continente, in cui ogni cittadino possa ricevere i risultati degli esami del sangue in un formato dati realmente aperto e interoperabile, con l'obbligo per ogni laboratorio di rispettare questi standard. Ricevo ancora oggi i risultati in documenti PDF, memorizzati centralmente come documenti e non come dati, con l'impossibilità di avere serie storiche facilmente analizzabili, persino a livello individuale."
Sante parole! É davvero assurdo che questi dati siano intrappolati in formati non machine readable e che non consentano una facile rielaborazione, tanto più che sono dati realmente nostri e per la quale abbiamo addirittura pagato.