LaCulturaDelDato #203
Dati & algoritmi attraverso i nostri 5 sensi
For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il duecentotreesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del duecentotreesimo numero:
👅Etica & regolamentazione & impatto sulla società. Ethos, Pathos e Logos: perché i dati da soli non convincono nessuno (neanche in azienda) 🙂
Nella mia prima parte della vita professionale mi sono illuso, o meglio, mi sono innamorato, dell’idea che, per riuscire ad arrivare a una decisione condivisa con altre persone, sia all’interno dell’organizzazione per cui lavoravo sia semplicemente all’interno della mia famiglia, bastasse portare buoni dati o informazioni a supporto della decisione. E, nonostante mi sforzassi di migliorare la qualità dei dati e delle informazioni a supporto, questa mia convinzione si è dimostrata un’illusione 🙂. Ho imparato infatti che le componenti in gioco erano anche tante altre, e l’importanza di queste (altre) cresce al crescere del numero di persone coinvolte nel processo decisionale. Probabilmente se avessi studiato meglio filosofia al liceo tutto sarebbe stato più semplice 🙂. Oppure se avessi avuto a disposizione gli approfondimenti che ti condivido oggi, la velocità del mio processo di apprendimento sarebbe sicuramente aumentata. Non lo saprò mai ;-).
Anne-Laure Le Cunff, una delle mie neuro-scienziate preferite, riflette in questo articolo e in questo approfondimento del suo laboratorio collettivo proprio su ciò che fa la differenza quando presenti dati o informazioni con l’obiettivo di convincere un’audience ad adottare una decisione o una strategia specifica. La differenza, secondo Le Cunff e… Aristotele nella retorica, la fanno l’uso di Ethos, Pathos e Logos.
Nell’articolo si spiega molto bene come questi tre artefatti si usano al meglio nel contesto organizzativo moderno, e cioè:
Ethos: costruisci credibilità oltre le credenziali. In pratica: non basta “avere titoli”, devi far percepire affidabilità con coerenza, trasparenza su metodo/limiti e segnali concreti di competenza.
Pathos: usa l’emozione in modo strategico. In pratica: attiva l’emozione giusta (urgenza, curiosità, empatia) per guidare attenzione e azione, senza scivolare nel melodramma o nella manipolazione.
Logos: fai sembrare la tua logica inevitabile. In pratica: accompagna il lettore passo passo da evidenze a conclusioni, anticipa le obiezioni e riduci i “salti” logici.
Molto più facile a dirsi che a farsi… ma esserne consapevoli è già parte del miglioramento possibile. Almeno lo è stato per me: spesso i dati non parlano da soli. Anche se, da buoni data lover, ne siamo a volte troppo convinti.
👃Investimenti in ambito dati e algoritmi. Europa: davvero siamo (irrimediabilmente) ‘vecchi’… o ci stiamo (anche) raccontando male?
In Europa siamo dei maestri nel raccontare e mettere in evidenza la parte peggiore di noi, e anche gli aspetti più negativi di un fenomeno in cui siamo immersi. E in Europa noi italiani siamo i migliori. Tutto questo genera fenomeni negativi, come la perdita di fiducia dei giovani, l’effetto profezia che si autoavvera e la tendenza dei migliori talenti ad abbandonare il vecchio continente. E l’aggettivo “vecchio” è probabilmente la causa di tutto.
Quando si parla di innovazione e di investimenti nel mondo VC, tutto questo emerge in maniera molto forte. Oggi voglio provare a dare una prospettiva di lettura diversa, più positiva, all’approfondimento che ti consiglio: l’edizione 2025 dello State of European Tech.
Lo State of European Tech è il report annuale più autorevole sull’ecosistema tecnologico europeo, curato dal fondo Atomico. È unico perché unisce dataset di partner, survey e analisi in un formato interattivo: talenti, investimenti, capitale e scelte di policy sono spiegati con grafici, fonti e note metodologiche che rendono i numeri verificabili e confrontabili. È importante leggerlo per comprendere i macro-trend strategici e le sfide competitive dell’Europa rispetto a USA e Asia, e anche come “benchmark” di lungo periodo: racconta l’evoluzione dell’ecosistema e richiama esplicitamente una traiettoria dal 2015 in avanti, con un archivio delle edizioni precedenti per fare confronti anno su anno.
Lascio a te la lettura del documento 2025, in tutti i dettagli e le sfumature, e ti fornisco due prospettive: per una volta, positive da un punto di vista europeo.
La prima immagine che ti condivido del report mostra tre indicatori che segnalano come l’ottimismo sulla possibilità di fare innovazione anche in Europa stia crescendo rispetto all’anno scorso: sia per la possibilità di trovare e trattenere talenti, sia perché, anche dal punto di vista geografico, l’Europa (rispetto ad altre aree del mondo) può fornire migliori garanzie.
La seconda immagine mostra come i capitali investiti in Europa, rispetto a quello che è successo nel 2025 in USA, non siano cresciuti. Ma in un mondo dell’innovazione dove, soprattutto grazie alla generative AI, il bootstrapping mode (autofinanziamento nelle prime fasi di vita della start-up) sta diventando sempre più rilevante, questa può non essere una notizia negativa. Soprattutto se, come molti sostengono, siamo in una bolla di valutazione delle aziende che lavorano in ambito AI…
🖐️Tecnologia (data engineering). Risorse pratiche per chi lavora con dati (senza annegare nel rumore)
Una delle rubriche che apprezzate di più è l’ultima domanda delle mie interviste: “Qual è lo strumento di cui non puoi fare a meno?”. Spesso i link consigliati dagli ospiti diventano i più cliccati della settimana, trasformandosi in risorse preziose per il vostro lavoro.
È successo anche per la puntata 81 di La Cultura del Dato. L’ospite era Serena Sensini (di cui potete sentire una recente intervista molto interessante qui fatta da Stefano Maestri ), che ci ha raccontato come il progetto Towards Data Science (TDS) sia stato fondamentale per la sua formazione continua.
Perché TDS è ancora essenziale nel 2026? Probabilmente lo conoscete già: nato nel 2016, TDS è diventato il punto di riferimento globale per chi lavora con dati, ML e AI. La grande novità è che da inizio 2025 TDS ha cambiato casa: ha lasciato la piattaforma Medium per diventare una pubblicazione totalmente indipendente. Una mossa dettata dalla volontà di riprendere il controllo sui propri contenuti e sulla SEO, ma che porta un vantaggio anche a noi lettori: un sito proprietario più accessibile e libero dalle logiche a pagamento . Oggi TDS va usato con due scopi precisi:
Come archivio storico: È un contenitore di tutorial e ricette pratiche. Quando dovete passare dall’idea al codice, spesso qui trovate la soluzione pronta.
Come radar (The Variable): Se il tempo è poco, il consiglio è iscriversi alla loro newsletter, The Variable. La loro selezione settimanale è utile per capire cosa sta diventando mainstream senza annegare nel rumore di fondo.
Ma i consigli di Serena non finivano qui. Il secondo link più cliccato della puntata è stato il suo progetto The Red Code dove Serena scrive, insieme a esperti del mondo tech, settimanalmente articoli sul mondo tech in italiano, con un taglio estremamente pratico e di grande valore. Sono diventato anch’io un suo assiduo lettore: super consigliato!
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Retrofit, bottleneck cascade e jagged frontier: il paradosso dell’AI in azienda, spiegato da diverse prospettive
Quando Geoffrey Hinton nel 2016 dichiarò “smettiamo di formare radiologi”, sembrava ovvio: l’AI riconosceva pattern meglio degli umani. Eppure oggi i radiologi non solo esistono ancora, ma sono più richiesti che mai. Come mai questa predizione è fallita? Negli ultimi mesi ho letto diversi articoli su questi temi e mi hanno fatto riflettere su un tema critico del nostro tempo: tutti, all’interno delle nostre aziende, stiamo cercando di migliorarle soprattutto grazie all’AI ma facciamo una grande fatica!. Tra le tante riflessioni, tre mi sono piaciute più di tutte perché spiegano, almeno in parte, quello che stiamo vivendo. Sono i tre approfondimenti di questa sezione di oggi.
Il problema non è tecnico, è sistemico. David Peterson di Angular Ventures lo chiama, nel primo approfondimento che ti suggerisco, “retrofit”: inserire l’AI in un singolo passaggio di un processo complesso senza ripensare il processo stesso. Come l’elettricità nei primi del ’900: inizialmente le fabbriche sostituivano semplicemente il grande motore a vapore centrale con un grande motore elettrico centrale, mantenendo il sistema di trasmissione a cinghie che distribuiva la potenza a tutte le macchine. Zero miglioramenti di produttività. Il salto è arrivato solo quando hanno capito che l’elettricità poteva essere distribuita ovunque e hanno adottato il “unit drive”: un piccolo motore elettrico dedicato per ogni singola macchina. A quel punto hanno potuto riarchitettare completamente le fabbriche: niente più layout vincolati dalla vicinanza al motore centrale, assemblaggi in linea logica invece che radiale, spazi più sicuri e luminosi.
E quando un collo di bottiglia viene risolto, ne emerge subito un altro: è la “bottleneck cascade” descritta sempre da Peterson nel secondo approfondimento che ti suggerisco. Due anni fa il limite era avere GPU, poi è diventata l’energia, ora forse è il talento.
Ma il tema del collo di bottiglia può essere visto anche da un’altra prospettiva: quella del terzo approfondimento che ti consiglio oggi, scritto da Ethan Mollick. Mollick è (anche famoso) per averci ricordato fin dall’inizio che l’AI ha una “frontiera frastagliata” (jagged frontier). Significa che le sue capacità non crescono in modo uniforme: può essere sovraumana in diagnostica medica differenziale o matematica, ma terribile in puzzle visivi semplici o nel gestire un distributore automatico. Non è un problema di “intelligenza generale”: è proprio che l’AI è bravissima in certi compiti specifici e pessima in altri, in modi che non rispecchiano la nostra intuizione di difficoltà. Questa frontiera crea colli di bottiglia insospettabili. Esempio concreto dalle Cochrane review (le meta-analisi mediche più autorevoli): GPT-4.1 ha riprodotto 12 anni di lavoro umano in due giorni, con accuracy superiore agli esperti, analizzando 146.000 citazioni scientifiche. Eppure non può completare il lavoro da solo perché non sa accedere ai file supplementari degli studi né scrivere email agli autori per richiedere dati non pubblicati: attività banali per un umano. Quel misero 1% di casi limite blocca l’automazione completa del processo. Il bello è che quando questi colli di bottiglia vengono risolti, tutto il sistema può saltare in avanti. Lo storico Thomas Hughes li chiamava “reverse salients”, il singolo problema tecnico o sociale che frena l’intero avanzamento. L’esempio più potente dell’ultimo mese: Google ha risolto la generazione di immagini coerenti con Nano Banana Pro. Improvvisamente PowerPoint, documenti e comunicazione visiva sono diventati automatizzabili in modi prima impossibili, perché la qualità delle immagini era il reverse salient che bloccava tutto.
Quello che emerge da queste letture è che diventa sempre più importante non solo guardare i benchmark dell’AI, ma anche guardare i colli di bottiglia dell’AI attuale in relazione al caso d’uso che ne vogliamo fare all’interno delle nostre organizzazioni.
👀 Data Science. Elo (non solo per gli LLM): finalmente capiamo (matematicamente) perché funziona e come farlo funzionare meglio
L’Elo rating è un sistema di classificazione sviluppato originariamente per gli scacchi (dal suo creatore Arpad Elo) che stima la forza relativa dei giocatori. Il principio è semplice: quando due giocatori si sfidano, il sistema calcola la probabilità attesa di vittoria basata sulla differenza tra i loro rating. Se vinci contro un avversario più forte, il tuo rating sale molto; se perdi contro uno più debole, scende parecchio. Oggi l’Elo è diventato fondamentale anche per valutare i modelli di intelligenza artificiale. Le leaderboard come LMSYS Chatbot Arena e, in parte, suite come OpenCompass (nelle valutazioni soggettive) usano varianti di Elo per classificare i LLM. Invece di far giocare a scacchi, si fanno competere le AI su task oppure si fa votare agli utenti quale risposta preferiscono.
È un metodo elegante perché:
non serve un benchmark statico che può essere raggirato;
si aggiorna continuamente con nuove sfide;
riflette le preferenze reali degli utenti.
Nonostante sia diventato un modo importante per valutare le intelligenze artificiali, finora mancava una comprensione matematica rigorosa del perché funzioni e di quanto velocemente converga ai valori reali. L’approfondimento che ti consiglio oggi è un paper, scritto da Sam Olesker-Taylor e Luca Zanetti: è abbastanza complesso dal punto di vista matematico, ma dimostra tre cose importanti:
Elo converge ai rating reali con velocità simili ad altri algoritmi che risolvono lo stesso tipo di problema .
Funziona in modalità online (aggiorna man mano), mentre gli altri algoritmi lavorano offline su dataset completi.
Si può ottimizzare quali confronti fare per far convergere i rating più velocemente, un po’ come scegliere bene quali partite far giocare in un torneo per capire chi è il più forte con meno match possibili. Per le leaderboard AI significa che non serve far competere tutti contro tutti: basta scegliere bene i confronti, riducendo potenzialmente da O(n³) a O(n) il numero di confronti necessari. Questo non è solo un esercizio teorico: ridurre i confronti necessari significa abbattere drasticamente i costi computazionali ed economici per mantenere le classifiche aggiornate.
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!




grazie per i contenuti sempre interessantissimi. Sugli investimenti non riesco a essere così positivo: i talenti vanno dove ci sono gli investimenti e non appena ritornerà una gestione più sensata del paese (USA)vedrai la fuga. A meno che da noi siano tutte startup AI-based, oppure che non ci sia abbastanza richiesta di fondi. In ogni caso un gap difficilmente recuperabile. Sul primo punto (dati): è verissimo, e a mio avviso anche dovuto al fatto che i dati rappresentano una efficace fotografia corrente/storica ma è molto difficile risalire alle cause del fenomeno osservato anche incrociando dataset diversi - e quindi vai di Pathos e Logos 😊
Sempre di grande ispirazione. Lo ascolto per trovare spunti interessanti che porto nel mio lavoro. Grazie