LaCulturaDelDato #214
Dati & algoritmi attraverso i nostri 5 sensi
For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il duecentoquattordicesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del duecentoquattordicesimo numero:
👃Investimenti in ambito dati e algoritmi. Irene Mingozzi: “I dati non bastano. Il vero vantaggio è trasformarli in azioni”
Presentati. Irene Mingozzi. Sono Partner in Italian Founders Fund, dove investo in startup da Pre-Seed a Series A in aziende con DNA italiano: nate in Italia, fondate da italiani nel mondo, o che vogliono entrare nel mercato italiano. Lavoro in questo spazio da circa 15 anni, la maggior parte dei quali a San Francisco, e ho avuto modo di vedere l’ecosistema da prospettive diverse: da dentro una startup, dal punto di vista di un acceleratore, e da quello di un’investitrice in fondi VC come Lombardstreet Ventures, MGI ed E12 Ventures.
Oggi in Italian Founders Fund il mio obiettivo è supportare founder ambiziosi a costruire aziende globali, mettendo insieme capitale, network e supporto operativo quotidiano.
Il mio ruolo tra 10 anni sarà… Molto diverso da oggi. La parte davvero importante resterà invariata: relazione personale con i founder, supporto continuo nel day by day e capacità di prendere decisioni con giudizio molto netto nei momenti ambigui. Tutto il resto sarà in gran parte automatizzato. Sourcing, analisi, benchmark, due diligence e monitoring saranno sempre più gestiti da sistemi e agenti. Il valore del ruolo sarà quindi ancora più concentrato su ciò che non è automatizzabile: capire le persone, leggere le dinamiche prima che siano evidenti nei dati e aiutare i founder a prendere decisioni difficili quando non esiste una risposta giusta o ovvia.
Qual è la sfida più importante nel mondo dei dati e algoritmi oggi?
Oggi esiste una quantità enorme di dati, ma spesso sono disorganizzati, non strutturati e difficili da trasformare in decisioni concrete. Il vero problema è portarli da “informazione” a “azione”, sia per gli umani sia per gli agenti.
Un esempio concreto è Reportaid, una delle aziende su cui abbiamo investito: nel contesto ospedaliero esistono moltissimi dati clinici, ma frammentati e poco fruibili. Reportaid crea valore proprio strutturandoli e rendendoli immediatamente utilizzabili, migliorando sia l’efficienza operativa sia la qualità delle decisioni.
Il vero salto nei prossimi anni sarà quindi nella capacità di organizzare, pulire e modellare i dati in modo che diventino realmente azionabili.
Segnalaci il progetto o risorsa nel mondo dei dati di cui non potresti fare a meno
Più che una singola risorsa, direi un approccio: costruire strumenti proprietari basati sui segnali che contano davvero per il nostro modo di investire.
È qualcosa che stiamo già facendo: sviluppiamo internamente tool e layer di analisi costruiti sui nostri use case, per integrare dati di mercato, metriche e insight qualitativi/quantitativi in modo rapido.
Ormai non c’è un’alternativa al farlo, il nostro settore si sta evolvendo troppo velocemente.
PS di Stefano: Ho conosciuto virtualmente Irene a partire da gennaio 2021 attraverso le straordinarie prime puntate del suo substack Silicon Valley Dojo, grazie al quale anche dall’Italia si potevano avere descrizioni dettagliate e utilissime dei batch di YCombinator. Dopo tanto tempo che la seguivo, conoscerla di persona e sentire la sua energia e la sua esperienza, ora che è tornata in Italia, è una ventata di ottimismo e speranza per tutto il movimento del VC italiano!
🖐️Tecnologia (data engineering). Perché i manager tech scrivono poco e perché dovrebbero farlo (e come)
C’è una cosa che chi lavora in tecnologia tende a fare bene: scrivere codice. E una cosa che tende a rimandare: scrivere tutto il resto 🙂 Eppure mettere per iscritto obiettivi, decisioni, strategie, aspettative è uno degli atti più potenti che puoi fare come manager o come professionista. Non perché il documento in sé valga qualcosa, ma perché il processo di scriverlo ti costringe a fare chiarezza. Prima scrivi, poi capisci davvero cosa pensi.
Bjorn Roche, engineering leader con anni di esperienza a New York e autore di un blog di management molto seguito, ha raccolto in un articolo i template documentali che usa davvero nella vita reale: artefatti testati in organizzazioni in crescita. Vale la pena conoscerli.
Uno degli errori più comuni è vedere il template come un vincolo burocratico. Roche la vede diversamente: un buon template non ti dice cosa pensare, ma ti indica dove guardare. Ti fa fare le domande giuste. E soprattutto abbassa la soglia di ingresso per chi non scrive per mestiere e in un team di ingegneri è la maggioranza.
La routine è l’altra faccia della medaglia. Un documento compilato una volta e poi dimenticato serve a poco. Quelli utili hanno un ritmo: vengono aggiornati a ogni ciclo, riletti quando il team cambia, condivisi prima delle decisioni importanti. La scrittura diventa un’abitudine importante!
Ecco alcuni esempi di documenti che ho usato anche io (in forma diversa) in alcuni momenti della mia vita professionale e che ritengo assolutamente molto utili. Il template proposto da Roche, in particolare, mi sembra decisamente efficace:
Career development plan: capire le ambizioni delle persone del tuo team non è un nice-to-have. È la base per allineare crescita personale e obiettivi aziendali. Il template aiuta a strutturare conversazioni che altrimenti rimangono vaghe.
Title ladder (scala dei ruoli): anche in un team piccolo, avere chiaro cosa distingue un junior da un senior evita incomprensioni e aspettative sbagliate. Una volta che superi una ventina di persone, diventa quasi obbligatorio.
Decision brief: quando una scelta è rischiosa o controversa, metterla per iscritto prima di agire fa emergere obiezioni, chiarisce le assunzioni, distribuisce la responsabilità. Roche avverte però: non usarla per paralizzare i processi o evitare conversazioni difficili.
Engineering post-mortem: dopo un incidente, la domanda non è “di chi è la colpa” ma “cosa possiamo imparare”. Il documento aiuta a rispondere in modo sistematico e a non dimenticare le lezioni.
La prossima volta che rimandi a scrivere quel documento che “tanto sai già cosa c’è dentro”, prova a scriverlo lo stesso. Potresti scoprire che non lo sapevi così bene. Soprattutto perché anche la sola condivisione innesca qualcosa di diverso: crei accountability, apri il confronto, costruisci una cultura. In un contesto tech, dove la comunicazione asincrona e il lavoro distribuito sono la norma, la scrittura condivisa può diventare infrastruttura quanto lo è il codice.
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Smetti di chattare con l’AI. Costruisciti un assistente personale
Ogni giorno usiamo ChatGPT, Claude o Gemini come interlocutori usa e getta: apriamo una chat, spieghiamo il contesto da zero, otteniamo una risposta, ricominciamo. È comodo, ma il valore resta al provider, non a noi. Il mio amico Massimiliano Turazzini, in un post che ti consiglio di leggere sulla sua newsletter “AI, Max”, propone un cambio di paradigma: passare dal “New Chat” al “New Task”. Non chattare con l’AI, ma farla lavorare con te, sui tuoi file, con le tue regole, nel tuo ambiente.
Perché costruirsi un assistente personale? Massimiliano lo spiega in dettaglio: ci sono tre ragioni concrete.
Primo: il contesto diventa tuo e indipendente dallo strumento. Se domani cambi modello, le istruzioni, la struttura delle cartelle e la memoria restano.
Secondo: hai il controllo. La memoria opaca dei chatbot commerciali, dove non sai cosa ricordano, cosa dimenticano, cosa mescolano tra progetti diversi, viene sostituita da file che puoi ispezionare e modificare.
Terzo: lavori come sei abituato a lavorare con i colleghi, in modo incrementale, senza rispiegare tutto ogni volta.
I passaggi chiave che Turazzini consiglia sono: partire da Claude Code (o un ambiente agentico equivalente), puntarlo su una cartella locale con i tuoi materiali, creare agenti specializzati per ruolo (analista, correttore, traduttore) scrivendo semplici “job description” attraverso lo standard degli skill, e connettere strumenti esterni via MCP. Nessun codice richiesto: basta descrivere cosa vuoi ottenere.
I limiti da tenere a mente: l’investimento iniziale in setup non è banale, le questioni di cybersecurity restano aperte (un agente che opera sul tuo filesystem ha accesso reale) e la curva di apprendimento esiste anche per i non-developer. Lo stesso Turazzini lo ammette: il suo post è, di fatto, una prefazione; la guida operativa è ancora da scrivere. Ma il punto vero è un altro: l’approccio pratico è l’unico che funziona. Non basta leggere di AI agentica: serve sporcarsi le mani, configurare, sbagliare, iterare.
Chi inizia oggi costruisce un vantaggio competitivo che si accumula nel tempo, conversazione dopo conversazione. Scegli un progetto reale, piccolo, e prova. Il passo da “chatto con l’AI” a “l’AI lavora per me” è meno lungo di quanto sembri. Anche io sto facendo questo viaggio/passaggio e, per ora, mi sembra molto utile.
👀 Data Science. “Correlation is not causation”: lo sapevi già. Nell’era degli agenti AI, vale il doppio!
Nel numero 92 di questa newsletter avevo aperto la sezione Datascience con la frase che senti spesso nei contesti data: “correlation is not causation”. Bella come promemoria, quasi mai davvero messa in pratica. Mi ero fermato sulla distinzione tra inferenza statistica, che ti dice se due variabili si muovono insieme, e inferenza causale, che ti dice se una ne provoca l’altra. Da allora qualcosa è cambiato. Non nel problema di fondo. Ma nella posta in gioco.
L’approfondimento più letto in quel numero era stato il bellissimo libro di Judea Pearl & Dana Mackenzie, “The Book of Why”, che mi sento di consigliarti ancora. Ma per riprendere il filo su questo tema ti suggerisco di partire, questa volta, da questo pezzo di Peter Attia che parla della Mendelian Randomization (MR): non un modello predittivo qualunque, ma una delle tecniche più usate nell’inferenza causale.
L’idea che sta alla base della MR è molto utile: siccome le varianti genetiche vengono assegnate alla nascita per pura casualità biologica, come tirare un dado, puoi usarle per simulare un esperimento controllato senza randomizzare nessuno. Funziona benissimo, per esempio, per studiare se il colesterolo alto causa malattie cardiovascolari: trovi le varianti genetiche che alzano l’LDL indipendentemente dallo stile di vita, verifichi se chi le possiede ha anche più infarti, e hai un argomento causale solido. Il problema nasce quando applichi la stessa logica a comportamenti complessi come la “dieta vegana” o la “dieta ipocalorica”. Non esiste un gene che ti fa mangiare vegano. Per far funzionare l’analisi, i ricercatori hanno dovuto abbassare la soglia di significatività di tre ordini di grandezza rispetto allo standard. L’analogia di Attia: è come usare un martello per avvitare una vite, accorgersi che il legno non tiene, e invece di cambiare attrezzo decidere di abbassare gli standard su cosa conta come “unione solida”. La sofisticazione del modello non compensa mai la debolezza delle premesse causali.
Ma cos’è cambiato dal 2023? Nel 2023 non avevo ancora motivo di affrontare questo punto: cosa succede quando non sei tu a interpretare il risultato di un modello, ma è un agente AI che agisce in autonomia? La causalità è un ingrediente ancora molto critico nell’AI di oggi e, allo stesso tempo, è fondamentale per costruire sistemi agentivi in cui reti di agenti aiutano a prendere decisioni, risolvere problemi e agire per conto delle persone. Un agente che ragiona per correlazione può fare la mossa sbagliata nel mondo reale: non ti consegna un numero da interpretare, esegue un’azione.
Ma la cosa più interessante è un paper del 2024 di Google DeepMind che ha dimostrato matematicamente che qualsiasi agente capace di adattarsi a distribuzioni diverse deve aver appreso un modello causale: ovvero che la causalità non è un optional per chi vuole costruire agenti che generalizzano davvero.
👅Etica & regolamentazione & impatto sulla società. HRV: il numero che ti dice come stai gestendo lo stress (più di quanto pensi)
Se c’è un parametro che spesso riassume in un solo numero come il tuo corpo sta gestendo carico (di allenamento) e stress, quello è l’HRV: la variabilità della frequenza cardiaca (Heart Rate Variability). Ne parlo spesso e ci torno oggi grazie a un approfondimento che ti consiglio: un’intervista molto chiara a Marco Altini nel podcast di UESCA, un riferimento mondiale nella formazione tecnica per sport di resistenza.
Marco Altini (ospite anche nella puntata #120 di questa newsletter) lavora proprio all’incrocio tra data science, fisiologia e sport: è il fondatore di HRV4Training e advisor di Oura, ed è uno degli esperti mondiali sul tema HRV.
Cos’è in pratica l’HRV? Il tuo cuore non batte come un metronomo. I Se hai 60 battiti al minuto, non significa che scocchi un battito ogni secondo esatto. Tra un battito e l’altro il tempo cambia continuamente: un intervallo può durare 0,9 secondi, quello dopo 1,1 secondi, e così via. L’HRV non è la distanza tra i battiti, ma la variazione di queste distanze nel tempo. Questa variazione riflette l’equilibrio tra le due branche del sistema nervoso autonomo: simpatico (che ti attiva) e parasimpatico (che ti fa recuperare). Quando sei sotto stress (o sotto carico: allenamento, poco sonno, magari stai covando qualcosa), in genere si riduce la modulazione vagale (parasimpatica): il battito tende a diventare più “regolare” e spesso anche più veloce. L’HRV scende. Quando sei più rilassato e recuperato, l’HRV tende a salire.
Un punto chiave che Altini sottolinea riguarda quando misurare. La misurazione al mattino è spesso più utile se vuoi guidare l’allenamento, perché avviene dopo l’effetto ristoratore del sonno e lontano dagli eventi che possono aver generato stress al corpo nella sera prima (idealmente: appena sveglio, prima di caffè e telefono). La misurazione notturna, raccolta dai wearable durante il sonno, è spesso più legata a comportamento e stile di vita (cena pesante, alcol, stress lavorativo). Mattino per il training, notte per la vita: regola pratica che può aiutarti a scegliere in modo più efficace (senza trasformarla in una “legge”).
Se preferisci una spiegazione in italiano con taglio medico, il mio amico cardiologo Dott. Nicola Triglione, che era stato ospite della newsletter nel numero 112, ha contenuti eccellenti su HRV e su come migliorarlo.
Ultimo punto, da utente di Oura Ring e Samsung Galaxy Watch: i due dispositivi mi danno valori diversi di HRV. Non stressarti su questo. Esistono metriche diverse (es. RMSSD e SDNN) e anche sensori/algoritmi diversi:
RMSSD è spesso usata dai wearable perché cattura bene la variabilità “a breve termine” (ed è quella più tipicamente collegata alla componente vagale).
SDNN è più “globale” (dipende molto dalla finestra di misura e dal contesto)
In più, anche i campioni di dati usati cambiano le carte in tavola: molti dispositivi lavorano su finestre da pochi minuti e poi fanno medie/aggregazioni durante la notte.
Quello che conta davvero è la tua media nel lungo periodo e gli scostamenti da quella media; meglio ancora: confrontati con te stesso usando sempre lo stesso device, o almeno lo stesso metodo. Se scendi sotto la tua norma per più giorni, è un segnale di recupero scarso o stress in aumento. Il singolo numero giornaliero, non è molto significativo.
Nella giungla di dati e KPI sulla salute, vale sempre di più il principio “less is more”: concentrati su pochi indicatori davvero utili senza farti travolgere. L’HRV è, secondo me, uno di quelli. Lo uso da più di 5 anni ed è stato (e continua a essere) di grande valore sia per lo sport che per migliorare il mio stile di vita.
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!


