LaCulturaDelDato #195
Dati & algoritmi attraverso i nostri 5 sensi
For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il centonovantacinquesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del centonovantacinquesimo numero:
👃Investimenti in ambito dati e algoritmi. Niccolò Sanarico: N8N, knowledge graph e tanta tecnologia. Il lato nerd del venture capital
Presentati. Niccolò Sanarico. Sono sempre stato attratto dallo sperimentare: con la chimica, la fisica, fino alla scoperta dell’informatica con il 286 di papà, da cui non mi sono più allontanato (l’informatica, non il 286). Ho studiato ingegneria del software, ho cominciato la mia carriera in Neptuny (oggi Moviri) prima di decidere di investire ancora su me stesso con un MBA presso la Oxford University (non sapevo cosa fare da grande, ad essere onesto). Durante quel percorso scopro che gli ingegneri possono anche fondare imprese, e non solo lavorarci dentro, ed in quel momento è scattato il mio secondo innamoramento professionale: decisi che da grande sarei finito o in una startup o nel venture capital. Rientrato in Italia (era il 2010) mi tengo impegnato in varie attività, fino all’ingresso in dPixel, una piccola boutique di advisory ed investimento specializzata nel venture capital, fondata da Gianluca Dettori. Da lì inizio il mio percorso con Gianluca ed il resto del team, fino a diventare general partner per la practice digital di Primo Capital SGR SpA. Oggi mi occupo soprattutto di gestione delle strategie di investimento in aziende nello spazio del digitale, pubblico la mia newsletter, The Week in Italian Startups, sugli eventi del mercato startup italiano, ma non ho mai smesso i miei abiti da ingegnere del software, e passo ancora molto tempo a studiare e sperimentare con quello che trovo.
Il mio ruolo tra 10 anni sarà ... (continua la frase come fossi GPT-10) )… lo stesso di oggi, ma con un sottostante molto diverso. Mi aspetto di continuare a lavorare con imprenditori in ambito tecnologico, e di raccontarne le azioni tramite la mia newsletter. Mi aspetto di continuare ad allocare capitali ed investire in aziende, ma le promesse dell’AI di oggi mi creano molti interrogativi sulla forma di queste aziende ed in generale del mercato tra 10 anni. Si parlerà ancora di software? Di “coding”? Non ne sono certo, e forse non me ne starò nemmeno più occupando. Sono molto eccitato per quello che ci aspetta.
Quale è la sfida più importante che il mondo dei dati e algoritmi ha di fronte a sé oggi? Nel mio mercato, è ormai molto affermata (ma non del tutto condivisa) la figura del data-driven VC, l’investitore che si affianca a tecnologie in ambito dati per supportare i processi chiave (raccolta, investimento, exit). Il VC è un grande esempio di mercato nato e cresciuto da relazioni ed istinto, che sta cercando di trasformarsi abbracciando pienamente un approccio data-driven. Siamo nel pieno della sfida di provare che questa trasformazione (A) si possa fare e (B) sarà migliorativa rispetto allo standard.
Segnalaci il progetto o la risorsa nel mondo dei dati di cui non potresti fare a meno …
Per mia fortuna non ho un progetto “irrinunciabile” - essendo uno sperimentatore, per qualunque cosa io usi ho almeno 2 o 3 alternative che ho provato, e che non sono necessariamente peggiori. Oggi lo strumento che più uso è N8N, che ormai è radicato in varie parti del mio lavoro quotidiano. Di fatto molta della mia quotidianità riguarda lo spostamento / trasformazione di dati (vd. N8N) o la loro visualizzazione / analisi (su questo sono ancora affezionato a Streamlit). Sarei molto molto triste se perdessi il knowledge graph sul mercato del VC italiano che mi sono costruito attraverso la newsletter in questi anni.
🖐️Tecnologia (data engineering). Da OpenAI ad Anthropic: la lunga corsa di Claude fino a sfidare ChatGPT
ChatGPT è considerato da quasi tutti il sinonimo di intelligenza artificiale generativa. Lo è perché, a novembre 2022, è stato il primo servizio di questo tipo esposto a una buona fetta della popolazione mondiale in una modalità davvero accessibile: una semplice chat, la parola scritta, che resta il modo più immediato e discreto per relazionarsi con un essere umano. Per certi versi persino più del parlato, che è arrivato solo qualche tempo dopo.
Questo vantaggio temporale, essere uscito per primo, insieme alla continuità dei miglioramenti nel tempo gli ha permesso di mantenere il primato d’uso a livello mondiale, fino a toccare, nel 2025, quasi il miliardo di utenti periodici.
C’è però un’altra intelligenza artificiale che è diventata gradualmente sempre più utile, interessante e, in molti ambiti, un reale competitor di ChatGPT: Claude.ai di Anthropic.
Ho avuto la fortuna, e per certi versi la perseveranza, di usarla fin dall’inizio nella sua versione a pagamento e ne ho apprezzato l’evoluzione, le differenze rispetto a ChatGPT e, in alcuni casi, la complementarietà. Oggi, per esempio, sul piano della capacità espressiva linguistica (anche in italiano) e del coding, la trovo persino migliore per i miei casi d’uso.
La sua storia arriva da lontano e, per certi versi, proprio da OpenAI. Infatti, nel 2021 alcuni ex-OpenAI, guidati da Dario e Daniela Amodei, fondano Anthropic con l’idea dichiarata di costruire modelli potenti ma soprattutto sicuri: da qui nascerà Claude. Tra 2021 e 2022 il team lavora ai primi prototipi e, nell’estate 2022, completa la prima versione interna di Claude, che però resta in test per motivi di sicurezza. A marzo 2023 Anthropic esce allo scoperto: lancia Claude e Claude Instant con accesso limitato a partner e utenti selezionati. L’11 luglio 2023 arriva Claude 2, disponibile al grande pubblico via web e API, con un contesto da 100.000 token che lo rende subito interessante per usi professionali. Nel frattempo l’interfaccia claude.ai si consolida come porta d’accesso consumer e business al modello, affiancata da integrazioni cloud come Amazon Bedrock. Il 4 marzo 2024 Anthropic presenta la famiglia Claude 3 (Haiku, Sonnet, Opus), che punta a superare GPT-4 e Gemini Ultra su molti benchmark, con capacità multimodali avanzate. A giugno 2024 debutta Claude 3.5 Sonnet, più veloce ed economico di Opus, accessibile gratuitamente su Claude.ai e pensato per un uso quotidiano intensivo, anche da mobile. Nel 2025 Anthropic continua ad allargare l’ecosistema lanciando Claude Code, l’agente di coding integrato nel browser e nell’app iOS, capace di lavorare direttamente sui repository GitHub. Nello stesso anno arriva anche Claude Haiku 4.5, ottimizzato per chat, coding e sintesi documentale in tempo quasi reale.
L’approfondimento che ti consiglio oggi, se non conosci bene le intelligenze artificiali di Anthropic, è il sito GitHub dell’azienda, in particolare la parte dedicata ai corsi per imparare a usare tutti i suoi servizi. L’approccio sia alla documentazione sia ai corsi veri e propri è molto “nerd” e orientato a un pubblico vicino allo sviluppo software e al mondo aziendale. A me piace molto e lo trovo davvero efficace. E questo approccio segue, o forse per certi versi è anche la causa, del diverso tipo di utilizzo rispetto a OpenAI.
Infatti, in termini puramente di mercato consumer, ChatGPT domina pesantemente (centinaia di milioni di utenti contro qualche decina di milioni per Claude): circa il 60% del mercato contro il 3–3,5%. Mentre nel mercato corporate Claude sembra in testa con un 32% di quota contro il 25% di OpenAI. Claude è particolarmente forte in education, ricerca scientifica, analisi di documenti complessi e settori regolamentati, mentre ChatGPT è più forte dove la multimedialità è un requisito importante.
Se sei uno sviluppatore o un data-expert, il consiglio è pragmatico: prova entrambi (Claude e ChatGPT) per almeno 2-3 settimane sui tuoi casi d’uso reali. Solo così scoprirai quale si adatta meglio al tuo caso d’uso.
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. La spirale negativa dell’AI: l’automazione rischia di eliminare la gavetta e il ricambio generazionale?
Per la prima volta in 45 anni, la disoccupazione tra i neolaureati americani ha superato la media nazionale, attestandosi tra il 5,8% e il 6,6%. Alla Stanford Business School, la percentuale di laureati con un’offerta entro tre mesi dalla laurea è diminuita dal 90% all’80% tra il 2021 e il 2024. Le aziende tech hanno dimezzato le assunzioni entry-level dal 2019 e oggi i neolaureati rappresentano solo il 7% delle nuove assunzioni nel settore.
Ti avevo già suggerito, proprio su questo tema, nella puntata 184 un bellissimo studio, Canaries in the Coal Mine? Six Facts about the Recent Employment Effects of Artificial Intelligence, di tre studiosi dell’Università di Stanford super autorevoli: Erik Brynjolfsson, Bharat Chandar e Ruyu Chen. Dallo studio emergevano segnali forti: l’IA generativa aveva iniziato a influenzare in modo significativo l’occupazione giovanile.
Il problema sembra non solo quantitativo ma anche strutturale. L’IA sta automatizzando proprio quel “lavoro sporco” che serviva come palestra formativa: l’analisi dei documenti negli studi legali (ridotta del 40%), la raccolta dei dati nelle investment bank, le prime versioni di codice nello sviluppo software. Il risultato è quello che viene chiamato “hollowing out”: le aziende rischiano di ritrovarsi senza middle management tra 5-10 anni, perché eliminando i ruoli junior oggi stanno tagliando la pipeline di talenti di domani, con le società di consulenza in testa. Questo non vuol dire che l’IA non vada usata, ma che vada usata con consapevolezza delle conseguenze organizzative. Se automatizzi la gavetta, devi ripensare come formi i futuri leader.
Cosa possono fare le organizzazioni per evitare questo “svuotamento”? Questo ottimo approfondimento di Ben Lorica suggerisce alcune strategie concrete: riposizionare i ruoli junior come “verificatori e orchestratori” di output dell’IA, creare programmi di onboarding intensivi in cui i senior trasferiscono deliberatamente la conoscenza, mantenere team multigenerazionali perché molte aziende, come BMW, hanno scoperto che i team misti novizi-esperti performano meglio di quelli omogenei. E la cosa non mi sorprende affatto: la diversità non è facile da gestire, ma paga sempre!
👀 Data Science. #30DayChartChallenge: la creatività gioca con i dati (e ti insegna un sacco di cose)
Studiare (un po’ di) la teoria è necessario, ma spesso noioso e, secondo me, anche un po’ sopravvalutato. Le vere competenze si affinano quando ci mettiamo alla prova, quando sbagliamo, quando ci confrontiamo con altri e quando, soprattutto, ci divertiamo.
È esattamente quello che succede con la #30DayChartChallenge, un’iniziativa che ogni aprile invita chiunque lavori con i dati a creare una visualizzazione al giorno per 30 giorni consecutivi, seguendo prompt tematici quotidiani.
Nata nel 2021 dall’intuizione di Cédric Scherer, specialista tedesco di data visualization, e Dominic Royé, climatologo spagnolo, la challenge si ispira alla precedente #30DayMapChallenge dedicata alle mappe. I due fondatori volevano creare uno spazio democratico dove professionisti e appassionati potessero sperimentare con qualsiasi strumento: da R e Python a Tableau, da Excel a Figma, senza giudizi di merito.
L’edizione 2025 ha visto migliaia di contributi da tutto il mondo, organizzati in cinque categorie tematiche: comparazioni, distribuzioni, relazioni, serie temporali e incertezze.
Il bello della challenge non sta solo nella pratica quotidiana, ma anche nell’essere una palestra di creatività sotto vincolo. Non c’è un premio finale: la vera ricompensa è la curva di apprendimento dopo un mese di sperimentazioni.
Puoi trovare un sacco di lavori molto interessanti che sono stati pubblicati sul web nel corso degli anni grazie a questa sfida. Per farti un’idea concreta del risultato, puoi guardare le dataviz di Joseph Ricafort, che ha usato dati socio-economici dell’area del sud-est asiatico per l’edizione 2024. Un altro bell’esempio è il lavoro di Nicola Rennie nel 2025, con un racconto puntuale di ciò che ha imparato strada facendo. Interessante anche il punto di vista di Vinicius Oike con gli highlight della sua prima partecipazione, in particolare la sua interpretazione del tema “cerchio”: ha mappato la densità di popolazione attorno ai centri urbani brasiliani con mappe circolari ispirate al package Python prettymaps.
Quest’anno, ad esempio, Jacque Schrag ha visualizzato 1.500 giorni del proprio umore come cerchi più sono pieni, migliore era la giornata. Il team USGS VizLab ha invece creato splendide visualizzazioni circolari sui dati idrici americani.
Sono lavori che non nascono da brief aziendali, ma dalla libertà di sperimentare. Partecipare alla challenge significa imparare velocemente: dove trovare dati interessanti, come lavorare con dataset sconosciuti, quali strumenti esistono là fuori, chi nella community sta facendo cose straordinarie. Significa anche accettare l’imperfezione: nessuno ti chiede il capolavoro da portfolio, ma di provarci ogni giorno. È un approccio che dovremmo portare più spesso nelle nostre organizzazioni: meno perfezionismo, più sperimentazione continua!
👅Etica & regolamentazione & impatto sulla società. Leggere fuori dall’algoritmo: Lindy, serendipity e agency.
Due anni e mezzo fa, nel numero (ferragostano) 74, ti proponevo una piccola “guida geek alle letture estive” e ti parlavo di un sito dal nome programmatico: ReadSomethingWonderful. Nel frattempo la piattaforma è cresciuta in quantità di articoli presenti, ma l’idea è rimasta la stessa: raccogliere scrittura “senza scadenza”, un antidoto alla nostra ossessione per il “pubblicato nelle ultime 24 ore”. Rileggendo oggi quello che ti scrivevo allora, mi sono accorto che erano presenti già tre temi che tornano spesso in questa newsletter: effetto Lindy, serendipità, agency. Vale la pena esplicitarli, perché spiegano bene perché continuo a consigliarti quel sito.
Effetto Lindy (Taleb docet)
Taleb chiama “Lindy”, e prima di lui Goldman e Mandelbrot, il fenomeno per cui più un’idea è sopravvissuta nel tempo, più è probabile che continui a farlo. ReadSomethingWonderful, per costruzione, lavora proprio contro il bias di “recenza” (neologismo che ha creato ChatGPT correggendomi la bozza ma che corrisponde ad una effettiva lacuna della lingua italiana come potete leggere qui 🙂): ti propone articoli, saggi e racconti che hanno già superato la prova degli anni, quando non dei decenni. Il pezzo che ti segnalo questa volta ne è un ottimo esempio: “The Tinkerings of Robert Noyce” (1983), il lunghissimo profilo scritto da Tom Wolfe su Robert Noyce, cofondatore di Intel e soprannominato il “sindaco della Silicon Valley”. È uscito più di quarant’anni fa e continua a essere citato come uno dei ritratti più lucidi delle origini della cultura tech.
Serendipità nella lettura.
Quando avevo presentato il sito, ti suggerivo di metterlo tra i preferiti e di scrollare la lista finché non compariva qualcosa di inaspettatamente interessante. Quel gesto, lasciare che siano l’algoritmo minimale del sito e il caso a proporti una lettura, è la versione slow del “random article” di Wikipedia: ogni tanto ti porta esattamente dove non sapevi di voler andare. In un mondo in cui leggiamo solo ciò che è “ottimizzato per noi”, coltivare un po’ di serendipità è quasi un atto politico.
Agency, soprattutto nell’era dell’AI.
Tra gli articoli apparsi sul sito che ho letto di recente c’è un pezzo che ti consiglio caldamente: “The Most Precious Resource is Agency” di Simon Sarris (lo trovi sempre su ReadSomethingWonderful, linkato all’originale su Substack). L’idea centrale è semplice e potente: la risorsa davvero scarsa non è il tempo o il denaro, ma la capacità di intervenire sul mondo. Sarris racconta come molte biografie di persone straordinarie inizino con esperienze molto concrete e responsabilità reali da giovanissimi: esperienze che oggi spesso togliamo ai ragazzi, sostituendole con anni di scuola sempre più astratta. Qui il collegamento con l’AI è immediato. Stiamo entrando in un’epoca in cui è facilissimo delegare: chiedere a un modello di scrivere il codice, la mail, la bozza di progetto. Per molti giovani questo rischia di aggiungere un ulteriore strato di disintermediazione dall’esperienza: meno tentativi, meno errori, meno piccoli progetti storti ma propri. Se non stiamo attenti, l’AI può diventare l’ennesimo motivo per rimandare il momento in cui si fa davvero qualcosa, in cui ci si assume un pezzo di responsabilità.
Per questo mi piace accoppiare, questa settimana, Noyce e Sarris. Il primo ti mostra cosa succede quando un ragazzo dell’Iowa cresce smanettando, costruendo cose e buttandosi in progetti che non esistono ancora. Il secondo ti ricorda che quell’attitudine, vedere il mondo come “malleabile” e imparare facendo, è ancora oggi la risorsa più preziosa che abbiamo. L’invito finale, quindi, è questo: come due anni e mezzo fa, lasciati portare dalla serendipità. Scorri la pagina finché non incontri un titolo che non stavi cercando. È un piccolo allenamento settimanale all’agency, anche nella lettura.
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!



Sembra ci siamo messi d'accordo su Claude, Stefano! Ho appena pubblicato su substack un primo post che racconta cosa sto combinando con Claude Code... ma non per programmare ;-)
Scrivimi che ti racconto qualche passaggio in più.
Qui in ITA https://www.maxturazzini.com/post/come-creare-un-assistente-ai-personale-che-lavora-con-te-senza-programmare e qui in EN su Substack https://maxturazzini.substack.com/p/how-to-build-a-personal-ai-assistant?r=27we4e
Sai che sono un fan della prim'ora di claude. Da semre mi aiuta nella scrittura della mia newsletter (anche se su questo Gemini gli sta dando del filo da torcere) e sulla preparazione di materiali per podcast ed interviste. Ma indubbiamente sul coding Claude (come modello e come ecosisteam con il loro CLI Claude Code) è imbattibile e al momento per me insostituibile. Jus my 2C