LaCulturaDelDato #202
Dati & algoritmi attraverso i nostri 5 sensi
For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il duecentoduesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del duecentoduesimo numero:
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Dalla Growth al dato: la visione “sistemica” del manager del futuro secondo Matteo Aliotta
Presentati
Matteo Aliotta. Ho iniziato 20 anni fa lanciando prodotti digitali sul web da pioniere, poi da fractional CMO in startup come Fitprime da zero al Product-Market Fit (proprio nel 2025 hanno fatto un’importante exit) ed in seguito da manager del dipartimento Growth Marketing in uno dei VC early stage più importanti in Italia. Oggi replico il modello tramite LTV, la mia firma di consulenza nata da un track record sulle corporate e più di 100 startup supportate nella crescita, tra cui Arduino, Boolean, Up2You e molte altre, con particolare focus nella fase dal pre-seed al Series A. Quando non sono sul campo sono docente e Director dell’Executive Growth Strategy del POLIMI GSoM.
Il mio ruolo tra 10 anni sarà … sempre più basato sulla visione “sistemica” del business. Di hard skills insostituibili ne rimarranno poche, quelle più difficili da replicare sono quelle che riguardano la visione d’insieme e la capacità di connettere i puntini con il valore aggiunto umano, che ha capacità di immaginazione e di astrazione. In sintesi, il manager del futuro sarà più competente a livello tecnico e meno puro gestore di risorse e fornitori, ma capace di una visione d’insieme basata sul valore e sulla crescita.
Qual è la sfida più importante che il mondo dei dati e algoritmi ha di fronte a sé oggi?
Abbiamo sempre più mezzi e il 2026 ci stupirà ulteriormente. Una delle tante rivoluzioni che abbiamo oggi è che chiunque può avvalersi di un data analyst personale grazie all’AI, ma conosco davvero pochissime aziende che hanno sfruttato questo vantaggio competitivo. La sfida a mio avviso è di adozione più che tecnologica: iniziare a misurare, tracciare, condividere, accumulare dati e fare sistema. Chi saprà farlo meglio si garantirà prosperità nei prossimi avvincenti anni.
Segnalaci il progetto o la risorsa nel mondo dei dati di cui non potresti fare a meno … Ti segnalo il blog di Paul Levchuk (su Medium) che ho scoperto non molto tempo fa e che è una risorsa incredibile per l’approccio strategico ai dati nei modelli di business tech, per me una vera fonte di informazioni, framework e strategie.
PSS (Post scriptum di Stefano): A costo di ripetermi, perché l’ho scritto in diversi numeri di questa newsletter, ti consiglio di iscriverti alla newsletter su Substack di Matteo. Scrive pochi articoli all’anno ma sono vere e proprie masterclass
👅Etica & regolamentazione & impatto sulla società. L’italiano ai tempi dell’AI generativa: cosa ci dice Giuseppe Antonelli sull’IA-italiano
Pur non essendo affatto un esperto di linguaggi, e men che meno di storia ed evoluzione della lingua, periodicamente cerco di interrogarmi e osservare come la lingua cambi in funzione dell’evoluzione della società e, in tempi più recenti (diciamo negli ultimi 30 anni), con l’evoluzione della tecnologia. Negli ultimi 3 anni, a causa dell’AI generativa, questa evoluzione è diventata ancora più frenetica. Non tanto perché noi, intelligenze umane, abbiamo cambiato il modo di esprimerci, ma perché abbiamo delegato sempre più spesso alle intelligenze artificiali il farlo o, quantomeno, l’aiutarci a farlo. E, in questo senso, se analizzi il testo scritto (per esempio sui social), sembra che la lingua sia cambiata bruscamente. Nel mondo occidentale, per esempio, con un netto incremento delle locuzioni derivate dalla lingua inglese. Gli approfondimenti che ti suggerisco oggi, se questa tematica ti appassiona, sono due: hanno un diverso livello di profondità (anche temporale), ma sono ugualmente utili per vedere e misurare questi cambiamenti in atto.
Il primo, il più breve, è un’edizione quasi monografica di Legge Zero, la newsletter di Ernesto Belisario Belisario, che evidenzia, numeri ed esempi alla mano, quanto sia cambiata la lingua in tutto il mondo a causa dell’uso intensivo che abbiamo fatto negli ultimi tre anni delle intelligenze artificiali generative. La percezione ce l’abbiamo tutti, ma le fonti e gli esempi che riporta Legge Zero sono piuttosto impressionanti e molto trasversali a tutti gli strati delle società.
Il secondo, il più lungo (47 pagine), è un paper molto bello di uno dei più importanti storici della lingua italiana, Giuseppe Antonelli, che analizza in profondità l’evoluzione negli ultimi tre anni dell’IA-italiano, andando a valutare, nella prima parte del suo lavoro (con i più diffusi LLM del mondo occidentale), un comune errore che commettiamo quasi tutti: l’errato uso del verbo incuriosire nella sua forma intransitiva. Il paper è veramente interessante perché non si fa prendere né dall’hype verso i nuovi strumenti generativi né dal neoluddismo tipico di una certa parte dell’accademia che si ostina a bollare questi strumenti come pappagalli statistici. E infatti Antonelli stesso, alla fine della prima parte del paper, scrive, a metà 2025: “Alla fine di questa carrellata non si può che rilevare il generale miglioramento, specie nelle nuove versioni di ChatGPT, del livello complessivo di correttezza e accuratezza linguistica, anche nei registri marcati. Tanto che, potremmo dire, la vera frontiera si sta spostando ora dalla correttezza alla creatività di queste produzioni testuali artificiali …”
E infatti, nella seconda parte del paper, affronta con maestria e leggerezza un’altra tematica della lingua e della scrittura, usando un maestro e un futurista di questi temi come Italo Calvino. Ne avevo già parlato io tempo fa qui ma, ovviamente, Giuseppe Antonelli lo fa in maniera decisamente migliore con un esperimento pratico sulle Città invisibili dello stesso Calvino. Imperdibile.
PS: ho provato sia con il tema legato al verbo incuriosire sia con la scrittura di una nuova città invisibile e, questa volta, Claude (4.5) e Gemini (3.0), più che ChatGPT (5.2 Thinking), mi hanno sorpreso con un’evoluzione negli ultimi 9 mesi, confrontandola con il paper, veramente stupefacente.
👃Investimenti in ambito dati e algoritmi. Il VC nel 2025 e la Start-up del mese di dicembre 2025: Mirelo.ai
Si può sintetizzare in tre punti il 2025 del Venture Capital mondiale:
Dal punto di vista degli investimenti globali, si è chiuso con un incremento del 30% rispetto al 2024 ($425 miliardi di dollari contro i $328 del 2024), segnando finalmente una chiara tendenza positiva rispetto alla flessione post-Covid del 2023 e 2024.
La concentrazione degli investimenti è stata la seconda caratteristica più forte.
Concentrazione geografica: gli investimenti negli USA sono passati dal 56% al 64% degli investimenti globali.
Concentrazione nel numero di aziende oggetto degli investimenti: 5 aziende (OpenAI, Scale AI, Anthropic, Project Prometheus e xAI) hanno assorbito il 20% degli investimenti e il 2,5% delle altre aziende (621) un altro 40%.
Concentrazione di settore: il 50% degli investimenti è andato nel settore dell’intelligenza artificiale.
(Quasi) tutta la crescita si è concentrata nelle fasi di maturità delle start-up (i grandi round delle Big AITech ne sono i principali responsabili), mentre il valore totale degli investimenti nelle fasi iniziali è quasi invariato anno su anno.
Tutti questi dati (e anche altri molto interessanti) emergono dal report di fine anno di Crunchbase.
La start-up del mese di dicembre 2025 è Mirelo. Mirelo è stata fondata nel 2023 da CJ Simon-Gabriel e Florian Wenzel, due ricercatori AI che si sono conosciuti ad AWS Labs e condividono una doppia anima: PhD in machine learning (Max Planck e Humboldt University, con passaggi a ETH Zurigo e Google Brain) e background da musicisti. CJ ha studiato pianoforte e composizione al Conservatorio di Strasburgo, Florian suona in una band elettronica a Berlino. La frustrazione da cui nasce Mirelo è semplice: mentre text, immagini e video hanno avuto la loro rivoluzione generativa, l’audio è rimasto indietro. Oggi chi crea video passa ore a cercare effetti sonori in librerie stock e a sincronizzarli frame per frame. Mirelo genera audio sincronizzato in secondi, direttamente dal video.
Il timing sembra perfetto: con l’esplosione dei video generativi (Sora, Runway, Kling), il problema dell’audio diventa sempre più evidente. Un video senza suono è come un film muto. Mirelo si posiziona come “audio layer” per tutto il contenuto visivo: video, gaming, social, film. I suoi modelli richiedono 50 volte meno capacità computazionale rispetto agli LLM tipici e, secondo i benchmark, battono le alternative (Sony, ElevenLabs, Kling AI) su qualità e sincronizzazione.
L’ho provato con video che avevo fatto sia reali (sostituendo l’audio originale) sia con video fatti con Sora e, francamente, il risultato mi è piaciuto molto.
Ha chiuso a dicembre un seed di $41M, guidato da Index Ventures e Andreessen Horowitz, e il totale raccolto è di $44M includendo il pre-seed di Atlantic. Tra gli angel investor: Arthur Mensch (CEO Mistral), Thomas Wolf (Hugging Face), Laura Modiano (OpenAI). Un cap table che sembra funzionare anche da validazione tecnica. Con i fondi raccolti vorrebbero portare subito il team da 10 a 20-30 persone, con focus su R&D e go-to-market. Il modello di business è API + Mirelo Studio (web app per creator). La roadmap include gaming adattivo e ambienti AR con audio generato in real time. Chiaramente il mercato è affollato (ElevenLabs, Boomy, AudioLDM) e i big player (Sony, Tencent) si stanno muovendo. La sfida sarà costruire una barriera reale prima che i modelli multimodali general-purpose integrino l’audio nativamente. Detto questo, il focus verticale sul mercato degli effetti speciali, dove c’è meno ricerca rispetto a speech e musica, sembra una scommessa intelligente. Mirelo non è solo “musica generata dall’AI”. La loro tecnologia Mirelo SFX analizza i pixel di un video e genera effetti sonori sincronizzati e colonne sonore che reagiscono dinamicamente all’azione sullo schermo.
Da seguire e da provare!
🖐️Tecnologia (data engineering). Altro che “l’AI sostituisce gli sviluppatori”: la mappa (concreta) di Andreessen Horowitz sul futuro del coding
Se dovessi scegliere, tra i tanti che ho letto negli ultimi due anni, un articolo da far leggere assolutamente a uno sviluppatore a cui voglio molto bene (per esempio a mio figlio maggiore, a cui l’ho quasi letto di persona 🙂), sceglierei senza dubbio quello che è oggetto dell’approfondimento di oggi. Come sai, quando scelgo letture che immaginano futuri di adozione di una tecnologia, prediligo quelle scritte da venture capitalist rispetto a quelle di consulenti. Entrambi hanno bias, ma i primi ci investono soldi e credibilità, e lavorano con chi (i founder) questo futuro lo sta costruendo.
The Trillion Dollar AI Software Development Stack del fondo VC Andreessen Horowitz parte cercando di dimensionare il mercato dello sviluppo software (circa 30 milioni di sviluppatori con una contribuzione economica mondiale di circa 3 trilioni di dollari all’anno) e poi scompone il processo di sviluppo software in diversi step, descrivendo un buon modello di come l’AI sta entrando in ciascuno step.
Raccontando, fase per fase, l’evoluzione in corso di ciascuno di questi processi, propone anche una mappa di mercato delle principali start-up che stanno facendo innovazione.
E nel finale descrive uno scenario abbastanza probabile e abbastanza scevro da hype:
“Cosa significa tutto questo per i 30 milioni di sviluppatori software nel mondo? L’AI sostituirà gli sviluppatori software in un futuro prevedibile? Ovviamente no. Questa narrativa senza senso è alimentata da un mix di sensazionalismo mediatico e marketing aggressivo che tenta di prezzare il software non come per-postazione, ma come sostituto del costo del lavoro umano. La storia ci insegna che mentre il pricing basato sulla sostituzione funziona nei mercati iniziali, alla fine il costo di un bene converge verso il suo costo marginale, e così anche il prezzo. Finora, i limitati dati effettivi che abbiamo suggeriscono che le imprese più avanzate nell’uso dell’AI aumentano le assunzioni di sviluppatori, perché vedono un’ampia gamma di casi d’uso con un ROI positivo nel breve termine.
Tuttavia, il lavoro dello sviluppatore software in sé è cambiato, e la formazione dovrà cambiare di conseguenza. I programmi universitari di oggi cambieranno drasticamente; sfortunatamente, nessuno (noi compresi) capisce ancora davvero come. Algoritmi, architettura e interazione uomo-macchina rimarranno rilevanti, e anche il coding conta ancora, poiché spesso devi tirare fuori l’LLM da una buca che si è scavato da solo. Ma un tipico corso universitario di sviluppo software è meglio visto come una reliquia di un’altra epoca, con scarsa rilevanza pratica per l’industria del software di oggi.”
👀 Data Science. 1+1=3: perché unire i dati (bene) vale più di quanto pensi
Unire dati è forse l’operazione più importante di quella attività che definiamo analisi dati. La “classica” non-equazione matematica che spiega molto bene questa operazione è “1+1 = 3”. Tantissime volte, nella mia vita lavorativa, ho visto in diversi contesti sottovalutare l’importanza di fare bene questa attività.
Unire dati nella vita reale vuol dire fare bene almeno tre cose:
Trovare dati utili dentro e fuori l’azienda. Ne ho parlato diverse volte a proposito della figura del data scouter.
Capire se e come questi dati trovati possano essere uniti bene e in maniera significativa ad altri. E capire bene il concetto di chiavi primarie o chiavi di join è tanto semplice quanto fondamentale. Ma bisogna farlo al momento giusto e con gli strumenti giusti.
Effettuare la join tra i due dataset nel modo migliore, anche dal punto di vista tecnico e computazionale.
E proprio a proposito di quest’ultima operazione, l’approfondimento di oggi recupera il link più cliccato da te quasi tre anni fa: quello che spiegava 13 modi diversi di fare join, l’operazione in linguaggio SQL che serve per unire due tabelle. L’ha scritto l’esperto di database e SQL Justin Jaffray, che ha realizzato altri interessanti articoli sui database e sull’SQL. Puoi recuperare altri articoli sia sul suo blog (che ha smesso di scrivere nel 2023) sia iscrivendoti alla sua newsletter, il cui tema è chiaro visto il suo incipit:
“It is easier to imagine an end to computing than an end to SQL.”
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!




