For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il centocinquantaseiesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del centocinquantaseiesimo numero:
👅Etica & regolamentazione & impatto sulla società. Dati e AI: tra trasparenza e formazione, la visione di Andrea Nelson Mauro
Presentati:
Andrea Nelson Mauro. Sono un appassionato di dati con oltre 20 anni di esperienza sul campo. Ho iniziato analizzando i dati elettorali nei giornali locali, poi dal 2012 mi sono specializzato su data journalism, open data e data visualization. Ho ideato e supportato diversi progetti data-driven per promuovere la cultura del dato e degli open data, collaborando con realtà come il Sole24Ore e la Commissione Europea. Insegno in corsi universitari e master (Università di Bologna, MIP del Politecnico di Milano), contribuendo alla diffusione delle competenze digitali. Le mie competenze sui dati mi hanno portato già anni fa verso l'Intelligenza Artificiale, e dal 2024, insieme a un gruppo di esperti, abbiamo iniziato a lavorare intensamente sul rapporto tra dati tabellari e intelligenza artificiale. Le mie aree principali di lavoro e studio oggi sono queste: soluzioni tecnologiche all'intersezione tra AI e dati da un lato, e competenze digitali dall'altro.
Il mio ruolo tra 10 anni sarà ... (continua la frase come fossi GPT-10)
Tra 10 anni mi immagino ancora impegnato in queste tre aree, e nella diffusione della cultura del dato e nell'innovazione digitale. Credo che le competenze sui dati saranno sempre più centrali per comprendere e utilizzare l’Intelligenza Artificiale in modo consapevole. Intendo sviluppare nuovi progetti e iniziative per rendere accessibili le competenze data-driven a un pubblico più ampio, contribuendo alla riduzione del divario digitale e all'inclusione delle fasce meno rappresentate. Mi interessa moltissimo sviluppare soluzioni tecnologiche per fare in modo che l’Intelligenza Artificiale “impari” a usare meglio i dati tabellari, cosa che oggi fa abbastanza male, come dimostrano tantissime pubblicazioni scientifiche al riguardo.
Quale è la sfida più importante che il mondo dei dati e algoritmi ha di fronte a sé oggi?
La principale sfida oggi è garantire trasparenza e accessibilità nella gestione e comprensione degli algoritmi e degli strumenti basati sull’Intelligenza Artificiale. È essenziale evitare che la complessità di queste tecnologie crei una frattura tra chi può comprenderle e chi ne subisce passivamente gli effetti. Parallelamente, è fondamentale investire nella formazione e nell’alfabetizzazione digitale per consentire a un pubblico più ampio di sfruttare appieno le opportunità offerte dai dati e dall’AI.
Segnalaci il progetto o la risorsa nel mondo dei dati di cui non potresti fare a meno …
Non esiste un singolo strumento o risorsa essenziale: il panorama è ricco e in continua evoluzione. Personalmente, mi affido a un metodo basato su studio continuo, sperimentazione pratica e condivisione di conoscenze. Pubblico spesso le risorse che trovo più utili sul mio profilo LinkedIn per contribuire con i miei 2 cents alla crescita della comunità. Le risorse più preziose per me restano il tempo per apprendere e sperimentare, e la collaborazione con persone di talento, da cui traggo continua ispirazione.
👃Investimenti in ambito dati e algoritmi. Investire sul miglioramento ogni giorno? Sì, ma senza farsi ingannare dai numeri!
“La gente ama dire che migliorando “dell'1% al giorno” si migliora di 37 volte dopo un anno, ma questo ovviamente non ha senso. Tuttavia, migliorare del doppio è possibile.”
Così inizia l’approfondimento che ti consiglio oggi, perfetto per riflettere sull’importanza di investire nel miglioramento continuo, sia a livello personale sia sul lavoro. Il tutto senza cadere nella trappola “matematica” dell’interesse composto, che funziona alla lettera in ambito finanziario ma non ha la stessa validità numerica quando si parla di processi e di relative misurazioni.
Nel “gustoso” articolo di Jason Cohen trovi anche consigli molto pratici ed esempi paradossali ma illuminanti su come aumentare la produttività, sia a livello personale che di team. Ecco i due suggerimenti chiave, semplici da comprendere ma non sempre facili da applicare:
Agire sulle attività più lente, perché è lì che i miglioramenti hanno il maggiore impatto sulla produttività totale, sfruttando il potere della media.
Saper scegliere le attività su cui concentrarsi ed evitare le altre. Lavorare di più è solo una soluzione temporanea e, nel lungo periodo, insostenibile.
Più complesso, e con implicazioni che toccano anche la psicologia e le neuroscienze, è il tema della gestione della continuità nel miglioramento continuo.
Ed è proprio la continuità il punto critico: è qui che si verificano le perdite più grandi nel processo stesso.
Su questo tema voglio darti alcuni suggerimenti personali, basati su ciò che ha funzionato per me e per i team con cui ho lavorato:
Misurare costantemente i progressi attraverso indicatori chiari e condivisi.
Pensare il miglioramento come un processo fatto di piccoli passi. Su questo ho un aneddoto podistico da condividere: da (ex) maratoneta, mi è stato spesso chiesto da chi non l’ha mai corsa come si gestisce mentalmente una maratona durante la gara. La mia risposta – che ripetevo, come un mantra, a me stesso in gara e che ho citato nel racconto della mia corsa più bella ed emozionante – è sempre stata la stessa: “Un chilometrino alla volta, vedendo ogni chilometro come un piccolo traguardo da cui partire ed andare avanti.”
🖐️Tecnologia (data engineering). Documentazione tecnica: l’AI aiuta, ma l’uomo resta al centro …
Il technical writing, ovvero la scrittura di documentazione tecnica, è ancora importante? E può essere delegata completamente all’intelligenza artificiale?
Le mie risposte – ora e per diversi anni a venire – rimangono due un assoluto sì (alla prima) e un assoluto no (alla seconda). Ma voglio articolare meglio questi punti, suggerendoti anche alcuni approfondimenti di esperti del settore che condividono la mia opinione (o meglio, io la loro 😊).
Questo, però, non significa che gli LLMs non siano utili per rendere la scrittura della documentazione tecnica più agile, o in alcuni casi, solo supervisionata dagli esseri umani.
Partiamo da un ottimo articolo scritto da
, esperto del settore. Nel suo pezzo, Ballotta parte dalla definizione di documento di specifica tecnica e fornisce una panoramica chiara e visuale di tutto il processo di redazione, compresa la difficile questione del giusto livello di dettaglio da mantenere, a seconda del contesto aziendale in cui lavori.Se sei un esperto del dominio, puoi usare l’articolo come checklist per migliorare il tuo approccio. Se invece sei alle prime armi, ti aiuterà a identificare i temi più critici del processo di documentazione tecnica. In entrambi i casi, è un contenuto prezioso.
Se invece vuoi capire perché l’uomo è e sarà ancora centrale nella scrittura di documenti tecnici, ti consiglio di leggere il contributo di Elliot Gunn. Gunn ha costruito una parte consistente della sua carriera nella redazione di documentazione tecnica e nel suo articolo analizza come questo settore sia cambiato dopo il rilascio di ChatGPT nel novembre 2022. È chiaro che la sua esperienza diretta possa avere un certo grado di polarizzazione, ma molte delle sue osservazioni sono condivisibili e rispecchiano la mia esperienza personale (e, in alcuni casi, le mie scottature). Tra i punti chiave, sottolinea l'importanza dell’esperienza, della conoscenza implicita da catturare in azienda e della comprensione del contesto, elementi fondamentali per una documentazione tecnica efficace: tutte caratteristiche assolutamente umane.
Detto questo, gli LLMs stanno migliorando sensibilmente nella scrittura della documentazione tecnica, specialmente nelle attività di reverse-engineering del codice e – per rimanere in un ambito a noi vicino, come data expert – nella scrittura esplicita della semantica dei dati.
Forse proprio per l’uso anche delle intelligenze artificiali generative , il ruolo di architetto della documentazione tecnica diventerà sempre più importante in azienda, e sarà sempre ricoperto da esseri umani… almeno, penso, fino alla mia pensione 😊.
Infine, se vuoi approfondire tecniche per migliorare l’efficacia delle AI nella scrittura (non solo di specifiche tecniche), ti consiglio un paper che presenta la tecnica STORM (“a writing system for the Synthesis of Topic Outlines through Retrieval and Multi-perspective Question Asking”). Ho testato alcune sue parti e le ho trovate decisamente efficaci, anche utilizzate insieme a strumenti come Deep Research.
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Perché il Data Engineer è più importante che mai
Era stato, di gran lunga, l’argomento più letto nella newsletter 35, quasi tre anni fa. Te lo ripropongo senza indugio, perché il suo ruolo in azienda è oggi ancora più importante e ben lontano dall’essere rottamato da qualunque intelligenza generativa!
Sto parlando della figura del Data Engineer, che era essenziale già prima dell’avvento di ChatGPT e lo è ancora di più oggi, se vogliamo davvero sfruttare al meglio ciò che gli LLMs e il loro ecosistema stanno portando di buono nelle nostre organizzazioni.
Sì, perché se vogliamo costruire una buona Retrieval-Augmented Generation (RAG) o affinare l’intelligenza artificiale nel nostro contesto aziendale, il data engineer è una figura imprescindibile. Più conosce e ha costruito i flussi dati aziendali, più sarà determinante nel garantire il successo delle nostre iniziative basate sull’AI.
Vale quindi la pena rileggere l’articolo che ti avevo segnalato allora, di cui scrivevo:
"Soprattutto se ti occupi di selezione del personale, è importante che tu legga questo articolo del famoso blog The Pragmatic Engineer. Definisce in maniera semplice, ma non banale, quali sono le attività, i tool e i contesti in cui si muove questa figura. Lo fa riportando l’esperienza diretta di un data engineer con esperienza internazionale, che ha lavorato anche in Facebook. La chiarezza delle sue parole mi ha colpito molto, anche perché si adattano perfettamente al ruolo svolto con efficacia in tutte le realtà, di qualunque dimensione o geografia, in cui mi sono imbattuto.
Che cosa fa un data engineer? Quali sono gli artefatti chiave del suo lavoro? E perché sta diventando così importante? Queste sono le tre domande a cui risponde in modo chiaro Benjamin Rogojan.
Scendendo nel concreto, Benjamin individua tre obiettivi primari della sua attività:
rendere i dati facilmente utilizzabili dagli altri data expert,
garantire ai dati e a chi li usa una prospettiva temporale di lungo periodo,
integrarli tra loro e con le strutture informatiche dell’organizzazione."
Se sei un data engineer o lo sei stato, mi piacerebbe sapere se ti ritrovi (ancora) in questa descrizione del ruolo e della sua importanza…
👀 Data Science. Quando troppi dati confondono la mente: affrontare l'info-obesità e i bias cognitivi
Nella puntata 154 della newsletter, abbiamo avuto come ospite
, esperto di neuroscienze e processi decisionali, che ci ha consigliato, come data-expert, di diventare ancora più competenti sui bias cognitivi. Perché? Perché questa sarà una competenza sempre più cruciale in futuro. Ho deciso, quindi, di approfondire il tema, ma devo confessarti che mi sono spaventato quando, leggendo questo articolo molto bello di , mi sono imbattuto in una infografica, citata anche dalla voce inglese di wikipedia relativa al cognitive bias, che raccoglie una tassonomia molto precisa di bias cognitivi. Impressionante, vero?La Cognitive Bias Codex (da questo link puoi “navigare” bias per bias) è un'infografica dettagliata che rappresenta oltre 180 bias cognitivi umani. Ideata da John Manoogian III, designer e ingegnere del software, si basa sul lavoro di Buster Benson, che ha catalogato e organizzato questi bias in categorie significative.
Tornando all’articolo di Michael Woudenberg dal titolo “Avoiding infobesity”, l’autore si concentra sull’eccesso di informazioni che ci sommergono ogni giorno e che, per paradosso, rendono le nostre decisioni meno efficaci. Oltre a presentare questa “spaventosa” mappa dei bias cognitivi, l’autore spiega in modo chiaro perché ci troviamo in questa situazione: viviamo in un mondo dove siamo inondati da dati e informazioni, ma il nostro cervello – a causa della sua stessa evoluzione – non è progettato per processarli tutti in modo efficiente.
Da appassionato di well-being, ho trovato particolarmente illuminante l’analogia tra il sovraccarico informativo e il surplus alimentare. Negli ultimi 70 anni, almeno nel mondo occidentale, abbiamo avuto accesso a un'abbondanza di cibo che, per millenni, non era mai esistita. Il nostro corpo, però, si è evoluto per sopravvivere in condizioni di scarsità, quindi tendiamo ad accumulare calorie anziché bilanciarle in modo naturale. Il risultato? Obesità e difficoltà nel gestire l’eccesso alimentare ma anche Il diabete e l’attitudine, selezionata dall’evoluzione, di molti di noi di essere molto attratti dagli zuccheri semplici. La stessa evoluzione ci ha selezionati ad essere predisposti all’uso immediato degli zuccheri semplici proprio per prevenire danni al cervello in periodi di carestie che sono, fortunatamente sempre più rare.
Lo stesso sta accadendo con l’informazione. Il nostro cervello si è evoluto per trovare e sfruttare al meglio le informazioni scarse, non per gestire un bombardamento continuo di dati. E oggi ci troviamo a fare i conti con l’info-obesità: un eccesso di contenuti che ci rende più confusi, meno lucidi e più vulnerabili ai bias cognitivi.
Come per l’obesità alimentare, anche per l’info-obesità esistono soluzioni. La prima? Diventare consapevoli del problema. Conoscere i bias cognitivi e capire i meccanismi che ci portano a prendere decisioni irrazionali è il primo passo per proteggere la nostra capacità di pensare in modo critico. E, in un mondo sempre più basato sui dati, questa è una competenza che non possiamo più permetterci di trascurare.
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!