For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il centoquarantaquattresimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del centoquarantaquattresimo numero:
🖐️Tecnologia (data engineering). Luca Sambucci: tra AI e Cybersecurity sfidando i limiti della tecnologia
Presentati:
Luca Sambucci. Per capire chi sono professionalmente bisognerebbe prendere la torta e dividerla in tre pezzi uguali. In un pezzo c’è l’informatico, smanettone fin dal 1984, con una predilezione per la sicurezza. Quello che testa script, che prova exploit, che sta fino alle due di notte per scoprire che mancava un punto e virgola.
Nell’altro pezzo c’è il divulgatore informatico, quello che scrive articoli sulla security da quando aveva diciotto anni (ora ne ho cinquanta), quello che apre blog (di cybersecurity nel 2005, di IA nel 2019) quello che va alle conferenze, a parlare e ad ascoltare.
Infine, il terzo pezzo è l’imprenditore. Tutti i miei studi principali sono nel business. Nel 1996 ho aperto uno dei primi ISP in Umbria. Fast forward di quasi trent’anni, oggi ho aperto una startup di AI security.
Il mio ruolo tra 10 anni sarà ... (continua la frase come fossi GPT-10)
… esattamente come oggi, ma spero con un reach di divulgazione un filino maggiore. Ritengo questa attività una vera missione: la tecnologia è complessa e non sempre facile da comprendere, ma è fondamentale per la nostra società. Mi dicono che sono bravo a spiegare in maniera facile concetti difficili. Quindi sfrutto questa capacità per far sì che più persone possibili capiscano quale ruolo giocherà la tecnologia (e la sicurezza) nelle nostre vite. Più siamo istruiti e informati, migliore sarà il nostro futuro collettivo. La conoscenza diffusa aiuta a costruire una società più sana e sicura.
Quale è la sfida più importante che il mondo dei dati e algoritmi ha di fronte a sé oggi?
Controllare la fluidità con cui i dati possono sfuggire di mano. Stiamo datificando tutto. Trasferiamo aspetti fondamentali della nostra vita, come finanze e relazioni, nel dominio digitale, rendendo la gestione di questi interessi meno naturale. Ma quello che mi preoccupa di più è che esponiamo tali risorse a pericoli che il cittadino medio non sa affrontare. La maggior parte della gente sa come impedire che gli sfili 50 euro dalla tasca, ma non ha idea di come proteggere i suoi asset digitali. Sappiamo parlare faccia a faccia e capirci, ma siamo delle frane a gestire i rapporti online.
Segnalaci il progetto o la risorsa nel mondo dei dati di cui non potresti fare a meno …
Non potrei fare a meno dei LLM. Sono come l'automobile per chi finora andava a piedi: un vero moltiplicatore di attività. Rappresentano un'estensione del nostro cervello, ci permettono di accelerare processi, generare idee e soluzioni in modo più efficiente. Non parlo da novello fan di ChatGPT: uso diversi modelli già dal 2021, scontrandomi sempre (ieri così come oggi) con i limiti di qualità e di accuratezza. Nonostante questo, li uso, li abuso e li maltratto per vedere a quanto stress resistono prima di mostrare la corda. Se arriva Skynet, senza dubbio sarò sulla sua lista di proscrizione.
👃Investimenti in ambito dati e algoritmi. Dai motori agli assistenti: come cambia il nostro modo di cercare informazioni
Il modo in cui cerchiamo (e cercheremo) le informazioni è e sarà sempre più centrale per l’evoluzione del sistema economico e, in particolare, per il mondo degli investimenti. Questo aspetto sta subendo cambiamenti ancora graduali e poco visibili, ma che presto subiranno un’accelerazione.
Dopo aver testato ChatGPT Search in modo continuativo per alcune settimane, sono convinto che questo passaggio avverrà molto più velocemente di quanto oggi suggeriscano i numeri. Giorgio, nel post da cui ho tratto la citazione, analizza dati che mostrano come i numeri attuali non supportino ancora chiaramente il passaggio da Google ad altri strumenti. Credo però che siamo solo agli inizi di questa trasformazione e che, come spesso accade con fenomeni esponenziali o non lineari, ci siano dinamiche ancora poco visibili. Personalmente, negli ultimi sei mesi ho ridotto l’uso di Google per le ricerche di quasi l’80%, preferendo strumenti diversi (non solo ChatGPT Search ) che trovo decisamente più performanti per i miei scopi.
Ti segnalo alcuni strumenti che sto usando e che potrebbero essere utili anche a te. Ecco qualche esempio:
Perplexity: ottimo per approfondire tematiche specifiche che non conosci, permettendo di ottenere panoramiche graduali dalle principali fonti informative. La versione Pro è decisamente più potente, ma anche quella gratuita offre un buon assaggio delle sue potenzialità.
Genspark: eccellente per cercare informazioni recenti, quasi in tempo reale. Ha una funzione specifica (un “agente”, come direbbero gli esperti) che cerca dati relativi a una tematica e ti restituisce risposte strutturate in forma di dataset.
You.com: nella sezione "agenti" trovi i primi esempi di assistenti di ricerca specializzati per ambiti specifici. Potrebbero rappresentare uno degli scenari più probabili di come effettueremo ricerche in futuro.
Sto testando altri strumenti con specializzazioni molto verticali, ma penso che questi tre siano un buon punto di partenza per esplorare come sta cambiando il modo in cui cerchiamo informazioni.
Concludo spiegando perché ho inserito questo argomento nella sezione dedicata agli investimenti. Secondo me, il modo in cui evolverà la ricerca influenzerà significativamente il mondo del B2C (business-to-consumer) e, in particolare, l’e-commerce. Lo si può intuire, ad esempio, testando la versione beta di Perplexity Buy. Farsi trovare continuerà a essere cruciale, ma in futuro potrebbe avvenire in modo diverso.
Come dice Giorgio Taverniti: “La pagina deve contenere l’informazione giusta”, probabilmente in modo ancora più preciso e comprensibile rispetto a oggi. Inoltre, nuovi standard per farsi trovare dagli LLM sembrano essere all’orizzonte, come dimostra questo progetto.
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Hybrid AI: il futuro è ibrido, ma sei pronto a capirlo davvero?
Tanto più diventa semplice e accessibile analizzare dati e scrivere codice nel mondo della data science, quanto più persone, spesso senza un solido background tecnico, si avvicinano a queste tematiche. Sempre più spesso, queste persone utilizzano strumenti e artefatti, a volte costruiti direttamente da intelligenze artificiali. Personalmente, vedo questo fenomeno in modo positivo, ma ritengo che renda necessario fornire conoscenze di base su quali strumenti usare, in base ai casi d’uso e al contesto rappresentato, ad esempio, dai dati disponibili.
I suggerimenti di questa sezione della newsletter vogliono semplificare questi concetti senza snaturarli, per aiutarti a navigare meglio questo mondo.
Uno degli argomenti su cui vedo fare più confusione nelle organizzazioni è capire quando sia meglio utilizzare un approccio di inferenza statistica e quando sia più produttivo scegliere un’inferenza basata sul machine learning.
In un post, il mio amico Ajit Jaokar, professore all’Università di Oxford, spiega questa distinzione in modo estremamente semplice. In un secondo articolo, entra invece nel dettaglio, approfondendo anche alcuni aspetti matematici.
In estrema sintesi, Ajit propone questa classificazione, che pur essendo di alto livello rappresenta un primo approccio efficace al tema:
Statistical Inference: Si basa su distribuzioni di probabilità note e modelli più semplici. È adatta per insiemi di dati più piccoli, offrendo una chiara interpretabilità e misura dell’incertezza.
Machine Learning Inference: Questo approccio, guidato dai dati, utilizza una varietà di algoritmi per apprendere direttamente dai dati. Richiede insiemi di dati più grandi e impiega modelli complessi, ma interpretabili.
Deep Learning Inference: È un sottoinsieme specializzato del machine learning che utilizza reti neurali profonde per modellare strutture complesse. Richiede dataset molto grandi, potenza di calcolo elevata, e offre un livello di interpretabilità più basso.
Poiché esistono diverse zone di grigio tra questi approcci, ti consiglio di leggere per intero i due post di Ajit, che non sono lunghi e possono essere utili anche in ambito aziendale.
Un altro tema che genera molta confusione è la differenza tra machine learning e generative AI, in particolare per i casi d’uso che possono essere risolti meglio con l’uno piuttosto che con l’altro. Su questo argomento, ti consiglio un articolo molto concreto di Bernard Marr, che illustra con esempi pratici le differenze e i casi d’uso più adatti per ciascuna metodologia.
Questo aspetto è cruciale, perché ci stiamo muovendo verso la creazione di soluzioni che integrano machine learning (non generativo) e generative AI. Sebbene questa integrazione sia spesso efficace nei risultati concreti, può generare incomprensioni tra chi non conosce il “dietro le quinte”.
Se è vero che il futuro sarà sempre più ibrido—si parla sempre più infatti di Hybrid AI—è importante che questa evoluzione avvenga in modo consapevole!
👀 Data Science. Come Jim Frost ci insegna … la statistica non passa mai di moda 🙂
Nella sezione precedente abbiamo parlato delle differenze tra statistica e machine learning. Negli ultimi dieci anni, il machine learning ha decisamente preso il sopravvento, spesso in maniera eccessiva e, a mio parere, ingiustificata. All’interno delle organizzazioni, la statistica rimane ancora un approccio decisamente utile, soprattutto quando si tratta di prendere decisioni importanti e sfruttare i dati in modo efficace (o almeno, quando si dovrebbe farlo).
Proprio per questo motivo, voglio riproporti, con piacere, i contenuti di Jim Frost. Era già stato il link più cliccato nella puntata 23 della nostra newsletter e trovo che il suo approccio sia incredibilmente formativo e pragmatico per l’utilizzo della statistica. Il suo sito è una vera miniera di materiale informativo e, in alcuni casi, anche molto divertente.
Nel frattempo, Jim ha pubblicato un libro che consiglio caldamente: “Thinking Analytically: A Guide for Making Data-Driven Decisions”. L’ho letto e l’ho trovato decisamente interessante. Non è troppo tecnico, ma affronta in modo scientifico e pratico il tema di come pensiamo (non senza problemi) per risolvere problemi e prendere decisioni.
👅Etica & regolamentazione & impatto sulla società. La mente collettiva sta invecchiando? Idee e soluzioni dal MIT
Parlo spesso in questa newsletter del trend dell’invecchiamento della popolazione mondiale, un fenomeno che interessa particolarmente l’Occidente. Ne parlo perché è un tema che richiede di essere letto attentamente, con i migliori dati a disposizione, per attuare le politiche più adatte. Inoltre, l’intelligenza artificiale gioca e giocherà un ruolo sempre più centrale nelle azioni di mitigazione di questo fenomeno.
L’articolo che ti suggerisco oggi affronta un aspetto interessante: l’impatto dell’invecchiamento sulla cosiddetta "intelligenza collettiva" dell’umanità. È stato scritto da Gianni Giacomelli, un ricercatore del Collective Intelligence Design Lab del MIT. L’articolo è parzialmente sotto paywall all’interno di una newsletter a cui sono abbonato, ma la parte accessibile è già sufficiente per farti un’idea chiara sul tema.
“La mente collettiva della nostra civiltà - un esempio di quella che Thomas Malone ha definito una ‘supermente’ - si basa, secondo le parole del sociobiologo Edward Wilson, sull'interazione di tre elementi: i cervelli paleolitici con le loro emozioni intrinseche, le istituzioni medievali e la tecnologia”, scrive Giacomelli nell’introduzione. Da questa premessa parte un’analisi, supportata da dati, su come questo nostro cervello collettivo stia evolvendo. Ci sono molti spunti utili per leggere meglio il presente: dalla tendenza verso posizioni politiche più conservatrici, alle scelte più prudenti e meno innovative nell’affrontare problemi cruciali di medio-lungo periodo, come il cambiamento climatico. Tutto questo è documentato con serie storiche che danno profondità all’analisi.
Ma attenzione: nulla è perduto. Giacomelli propone strategie per rendere la mente collettiva più giovane o, quantomeno, per sfruttare al meglio la saggezza che deriva dall’età. Tra queste strategie, l’uso intelligente dell’intelligenza artificiale gioca un ruolo chiave. “Dobbiamo rendere il futuro del lavoro più a misura di anziano, ma senza penalizzare i giovani. Ad esempio, il coaching supportato dall’intelligenza artificiale per favorire una migliore collaborazione tra diverse età (e culture), oppure una progettazione più smart di assunzioni e formazione, saranno di grande aiuto. Anche il concetto di pensione va reinventato, magari con lavori utili che aiutino gli anziani a mantenersi economicamente indipendenti, socialmente attivi e mentalmente in forma.” scrive Giacomelli. E ribadisce più avanti nell’articolo: “Gli anziani hanno competenze sociali preziose che possono essere messe al servizio delle comunità, supportando sia bambini sia adulti. Mantenendoli impegnati, si migliorano le loro capacità mentali e si contribuisce a contenere i costi sanitari. L’intelligenza artificiale, se utilizzata correttamente in processi incentrati sull’uomo, può supportare queste dinamiche, potenziando l’intelligenza individuale degli anziani e favorendo la loro collaborazione con gli altri.”
Nel post ci sono anche numerosi riferimenti ad approfondimenti e studi di studiosi di tutto il mondo, che quantificano chiaramente il fenomeno e offrono strumenti e modalità per affrontarlo al meglio. E se sei “diversamente giovane” come me, questi contenuti potrebbero interessarti anche a livello personale, oltre che collettivo. 😂
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!