For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il centoventicinquesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Questa è un’edizione speciale perché come ti avevo condiviso (e l'idea ha riscosso l'approvazione dell'84% dei partecipanti che avevano espresso un parere) sarà diversa da (quasi) tutte le altre e divisa in due parti:
🔎 la prima parte sono domande a cui rispondo su strategia e scenari del mondo dei dati e dell’AI
🙋♂️ la seconda parte sono curiosità che hai su di me, sul mio percorso professionale o su specifici argomenti su cui sei curioso di sapere come la penso …
Se vuoi sapere qualcosa su di me e su come realizzo la newsletter nel numero 100, il primo AMA (Ask Me Anything), puoi trovare (quasi) tutte queste informazioni.
Questo è #LaCulturaDelDatoAma2 cominciamo …
🔎 Strategie e scenari nel mondo dei dati e dell’intelligenza artificiale
Come può essere strutturata una strategia aziendale dei dati? Non intendo i dettagli tecnici ovviamente, ma piuttosto gli approcci possibili e le criticità anche a livello culturale
La strategia dei dati in una azienda di medio grandi dimensioni ha a mio avviso quattro importanti ingredienti da utilizzare e due risultati, uno di breve e uno di medio-lungo, da raggiungere. Gli ingredienti sono in ordine di importanza: le persone/competenze interne, le risorse economiche da investire, la struttura organizzativa e infine la tecnologia. I due risultati da raggiungere sono un piano operativo di breve periodo che dia risultati tangibili su cui si possa innestare il secondo risultato di medio-lungo periodo che è l’aspetto della cultura del dati in azienda. Ovviamente, come in cucina, puoi avere tutti gli ingredienti migliori e non riuscire a ottenere un ottimo piatto ma per ottenerlo devi partire da ingredienti almeno buoni. Usare gli ingredienti al meglio è un mix di arte e di scienza e la strategia è di grande aiuto per questo. Visto che non riesco a dare risposta più completa in poche righe, se vuoi sapere il mio parere ed esperienza l’ho raccontata ad eventi pubblici e nel libro “la cultura del dato” che ho scritto con
in particolare nel capitolo 1.Quali sono le migliori applicazioni di Dati e AI alle scienze esatte e alla medicina?
Ritengo che le migliori applicazioni di Dati e AI alle scienze esatte e alla medicina siano quelle che offrono il più ampio beneficio per l'umanità, in particolare nel campo della ricerca scientifica e del progresso medico. Un esempio recente e significativo è stato osservato durante la pandemia di COVID-19. La rapidità con cui siamo riusciti a sviluppare vaccini efficaci contro il virus è stata in gran parte dovuta usando molto bene i dati e all'applicazione di tecniche IA in varie fasi del processo di creazione di nuovi farmaci.
Quali sono gli scenari futuri per l'IA generativa?
Quando si parla di scenari futuri per l'IA generativa, il mio interesse si concentra su due aspetti principali:
Come potremo utilizzare al meglio questa tecnologia a beneficio dell'umanità.
Come verrà regolamentato il suo utilizzo nelle diverse aree del mondo.
Ritengo che questi due fattori influenzeranno significativamente l'evoluzione tecnologica dell'IA generativa. In prospettiva, prevedo una maggiore integrazione di questa tecnologia con i dati e il machine learning tradizionale rispetto a quanto abbiamo visto finora.
Potresti prevedere, ad esempio una volta al mese, una sezione dove riporti un elenco di percorsi formativi sul tema data science, meglio se open? Da quelli presenti su Udemy ai MOOC universitari
Apprezzo la tua richiesta, ma preferisco dare consigli o fare recensioni solo su prodotti e servizi che ho sperimentato personalmente. Attualmente, non sto seguendo in modo regolare corsi di questo tipo, avendolo fatto in passato.
Tuttavia, ho spesso segnalato in questa newsletter progetti di formazione open source specifici per vari ambiti della data science. Ad esempio:
Nel numero 35, ho evidenziato tre progetti formativi di alto valore per economisti, umanisti e professionisti che lavorano con le mappe.
Regolarmente suggerisco piattaforme come Kaggle, che uso e con cui mantengo contatti, per il loro approccio pragmatico al miglioramento delle competenze.
Non escludo la possibilità di realizzare in futuro una catalogazione ragionata dei percorsi formativi sulla data science, ma al momento richiederebbe più tempo di quanto ne abbia a disposizione.
In aziende di medie grandi dimensioni ma senza un ufficio dedicato alla data analysis/ data science, quali sono le soluzioni software e gli strumenti che vengono maggiormente utilizzati per rispondere alle richieste che possono venire dalle varie unit? Il riferimento in questo tipo di realtà è l’ufficio IT tipicamente?
Nelle aziende di medio-grandi dimensioni senza aree dedicate all'analisi dati o alla data science, ho osservato i migliori risultati quando sono stati adottati strumenti di business intelligence, come PowerBi. Questi strumenti permettono all'azienda di fare un salto di qualità, offrendo una discontinuità gestibile rispetto alle analisi dati su Excel, che sono sicuramente già in uso.
Il referente principale per l'implementazione di queste soluzioni è, nella stragrande maggioranza dei casi, l'IT, poiché gestisce i dati aziendali. In un numero minore di casi, ma comunque significativo, il riferimento può essere l'area finanziaria dell'azienda, dato che oggi non può fare a meno di utilizzare almeno Excel per le analisi di base. 🙂
Quanto secondo te è / sarà importante l'interazione vocale con le AI?
Per oltre un decennio, l'interazione vocale con l'AI è stata meno importante di quanto si prevedesse all'inizio degli anni 2000. Ora, la situazione potrebbe cambiare.
Quando le grandi aziende tecnologiche come Google, Amazon e Apple integreranno la "nuova AI" (e mi riferisco ai recenti progressi dell'intelligenza artificiale generativa) nei loro prodotti ad interazione vocale su larga scala, vedremo se questo tipo di interazione finalmente decollerà.
Ho ancora dei dubbi sul piano sociale, principalmente legati alle nostre abitudini. Tendiamo a preferire la scrittura al parlato per molte cose, forse per una questione di privacy più psicologica che reale. Ma probabilmente mi sbaglio...
Ho l'impressione che sull'intelligenza artificiale ci sia una corsa alla produzione di dati "originali", spesso con campioni molto piccoli e mal pesati, pur di pubblicare il proprio report, soprattutto sugli effetti dell'IA sulle imprese e lavoratori. Concordi con questa visione?
Sì, concordo con questa visione. Il fenomeno che descrivi è significativo, almeno per il momento.
C'è effettivamente una corsa alla produzione di dati 'originali' sull'intelligenza artificiale, spesso basati su campioni piccoli e mal ponderati. Questo è in gran parte spinto da dinamiche di marketing, soprattutto da parte di chi vende la tecnologia. Purtroppo, è una tendenza che si osserva in quasi tutti i settori tecnologici emergenti.
Per quanto riguarda gli effetti dell'IA sulle imprese e i lavoratori, il miglior studio che ho letto e su cui ho buona confidenza è questo, che ho citato spesso nella newsletter. Questo lavoro si distingue per la sua metodologia rigorosa e la dimensione del campione analizzato.
Ci sono due trend opposti, da un lato il web è ormai inondato da contenuti fake o ai-generated, dall’altro le fonti più autorevoli stanno limitando l’accesso ai loro contenuti ai produttori di LLM. Quanto pensi sia concreto il rischio che nel prossimo futuro il training set su cui lavoreranno gli LLm sia di pessima qualità, basato su una “conoscenza derivata”? Saremo in grado di distinguere il falso dal vero?
La mia visione su questo tema è divisa tra pessimismo nel breve periodo e ottimismo nel medio-lungo termine.
Nel breve periodo, il pericolo che menzioni è concreto. È probabile che assisteremo a diverse situazioni critiche causate da questo problema. Per esempio, potremmo vedere casi di disinformazione su larga scala o decisioni importanti basate su dati non affidabili generati dall'IA.
Tuttavia, se supereremo questa fase critica iniziale 😀 (e sono ottimista anche su questo), prevedo due sviluppi positivi:
Impareremo a usare in modo più efficiente i dati per l'addestramento degli LLM, riducendo la necessità di enormi quantità di dati potenzialmente non affidabili.
Svilupperemo metodi per identificare e valorizzare i dataset di alta qualità.
Questi due fattori potrebbero innescare un circolo virtuoso, dove la qualità dei dati migliora costantemente l'affidabilità degli LLM, che a loro volta diventano più capaci di distinguere e generare informazioni accurate.
Quale è l’importanza della data quality nell’evoluzione futura del nostro mondo?
L'importanza della data quality nell'evoluzione futura del nostro mondo sarà sempre maggiore, proprio come accennato nella risposta precedente. Questa crescente rilevanza si manifesterà in diversi aspetti:
Valore economico: Sarà fondamentale attribuire il giusto valore economico ai dati di qualità. Questo potrebbe tradursi in un mercato più sofisticato per i dataset di alta qualità che influenzano decisioni aziendali e politiche pubbliche.
Metriche di qualità: Dovremo sviluppare metriche più robuste e condivise per misurare la qualità dei dati. Per esempio, potremmo vedere l'emergere di standard industria-specifici per valutare l'accuratezza, la completezza e la rilevanza dei dati.
Aspetto culturale: È importante riconoscere che la qualità del dato è anche un fatto culturale. Ciò significa che dovremo lavorare non solo sugli aspetti tecnici, ma anche sulla consapevolezza e sull'educazione riguardo l'importanza della data quality a tutti i livelli della società.
In sintesi, la data quality sarà un pilastro fondamentale per garantire che l'evoluzione tecnologica, specialmente nel campo dell'IA, porti benefici reali e affidabili alla nostra società.
Pensi che l’AI Act replicherà l’effetto Bruxelles del GDPR?
Spero di no, ma il rischio esiste, almeno nel breve periodo. L'effetto dipenderà molto da due fattori:
La concretezza nell'applicazione dell'AI Act.
Il coinvolgimento di esperti competenti nel guidarne l'implementazione.
Questi elementi saranno cruciali per evitare una replicazione dell'effetto Bruxelles del GDPR nel contesto dell'intelligenza artificiale.
Sono iscritto da poche puntate, magari ne hai parlato in passato, ma mi piacerebbe capire meglio come funzionano gli strumenti di AI applicati al digital advertising e qual è il grado di maturità di questo specifico contesto di mercato?
Ho trattato l'argomento indirettamente nella puntata 87, dove ho intervistato Eric Enge, guru mondiale del SEO.
Il Digital Advertising utilizza da tempo strumenti evoluti di intelligenza artificiale, in particolare di machine learning. È un settore molto maturo nell'uso di strumenti AI-driven.
Approfondirò sicuramente questa tematica in future puntate della newsletter, data la sua rilevanza e continua evoluzione.
Si potrebbero applicare le logiche delle GPU ai processi ETL per arrivare a renderli near real time ?
È un tema interessante su cui si sta facendo molta ricerca. Il progetto Rapids appare uno dei più promettenti in questo senso.
Tuttavia, ritengo che la velocità e la qualità dei processi ETL siano ancora più legate a questioni organizzative e di condivisione della conoscenza e semantica dei dati nelle organizzazioni, piuttosto che a soli aspetti tecnologici.
Ho un debole, te lo confesso, per le foto sfocate soprattutto quando mi ricordano momenti piacevoli come questo. Sto per prendere la parola ad uno dei più piacevoli eventi a cui ho partecipato in questo 2024: un evento di Cosmico, una community di oltre 18.000 professionisti del Design, Coding, Data & AI, Marketing e Cybersecurity, che è anche una piattaforma che connette questa community con le aziende che necessitano del loro talento, attraverso il lavoro da remoto.
🙋♂️ Cosa ne pensi di … o che esperienza hai avuto con …
Quali sfide nel mondo dei dati ti è capitato di affrontare? Quali sono state le più difficili?
Le sfide più complesse sono state quasi sempre relative alla scelta dei talenti giusti per il contesto/progetto da affrontare. Per 'giusto' non intendo i migliori in assoluto, ma i più adatti al contesto e alla cultura aziendale.
Un'altra sfida significativa è stata dare il giusto grado di libertà alle start-up su cui avevo investito all'interno di organizzazioni complesse.
Sul fronte tecnologico, la sfida più impegnativa risale agli albori del web: gestire (non da solo) un roll-back durato diversi giorni di un servizio strategico aziendale.
Quanto riesci a riutilizzare nel lavoro di quello che hai appreso preparando la newsletter?
Riesco a riutilizzare molto di ciò che apprendo preparando la newsletter nel mio lavoro. Il beneficio è duplice:
Mi permette di rimanere aggiornato e riflettere su trend tecnologici che non sempre posso sperimentare direttamente in azienda.
Mi offre stimoli e spunti di riflessione utili per le decisioni strategiche che devo prendere.
Quando scrivi i contenuti pensi a un target specifico di lettori? Come misuri il successo e l’impatto della tua newsletter sul tuo pubblico?
Non mi rivolgo a un target troppo specifico, dato il background diversificato dei lettori. Cerco di includere in ogni newsletter almeno un argomento che possa interessare una parte di loro cercando di far leva anche sull’aspetto serendipico per quello che sembra non interessare. Misuro l'impatto attraverso due famiglie di indicatori:
Quantitativa:
Open rate della mail settimanale
Numero di lettori unici del post
Numero di iscritti alla newsletter (Ho anche indicatori più sofisticati 🙂)
Qualitativa:
Interazioni via mail o WhatsApp con i lettori per approfondire specifiche tematiche (l'indicatore più importante)
Hai qualche consiglio per stimolare le diverse aree aziendali ad interessarsi di più ai dati e all’AI? Che ruolo può giocare l’HR in questa sfida?
Per stimolare le diverse aree aziendali, il consiglio migliore è riuscire a risolvere problemi per o con loro usando dati e AI. Non c'è nulla di meglio dei 'quick-win', come dicono gli inglesi.
HR può e deve avere un ruolo chiave nella trasformazione in corso:
Agire come facilitatore (non è un ruolo semplice, ma decisamente importante)
Capire i vari ruoli dei data-expert in azienda, con le loro specificità
Comprendere le difficoltà di questi esperti nell'inserirsi nelle varie aree delle organizzazioni moderne
Qual è la cosa che non ti fa dormire la notte?
Ciò che mi tiene sveglio la notte è il tempo, la risorsa più scarsa che abbiamo. Con l'avanzare degli anni, più che i problemi da risolvere, è l'avere troppo poco tempo per fare tutto ciò che mi piacerebbe fare.
Ammetto di non essere immune dalla FOMO (Fear Of Missing Out).
Fortunatamente, l'Oura Ring e i consigli di Nicola Triglione fungono da potente sonnifero 😊
Quali sono I migliori tool per verificare sul web cosa c'è su di noi. I nostri dati pubblici.
Senza dubbio Google Alert è il migliore strumento per questo scopo. Nel corso del tempo, ho costruito una serie molto fitta di query, rendendolo uno strumento estremamente potente per me.
Quale pensi sarà in futuro il ruolo di chi ha l'obiettivo, da consulente, di aiutare le aziende italiane ad usare in modo strategico i propri dati?
Il futuro per questi consulenti potrebbe essere brillante, a condizione che si risolva uno dei problemi più grossi della consulenza: la mancanza di un forte coinvolgimento da parte di chi lavora in azienda. Purtroppo, questo accade ancora troppo poco. Il problema, a mio parere, è la necessità di essere molto più 'skin in the game', come dice anche Taleb, sui risultati dei consigli che i consulenti normalmente forniscono...
Curioso circa il tuo prossimo progetto professionale/personale!
Anche io ;-)
Cosa ne pensi di questo articolo: ? “ChatGPT is bullshit”
Innanzitutto, ho trovato l'articolo molto raffinato e colto. Grazie per la segnalazione, me lo ero perso.
Affronta il tema delle cosiddette 'allucinazioni' degli LLM da un punto di vista semanticamente e tecnologicamente più appropriato rispetto a molti altri articoli. Come dicevano i latini, 'Nomen omen': è già un passo avanti.
La mia critica personale all'articolo è che dia per scontato che noi umani abbiamo un concetto univoco di verità e che siamo così attenti e consapevoli di questo concetto. Probabilmente la mia risposta è influenzata dall'essere nel periodo 'scettico' della mia vita 🙂
PS: Ho sottoposto la mia risposta e l'articolo a Claude 3.5 (versione pro) per un'analisi critica. Omettendo la parte elogiativa, ecco il punto più critico:
'La tua critica principale all'articolo - che dia per scontato un concetto univoco di verità tra gli umani - è interessante e mostra un pensiero critico. Tuttavia, l'articolo non si concentra tanto sul concetto di verità quanto sul fatto che ChatGPT non sia progettato per cercare la verità in primo luogo.
Un focus sulle tematiche di managerialità e leadership, su come supportare le persone dell'azienda rispetto alla paura di perdersi qualcosa (FOMO) in particolare su temi di AI e gen AI, con le migliaia di informazioni/applicazioni che dovremmo conoscere per il nostro lavoro presente e futuro.
Premesso che, come ho menzionato prima, anch'io non sono immune dalla FOMO e quindi non posso dispensare troppi consigli, penso che l'effetto Lindy, anche nel breve periodo, possa venirci in aiuto.
In concreto, suggerisco di:
Creare un elenco di argomenti da approfondire, ma non farlo subito.
Aspettare qualche settimana/mese per capire se ne valga veramente la pena.
Essere sempre early adopters fa perdere troppo tempo ed energie. Diventa early adopter solo quando:
Sei super appassionato di una tematica
È per te molto strategica e molto divertente
E per questo #AMA2 sono giunto al termine. Scrivimi nei commenti o via mail a (st.gatti@gmail.com) se ti è piaciuto e su cosa sei più o meno d’accordo. E se ti è piaciuto mandami fin da subito altre domande per #AMA3
Alla prossima!