For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il settantacinquesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del settantacinquesimo numero:
🖐️Tecnologia (data engineering). Open Science and the Future of Data: A Conversation with Biomedical Engineer Serena Bonaretti
Presentati:
Mi chiamo Serena Bonaretti e sono un’ingegnera biomedica. Mi piace fare ricerca e insegnare. La mia ricerca si focalizza sull’analisi di dati del sistema muscoloscheletrico, principalmente provenienti da immagini TAC e di risonanza magnetica. Sono una convinta sostenitrice della scienza aperta, e non solo cerco di metterla in pratica al mio meglio, ma la promuovo anche con presentazioni e sul mio canale YouTube. Ho insegnato durante vari momenti della mia carriera lavorativa sia a livello accademico che privatamente. In quest’ultima modalità, ho insegnato Python e dal materiale didattico sviluppato sto creando il libro gratuito Learn Python with Jupyter. Per amore del mio mestiere, ho studiato e lavorato in diversi paesi, inclusi la Svizzera, gli Stati Uniti, e i Paesi Bassi.
Il mio ruolo tra 10 anni sarà ... (continua la frase come fossi GPT-10)
Ricercatrice e insegnante! Mi piacerebbe continuare a sviluppare strumenti per la ricerca aperta. Con la Open and Reproducible Musculoskeletal Imaging Research (ORMIR) community, stiamo portando avanti l’ambizioso progetto di omogeneizzare il codice che sviluppiamo nei nostri laboratori di ricerca in giro per il mondo, e di renderlo gratuitamente disponibile per tutti. Stiamo anche lavorando per lo scambio di dati di ricerca, ma questo aspetto è più complicato per la giusta protezione dei diritti dei volontari che partecipano agli studi. Mi piacerebbe anche che il metodo di insegnamento di Learn Python with Jupyter, se ritenuto valido, venisse adottato nelle scuole superiori per contribuire all’alfabetizzazione digitale delle nuove generazioni.
Quale è la sfida più importante che il mondo dei dati e algoritmi ha di fronte a sé oggi?
Credo che le sfide più importanti siano quella legislativa ed etica. Ci sono già regole per una acquisizione e analisi corretta e rispettosa dei dati personali degli utenti (con grandi differenze fra diversi paesi), che si traducono per esempio nell’accettare o rifiutare l’autorizzazione dei dati personali da siti internet. Ma non ci sono ancora ancora regole ben definite su quello che si può fare o meno con i dati acquisiti, soprattutto nel campo dell’intelligenza artificiale generativa. È importante che i legislatori creino regolamentazioni che tengano conto delle conseguenze etiche dell’uso dei dati.
Segnalaci il progetto o la risorsa nel mondo dei dati di cui non potresti fare a meno …Jupyter notebook! Lo uso da tanti anni, e adoro l’integrazione fra codice e narrativa, l’immediatezza d’uso, e la piacevolezza dell'interfaccia. Il Jupyter notebook ha modificato il modo di lavorare di molte persone anche perché ha cambiato il modo in cui pensiamo mentre lavoriamo. La continua rielaborazione della narrativa intorno al codice e all’analisi dei dati, ci ha aiutato a essere più rigorosi e focalizzati durante la creazione delle pipelines, dall’importare i dati al risultato finale. In aggiunta, ho la possibilità di frequentare tante persone che fanno parte della Jupyter community, che mi arricchiscono non solo lavorativamente, ma anche e soprattutto umanamente, per i valori di rispetto e gentilezza che condividono.
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. AI's Global Hustle: From Lagos Freelancers to Oxford Think Tanks
L’uso della generative AI sta trovando spazio in molte attività all'interno delle organizzazioni, espandendosi in maniera molto più rapida di quanto potessimo immaginare. Questo fenomeno è particolarmente evidente nei processi che molte aziende occidentali esternalizzano verso paesi in via di sviluppo. Se vuoi approfondirlo con esempi concreti, ti consiglio un articolo di “Rest of the World”. Questa testata giornalistica, attraverso reportage sul campo in luoghi spesso trascurati e sottovalutati, analizza l'impatto della tecnologia al di fuori del contesto occidentale. Attraverso questo articolo, potrai scoprire la storia di Abisoye Otusanya-Azzan, una copywriter che vive a Lagos, in Nigeria. Per adeguarsi alle nuove esigenze e ai nuovi costi dei suoi clienti, Abisoye ha adottato ChatGPT, riducendo così di quasi il 90% il tempo necessario per la produzione di un articolo. L'articolo offre anche altri tre esempi in cui lavori esternalizzati (soprattutto generazione di testo e immagini) dal mondo sviluppato al mondo in via di sviluppo hanno subito significative trasformazioni. Questo è un pezzo da non perdere, ricco di dati e di esempi efficaci.
Tornando al contesto occidentale e in particolare al ruolo del product manager, anche qui si stanno verificando profondi cambiamenti, probabilmente più marcati nel prossimo futuro che nel presente. Questi cambiamenti sono inesorabili. Avevo già accennato all'importanza crescente del ruolo del data & AI product owner nell'era della generative AI. In questi articoli (introduzione - gruppo di ricerca) del mio amico e professore all'Università di Oxford, Ajit Jaokar, trovi riflessioni importanti sul ruolo del product manager. Personalmente, ritengo che questo ruolo si stia sempre più sovrapponendo a quello del data & AI prodle storie uct owner, almeno in certi settori industriali.
👀 Data Science. Decision-making and Signal Detection Theory: Unraveling the Craft Behind Informed Choices
Se sei appassionato di decision-making, cioè il processo cognitivo che porta alla selezione di una decisione tra diverse possibili opzioni alternative, il sito che ti propongo questa settimana fa al caso tuo; anzi, oserei dire: ti farà divertire molto!
d′etectable. Questo è il nome della prima parte del progetto che si descrive come “un'introduzione interattiva alla teoria del rilevamento del segnale (SDT). Questo sito utilizza diagrammi manipolabili, tabelle dinamiche ed equazioni dal vivo per spiegare la motivazione, la concettualizzazione e l'applicazione del SDT. L’SDT è stato originariamente sviluppato per comprendere le decisioni degli operatori radar che tentavano di rilevare le deboli tracce di aerei nemici, bogey, tra i lampi spuri sullo schermo radar (1954). La domanda fondamentale era: come fa una persona a decidere se sta vedendo un segnale o un rumore?... Nel rispondere a questa domanda, i ricercatori hanno tentato di scomporre il processo cognitivo sottostante nelle sue parti costitutive. Quindi hanno specificato una teoria che descrive queste parti in un modello matematico formale. Il risultato fu la teoria del rilevamento del segnale (1966)…”
La realizzazione del progetto è meravigliosa sia dal punto di vista tecnico sia per la gradualità con cui si viene introdotti alle basi della teoria del segnale, che sono poi le basi anche di un problema di classificazione della moderna datascience. In maniera molto interattiva ti vengono spiegati i concetti di matrice di confusione e curva ROC dalla prospettiva del rilevamento di un segnale per poi proseguire su concetti leggermente più specifici e complessi. Il tutto è stato realizzato da Adam Krawitz, assistant teaching professor del dipartimento di psicologia dell'Università di Victoria in Canada. È la prima parte di un progetto più ampio che porterà all'approfondimento del processo decisionale, dalla prospettiva della scelta tra opzioni con differenti livelli di rischio (prospectαbλe) e prospettive temporali (diskountable). Come sottolineato da Krawitz stesso “la SDT può essere vista come un primo e classico esempio di neuroscienza cognitiva computazionale: lo studio interdisciplinare della mente, del cervello e del comportamento attraverso la fusione di approcci computazionali, psicologici e neuroscientifici”. E’ per questo una disciplina molto giovane all’incrocio tra campi del sapere in grande evoluzione e anche dal grande impatto per l’evoluzione e la comprensione della società. Non perderti le prossime tappe del progetto!
👃Investimenti in ambito dati e algoritmi. Crowdsourcing to Cornerstone: The Intricate Tale of Waze's Acquisition Journey
Essendo stato un early adopter di Waze, un'applicazione mobile gratuita di navigazione stradale basata sul concetto di crowdsourcing, sono entusiasta di proporti il racconto di come nel 2013 Waze finì acquisita da Google (per 1.15 miliardi di dollari) dopo essere stata quasi acquistata da Facebook. Il racconto che ti condivido proviene direttamente da Noam Bardin, CEO di Waze all'epoca, ed è stato pubblicato su Post.news, che potremmo definire come un Twitter focalizzato sul giornalismo, piattaforma recentemente fondata proprio da Noam con un finanziamento da parte del fondo americano a16z. La storia delle trattative è avvincente, con espliciti riferimenti alle lezioni apprese durante la lunga negoziazione e a colpi di scena grotteschi. Uno degli aspetti che ritengo più interessante e spesso sottovalutato durante il processo di acquisizione è l’empatia tra i team. Un passo significativo a riguardo dice: “Facebook, d'altra parte, vedeva la trattativa come l'inizio di un processo per determinare cosa avrebbero fatto con Waze. Questo divario generò crescente tensione tra i team: non si sapeva chi ci stesse valutando e il tempo avanzava. Ci sono stati giorni in cui eravamo incerti sul passo successivo, attendendo semplicemente... Inoltre, la chimica con le persone con cui interagivamo non era ideale. Io e Mark non ci siamo trovati e gli ingegneri responsabili della due diligence, essendo molto giovani, tendevano a sminuire con sicurezza ciò che avevamo costruito...” La storia prosegue delineando, spesso con riflessioni posteriori, le ragioni dietro la scelta finale. Una scelta che potrebbe aver influenzato il mercato degli strumenti di navigazione stradale per decenni a venire. Anche se non ti interessa leggere l'intera storia, ti suggerisco comunque di dare un'occhiata, nel finale, alle sei lezioni apprese dalla vendita. Per mia esperienza personale, queste lezioni sono preziose anche per acquisizioni di dimensioni inferiori. La mia lezione preferita è la numero 4: “Tutto ciò che riguarda le acquisizioni è personale: dal motivo per cui le aziende acquisiscono, al prezzo, fino al processo stesso. È fondamentale identificare chi prende le decisioni e dedicare tempo alla costruzione di relazioni personali con loro.”
Ma non fermarti qui. Ognuna delle lezioni condivise da Bardin offre una profonda introspezione sulla complessità e le sfumature delle trattative aziendali. Nell'era digitale, dove tutto sembra muoversi alla velocità della luce, sono queste riflessioni ponderate che possono fare la differenza tra un accordo riuscito e un'opportunità mancata.
Per concludere, la storia di Waze non è solo un racconto di successo aziendale o di negoziati milionari. È una testimonianza del fatto che, dietro ogni applicazione che usiamo, c'è una rete di persone, decisioni, rischi e opportunità. E spesso, sono le relazioni umane e l'empatia che possono orientare il risultato finale, non solo i numeri su un foglio elettronico. Quindi, se ti stai avvicinando al mondo delle start-up, delle acquisizioni o semplicemente sei interessato a comprendere meglio le dinamiche dietro le grandi notizie tecnologiche, la storia di Waze è un ottimo punto di partenza. E chi può raccontarla meglio di chi l'ha vissuta in prima persona? Buona lettura! 🙂
👅Etica & regolamentazione & impatto sulla società. Deconstructing AI: Parrots or Pioneers of Creativity?
Nel dibattito sulle capacità creative delle intelligenze artificiali generative, emergono principalmente due scuole di pensiero. La prima sostiene che gli attuali Large Language Models (LLM) siano semplicemente "pappagalli stocastici", mentre la seconda ritiene che questi modelli abbiano una vera e propria capacità di comprendere il mondo e di manifestare una certa forma di creatività. Personalmente propendo per la seconda ipotesi come ho anche scritto nell’introduzione, che puoi leggere in anteprima, del libro “In principio era ChatGPT” scritto dagli amici
Per iniziare, ti consiglio un articolo di Anne-Laure Le Cunf, ricercatrice in neuroscienze al King's College di Londra. In questo pezzo, Anne-Laure delinea in modo chiaro e concreto il concetto di creatività artificiale, presentandolo anche attraverso un’interessante matrice.
Puoi passare poi a leggere un intervento di Andrew Ng che si è espresso in maniera abbastanza chiara. Questo è uno dei passaggi cruciali: “A mio avviso, il lavoro su Othello-GPT è una dimostrazione convincente del fatto che i LLM costruiscono modelli del mondo; cioè, capiscono com'è realmente il mondo piuttosto che ripetere ciecamente le parole. Kenneth Li e colleghi hanno addestrato una variante del modello linguistico GPT su sequenze di mosse tratte da Othello, un gioco da tavolo in cui due giocatori posizionano a turno i pezzi del gioco su una griglia 8x8. Ad esempio, una sequenza di mosse potrebbe essere d3 c5 f6 f5 e6 e3..., dove ogni coppia di caratteri (come d3) corrisponde al posizionamento di un pezzo del gioco in una posizione della tavola. “ E la lettura del paper citato non ha che rafforzato la mia convinzione. Se lo riesci a leggere anche tu scrivimi cosa ne pensi.
In conclusione, ti suggerisco un'analisi approfondita, seppur complessa, di Stephen Wolfram. Nel suo articolo, Wolfram esplora la possibilità che le reti neurali e, in particolare, gli LLM, possano aiutarci a comprendere la mente di una potenziale entità aliena, fornendo esempi concreti e riflessioni filosofiche su tale prospettiva. L'approccio di Wolfram è unico nel suo genere, combinando la matematica, la fisica e la filosofia per sondare le profondità delle potenzialità delle intelligenze artificiali. La sua capacità di collegare questi campi in modo innovativo offre una visione fresca e stimolante su come potremmo un giorno interagire e comprendere anche intelligenze non umane.
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!
Quello sugli LLM e la loro comprensione del mondo è un dibattito appassionante e lontano da essere rivolto. Il linguaggio è di per sé un modello del mondo. Ad esempio, senza aver inventato la parola "malinconia" gli umani non avrebbero saputo dare un senso a questo stato dell'animo. A mio avviso gli LLM hanno una comprensione derivata, non hanno quel tipo di percezione fisica che ci ha portato a codificare il mondo esterno. Per ora
Bella la storia di Noam Bardin. Hai provato Post.news? Mi sembra che per ora abbia zero traction in Europa (forse a loro non interessa eh)