For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il settantaduesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Prima di cominciare, ho una notizia che mi fa molto piacere condividere con te. Il 5 Settembre uscirà "In principio era ChatGPT: Intelligenze artificiali per testi, immagini, video e quel che verrà..." un libro scritto da un'amica, Mafe De Baggis, che tra le altre cose mi ha aiutato a progettare questa newsletter, e da Alberto Puliafito, direttore di Slow News. Il libro tratta di un argomento molto caro a questa community, ma lo fa in un modo molto particolare. Non aggiungo altro perché, avendo avuto l'onore di leggerlo e di scrivere la prefazione, vi assicuro che ne vale la pena. È già ordinabile e, se volete, potete già scaricare indice e prefazione, dove spiego perché è un libro speciale ...
Ed ora i cinque spunti del settanduesimo numero:
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. The Future of Work (Productivity) in the Modern Organization (How we can imagine now …)
"L'intelligenza artificiale sta arrivando al tuo posto di lavoro? E se sì, quando? Purtroppo, non esistono risposte chiare a queste domande. La tecnologia si sviluppa in modo imprevedibile. Tuttavia, un documento pubblicato il mese scorso da tre studiosi - Edward W. Felten di Princeton, Manav Raj dell'Università della Pennsylvania e Robert Seamans dell'Università di New York - ha offerto alcuni spunti utili, almeno per quanto riguarda l'intelligenza artificiale come la conosciamo ora.” Questo è l’onesto incipit di un articolo arricchito da accattivanti grafiche interattive, risalente a quasi 3 mesi fa e pubblicato sul Washington Post. Questo articolo rappresenta molto bene lo stato attuale di conoscenza (ancora limitato) dell'impatto dell'intelligenza artificiale generativa sulla maggior parte dei lavori nelle organizzazioni moderne. Ha il merito di essere molto sintetico, ma valuta sia in maniera aggregata che specifica la portata dell'impatto, evitando di addentrarsi in improbabili previsioni su una completa sostituzione delle attività umane da parte delle AI.
Tutto ciò viene fatto sposando la tesi di uno dei professori citati nell'articolo, tesi che è riassunta molto bene nel finale: “La maggior parte dei ricercatori esita a prevedere la velocità di implementazione dell'intelligenza artificiale. Seamans della NYU, professore associato di gestione e organizzazioni, ritiene che ci vorrà ancora molto tempo prima che l'effetto si manifesti in pieno. Mentre nel 2019 [Elon] Musk parlava di flotte di Tesla senza conducente entro il 2020 (cosa che ancora non esiste), Chris Urmson, un esperto di veicoli autonomi, prevedeva un orizzonte di 30-50 anni", ha scritto Seamans in una e-mail.”
Se hai più tempo e un approccio più analitico, ti consiglio anche un recente articolo di McKinsey sull’argomento. Questo, oltre a tentare di prevedere l’impatto sulla produttività su scala globale (con valori, a mio avviso, decisamente elevati), fornisce, tra le altre cose, una sintesi unica sui settori industriali più impattati (analizzando in dettaglio i principali), e presenta un’analisi specifica sui ruoli lavorativi in cui l'intelligenza artificiale generativa potrebbe creare più valore, soprattutto in termini di aumento di produttività.
Quello che in generale risulta meno presente in tutte queste analisi è il calcolo della creazione di valore effettiva sulla generazione di nuovi prodotti o servizi. Mi rendo conto, però, che, allo stato dell’arte, questo afferisce più al dominio della magia 🙂
🖐️Tecnologia (data engineering). Accelerating Data Analysis: The Evolution of AI Tools and the Emergence of the Data-Product Owner
Il mondo dell'analisi dei dati sta evolvendo a un ritmo impressionante. Solo 15 giorni fa, OpenAI ha integrato in ChatGPT una potente funzionalità, Code Interpreter, che, come spiegato nelle note di rilascio del 6 luglio e in questo chiaro articolo del Sole 24 Ore, "permette a ChatGPT di eseguire codice con accesso ai file caricati dall'utente. Potete chiedere a ChatGPT di analizzare i dati, creare grafici, modificare i file, eseguire calcoli, ecc." Dopo averlo provato per alcuni progetti personali devo dirti che è veramente utilissimo e fatto molto bene. Unitamente alla possibilità di ottenere da ChatGPT il codice Python creato per risponderti in linguaggio naturale, Code Interpreter diventa uno strumento estremamente flessibile che accelera notevolmente qualsiasi tipo di analisi dei dati, spingendosi anche verso la parte più algoritmica.
A mio parere, questo tipo di strumento accentua l'importanza del data-product owner all'interno dei progetti, poiché accentua l'importanza di chi conosce semanticamente i dati nello sviluppo di nuovi servizi/prodotti. Conoscendo il dominio dei dati, è, con questi nuovi strumenti, più facile e veloce esplorare le possibilità che si hanno in mente o che emergono in un dialogo creativo (sì, è possibile, credimi) con lo stesso ChatGPT. L'analisi dei dati non è e non sarà mai più la stessa, per parafrasare una celebre citazione.
Ma tutto il mondo degli strumenti di supporto all'analisi dei dati, non solo ChatGPT, sta evolvendo a una velocità impressionante. Eccoti alcuni progetti molto interessanti in questo ambito.
In primis, ho provato e sono rimasto veramente impressionato dal progetto/prodotto RATH che, come si descrive, "non è solo un'alternativa open source a strumenti di analisi e visualizzazione dei dati come Tableau, ma automatizza il flusso di lavoro di analisi esplorativa dei dati con un motore analitico potenziato, scoprendo modelli, intuizioni, cause e presentando tali intuizioni con una potente visualizzazione multidimensionale dei dati generata automaticamente". Assolutamente da provare: per ora in maniera totalmente gratuita … basta un file CSV e tanta passione! 🙂
Ma ci sono anche progetti, sempre nello spirito "data-copilot", che sembrano molto interessanti. È un po' più complicato provarli perché richiedono installazione, ma sono ben documentati. Si tratta, per esempio, di Data Copilot (di nome e di fatto) e CSV-AI, entrambi con una potente interfaccia linguistica.
Se invece lavori prevalentemente con le immagini, devi provare Voxel51, il tuo assistente AI per la computer vision!
👀 Data Science. Catching the AI Wave: Your Summer Dive into Generative Systems
Ricevo numerose richieste di consigli riguardanti corsi di vario livello su ChatGPT e, più in generale, sui sistemi di AI generativa. Pertanto, ho deciso di fornirti una panoramica concisa e alcuni approfondimenti. L'estate, per molti, è il periodo in cui si ha più tempo da dedicare alla formazione, specialmente nei campi di proprio interesse.
Ecco i miei tre consigli principali sull'argomento:
1. La pratica diretta con questi sistemi rappresenta la formazione più efficace possibile. Data l'attuale scarsa conoscenza e la dinamicità del campo, utilizzarli integrandoli nella tua routine lavorativa dovrebbe essere la priorità. Per farlo, ti consiglierei di considerare come un investimento personale e formativo l'abbonamento anche a servizi premium (ad esempio, ChatGPT4 e il suo sistema di plugin), che offrono un'esperienza migliore e più efficiente.
2. Se desideri seguire un corso, cerca di essere il più specifico possibile riguardo all'ambito in cui intendi applicare l'AI generativa. In questo post di Bernard Marr troverai un elenco completo di corsi (gratuiti e a pagamento) suddivisi per campo applicativo: è un ottimo punto da cui partire.
3. Tra le risorse che ho testato e che ritengo molto valide, ci sono i corsi gratuiti di deeplearning.ai, che forniscono una base introduttiva, e i corsi a pagamento della Finxter Academy. Quest'ultima, tramite un abbonamento, ti offre l'accesso a una suite di corsi che non solo riguardano l'AI generativa, ma presentano anche un taglio più tecnico.
Ti auguro una formazione estiva produttiva 🙂
👃Investimenti in ambito dati e algoritmi. Marc Andreessen at the Crossroads: Innovation, Entrepreneurship, and Investment in AI's Future
Gli innovatori, gli imprenditori e gli investitori, oltre a condividere la lettera iniziale, possiedono diverse caratteristiche comuni. Spesso, per una parte della loro vita, hanno fatto parte di tutte queste tre categorie, a volte contemporaneamente. Una caratteristica sicuramente comune è la fiducia nel progresso, nella tecnologia e nella capacità dell'uomo di migliorare la società. Senza questo tratto, non riuscirebbero a sopportare gli effetti negativi che gli insuccessi riversano su gran parte di loro, così come sintetizzato da Taleb nella sua proposta di una giornata mondiale dell'imprenditore.
Marc Andreessen, che ho citato più volte in questa newsletter, è uno degli esempi più rappresentativi di queste tre figure: innovatore, imprenditore ed ora principalmente investitore con il suo celebre fondo a16z. Nonostante sia un esponente del tecno-liberismo più estremo della costa ovest americana, ritengo che Marc debba essere ascoltato e letto anche quando non si è completamente d'accordo con lui.
Per questo, il suo post "Why AI Will Save the World" merita di essere attentamente considerato. Andreessen non solo espone le sue idee sul perché dovremmo essere ottimisti e cercare di accelerare lo sviluppo dell'AI senza lasciarci intralciare eccessivamente dalla regolamentazione, ma argomenta efficacemente a favore di queste tesi. In uno scenario globale altamente diversificato, una regolamentazione eccessiva potrebbe giocare a sfavore del mondo occidentale, ostacolando forse anche un migliore utilizzo dell'AI. Non condivido tutte le sue posizioni, ma riconosco che molte delle sue argomentazioni potrebbero avere un ruolo significativo nel futuro sviluppo dell'AI nella società.
Il post di Andreessen è scritto in modo molto avvincente e vale la pena dedicargli il tempo necessario, almeno 30 minuti, per apprezzarlo pienamente, senza ricorrere a ChatGPT per una sintesi 🙂. Se invece preferisci ascoltare le voci di dieci imprenditori selezionati da Marc Andreessen per i suoi investimenti, in questa pagina troverai dieci aziende che stanno cercando di migliorare il mondo con l'AI, e in particolare con la Generative AI. Le aziende sono presentate dai loro fondatori e rappresentano investimenti del fondo di Marc, a16z. Credo valga la pena dedicare del tempo anche a queste presentazioni, perché tra questi imprenditori potrebbe esserci il Marc Andreessen del 2050.
Rimanendo nel 2023 ma su giovani (italiani) che stanno cercando di fare innovazione con la AI generativa non posso non segnalarti Safurai. Safurai è un assistente per lo sviluppo software molto particolare che funziona in maniera diversa da Github Copilot ed è per ora disponibile come estensione di VsCode. Lo ho provato e l’ho trovato veramente figo!. Safurai ha avuto un pre-seed di 120k da parte di Techstars ma sicuramente sarà il primo di una lunga serie …
👅Etica & regolamentazione & impatto sulla società. AI Polarization: A Complex Issue of Bias in Generative AI and Our Shared Responsibility
Il problema della polarizzazione (bias) dei sistemi di intelligenza artificiale non è certamente nato con la generative AI, perché era già presente nei modelli di machine learning e, in misura minore, in ogni approccio statistico basato su un campione di dati rappresentativo di una popolazione di individui. Possiamo dire che la generative AI ha reso più evidente e percepibile a tutti questo fenomeno, soprattutto nella generazione di immagini. Proprio su questo concetto si muove l'articolo e lo studio del team di Bloomberg, molto ben fatto sia sul piano scientifico che di spiegazione del fenomeno della polarizzazione, nel caso specifico di generazione di immagini con Prompt tramite il motore generativo Stable Diffusion. In estrema sintesi, l' “analisi di oltre 5.000 immagini create con Stable Diffusion ha rilevato che le disparità razziali e di genere vengono esasperate, peggiorando quelle riscontrate nel mondo reale”. Il confronto interessante è stato fatto attraverso i dati censuari americani, che mostrano già importanti problemi di polarizzazione di genere e di etnia su base socio-economica. Un altro aspetto interessante, visto che Stable Diffusion ottiene i suoi dati grezzi da LAION-5B, il più grande dataset di immagini e testi al mondo di libero accesso, è la questione posta da uno degli autori dell’articolo nella parte finale. Ci si chiede infatti: "chi si assume la responsabilità?È dei fornitori di dati? È dei modelli? O sono i creatori?". Come tutte le domande complesse anche questa non ha una risposta semplice e univoca ma probabilmente la responsabilità si distribuisce in tutte le fasi del processo. E non dimentichiamo che la realtà stessa è polarizzata, e l’abbiamo nel passato creata noi, senza l’aiuto di intelligenze non umane.
Se sei particolarmente interessato al tema e non dai per scontato che l'uso di molti dati o di quelli sensibili sia una causa del problema, ti invito a leggere questo articolo dell'Harvard Business Review. Esso evidenzia come in alcuni studi relativi al mondo del credito, proprio l'uso di dati (sensibili) di genere (il sesso della persona a cui può essere concesso un prestito) possa aiutare a minimizzare le polarizzazioni invece di aumentarle, in maniera abbastanza sorprendente. Questo mi porta a pensare che non sia solo un problema di allineamento tra uomo e macchina, come evidenziato in maniera molto "markettara" in questo post di Open AI, ma soprattutto un tema di funzione e obiettivi che noi umani diamo alle macchine stesse. In questo senso, i problemi di bias, già presenti nel nostro mondo, potrebbero, in maniera un po’ provocatoria, essere addirittura migliorati dall'AI se esiste veramente la volontà di farlo, anche a scapito di una parte di efficienza e di profitti, almeno nel breve periodo. Il tema è certamente complesso... importante è non scaricare sulle macchine, incoscienti, problemi che sono di noi esseri coscienti. 🙂
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!