For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il centunesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
🚀 Sezione Sponsor: “OfficeOfCards”.
Ciao! Mi scrivete in molti per il contenuto che divulgo e sono davvero contento che i miei sforzi aiutino le persone ad approfondire tematiche così affascinanti e attuali come quelle legate alle evoluzioni del mondo dati. Ma per leggere una newsletter ci vuole tempo, e ci vuole anche il giusto grado di concentrazione.
E se poi di newsletter uno ne vuole leggere 4 o 5 … pure peggio. Per questo ho condiviso con l'amico Davide Cervellin, autore del libro e del podcast Office of Cards, uno sconto esclusivo per i lettori de La Cultura Del Dato per il videocorso Iper Produttività, che ho fatto io stesso alla fine dello scorso anno. Il videocorso di Davide è un compendio di tips&tricks per ottimizzare tutte le nostre attività e per guadagnare tempo dalle nostre giornate. Tempo che poi possiamo spendere per lavorare di più, per stare con la nostra famiglia, per coltivare i nostri hobbies… o per leggere “LaCulturadelDato” :-)
Per avere accesso all'offerta, 100€ di sconto, basta digitare il codice LaCulturaDelDato-100 al checkout. Affrettatevi, perché lo sconto scade il 29/2 e Davide ne ha messi a disposizione solo 10!
Ed ora i cinque spunti del centunesimo numero:
👅Etica & regolamentazione & impatto sulla società. AI in the Newsroom: Beyond the Hype and Fear
Siamo evoluti anche grazie alla creazione, in chiave evolutiva, di quel negativity bias che è benissimo rappresentato dalla vignetta che ti ho riproposto sotto. Tuttavia, oggi questa predisposizione spesso ci danneggia in diversi contesti.
In realtà l’approfondimento di oggi non è sul negativity bias piuttosto sull’uso del AI nel giornalismo. Siamo particolarmente attenti ai danni che l'AI sta causando e potrebbe causare nel mondo dell'informazione, dalle fake news alla sostituzione dell'informazione di qualità, e forse troppo poco focalizzati su come invece potrebbe migliorarla.
“I nostri mezzi di comunicazione stanno subendo una trasformazione significativa a causa dei progressi tecnologici, in particolare dopo la proliferazione dell'AI generativa. Questa trasformazione ha scatenato discussioni e vari argomenti sui media, che oscillano tra le scoperte positive in campi come la medicina e le preoccupazioni per il potenziale dell'AI generativa di generare disinformazione non rilevabile, esacerbando la discriminazione e le disuguaglianze sociali. La nostra ricerca approfondisce queste preoccupazioni e gli utilizzi positivi, oltre a rivelare che la genAI sta già rimodellando il panorama giornalistico. La nostra ricerca include anche un contesto su come le organizzazioni giornalistiche hanno continuato a sviluppare l'AI "tradizionale" e su come stanno affrontando le nuove sfide della genAI.”. Questo è il punto di partenza di un'indagine globale e su larga scala su come diverse tipologie di media company stiano affrontando l'uso dell'intelligenza artificiale nei loro processi, senza cadere nell'errore di prevedere irrealistiche sostituzioni di intere redazioni. Il report è di novanta pagine ma già la lettura di pagina 7, 8, e 9 con i 31 temi chiave emersi è secondo me un ottimo punto di partenza per poi andare nel dettaglio di quelli di tuo specifico interesse. Una buona fetta di questi 31 aspetti sono a mio giudizio positivi ma ti rimarranno in mente solo quelli negativi 😄
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Stay Sharp, Coders: Mastering the Art of Learning
Imparare ad imparare, o, in altre parole, cercare di capire qual è il modo migliore per noi, in un dato momento della vita o in un determinato ambito, di apprendere è una domanda che probabilmente anche tu ti sei posto almeno una volta. Personalmente, l'ho fatto più volte e ho scoperto che non esiste un metodo univocamente migliore per farlo; inoltre, nel corso del tempo, le modalità che ci sembrano più efficaci possono cambiare. L'approfondimento che voglio consigliarti oggi esplora proprio ciò che chi scrive codice dovrebbe sapere sui metodi di apprendimento. Questo è estremamente importante in un mondo che cambia a un ritmo sempre più veloce. "Gli sviluppatori software devono apprendere continuamente per tenere il passo con i rapidi cambiamenti nel settore. Imparare qualcosa, incluso programmare, implica memorizzare informazioni. La memoria umana è affascinante e complessa e, sebbene presenti alcune similitudini con l'architettura dei computer, funziona in maniera sostanzialmente diversa. In questo articolo, abbiamo discusso le attuali conoscenze scientifiche sul funzionamento della memoria umana, sul processo di apprendimento, sulle differenze tra principianti ed esperti, e abbiamo collegato tutto ciò a misure pratiche che gli sviluppatori software possono adottare per migliorare l'apprendimento, la formazione e il reclutamento." Questa è una sintesi fedele delle 10 tesi approfondite nell'articolo, che non è rivolto solo ai programmatori ma anche a tutti coloro che gravitano intorno al mondo della programmazione: dal personale di recruiting a chi collabora con loro in team. È difficile indicare tra le 10 tesi quella che preferisco, ma se devo scegliere, ti suggerirei la sesta: "The Internet Has Not Made Learning Obsolete". Merita di essere letta e compresa, soprattutto se non sei uno Zoomer come il sottoscritto. Se ti ho incuriosito sull'importanza dell'apprendere, non puoi perderti ciò che Barbara Oakley, un'esperta di apprendimento che ha condotto ricerche significative all'incrocio tra neuroscienze e comportamento sociale, invia ogni venerdì. Ho partecipato al suo corso su Coursera qualche anno fa e ho letto uno dei suoi libri più popolari, trovando il tutto estremamente utile.
🖐️Tecnologia (data engineering). From FOMO to JOMO: Navigating Generative AI with the Best Guides in Town
Come scrivevo nella precedente sezione, continuare ad imparare e a rimanere aggiornati è sempre più importante. Lo è, in questo momento, soprattutto per chi sta vivendo e cercando di capire i cambiamenti, anche tecnologici, che la generative AI ci sta mettendo di fronte. In alcuni casi ci troviamo di fronte a cambi di paradigmi, in altri a integrazioni importanti su soluzioni esistenti. Non farsi prendere dalla FOMO e riuscire a dedicare il tempo adeguato a questo è una delle più grandi sfide dei nostri tempi ed è anche l’obiettivo di questa newsletter, nel suo piccolo. Scegliere le migliori fonti è qualcosa che diventa sempre più difficile sia per razionalizzare il tempo sia per avere gli strumenti giusti (di formazione) quando questi ci servono. Il principale approfondimento di oggi, “State of Open Source AI Book - 2023 Edition“, parte proprio da queste necessità per offrire una vista completa di tutto quello che ruota attorno alla rivoluzione della generative AI a 360°: dai sistemi di valutazione dei modelli fino alle schede hardware visto dalla prospettiva del mondo Open Source. È diviso in undici capitoli con tantissimi esempi e rimandi ad altri contenuti e copre anche molto bene tematiche applicabili anche nel mondo non Open Source. Visto il formato enciclopedico del progetto è qualcosa che difficilmente si legge in maniera sequenziale ma va usato e letto sulla base delle necessità. E’ una risorsa imperdibile se sei un machine learning engineer, devi lavorare a contatto con gli LLMs o li vuoi usare in maniera consapevole.
Rimanendo sul tema e su risorse molto utili per la formazione di data engineer o machine learning engineer, ti consiglio queste due progetti:
- Machine Learning Engineering Open Book: Una raccolta aperta di metodologie che aiutano ad addestrare con successo LLMs e modelli multimodali.
- Questo progetto, del software engineer Brendan Bycroft, che visualizza in maniera stupefacente le varie parti di cui sono composti gli LLM e che è molto adatto se ti piace usare la parte visuale come modo per imparare.
👀 Data Science. Neurons & Algorithms: Cracking the Code of Human and AI Learning
Le neuroscienze e il machine learning hanno fatto passi da gigante negli ultimi 70 anni. Abbiamo scoperto tantissimo su come funziona il nostro cervello e sulle ragioni della sua evoluzione. Questo ha permesso anche di curare alcune malattie mentali e di comprendere meglio i nostri comportamenti. Fino ad ora, siamo stati comunque più abili nell'accumulare informazioni che nell'applicarle efficacemente su larga scala, se guardiamo ai dati. Non serve, in questo contesto, che ti ricordi i successi del machine learning. I progressi di queste due aree si sono incrociati probabilmente troppo poco, eccezion fatta per l'ispirazione che le reti neurali, che possiamo definire un’area del machine learning, hanno tratto dalle neuroscienze. Negli ultimi venti anni, grazie anche all'avanzamento tecnologico, questi percorsi si sono intrecciati più frequentemente. Da novembre 2022, con il lancio di Chat-GPT3.5, un tipo specifico di rete neurale, il mondo ha iniziato a realizzare quanto sofisticata sia diventata questa ispirazione/simulazione.
L'approfondimento che ti suggerisco oggi è un corso straordinario, "Neuroscience for machine learners", offerto in modalità Open Science dall'Imperial College di Londra, tenuto dagli esperti Dan Goodman e Marcus Ghosh. In dieci settimane, il corso ti guida attraverso l'evoluzione e l'intreccio di queste discipline in modo meraviglioso e sorprendentemente pratico. Si parte dalle basi dell'anatomia e funzionamento del cervello, si passa a come apprendono sia il cervello che le reti neurali, fino ad arrivare a nozioni più teoriche sul funzionamento e l'evoluzione delle reti neurali. Nella parte finale, si esplorano le evoluzioni e gli intrecci presenti e futuri tra le due discipline. Non ho (ancora) seguito tutto il corso, ma la qualità sia teorica che pratica e le possibilità di approfondimento mi sembrano di alto livello. Anche se non sei un esperto di machine learning ma sei incuriosito dall'argomento, la prima parte del corso è facilmente accessibile. Una delle cose che mi ha colpito di più, all'inizio del corso, è stata il confronto tra le sfide e le caratteristiche diverse di mente umana e reti neurali. Per darti un esempio concreto, AlphaGo, l'intelligenza artificiale che ha sconfitto Lee Sedol, uno dei migliori giocatori di Go al mondo, in una serie di partite nel febbraio 2016, ha utilizzato, in media per partita, quasi 50.000 volte l'energia di un umano (riducendo poi il suo consumo energetico di 100 volte grazie a miglioramenti tecnologici un anno dopo!). E per quanto riguarda il numero di partite giocate per raggiungere un livello simile, AlphaGo ha dovuto "giocare" migliaia di volte più del campione del mondo (ma in meno tempo!). Quindi, come esseri umani, non dobbiamo sottovalutarci: siamo ancora molto più efficienti e "verdi" di ChatGPT. 🙂
👃Investimenti in ambito dati e algoritmi. AI Investments Unveiled: How Tech Giants are Shaping the Future
“Secondo un'analisi del Financial Times, nel 2023 le Big Tech hanno investito due terzi dei 27 miliardi di dollari raccolti dalle aziende emergenti nel settore dell'AI. Questi investimenti hanno superato il record di 11 miliardi di dollari che il settore dell'AI aveva raccolto nel 2021 e non includono il capitale e le risorse investite dalle aziende tecnologiche affermate per sviluppare i propri prodotti e servizi.” Questo è il fulcro dell'approfondimento che ti consiglio oggi, nella sezione investimenti. È un articolo scritto a quattro mani da Alex Irina Sandu e Michael Spencer, che esplora in modo dettagliato e con un'impostazione grafica accattivante come, dove e quanto le grandi aziende di tecnologia hanno investito nell’AI nel 2023. L'analisi inizia con gli investimenti nelle Foundation Model Companies,
passa poi alle piattaforme di sviluppo,
e conclude con uno sguardo alla differenziazione competitiva degli LLM,
il tutto arricchito da un'interessante disamina sulla strategia di investimenti trasversale adottata da Nvidia e Salesforce.
Questa panoramica è cruciale non solo per comprendere la posizione di forza delle Big Tech ma anche per riconoscere che il loro dominio sul mercato trascende il successo dei prodotti sviluppati internamente in questo settore.
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!