For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il settantaseiesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del settantaseiesimo numero:
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Decoding the Future: McKinsey's Insights on AI Trends and Talent Dynamics for 2023
I suggerimenti di lettura per questa settimana provengono interamente da McKinsey e si complementano perfettamente tra loro. Il primo documento, dal titolo "Technology Trends Outlook 2023", ha una delle sue cinque sezioni dedicata a ciò che viene descritto come la "rivoluzione dell'IA". Questa sezione è suddivisa in tre trend specifici: dal più tecnico relativo all'implementazione ("Industrializing machine learning"), passando per il più tradizionale ("Applied AI"), fino all'unico trend introdotto rispetto al documento del 2022, che riguarda l'IA Generativa. Il report è ricco di dati e analisi comparative che attestano la crescita del settore, senza rivelazioni particolarmente sorprendenti. Ciò che spicca maggiormente è l'analisi dettagliata relativa alla ricerca di talenti, suddivisa per ruolo e competenza, con un'enfasi particolare su UK e USA. In breve, assistiamo a una crescente domanda di talenti, ma anche a un aumento dell'offerta, portando a un equilibrio progressivo tra domanda e offerta, influenzato anche dai recenti licenziamenti massicci. Una nota di eccezione riguarda le figure lavorative legate alla "Regulatory Compliance" nel campo dell'IA Generativa, che sembrano quasi introvabili.
Il secondo documento, intitolato "The state of AI in 2023: Generative AI’s breakout year", riporta i risultati di un'ampia indagine condotta da McKinsey ad Aprile 2023 su 1684 grandi organizzazioni distribuite globalmente. Particolarmente interessante è il primo grafico interattivo che mostra l'utilizzo dichiarato della generative AI, sia in ambito lavorativo che non. Emerge che l'Europa, tra le cinque regioni analizzate, utilizza meno l'IA in ambito professionale, ma parallelamente all'Asia, in particolare la Cina, la utilizza intensamente in contesti non lavorativi. C’entrerà qualcosa l’approccio regolamentare? 😏In linea con il primo studio il tema della ricerca dei talenti che sembra essere un problema meno sfidante rispetto al 2022 in quasi tutti i ruoli. Unica eccezione, ed è un mio pallino di cui ti parlo spesso, quella del AI product owners/managers che non segue il trend e rimane un punto critico per quasi tutte le aziende. Il documento è ricco di altre informazioni preziose e il formato interattivo del report ti permette di focalizzarti rapidamente sugli argomenti che ti interessano di più.
🖐️Tecnologia (data engineering). Beyond Traditional Coding: Embracing New Libraries and Languages in the AI Era
Anche nell'era dell'intelligenza artificiale generativa, scrivere codice corretto rimane fondamentale. Pur avendo a disposizione strumenti che facilitano la scrittura, spesso ci si trova nella necessità di intervenire per correggere errori logici o semantici. Questa esigenza diventa ancora più pronunciata quando si lavora con dati e algoritmi: è essenziale produrre codice efficiente nella gestione dei dati e rapido nell'esecuzione degli algoritmi, soprattutto considerando che i dati possono aumentare man mano che il progetto si sviluppa. I due consigli che seguono sono pensati proprio per aiutarti in questo ambito.
Se non hai partecipato al Pycon 2023 a Firenze, l'evento di punta della comunità Python italiana, potresti aver perso l'intervento di
Ma se vuoi andare oltre Polars, potresti considerare l'approfondimento di un nuovo e promettente linguaggio di programmazione dedicato all'intelligenza artificiale: Mojo. Questo linguaggio è stato sviluppato, nell'ambito del progetto/azienda Modular, da Chris Lattner, ideatore originale del linguaggio di programmazione Swift, e da Tim Davis, ex-leader di un prestigioso team di machine learning presso Google. Mojo unisce la facilità d'uso di Python alle prestazioni del C e aspira a integrarsi perfettamente nell'ecosistema del Progetto Jupyter. Tuttavia, è bene sottolineare che non è ancora del tutto compatibile con il codice Python 3.x e supporta solo un sottoinsieme della sua sintassi. Anche per Mojo, il livello di attività sul suo repository Github indica un forte interesse, segno promettente per il suo futuro.
Infine, se non sei incline a sperimentare nuovi strumenti e desideri piuttosto imparare come sviluppare e distribuire un'applicazione basata su dati usando SQL, Python e Jupyter notebook, ti suggerisco vivamente il corso offerto da Laura Gutierrez, una data scientist brasiliana. Il corso copre in dettaglio tutti i passaggi necessari, utilizzando dataset reali.
👀 Data Science. Leafmap: Your Gateway to Easy Geospatial Analysis and Visualization
Leafmap è una libreria Python gratuita e open-source che consente di analizzare e visualizzare dati geospaziali con pochissimo codice, e ciò è possibile anche in ambienti Jupyter come Google Colab, Jupyter Notebook e JupyterLab. La caratteristica saliente di questa libreria è la sua estrema facilità d'uso, supportata da una documentazione e tutorial molto dettagliati. Anche se non sei esperto di Python o di dati geospaziali, partendo dalla sezione "Get Started" del sito e dai 57 Notebooks d'esempio presenti, puoi creare visualizzazioni affascinanti dei tuoi dati geografici.
Se cerchi ispirazione da chi realizza visualizzazioni geografiche professionali, puoi esplorare i progetti di Asjad Naqvi. Lui è un economista particolarmente abile nel narrare trend attraverso l'uso di dati e mappe.
D'altro canto, se sei un appassionato di musica e desideri rappresentare su un diagramma temporale i tuoi artisti preferiti, Guillermina Sutter Schneider ha realizzato un esperimento molto interessante che puoi anche ascoltare su Spotify 🙂
👃Investimenti in ambito dati e algoritmi. Startup of the Month (July 2023) is Redpanda
Come ogni mese, utilizzo una delle mie attività per esplorare il mercato dell'innovazione e degli investimenti e segnalarti una startup internazionale che ha particolarmente colpito la mia attenzione e che ha ottenuto finanziamenti il mese precedente. Questa startup opera nel mondo dei dati e degli algoritmi, o ne fa un uso massiccio, vantando all'interno del suo team, o nelle selezioni attuali, un nutrito gruppo di esperti dati.
Gli investimenti globali nell'ambito Data & AI sono tornati a luglio ai livelli tendenziali tipici del 2023, dopo il picco che ti avevo segnalato a giugno.
Tra le 64 startup etichettate come "data & algorithms" a luglio (su un totale di 430, ovvero circa il 15%, una percentuale in linea con la media del 2023), ti segnalo Redpanda. Si tratta di una piattaforma dedicata allo streaming di dati in tempo reale che ha recentemente concluso un round di investimenti (Series C) di $100 milioni. È stata sviluppata integralmente in C++ e, quindi, non necessita della JVM (Java Virtual Machine) come invece fa Apache Kafka, l’attuale standard de-facto per quanto riguarda lo streaming di dati in ambiente aziendale. Redpanda è nata con l'obiettivo di competere con Kafka e la sua versione con supporto Confluent, puntando a superarne alcune limitazioni come la complessità architetturale e il costo complessivo di gestione. Tuttavia, le opinioni su chi dei due sia migliore non sono univoche e, al momento, gli esperti dati si esprimono con un cauto "dipende...". Va detto che, essendo Redpanda compatibile con il protocollo Kafka, è possibile optare per questa piattaforma senza dover apportare significative modifiche al codice. Non bisogna dimenticare, però, che Kafka è open source con licenza Apache, mentre Redpanda è disponibile (anche nella versione gratuita "community") con licenza BSL (Business Source Licence). Ciò nonostante, dal punto di vista commerciale e della visibilità su GitHub, il prodotto sta crescendo rapidamente, come afferma il CEO: "Abbiamo quintuplicato il nostro fatturato l'anno scorso e raddoppiato le dimensioni della nostra azienda. Non abbiamo perso un accordo in sette mesi contro nessuno dei nostri concorrenti". Senza dubbio, un progetto da tenere d'occhio sia tecnicamente che dal punto di vista della crescita della start-up!
👅Etica & regolamentazione & impatto sulla società. AI, Creativity, and Data Dignity: Diving into the Deep End with Jaron Lanier and Friends
La scorsa settimana in questa sezione della newsletter ti avevo proposto il dibattito sulle due scuole di pensiero circa la capacità creative delle intelligenze artificiali generative. Mi ero schierato a favore della scuola di pensiero di quelli che pensano che gli attuali Large Language Models (LLM) abbiano capacità di comprendere il mondo e di manifestare una certa forma di creatività e non siano solo solo pappagalli stocastici. Sebbene sostenga fermamente la mia visione, ritengo essenziale ascoltare le opinioni contrastanti, specialmente quando provengono da esperti nel settore in questione. Proprio per questo, ti suggerisco la lettura di un articolo di Jaron Lanier pubblicato sul The New Yorker.
Jaron Lanier, informatico, compositore e saggista statunitense, è celebre per aver popolarizzato il termine "virtual reality", diventando un pioniere in quel campo. Con il passare del tempo, ha espresso crescenti perplessità sullo sviluppo economico e sociale del web, culminando nel gustosissimo libro “"10 argomenti per cancellare il tuo account sui social" che ti consiglio anche se, come il sottoscritto, non sei completamente d’accordo con la sua tesi. Tornando all’articolo che ti suggerisco, Lanier sfida le visioni tradizionali dell'Intelligenza Artificiale (IA). Mentre molti la percepiscono come un'entità autonoma, paragonandola all'intelligenza umana, Lanier suggerisce di vederla come uno strumento avanzato di collaborazione sociale: una sinergia tra uomo e macchina. Un punto saliente del suo ragionamento è il concetto di "data dignity" o "dignità dei dati". In un periodo in cui i tuoi dati personali vengono continuamente sfruttati dalle grandi aziende tecnologiche, Lanier propone un cambio di paradigma. Secondo lui, ogni individuo dovrebbe avere il diritto di controllare e, più importante, essere giustamente retribuito per i dati che produce e condivide online. Questo significherebbe trasformare gli utenti da meri prodotti a stakeholder attivi nell'economia digitale, contrastando il modello attuale in cui poche entità monopolizzano i benefici dei dati. Seguendo questo pensiero c’è anche ci si chiede se a quella che chiamiamo intelligenza artificiale serva essere effettivamente intelligente …
Dalla sua riflessione emerge comunque una preoccupazione per i possibili scenari distopici che l'evoluzione dell'AI potrebbe creare. Tuttavia, il suo punto di vista risulta meno apocalittico rispetto a quello (ribadito in questa recente intervista) di Nick Bostrom, autore del noto libro "Superintelligenza" e sostenitore della teoria della realtà come simulazione.
C’è anche chi realizza stupende visualizzazioni interattive sulla nostra via alla AGI (Artificial General Intelligence) o alla Superintelligenza di cui parla Bostrom a cui arriveremmo tra 25 anni. Da vedere e mettere tra i preferiti per controllare ogni 5 anni se siamo passati al livello successivo 🙂
Ma non voglio concludere con un tono eccessivamente allarmista. Ti invito pertanto a scoprire una visione più ottimistica sul futuro dell'AI presentata da Bill Gates, e a guardare il video di 5 minuti "AI Boyfriend", che affronta con ironia le potenziali interazioni tra IA e umani. Sono sicuro che ti strapperà più di un sorriso! 😂
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!
Per chi volesse approfondire la Geospatial Data Science consiglio il materiale disponibile del corso universitario di UniTN
https://napo.github.io/geospatial_course_unitn/