For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il quarantunesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Innanzitutto visto che questo numero esce proprio il 24 Dicembre ti auguro un sereno Natale e buone Feste non dimenticandoti di continuare a leggere e a informarti sul nostro effervescente mondo dei dati. Per l’ultima puntata di quest’anno, che sarà la numero 42 (un numero particolare per chi ama il mondo dell'intelligenza artificiale), ti sto preparando qualcosa di diverso … speriamo speciale!
Ecco i cinque spunti del quarantunesimo numero:
👃Investimenti in ambito dati e algoritmi. State of European Tech 2022
Lo “State of European Tech 2022” ha sicuramente un primato: è il più lungo report che conosca sullo stato dell’arte degli investimenti e delle valutazioni di aziende tecnologiche europee. La sua lettura completa (senza approfondimenti) dura circa 3 ore. Tranquillo! Anche io non l’ho letto tutto, neppure quest’anno. Oltre ad essere lungo e completo è anche fatto molto bene dal punto di vista editoriale e la versione on-line si naviga facilmente per cogliere le angolature che più interessano. Essendo giunto all’ottavo anno di pubblicazione ha una buona serie storica e questo lo rende ancora più prezioso. Ti fornisco 4 possibili modi per evitare le 3 ore e più di lettura senza perdere informazioni che nel suo insieme sono uniche:
Usa il percorso veloce che in 10 minuti di lettura ti fornisce le informazioni più significative.
Leggi questo articolo dell’autorevole testata on-line Sifted che elenca i 19 punti più significativi del report.
Navigalo seguendo la barra di sinistra leggendo solo alcune delle 7 parti in cui è diviso
La quarta è ancora più veloce ma ti devi fidare del mio giudizio e dei miei interessi.
Ecco le 6 cose che mi hanno più colpito o comunque ritengo rilevanti:
Il valore di capitalizzazione del mercato tech in Europa (aziende quotate e non) pur in discesa dal 2021 (valeva 3.1 Trilioni di dollari contro gli attuali 2.7 T, magari anche qualcosa di meno visto la discesa ancora in corso) rispetto al 2022 è enormemente più ampio dei 0.6 T del 2015. La tecnologia ha un mercato significativo anche in Europa … 🙂
In grande discesa nel 2022 i round di investimento grandi (oltre round A) e il numero di unicorni mentre rimangono molto resilienti gli investimenti nelle prime fasi (seed e round A)
Milano, come hub Europeo, è nono per capitali investiti e decimo per numero di investimenti. In ritardo ma in crescita assoluta e relativa
L’aspetto in cui l'ecosistema italiano è più in ritardo, oltre che in termini di numeri assoluti, è anche per il valore medio di round A e seed. Siamo molto lontani da olandesi, tedeschi e francesi: i nostri valori medi di investimenti iniziali sono più bassi del 60-70%. E questo rende più difficile far crescere l’ecosistema.
La tecnologia europea mostra segnali di resilienza più forti rispetto a quella americana ma viste le “sproporzioni” in termini assoluti e di crescita recente sarebbe stato molto grave il contrario!
I dati e l’intelligenza artificiale non sono citati in maniera specifica né come ambito tecnologico né come area di investimento perché ormai sono una parte “necessaria” e centrale per qualunque nuova iniziativa di business. Dati e intelligenza artificiale hanno così raggiunto l’obiettivo che si erano posti alla fine dello scorso decennio. Forse con qualche anno di ritardo ma in maniera chiara e definitiva!
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. The state of AI in 2022 — and a half decade in review by McKinsey
Ti consiglio senza alcun dubbio di dare un’occhiata al fresco report di McKinsey sullo stato dei sistemi di intelligenza artificiale all’interno delle organizzazioni. In particolare guarda la versione on-line più che il pdf scaricabile perché molto più facile da leggere e con una eccellente evidenza dei concetti chiave. Essendo il quinto anno dell’indagine e avendo una estensione su varie dimensioni riflette molto bene la situazione nelle grandi organizzazioni del mondo occidentale. Vi segnalo, per ciascuna delle tre parti in cui è organizzato, quello che mi ha colpito particolarmente.
Parte 1- Five years in review: AI adoption, impact, and spend
Adozione (dell’AI nelle organizzazioni) stabile (2022 Vs 2021) con un fattore 2.5 assoluto di crescita dal 2017. Spesa in crescita significativa costante!
Ancora troppo focus sugli ambiti di ottimizzazione (Robot Process Automation in primis) piuttosto che su quelli di creazione di valore sui prodotti, comunque anch’essa in crescita.
Parte 2- Mind the gap: AI leaders pulling ahead
Distanza più ampia, tra le aziende leader nell’uso dell’AI rispetto al campione totale, sulla capacità di integrare dati e investire sui talenti. Meno distanza su tematiche di definizione della strategia e uso dei modelli. Non mi sorprende perché dati e persone sono i veri fattori chiave: per me un’ossessione! 🙂
Focus sempre più alto su governance, monitoraggio e ottimizzazione dei progetti in produzione. Buon segnale, in questo senso, di maturità dell’ecosistema.
Parte 3- AI talent tales: New hot roles, continued diversity woes
Difficilissimo sintetizzare la parte sui trend dei ruoli dei data-experts ed è la parte che ti consiglio di leggere integralmente. Si conferma il data-engineer come ruolo in più forte crescita di domanda in tutto il mondo.
La correlazione (ma azzarderei anche il sostantivo causazione 🙂) tra risultati ottenuti e la diversità, sotto vari attributi, dei team di data-expert è veramente forte. Niente di nuovo se non una piacevole conferma. Qui però il tema è la complessità (che adoro) di gestire team con queste caratteristiche …
🖐️Tecnologia (data engineering). The present and future of coders told by a coder
Ho trovato molto interessante l’intervista a Clive Thompson da parte del chief marketing officer, Khalid El Khatib, di Stack Overflow, durante la loro prima conferenza dal nome che è tutto un programma “Flow state”. Clive Thompson ha scritto nel 2019 uno dei libri recenti più importanti sui programmatori che è stato definito quasi uno studio etnografico. Lo ha fatto, da appassionato programmatore quale è, parlando a migliaia di programmatori in giro per il mondo. Ne ho letto alcune parti ed è fatto molto bene. Questi 35 minuti di intervista sono una sintesi e direi un aggiornamento di quello che scrive sul libro dopo 3 anni, gli ultimi in pandemia, che per diverse motivazioni hanno rivoluzionato molti aspetti di questa attività. Se non hai 35 minuti, ma meritano anche per la brillantezza di Clive, in questo articolo trovi una buona sintesi. Gli aspetti che mi hanno più colpito, non direi sorpreso, sono questi 3:
La consapevolezza che il lavoro da remoto, non una completa novità in questo ambito, sta cambiando il coding favorendo da un lato il tanto amato “stato di flusso” ma andando ad indebolire alcune pratiche quali il pair programming e la face-to-face synchronization. Il tutto con qualche perplessità di Clive sulla qualità del codice, perlomeno nel lungo periodo. La metodologia di lavoro ibrida sembra essere la forma più efficace che sta emergendo, soprattutto nelle aziende medio piccole, per ottimizzare il tutto.
L’intelligenza artificiale, Clive cita nella fattispecie Copilot, avrà sempre di più un impatto sulla metodologia di lavoro andando a favorire e rendere ancora più produttivi e a favorire i migliori e quelli che sapranno usare al meglio i nuovi strumenti
Un aumento ancora più forte di chi realizzerà codice senza essere un vero programmatore attraverso gli strumenti low-code no code. Questo è un trend inevitabile favorito sia dalle nuove piattaforme sia da una sempre più evidente carenza di coder.
Quindi se sei un data-engineer il messaggio sembra chiaro: non perderai certo il lavoro ma se vuoi restare “sulla cresta dell’onda” devi saper cambiare un po’, in futuro, il modo in cui lavori. E aggiungo, prendendo la parola, dovrai ancora di più conoscere il contesto di business in cui lavori.
👀 Data Science. Data Science Art
Allison Horst è una datascientist artista che sta costruendo (ma la collezione è già molto ampia) illustrazioni che spiegano molto bene alcuni concetti fondamentali della datascience e della statistica in generale. Le immagini, oltre ad avere una grafica accattivante, hanno la magia di semplificare concetti non sempre banali in modo semplice e visuale. Mi è capitato di usarle in alcune presentazioni recenti con successo. Le immagini sono disponibili per uso aperto secondo la licenza CC-BY (Creative Commons Attribution 4.0 International License). La galleria è organizzata per tematiche. Le mie preferite sono quelle che illustrano la logica del K-means clustering, alcuni concetti del mondo git/github e quelle più generiche sul mondo della Computer Science. Te ne lascio una sotto come esempio che illustra un concetto importante, quello del versioning, ma che non è sempre nel mindset tipico del data scientist. Ma non mi riferisco certamente a te ;-)
👅Etica & regolamentazione & impatto sulla società. The Turing Way handbook to reproducible, ethical and collaborative data science
The Turing way è un libro, una comunità e una grande collaborazione globale che si dedica a rendere la ricerca collaborativa, riutilizzabile e trasparente "troppo facile da non fare". Sia che tu faccia progetti di datascience in azienda sia che lavori nella ricerca in qualunque tipo di organizzazione, The Turing way è uno strumento fondamentale. Ti può aiutare sia per muoverti sui concetti e sulle definizioni di base, che poi troppo scontate e univoche non sono, sia per approfondire i vari aspetti che rendono un progetto, non solo di ricerca, realmente riproducibile.
Ci sono tre cose che mi sono particolarmente piaciute di questo progetto che lo rendono veramente unico, nel suo ambito:
Le definizioni di una ricerca/progetto riproducibile fatta a matrice che ti riporto sotto
La completezza con cui viene coperto ogni aspetto necessario alla riproducibilità di un progetto suddividendo il tutto in cinque guide facilmente accessibili. Si parte dalla guida alla ricerca riproducibile, che è il cuore del testo, si passa poi alla guida al project design, alla comunicazione, alla collaborazione e per finire alla parte dedicata alla ricerca etica. Il tutto con una precisione e una serie di note che rende il tutto facile da leggere e da approfondire
La grafica, rilasciata in creative commons, che rende facilmente comprensibili e memorizzabili anche i concetti più complessi. Per esempio ti riporto sotto lo sketchnoting che rende visuale la matrice che ti ho proposto sopra
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!