For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il centoquarantaduesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del centoquarantaduesimo numero:
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Michele Cermele: Dal Venture Capital all'Intelligenza Artificiale: un 'tifoso' vicino alla panchina 😊
Presentati
Michele Cermele. Ho svolto diversi ruoli, ma quelli più significativi sono stati l’imprenditore e l’investitore. Ho studiato ingegneria e per un periodo mi sono dedicato alla ricerca su temi che oggi chiameremmo Cloud Computing. Ho lavorato presso i laboratori di ricerca dell’Istituto Nazionale di Fisica Nucleare, e successivamente ho trascorso alcuni anni nella consulenza di direzione in McKinsey & Co, e poi ancora nel settore delle piattaforme di pagamento in Mastercard Intl. L’esperienza che mi ha segnato di più è stata quella da imprenditore nell'ambito dei servizi per la gestione del credito. Dopo l’ingresso della mia ex startup nel gruppo Cerved, che è stata una lieta exit, ho passato il testimone a nuovi manager e mi sono dedicato al venture capital, sia con un’iniziativa globale chiamata Copernion, sia con un progetto italiano focalizzato sulle startup nell’Intelligenza Artificiale. In aggiunta, negli ultimi due anni mi sono anche dedicato a un progetto lanciato dal mio Comune di origine (Campobasso) che si chiama Casa delle Tecnologie Emergenti.
Il mio ruolo tra 10 anni sarà...
Innanzitutto, cercare di esserci. Conoscere le statistiche aiuta a non dare per scontato ciò che non lo è. Se ci sarò, vorrei essere al fianco di chi ha un’idea o una scommessa da giocare. Un imprenditore degli anni trenta. Potrei definirmi un tifoso, non proprio quello della curva troppo fazioso, ma neanche quello della tribuna VIP. Piuttosto sarò seduto a pochi passi dalla panchina, dove ascolto l'allenatore e magari, ogni tanto, bisbiglio qualche suggerimento.
Qual è la sfida più importante che il mondo dei dati e algoritmi ha di fronte a sé oggi?
Distinguiamo i dati dagli algoritmi. Per i dati vedo ancora molte sfide aperte. Ci illudiamo di raccogliere informazioni utili, ma spesso lo facciamo male. Se sapessimo quanto sono sporchi i database che alimentano alcuni sistemi decisionali, non accetteremmo mai di seguirne le raccomandazioni. È come salire su un taxi con un conducente che ha le lenti degli occhiali frantumate. Sul fronte degli algoritmi, viviamo in un’epoca in cui si pensa di poterli usare senza conoscerli, come quando, grazie alla calcolatrice, tutti si chiedevano se non era più necessario sapere fare le divisioni. Ed era così! Mi incuriosisce l'avvento dei programmatori che non conoscono l'algoritmo.
Segnalaci il progetto o la risorsa nel mondo dei dati di cui non potresti fare a meno... Attribuisco molta importanza alla tempestività nel ricevere i dati, più che alla loro forma o agli strumenti di visualizzazione. Per questo, per me sono fondamentali gli alert su notizie e, ancor di più, quelli basati su soglie quantitative. Servono a monitorare indici aziendali, ma anche informazioni extra-professionali come lo stato dei trasporti, allarmi di sicurezza e l’intrattenimento disponibile. Mi aspetto grandi progressi dalla realtà aumentata, che possa migliorare la consapevolezza di ciò che ci accade intorno. In sintesi, sono uno di quelli che andava allo stadio con la radiolina nell’orecchio: la mia risposta è la radiolina.
👃Investimenti in ambito dati e algoritmi. Start-up del mese Ottobre 2024: Path Robotics
Come ogni mese, grazie alla mia attività di monitoraggio dell'innovazione e degli investimenti a livello mondiale, ho l'opportunità di presentarti una startup che ha catturato particolarmente la mia attenzione. Si distingue per aver ottenuto finanziamenti significativi a ottobre 2024 e opera nell'ambito dei dati e degli algoritmi, integrando queste tecnologie in modo sostanziale nei suoi prodotti destinati al mercato.
Prima di segnalarti la startup che ho scelto per questo mese, analizziamo i dati di ottobre del Venture Capital a livello mondiale. Finalmente, ci sono notizie positive: come puoi leggere dal solito pezzo “molto sul pezzo” di Crunchbase, ottobre è stato certificato come il miglior mese, per valori investiti, dall’inizio dell’anno. Guardando più da vicino i dati, emerge una crescita molto forte nella parte del late-stage funding, trainata dal grosso round di OpenAI e da altri big, in particolare nei settori dell’Energia e della Robotica. Anche dal mio piccolo osservatorio ho rilevato questa crescita, soprattutto nel numero di investimenti (600 contro i 513 del mese scorso), con il settore data & AI ancora in grande spolvero sia in termini di operazioni (+30% rispetto al mese scorso) che di valori investiti (quasi l'80% in più).
A testimonianza del fatto che la Robotica è un settore molto caldo e in cui l’Italia, con la sua forte dipendenza dalla manifattura, dovrebbe investire di più, la startup del mese viene proprio da questo settore. Path Robotics affronta una delle sfide più complesse della manifattura: automatizzare il processo di saldatura per produzioni personalizzate e in piccole serie. Integrando tecnologie avanzate di AI e apprendimento automatico, l'azienda sta ridefinendo ciò che è possibile fare nella saldatura robotica.
I sistemi di saldatura robotica tradizionali eccellono in compiti ripetitivi ad alto volume, dove l'ambiente e i materiali sono costanti. Tuttavia, faticano a gestire la variabilità e la complessità tipiche della fabbricazione personalizzata e della produzione in piccole serie. Questo segmento si basa fortemente su saldatori umani qualificati, in grado di adattarsi a diversi design, materiali e specifiche, una risorsa sia scarsa che costosa.
Path Robotics cerca di colmare questa lacuna sviluppando robot di saldatura autonomi capaci di adattarsi a una vasta gamma di compiti senza la necessità di riprogrammazione estensiva o intervento manuale. Per raggiungere questo obiettivo, sta utilizzando in modo massiccio (e sembra con grande efficacia) la Visione Computerizzata Avanzata, la Pianificazione Dinamica del Percorso di saldatura, il Reinforcement Learning per apprendere durante la produzione e l’Edge Computing.
Il round D da 100 milioni di dollari che ha ricevuto a ottobre è solo l'ultimo di una serie di investimenti ripetuti nella scale-up dal 2021, che portano il totale investito a 371 milioni di dollari.
🖐️Tecnologia (data engineering). La scienza delle password (a 4 cifre): analisi, curiosità e pattern sorprendenti
L'analisi e la relativa visualizzazione dei dati relativi a password era qualcosa che, francamente, non avevo mai fatto né visto fare in modo davvero scientifico. Probabilmente perché gli aspetti legati alla sicurezza mi hanno sempre annoiato, soprattutto nella prima fase della mia carriera. Ho iniziato ad apprezzarne il valore solo più avanti, insieme ai temi legati alle infrastrutture informatiche, quando mi sono reso conto di quanto sia importante affrontare questi aspetti in un'ottica preventiva. Infatti, quando si presenta un problema in questi ambiti, le soluzioni a tua disposizione sono spesso già compromesse. Un po' come accade per la salute.
L’approfondimento di oggi arriva dal blog DataGenitics del compianto Nick Berry e quello che ti propongo non è per nulla noioso: si basa su un’analisi su larga scala di oltre tre milioni e quattrocentomila password, provenienti da database pubblici, o meglio, da database di password hackerati. Tieni presente che non si tratta di password “hackerate” nel senso comune del termine; altrimenti, l’analisi ne risulterebbe distorta da un bias di sopravvivenza (al contrario), e il campione non sarebbe rappresentativo di come le persone distribuiscono le password numeriche a quattro cifre.
Quella che ti ho riportato sopra è solo la punta dell'iceberg che emerge da questa analisi super nerd. Che 1234 fosse la password più prevedibile lo sapevamo già, ma il fatto che le prime 10 password tra le 10.000 possibili rappresentino quasi il 25% del totale è decisamente meno scontato. Inoltre, scoprire che la password 2580 si trovi al 22° posto, come frequenza, mi ha sorpreso, finché non ho letto la spiegazione nel post (pensaci, ha a che fare con qualcosa di "spaziale"...). Tutte le considerazioni che emergono e che Nick Berry inserisce nella conclusione sono decisamente utili (e divertenti come tutto l’articolo), sia che tu sia uno sviluppatore, sia che tu sia un semplice custode dei tuoi dati: “Se siete sviluppatori o tester spero che siate sufficientemente paranoici da controllare immediatamente che i vostri sistemi non memorizzino informazioni sensibili, come le password, in chiaro. Il motivo per cui ho potuto eseguire questa analisi è che gli sviluppatori stupidi e pigri hanno memorizzato le informazioni in chiaro. La vostra pigrizia può avere un impatto su milioni di persone. Se siete utilizzatori e riconoscete uno dei numeri che ho usato in questo articolo come vostre password/pin, spero che applichiate il buon senso e li cambiate immediatamente con qualcosa di meno prevedibile. In alternativa, potreste essere pigri e non cambiare le cose (in questo caso, almeno l'unica persona che state danneggiando con questa apatia siete voi stessi).
Dimenticavo: nell’articolo si analizzano anche pattern di password più complessi, fino a 10 cifre, ma credo che, considerando che ancora molte cose vengono protette con password a 4 cifre, sia particolarmente utile concentrarsi su questa area specifica dell’analisi. E se sei riuscito, senza sbirciare l’articolo, a capire perché 2580 sia al 22° posto, ti sfido – sempre senza sbirciare la motivazione nell’articolo – a intuire perché 1004 sia molto in alto nella classifica delle password preferite 😊.
👀 Data Science. Impara (o ripassa) Python con il libro di Wes McKinney, il creatore di Pandas
Era stato il link più cliccato nel 21° episodio della newsletter, e devo dire che merita assolutamente ancora la segnalazione. Sto parlando della terza edizione del mitico “Python for Data Analysis,” la cui prima edizione è uscita nel 2012. A mio parere, è ancora il miglior libro da cui iniziare a imparare (o ripassare) Python, soprattutto se sei un data analyst. L'autore è Wes McKinney, una delle figure più importanti dell’ecosistema Python, grazie alla sua contribuzione a diversi progetti open source, tra cui la libreria Pandas, di cui è stato il creatore e per cui ricopre il ruolo di BDFL (Benevolent Dictator For Life).
Nel tipico spirito di Wes, che ha spesso gestito i suoi progetti con una visione aperta, ha reso disponibile una versione gratuita del libro in HTML e su GitHub puoi trovare anche il codice presentato nel libro.
Rispetto all'agosto 2022, quando ti avevo segnalato la nuova edizione, è stato rilasciato un aggiornamento alla versione 2.0.0 di Pandas. Ho adottato questo testo anche come libro base per il mio corso in Cattolica, “Laboratorio per le decisioni aziendali,” e finora è stato decisamente apprezzato anche dagli studenti!
👅Etica & regolamentazione & impatto sulla società. Rischi e opportunità dell'IA: tra sicurezza e disuguaglianze socio-economiche
Il dibattito sulla sicurezza e sui rischi che l’intelligenza artificiale pone al futuro dell’umanità va di pari passo (in modo quasi paradossale) con la discussione sulla sua eco-sostenibilità, intesa sia in termini economici sia ecologici. Gli approfondimenti che ti propongo oggi riguardano il primo tema.
La prima lettura che ti suggerisco è l’”International Scientific Report on the Safety of Advanced AI”, presieduto da Yoshua Bengio. Bengio è uno dei pionieri dell'intelligenza artificiale e del machine learning, noto soprattutto per i suoi contributi fondamentali allo sviluppo delle reti neurali e del deep learning. Professore all'Università di Montréal e fondatore del Mila (Quebec Artificial Intelligence Institute), Bengio è anche impegnato in questioni etiche legate all'IA, promuovendo un uso responsabile e umanistico della tecnologia.
Il documento è estremamente completo (132 pagine! 🙂) e offre un panorama davvero equilibrato dei rischi. Lo spirito del report è ben descritto nelle parole dello stesso Bengio nella presentazione: “Sappiamo che l'IA avanzata si sta sviluppando molto rapidamente e che c'è una notevole incertezza su come questi sistemi avanzati di IA potrebbero influenzare il nostro modo di vivere e lavorare in futuro. L'IA ha un enorme potenziale per migliorare le nostre vite, ma presenta anche rischi significativi. Per questo motivo, è essenziale un'analisi approfondita della letteratura scientifica e delle opinioni degli esperti. Più ne sappiamo, meglio siamo attrezzati per plasmare il nostro destino collettivo.”
Mi permetto di ampliare il “più ne sappiamo” con un più inclusivo “più siamo a saperne e ad essere consapevoli dei rischi”: così potremo costruire un futuro favorevole anche per l’IA. Sai bene quanto sia un grande sostenitore della formazione e dell’uso di queste tecnologie su larga scala (umana) perché, a mio parere, il rischio più grande che affrontiamo è l’ulteriore aumento delle disuguaglianze socio-economiche, sia tra le nazioni che all’interno di esse, causato proprio dall’uso diseguale dell’IA. Conseguenze che iniziamo già a toccare con mano anche sul piano politico, specialmente nel mondo occidentale.
La parte del report che preferisco è il capitolo 4.3, che esplora proprio i rischi legati all’aumento delle disuguaglianze: “4.3 systemic risks: General-purpose AI could increase income inequality” (pag. 54 del report).
Se il tema del rischio di disuguaglianza dovuto all’IA ti interessa e vuoi approfondirne anche gli aspetti tecnici, ti consiglio due letture, entrambe tratte da documenti pubblicati quest’anno dal Fondo Monetario Internazionale.
La prima è “Gen-AI: Artificial Intelligence and the Future of Work”. Questo documento è molto ricco di dati e simulazioni. Non aspettarti previsioni specifiche su un tema così complesso, ma piuttosto scenari. La sintesi del documento è decisamente interessante: “L'Intelligenza Artificiale (IA) ha il potenziale per rimodellare l'economia globale, soprattutto nel campo dei mercati del lavoro. Le economie avanzate sperimenteranno i benefici e i rischi dell'IA prima delle economie emergenti, soprattutto a causa della loro struttura occupazionale incentrata su ruoli ad alta intensità cognitiva. Esistono alcuni schemi coerenti per quanto riguarda l'esposizione all'IA: le donne e le persone con un'istruzione universitaria sono più esposte ma anche più pronte a raccogliere i benefici dell'IA, mentre i lavoratori più anziani potrebbero avere maggiori difficoltà ad adattarsi. La disuguaglianza del reddito da lavoro può aumentare se l'IA rafforza i guadagni dei lavoratori ad alto reddito, mentre i rendimenti del capitale potrebbero accrescere le disuguaglianze di ricchezza. Tuttavia, se gli aumenti di produttività saranno sufficientemente consistenti, i livelli di reddito potrebbero migliorare per la maggior parte dei lavoratori. In questo panorama in evoluzione, le economie avanzate e i mercati emergenti più sviluppati devono concentrarsi sul miglioramento dei quadri normativi e sul sostegno alla riallocazione del lavoro, mentre i mercati emergenti e le economie in via di sviluppo dovrebbero dare priorità allo sviluppo delle infrastrutture e delle competenze digitali.”
L’ultimo consiglio di lettura è dedicato proprio alle politiche fiscali, sempre da un lavoro del Fondo Monetario Internazionale. Ti consiglio il post “Fiscal Policy Can Help Broaden the Gains of AI to Humanity”, che sintetizza il report “Broadening the Gains from Generative AI: The Role of Fiscal Policies”, contenente anche i dettagli tecnici delle simulazioni effettuate.
📅 Nel Mio Calendario (passato, presente e futuro)
Sabato 14 Dicembre 2024 sarò a Roma per una giornata di lezione del corso di Data Driven and Business Transformation all’interno del MBA organizzato dalla John Cabot University con il Politecnico di Milano
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!
😳 Stefano non so come fa a darci tutte le settimane questi contenuti, ma la prego continui cosi! Poi spero un giorno di sentirla parlare dal vivo