For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il quarantacinquesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del quarantacinquesimo numero:
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Staff “Data” Engineer
Mi sono permesso di aggiungere la parola data nel titolo perché penso che quanto scritto nel post e nel libro, che vi consiglio questa settimana, valga sempre di più anche per il mondo dei dati. Il tema affrontato è quello delle evoluzioni professionali, all’interno delle organizzazioni, dei tecnici, in particolare dei software engineer, che spesso evolvono in maniera troppo scontata verso posizioni manageriali. Il post del mitico blog “The Pragmatic Engineer” infatti presenta tre estratti del libro “The Staff’s Engineer Path” di Tanya Reilly che descrive un percorso alternativo a quello manageriale che porta ad una leadership tecnica spesso troppo assente nelle moderne organizzazioni. E l’assenza di questa figura si fa sentire soprattutto nel tempo perché, come scrisse Titus Winters in Software Engineering at Google “Software engineering is programming integrated over time.” Per chi è diversamente giovane, come il sottoscritto, il paragone che Tanya fa di alcune componenti software, presenti in azienda, alla nave di Teseo, a cui vengono mano a mano sostituite tutte le componenti mantenendone la stessa architettura, pare particolarmente azzeccato. Per questo è importante avere figure senior a livello tecnico a cui è disegnato un cammino specifico, differente rispetto a quello manageriale ma che converge, nel corso del tempo, a livelli gerarchici aziendali analoghi. Nei tre estratti del libro, presenti nel post, ci sono tanti spunti interessanti come la descrizione dell'evoluzione della carriera dello Staff Engineer, l’importanza della figura come modello per i giovani software engineer e soprattutto della sua capacità di guardare al futuro tecnologico dell’azienda con l’esperienza del passato.
Essendo presente nella piattaforma della O’reilly, a cui sono abbonato, ho letto anche altri passaggi del libro, e l’ho trovato davvero illuminante perché disegna, anche graficamente molto bene, l’evoluzione professionale da Staff-Engineer fino a Principal Engineer e ne descrive minuziosamente, con esempi e citazioni, caratteristiche e criticità. Penso che il post e il libro possano essere d’ispirazione soprattutto a molte persone che lavorano nelle risorse umane per capire un’evoluzione di carriera sempre più necessaria.
👀 Data Science. A Great Way to Start, to Learn & to Experiment with Many Machine-learning Models: Pycaret
PyCaret è una libreria open-source e low-code in Python che automatizza la costruzione e la comparazione di diversi modelli di machine learning partendo dal dataset che descrive il problema che hai di fronte. In concreto con tre righe di codice hai una prima comparazione di almeno una quindicina di modelli diversi. Le tre linee di codice sono:
il caricamento del dataset (con Pandas)
la descrizione delle variabili da utilizzare (comando setup(con i parametri scelti))
la comparazione dei modelli (compare_models())
Pycaret ti consente anche di creare il singolo modello su cui scegli di lavorare e sempre in maniera molto veloce, ottimizzarlo.
L’ho provato e ti consiglio di farlo anche tu perché è veramente molto rapido e semplice. Ti lascio 4 brevi consigli e considerazioni:
Se lo provi usando Colab usa la versione appena rilasciata 3.0 seguendo il link indicato in homepage del progetto.
E’ veramente un ottimo modo per imparare, confrontando le metriche, tutti i vari modelli applicabili ad uno specifico problema.
Ha una ottima documentazione che ti consente anche di usarlo per migliorare i/il modello/i su cui vuoi lavorare ottimizzando tutti i parametri a disposizione
Nel vero spirito low-code (almeno quello che preferisco) rende più veloce le tue attività ma non ti esime affatto dal conoscere come funzionano i modelli e cosa devi fare per ottimizzarli. Ti regala proprio tempo da dedicare a queste ultime attività.
Per finire, se poi vuoi una recensione ancora più dettagliata e tecnica, ti segnalo questo ottimo articolo di Bence Komarniczky.
👃Investimenti in ambito dati e algoritmi. Remote Patient Monitoring
C’è un ambito specifico della medicina in cui la maggiore disponibilità di dati e algoritmi insieme a problemi strutturali della società moderna mi porta ad essere molto ottimista sulla crescita degli investimenti. Il settore è quello del monitoraggio a distanza dei pazienti. Uno degli obiettivi principali dei dispositivi RPM è quello di aiutare i medici a seguire i loro pazienti tra un appuntamento e l'altro e di monitorarli nella loro vita quotidiana al di fuori della clinica. Per farti un esempio concreto, qualche puntata fa ti avevo già segnalato un round di Empatica, l’azienda italo-americana, che ha costruito un braccialetto per il monitoraggio e la sicurezza dei pazienti epilettici. Questa settimana vi segnalo un articolo di crunchbase che fa un punto molto preciso sugli investimenti in questo ambito con dati molto eloquenti su come stia crescendo, soprattutto negli Stati Uniti. Uno degli esempi più interessanti riportati nell’articolo è quello di General Prognostics. La startup fornisce un sensore indossabile per le persone a rischio di insufficienza cardiaca. Il sensore, insieme all'app, raccoglie dati in tempo reale su biomarcatori ematici chiave come l'NT-proBNP, responsabile delle funzioni cardiache, e avvisa il medico di eventuali anomalie. Anche in Europa credo che la carenza sempre più strutturale di medici insieme all’aumento della vita media della popolazione non possa che portare grossi investimenti sia da parte del settore pubblico che di quello privato in questo ambito. Il tema più critico, visto che la tecnologia oggi è matura, rimane quello della capacità di far utilizzare al meglio questi strumenti sia ai pazienti che al personale sanitario. In questo senso la cultura digitale di ciascuna popolazione determinerà la velocità di adozione su larga scala e anche la crescita del settore nelle diverse geografie.
🖐️Tecnologia (data engineering) 2022 Databases Retrospective
Andy Pavlo è professore di database alla Carnegie University di Pittsburgh e cofondatore di Ottertune, un software che usa anche intelligenza artificiale per ottimizzare MySql & PostgreSQL, on-premises e nel cloud di AWS. Per il secondo anno consecutivo Andy ci propone una sintesi del 2022 per il mondo dei databases fatta molto bene perché copre tutti gli aspetti: dagli investimenti alle evoluzioni tecnologiche più importanti. Se lavori in questo ambito, soprattutto se devi definire le linee architetturali dei sistemi di gestione dei dati, ti consiglio di leggere in dettaglio tutti i punti.
In estrema sintesi la tendenza a lungo termine che vede Pavlov è la proliferazione di framework come Velox, Polars e Substrait, cioè componenti di caricamento dati e ottimizzazione delle query, che renderanno i DBMS OLAP tutti molto vicino dal punto di vista delle performance nei prossimi cinque anni. E poiché nel cloud il livello di storage è molto simile, “il fattore critico di differenziazione tra le offerte di DBMS sarà costituito da aspetti difficili da quantificare, come l'interfaccia utente e l'ottimizzazione delle query stesse”. Infine, nella sintesi del 2022 dei databases, Pavlo oltre a bocciare definitivamente l’utilizzo di databases basati sulla blockchain ci segnala un episodio che ha coinvolto Larry Ellison, il fondatore di Oracle, che mischia tecnologia e politica e che ti consiglio di leggere per non pensare che Musk, per certi versi, sia unico 🙂.
👅Etica & regolamentazione & impatto sulla società. New Generative AI Problems (& New Opportunities) in Education
Il link che ti propongo oggi mi è stato segnalato da un membro molto attivo della nostra community e riporta la notizia che, a seguito delle ultime evoluzioni dell’intelligenza artificiale generativa come ChatGPT, alcune università australiane “hanno rivisto il modo in cui svolgeranno le valutazioni nel 2023, inclusi gli esami supervisionati facendo un maggiore uso di esami e test con carta e penna … e la riprogettazione della valutazione è fondamentale ed è in corso per cercare di anticipare gli sviluppi dell'IA".
L’argomento mi sta molto a cuore sia per l’importanza che le nuove tecnologie hanno nell’evoluzione di tutto il settore educativo sia perché, nella prima parte del 2023, terrò un corso all’Università Cattolica di Milano e quindi dovrò anche io pensare a questo nuovo tipo di interazione … possibile. Del resto il settore educativo, soprattutto l’Università, deve rivedere le modalità di valutazione in maniera più moderna, integrando meglio l’uso della tecnologia e non eliminandola. Ecco due considerazioni che mi sento di condividerti prendendo spunto da alcuni interventi citati nell’articolo:
“L'Australian National University ha modificato i progetti di valutazione per affidarsi alle attività di laboratorio e al lavoro sul campo, modificando la durata degli esami e introducendo un maggior numero di presentazioni orali.” Credo in queste misure ci siano molti aspetti che portano verso la modernizzazione della valutazione in grado di avvicinarsi agli standard aziendali. Infatti le presentazioni orali e in generale le attività sul campo e di laboratorio, oltre ad essere meno soggette a frodi, portano a favorire e migliorare quella capacità di lavorare in gruppi, valorizzando le attività in presenza, esperienza molto utile quando si entra nel mondo del lavoro. Anche agire sulla durata degli esami scritti, rendendoli molto brevi, meno nozionistici e più adatti al ragionamento veloce è un buon sistema anti-frode, dal momento che qualunque interazione con un sistema terzo diventa una penalizzazione importante.
“Invece di vietare agli studenti l'uso di questi programmi, ci proponiamo di aiutare il personale accademico e gli studenti a utilizzare gli strumenti digitali per supportare l'apprendimento” dichiara un docente della Flinders University. E’ un tema non facile ma sono convinto che se i docenti usano e comprendono le logiche dei nuovi sistemi di intelligenza artificiale sono anche in grado di lavorare su due leve della valutazione: la prima è di consentire l’uso di questi strumenti, valutandone la capacità degli stessi studenti dell’uso di questi strumenti. Del resto non chiederemo, non appena si saranno laureati, agli stessi ragazzi di essere efficienti e saper usare queste nuove tecnologie per i progetti in azienda? Perché allora dovremmo valutarli ora solo su esami con carte e penna? La seconda leva è che i docenti dovranno inserire elementi di novità e creatività nei temi di valutazione abbandonando sempre di più il nozionismo e la ripetitiva meccanicità di alcune prove che si usano oggi. Modalità molto comoda per gli insegnanti ma poco utile per il futuro dei discenti.
Potrei scrivere tanto altro ma preferisco fermarmi e sentire se hai considerazioni, soprattutto in confutazione o integrazione rispetto a quanto ho scritto. Sperando di sì, ti chiedo di mandarmele via mail (st.gatti@gmail.com) o di scriverle come commento alla fine della newsletter. Il mio auspicio, analogamente a quanto è avvenuto negli ultimi 3 anni in pandemia per il modo di lavorare, è che il clamore e il timore, un po’ ingiustificato, dell’influenza di ChatGpt sulle valutazioni di apprendimento possano portare a ripensare in maniera più moderna e pragmatica come i nostri giovani sono valutati dal sistema educativo. Non dimenticando che lo scopo della scuola è insegnare ad apprendere e non valutare. Troppo spesso abbiamo scambiato il mezzo per il fine.
Se la Generative AI riuscirà a innescare questo processo di cambiamento dovremo ringraziarla non soltanto per il tempo che ci sta facendo risparmiare per creare nuove immagini o sintetizzare diverse fonti informative!
E per finire:
🙏🙏🙏 Ringraziamenti a:
Ondata, un’associazione che promuove l’apertura dei dati pubblici per renderli accessibili a tutte e tutti, che nella sua prima newsletter su substack ci ha citati.
Hacking Creativity, un eccellente podcast sulla creatività e non solo, che, nell’ultima puntata, ha citato tutte le newsletter che fanno parte del network Newsletterati, a cui apparteniamo.
🚥🚥🚥 Risultato della survey della scorsa settimana:
Con l’87% di pareri favorevoli avete approvato l’idea di inserire, una o due volte al mese, in una delle cinque parti della newsletter, una sezione “Qualcuno di noi” con un’intervista breve (3/4 domande) ad un data-lover cioè un professionista, che lavora, con passione, nel mondo dei dati e degli algoritmi. A febbraio la introdurremo …
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!