For my English speaking friends, click here for the translated version
Ciao,
sono Stefano Gatti e questo è il centotrentesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del centotrentesimo numero:
👅Etica & regolamentazione & impatto sulla società. Claudia Morelli: un viaggio verso la democrazia digitale anche attraverso l'innovazione giuridica
Presentati:
Claudia Morelli. Sono giornalista e divulgatrice di innovazione legale, esperta di Comunicazione in ambito legale. Insegno Comunicazione del giurista alla facoltà di Giurisprudenza dell’Università di Bologna Alma Mater Studiorum.
Laureata in Giurisprudenza, sono iscritta all’albo dei giornalisti professionisti. Ho lavorato per 12 anni alla redazione di ItaliaOggi, come responsabile di un inserto settimanale sui sistemi giuridici, e come giornalista parlamentare.
Ho ricoperto il ruolo di responsabile della Comunicazione istituzionale del Consiglio Nazionale Forense in un periodo cruciale per la comunicazione digitale.
Ho ideato e pubblico da sette anni, in un noto portale giuridico, una rubrica settimanale sulle nuove tecnologie e innovazioni di processo, con un focus sui diritti dei cittadini. Svolgo consulenze in comunicazione e nell’aprile 2024 è uscito il mio primo libro, intitolato "Intelligenza artificiale. Essere avvocati nell’era di ChatGPT".
Il mio ruolo tra 10 anni sarà ... (continua la frase come fossi GPT-10) …
(Non ho ancora allenato nessun NLP con i miei testi :-) … rispondo con il cuore).
vorrei dedicarmi a tempo pieno alla divulgazione dell'innovazione nel campo giuridico, con particolare focus sulla consapevolezza della democrazia digitale, dove c’è ancora tanto da costruire. In ambito education, vorrei ampliare in altre sedi universitarie l’insegnamento della Comunicazione nel campo del diritto, non solo in funzione di marketing, ma di plain language e di legal design. Penso che più i giuristi acquisiscono nuove skills digitali e di comunicazione, più si espande la consapevolezza diffusa della necessità di partecipare alla costruzione di una rinnovata democrazia. Utopico? Forse…
Quale è la sfida più importante che il mondo dei dati e algoritmi ha di fronte a sé oggi?
La trasparenza e l’etica. Non sono una tecnica, non sono una data scientist o una ingegnera. Ma ritengo che se vogliamo che il mondo digitale tenda alla maggiore equità possibile è necessario che il cittadino possa avere contezza dei meccanismi di esercizio del potere pubblico “automatizzato”; che i consumatori abbiano contezza della intermediazione sui loro gusti e sulle loro azioni degli algoritmi social e commerciali; che i giovani siano resi consapevoli che molto passa dall’automazione di processo, ma tantissimo dalla capacità di pensiero, che si sviluppa ancora (antropologicamente parlando) facendo esperienza del mondo con i propri sensi.
Segnalaci il progetto o la risorsa nel mondo dei dati di cui non potresti fare a meno …
So che è una risposta che hai dato anche tu; ma credo che Wikipedia sia stata una grande “invenzione”, la cui logica mi sembra non abbia trovato altri emuli. Devo dire che io ho “imparato” tanto da Linkedin, al netto delle note limitazioni dei social. Poter collegarsi senza formalismi a tanti veri esperti, senza doversi preoccupare di confini territoriali e barriere di vario genere, mi è stato molto utile per avere spunti importanti e per continuare ad imparare.
La “Cultura del dato” è un esempio calzante 😉
PSS (Post Scriptum di Stefano): Quando ho cominciato a leggere il libro di Claudia, ero disconnesso (dal mondo e dalla rete), in aereo, durante uno dei miei frequenti viaggi verso una delle parti del mondo che amo di più, culturalmente e non solo: Copenaghen e i miei “Nordics”. L'ho fatto perché uso questo tempo per concentrarmi su qualcosa che temo possa annoiarmi. E spesso le “cose legal” annoiano noi data lover e amanti dell’innovazione. E sbagliamo. E anche questa volta mi sbagliavo. L'ho letto (e l'ho fatto in luoghi che amo tantissimo) quasi tutto d’un fiato. E ho anche trovato diversi errori. Sì, perché nella prefazione, nell’introduzione e persino nel commiato si parla di come questo libro sia dedicato “ad avvocati e giuristi ‘curiosi’ che vogliono saperne di più; agli studenti di legge e ai praticanti”. No, questo libro non è solo per loro. Dovrebbe essere letto (almeno molte sue parti) da tutti quelli che lavorano nell'ambito dell'AI, soprattutto da chi si occupa di tecnologia e innovazione. Claudia, infatti, nel libro sa mixare in maniera sapiente, senza annoiare, conoscenze giuridiche di base e tematiche tecniche legate alla tecnologia dell’AI con esempi pratici. Due sono le sezioni del libro che mi sono piaciute di più: in primis, la parte dedicata alle decisioni automatizzate o robotiche, un tema centrale nella vita lavorativa e privata di tutti noi. E poi, la parte in cui si traccia un'ottima mappa dell’innovazione nel settore legale con tassonomie (analytics, automation e research, la mia preferita) e informazioni anche per chi fa investimenti nel settore Legal Tech o è semplicemente un utilizzatore di questi sistemi. Come Jen, che scoprirai chi è se arrivi alla fine del libro 😊.
👃Investimenti in ambito dati e algoritmi. Start-up del mese Luglio 2024: Leyla
Come ogni mese, grazie alla mia attività di monitoraggio dell'innovazione e degli investimenti a livello mondiale, ho l'occasione di presentarti una startup che ha catturato particolarmente la mia attenzione, distinguendosi per aver ottenuto finanziamenti significativi a luglio 2024. Questa startup opera nell'ambito dei dati e degli algoritmi, integrando queste tecnologie in modo sostanziale nei suoi prodotti destinati al mercato.
Iniziamo, come sempre, con qualche dato su luglio 2024 a livello globale: il numero e i valori degli investimenti sono leggermente inferiori rispetto a giugno 2024, ma comunque in linea con la media dell’anno e decisamente superiori ai livelli di luglio 2023. Ho inserito nel mio database 450 investimenti a livello globale, di cui circa 74 associabili al settore Data & AI, con una crescita in termini di volumi anche rispetto al mese scorso. Gli investimenti categorizzabili come Data & AI e Healthcare rappresentano circa il 50% degli investimenti totali, con valori oscillanti, a seconda dei mesi, tra il 22% e il 27% dei volumi complessivi, almeno nell’ultimo anno per ciascuno dei due ambiti. Se vuoi un approfondimento dettagliato di questo fenomeno e degli andamenti su scala globale, ti suggerisco questo post di Crunchbase.
E, in linea con l'intervista con Claudia Morelli, la startup del mese è Leyla. Leyla è una startup svedese che sviluppa un ambiente di lavoro supportato dall'intelligenza artificiale per studi legali e professionisti del settore legale. La piattaforma consente agli avvocati di automatizzare compiti ripetitivi, accedere a fonti pubbliche e gestire i propri dati in un'unica interfaccia. Tra le sue funzionalità principali ci sono l'estrazione di dati da documenti, la generazione di bozze e la ricerca di informazioni legali, facilitando così il lavoro quotidiano degli avvocati e migliorandone la produttività.
Proprio a luglio, Leyla ha ottenuto un finanziamento di 25 milioni di dollari in un round di Serie A, dopo aver raccolto 10,5 milioni di dollari solo due mesi prima. Questo capitale sarà utilizzato per accelerare lo sviluppo del prodotto e l'espansione in nuovi mercati, come il Regno Unito.
Inoltre, Leyla è uscita dal primo batch di Y Combinator del 2024 che ti avevo segnalato e commentato nel numero 113 di questa newsletter. In generale, il numero di startup che utilizzano dati e intelligenza artificiale per innovare nel settore legale è in forte aumento.
🖐️Tecnologia (data engineering). Agenti AI per Codice Legacy: Sogno o Realtà?
“Come potremmo iniziare a usare l'AI per migrare anni di codice legacy disordinato e fragile a uno stack moderno? ... Forse un Agente di Migrazione del Codice AI???". Se questa domanda ti suona familiare e l’hai sentita nell’organizzazione per cui lavori, prosegui nella lettura dell’approfondimento che ti suggerisco. È molto tecnico (il solito Data Machina che ogni tanto ti propongo), oppure puoi seguire ancora un po’ a leggere la mia traduzione e una mia breve sintesi. Il pezzo continua con un’atmosfera da tecno-western: “Stiamo facendo chiacchiere sull’AI con caffè espresso a Level 39, One Canada Square. James, un veterano CTO con tutte le cicatrici del mestiere, sta ponendo queste domande piuttosto divertenti e retoriche. C'è un silenzio profondo nella stanza, volti pensierosi tutt'intorno. Tutti fissano attraverso le enormi finestre che dominano lo skyline della City mentre il tramonto illumina la scena. Ci chiediamo perplessi, nel senso più filosofico e teorico del termine, se gli Agenti SW AI siano davvero pronti per compiti del genere in produzione, e se sì, quando…”. No, non c’è il solito consulente in scena che ti dice che sei già in ritardo e che già una buona parte delle aziende nell’altro continente hanno convertito tutto il loro Cobol in un modernissimo Kotlin in pochi giorni con il loro agente AI!
Scherzi a parte, se vuoi avere le idee un po’ più chiare sullo stato dell’arte degli agenti che scrivono codice e risolvono autonomamente bachi software, oltre a leggere l’articolo che ti ho segnalato, che fa una panoramica dei migliori di questi sistemi, puoi visitare questa pagina per vedere un ranking specifico denominato SWE-Bench. SWE-Bench è un metodo per testare la capacità di questi agenti di scrivere codice (bene) facendogli risolvere alcune issue presenti su GitHub. Il dataset raccoglie 2.294 coppie di Issue-Pull Request dai 12 repository Python più popolari. La valutazione viene eseguita verificando i test unitari e utilizzando il comportamento post-risoluzione dell’issue come soluzione di riferimento. Esistono tre versioni di questo benchmark: quella completa (Full), una versione semplificata (Lite) che esclude alcuni problemi non espressi in maniera chiara, e quella con annotatori umani (Verified). Il Benchmark Verified, uscito da poco e realizzato dal team di OpenAI, assicura che le coppie di issue e pull request siano di alta qualità e rappresentino casi di studio validi per la valutazione delle capacità di risoluzione automatica. Ad oggi, in tutte le tre classifiche, nessun agente ha superato il 50% di capacità risolutiva. Nella versione Full, che rappresenta a mio parere meglio il mondo reale dello sviluppo, nessun agente ha superato il 20% di risoluzione. In due delle tre classifiche, il miglior agente è Amazon Q Developer.
“Adelante Pedro, con juicio, si puedes” ... ottimismo dei consulenti permettendo 🙂
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Leadership e competenze tecniche: un binomio troppo spesso sottovalutato
È stato di gran lunga il link più cliccato dai lettori del numero 9 di questa newsletter, e anche su LinkedIn, più di due anni fa, aveva generato apprezzamento e discussione.
aveva scritto questo pezzo discutendo l'importanza delle competenze tecniche anche quando si parla di leadership, un concetto spesso trascurato, soprattutto nel nostro paese, come fa notare Alberto, nel post, in modo molto data-driven. È curioso, rileggendolo, notare le due citazioni sulla tecnologia dei Transformers e su Julio Velasco, fatte ben prima che ChatGPT uscisse e che l'Italia della pallavolo femminile vincesse l'oro olimpico, riscoprendo così al nostro paese le doti non solo di allenatore pallavolistico dell’argentino. Come scrivevo commentando l’articolo nel numero 9 di questa newsletter: “Negli ultimi 10 anni, nelle discussioni sulle organizzazioni, abbiamo assistito a un passaggio di terminologia da Manager a Leader, che in molti casi è stato più un cambio di parola che di sostanza.” Non voglio dilungarmi, ma se leggi o rileggi l'articolo e fai qualcosa nella tua organizzazione per valorizzare di più la leadership basata sulle competenze, credo che questo possa aiutare soprattutto i giovani a vivere meglio in azienda e a percepire il nostro paese come meno ostile. E personalmente, ci tengo molto… 🙏👀 Data Science. Intransitività nei modelli AI: impariamo da sasso, carta e forbice 🙂
Dal momento che amiamo la certezza e siamo evoluti anche grazie a questa pulsione spesso abusiamo della proprietà transitiva per evitare di affrontare l’incertezza. Facendo un esempio concreto preso dal mondo dello sport: se la squadra A ha battuto la squadra B e la squadra B ha battuto la squadra C, allora tendiamo a inferire con sicurezza che la squadra A batterà la squadra C. Questo però non è sempre vero, soprattutto quando i livelli delle squadre sono simili e il contesto temporale e fisico dell’incontro sono differenti.
Questo concetto di “intransitività” si applica sempre di più anche al mondo dei modelli di AI generativa. L’approfondimento che ti consiglio oggi di Matt Wood lo spiega molto bene usando la metafora di uno dei giochi più antichi del mondo: “Sasso, Carta e Forbice”.
Matt scrive infatti: “Assumere la transitività nel confronto tra modelli, ovvero che esista un modello ‘migliore’ in assoluto indipendentemente dal contesto, porta spesso a prestazioni subottimali di un sistema di IA e a costi complessivi più elevati. Ma se assumiamo l’intransitività del modello, il valore si sposta dalla ricerca del ‘migliore’ all'utilizzo dei ‘molti’ per il compito giusto al momento giusto.”
Nei primi mesi post rilascio di ChatGPT-4, vista la relativa scarsa presenza di reali competitor, questo aspetto non era così evidente, ma oggi è una realtà. Personalmente, a seconda dei contesti, sto usando ChatGPT-4o, Claude-3, Gemini e Perplexity.ai.
Ti segnalo, per correttezza, che Matt Wood è un esponente chiave negli sviluppi dell'intelligenza artificiale di Amazon AWS, e questa situazione di co-leadership tra modelli è proprio ciò su cui AWS sta strategicamente puntando, come evidenziato nell’articolo, con il framework Bedrock, che facilita proprio l’uso e l’orchestrazione di più modelli. Conosco personalmente Matt Wood e lo stimo come professionista; su questo ambito la penso come lui, ma è giusto che tu sia consapevole di questo potenziale conflitto di interessi.
📅 Nel Mio Calendario
24 Settembre 2024 sarò presente a Milano come moderatore di una tavola rotonda al CTO Connect di Codemotion dove ci confronteremo (insieme ad altri tech lovers) sulle grandi sfide tech delle aziende contemporanee. E naturalmente, spoiler alert, si parlerà di AI ma non solo … anche di dati 🙂
2 Ottobre 2024: appuntamento con la mia lezione per BoomAI by IAG, il corso di formazione online dedicato a chi vuole prepararsi a investire in Intelligenza Artificiale! Durante la mia lecture, esplorerò le strategie adottate dalle aziende nel nuovo mercato della GenAI, analizzerò le sfide che queste devono affrontare e le tendenze future che influenzeranno ulteriormente i contesti aziendali. 🚀
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!