Ciao,
sono Stefano Gatti e questo è il venticinquesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del venticinquesimo numero:
🖐️Tecnologia (data engineering). Using GPT-3 to explain how code works
Tra i possibili usi di GPT-3, un modello linguistico che utilizza il deep learning per produrre testo simile a quello umano, non mi era ancora capitato di vedere quello che ci racconta il super nerd Simon Willinson in questo post. Simon ci spiega infatti come, dando in pasto a GPT-3 porzione di codice e poi interrogandolo con linguaggio naturale si hanno informazioni molto utili alla comprensione del codice stesso. Il post contiene esempi in diversi linguaggi di programmazione. E’ un po’ il contrario del progetto, che ti consiglio di seguire e metterti in lista di attesa per provarlo, che sta realizzando OpenAi Codex con l’obiettivo di generare codice partendo proprio da linguaggio naturale.
👀 Data Science. Pretty Maps in Python
Rimango anche questa settimana sul tema mappe e più in generale data-visualization per suggerirti di provare questo progetto molto figo che si chiama Pretty Map e che realizza, come dice il nome, mappe molto belle sfruttando lo stack Python in accoppiata a OpenStreetMap. Se vuoi provare a realizzare la mappa del tuo luogo preferito puoi farlo, come ho fatto io per il centro di Milano nell’immagine sotto. Ma ti consiglio di leggere l’articolo di Mark Litwintschik che spiega molto bene in dettaglio come realizzarlo con il codice in poche righe di Python e qualche minuto per l’installazione delle librerie necessarie. Nel post Mark evidenzia un aspetto meraviglioso di cui spesso sottovalutiamo il valore socio-economico: Pretty Map è realizzato solo con 425 righe di codice grazie al fatto che si poggia sulle spalle di giganti, cioè importanti e storici progetti open source.
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Global Data Governance Map
Il Digital Trade and Data Governance Hub è un istituto di ricerca no-profit affiliato alla Elliot School of International Affairs della George Washington University (GWU) che si propone di aiutare i politici e pubblico a capire come gli stati di tutto il mondo governano i dati. Uno dei suoi lavori più recenti e interessanti è la Global Data Governance Map e il report relativo che si può scaricare dal sito stesso. Copre 68 nazioni, comprese tutte quelle dell’Unione Europea valutandole su 6 attributi principali: 1.strategie; 2.leggi e regolamenti; 3.cambiamenti strutturali; 4.diritti umani e linee guida etiche; 5.coinvolgimento del pubblico; 6. meccanismi di cooperazione internazionale. L’Italia si pone al ventesimo posto appena dietro gli Stati Uniti ma la parte alta della classifica è popolata da UK, Germania, Australia, Nuova Zelanda e Francia: tutto assolutamente ragionevole! Le 28 pagine del report sono fatte molto bene e forniscono informazioni interessanti come la carenza di strategia in questo ambito del nostro amato paese …
👃Investimenti in ambito dati e algoritmi. European Edtech shows signs of resilience
Brighteye Ventures è uno dei fondi di investimento più importanti in Europa nel settore EdTech. Nel report semestrale sull’andamento degli investimenti in questo settore, che ti invito a sfogliare, evidenzia la stupefacente resilienza dell’Europa che, a fronte di un calo globale 2022 vs 2021 molto accentuato soprattutto negli USA (-50%), mostra numeri, sia in termini di valore degli investimenti che in numero di transazioni in linea con l’anno scorso. E’ un segnale importante per un continente molto anziano che sta comunque capendo l’importanza del continuous lifelong learning. E tra le start-up del settore, in significativa crescita, te ne segnalo una Edyoucated che usa dati e algoritmi in maniera molto intensiva nella sua piattaforma per favorire la formazione in ambito aziendale.
👅Etica & regolamentazione & impatto sulla società. Beneficial ownership transparency
Il tema della reale proprietà di un’azienda, soprattutto se la catena di controllo va oltre i confini di una singola nazione, è un tema molto critico e di grande impatto socio-economico mondiale. Avendo lavorato per molti anni in aziende che lavorano su queste tematiche conosco le difficoltà sia dal punto di vista tecnico (dati e algoritmi) che politico (apertura di questi dati). Vista l’importanza del tema ti consiglio di leggere quello che Open Ownership, una no-profit che lavora sul tema, sta facendo ritenendo che le informazioni sui veri proprietari delle aziende siano una parte essenziale di un'economia e di una società ben funzionanti. I registri pubblici dei titolari effettivi danno accesso a dati di alta qualità su chi possiede, controlla e beneficia delle aziende e dei loro profitti. Queste informazioni, quando disponibili, aiutano a combattere la corruzione, a ridurre il rischio di investimento e a migliorare la governance nazionale e globale. Se il tema ti appassiona il materiale sul sito è notevole ma non è di facile fruizione per questo ti consiglio tre possibili approcci a seconda della tua estrazione e conoscenza:
1) Se vuoi avere un'introduzione non troppo tecnica sull'argomento comincia qui
2) Se invece vuoi avere qualche dettaglio in più sui dati e sulla parte di sviluppo software parti da qui
3) Se invece vuoi cercare direttamente nel database (finora esistente e limitato a UK, Ucraina, Slovacchia, Danimarca e altre fonti dati minori che non coprono in maniera significativa altri paesi) vai qui. Se vuoi fare una prova puoi per esempio cercare e vedere come Euan Anthony Blair controlli l’azienda Multiverso.io, che ti avevo segnalato qualche puntata fa e che opera nel Edtech facendo formazione anche su dati e algoritmi.
Se in questo caldo agosto Ti sei perso qualche puntata ti rimetto il link delle edizioni uscite con il topic principale (il più letto):
ed.24 Data Visualization and the modern imagination [Alle origini della data-visualization …]
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!