Ciao,
io sono Stefano Gatti e questo è il tredicesimo numero della newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del tredicesimo numero:
👀 Data Science. Datascience: the science of knowing the contest
Questa settimana, nella mia casa digitale, ho pubblicato alcune considerazioni sull’importanza di conoscere il contesto dell’azienda e del settore in cui si lavora, quando si fa data science. In molte esperienze, di cui sono stato testimone, questo problema è stato la causa di grossi insuccessi. Conoscere il contesto è una questione di tempo e di organizzazione: fidati, è molto importante! Nella parte finale del post ho inserito anche una check-list in cinque punti come guida per un datascientist moderno, pragmatico e consapevole. Se la leggi e hai osservazioni, commenti e integrazioni scrivimele!
👃Investimenti in ambito dati e algoritmi. EdTech for continuous learning
In un contesto dove dovremo continuare a studiare fino alla pensione e forse oltre. In un contesto dove gli insegnanti, intesa come professione primaria, sono sempre meno e non adeguatamente retribuiti e apprezzati. Ecco in questo contesto sono personalmente molto positivo sul settore EdTech che usa tecnologia, dati e intelligenza artificiale a supporto dell’apprendimento per scalare e migliorare gli impatti su un pubblico più ampio rispetto a quello dell’insegnamento tradizionale. L’Edtech diventa fondamentale anche per abbassare il costo della formazione e abbattere il “ learning divide” sempre più evidente, tra classi sociali, anche all’interno dello stesso paese. Se avete resistito a questa premessa non potete non leggere questo articolo molto completo di Eleonora Pantò che fornisce anche spunti e link molto dettagliati sul tema degli investimenti pubblici e privati in questo settore con dati precisi che lasciano ben sperare.
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. AI US-Business survey
L’AI Business survey 2022 di PWC è un punto di vista interessante sulla maturità dell’evoluzione dell’utilizzo dell’intelligenza artificiale nelle organizzazioni. Occorre tener conto però che è un punto di vista limitato (1000 aziende), solo americano e con prevalenza di grandi organizzazioni (23% con ricavi superiori ai 5 miliardi di dollari). Fatte le dovute precisazioni offre probabilmente, almeno per l’Europa, una vista importante sul prossimo futuro. La cosa che mi sorprende di più è la differenza tra le risposte di quelli che sono considerati leader (circa un terzo) da quelli che non lo sono. Questo aumenta ancora di più la convinzione che l’uso di dati e algoritmi sia un fattore differenziante molto importante ma crei anche molta disomogeneità nel tessuto industriale. Non mi sorprende affatto invece il punto critico delle risorse umane per scalare ulteriormente nei progetti: tema che sta diventando caldo anche nella vecchia Europa!
🖐️Tecnologia (data engineering). Data quality for images
In un mondo in cui le immagini sono sempre più importanti, le dimensioni dei nostri sistemi di storage, dai file system ai database per arrivare ai dataset di training di computer vision, crescono esponenzialmente. Per questo ben venga la libreria python FastDup che, lavorando solo su CPU anche su milioni di immagini, fornisce informazioni veramente interessanti. Può trovare immagini duplicate, cluster di somiglianza, interazioni temporali tra le immagini, anomalie di etichettature e anche altro. Io l’ho provata e mi è sembrata veramente efficace! Se la provi sui tuoi progetti raccontami cosa ne pensi.
👅Etica & regolamentazione & impatto sulla società. Open Data Essentials.
In questa piccola, ma molto densa guida anche scaricabile in PDF, Simone Aliprandi scrive tutto quello che devi sapere per usare in maniera consapevole e “legale” gli Open Data. Troppe volte mi è capitato di sentire l’equazione Open Data = “uso i dati come mi pare … tanto sono aperti!”. Come scrive nella prima parte della guida Simone gli Open Data sono trattati da tre branche del diritto che agiscono su tre piani diversi: il diritto della proprietà intellettuale, il diritto della privacy e del trattamento dei dati personali e il diritto amministrativo. Fondamentale è anche la parte della guida dove si approfondiscono le licenze di uso con cui vengono rilasciati i dati aperti. Attraverso chiare infografiche Simone ti aiuta, per esempio, a capire come puoi usarli e condividerli. La cosa non è scontata soprattutto se li integri in altri prodotti o banche dati.
Se hai ulteriori suggerimenti e riflessioni sui temi di questo numero o per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!