Ciao,
io sono Stefano Gatti e questa è la newsletter LaCulturaDelDato: dati & algoritmi attraverso i nostri 5 sensi. Le regole che ci siamo dati per questo viaggio le puoi trovare qui.
Ecco i cinque spunti del secondo numero.
🖐️Tecnologia (data engineering). Modin è una libreria open-source Python che consente di rendere molto più veloci (l'ho provata anche io sul mio laptop!) le principali operazioni fatte con Pandas senza cambiare una riga di codice (beh una riga in effetti va aggiunta ma solo una!). L’azienda che sta supportando lo sviluppo è stata fondata da 2 PhD di Berkeley e ha ricevuto anche un sostanzioso recente investimento. Gettate un occhio anche a Lux, una libreria di data exploration, sempre dello stesso team che vi potrebbe stupire …
👀 Data Science. Continuare ad imparare è una necessità ed un privilegio dei tempi moderni. Anche un Kaggle Competitions GrandMaster come Alberto Danese, amico e collega, si è cimentato in un percorso di apprendimento e certificazione di AWS Machine Learning Specialist. E ha spiegato (molto bene) perché lo ha fatto e come lo ha fatto.
👂🏾Organizzazione e cultura dei dati e algoritmi nelle organizzazioni. Due data scientist per ogni data engineer in ogni data-team: questa è la sorprendente media che sembra emergere da questa analisi data driven. Ma la varianza è molto alta e la maturità dell’ambito industriale è correlata positivamente a questo rapporto. Questo sembra invertire la proporzione che Jesse Anderson in un famoso articolo pubblicato dalla O’Reilly aveva evidenziato 4 anni fa. La figura del machine learning engineer ha dunque “sparigliato le carte”? Data Engineer non temete: in Italia ci sarà tanto bisogno di voi per ancora tanto tempo! :-)
👃Investimenti in ambito dati e algoritmi. Lui è Abraham Thomas: ha creato Quandl, diventata leader mondiale degli “alternative data” e poi venduta profumatamente al Nasdaq, l’azienda che gestisce l’omonimo mercato borsistico. Ma ha fatto anche il manager in Hedge Fund e oggi fa prevalentemente l’investitore. In questo meraviglioso articolo fornisce la definizione e le 6 regole di quello che è (e come si costruisce) il solitamente mal descritto “Business dei Dati”. Lo fa in maniera chiara, completa e soprattutto con tanti esempi. Ci vogliono 15 minuti per leggerlo ma che siate startupper, investitori, manager o data lovers non potete perderlo!
👅Etica & regolamentazione & impatto sulla società. Quando si parla di regole e normative sui dati quasi tutti pensano al GDPR e pochi alla proprietà intellettuale. Prima di usare un dataset, soprattutto per scopi commerciali ma non solo, dobbiamo sapere se possiamo farlo anche se non sono dati personali. Per darvi un’idea di come il tema sia complesso vi sfido a leggere gli scenari di derivazione e integrazione di dataset o database spiegato in maniera semplice e concreta da un esperto, Simone Aliprandi, con cui ho avuto il piacere di lavorare sulla divulgazione di queste tematiche all’interno di community di data-lovers.
Una lettrice ha paragonato il primo numero “ad un ottimo aperitivo che può restare tale o "degenerare" in un bel banchetto” . 🙏Questo giudizio mi lusinga anche perché il rispetto del vostro tempo è proprio uno degli obiettivi di questo progetto!
Se hai suggerimenti e riflessioni sui temi di questo numero o se hai suggerimenti per migliorare questa newsletter scrivimi (st.gatti@gmail.com) o commenta su substack.
Se ti è piaciuta e non sei ancora iscritto lascia la tua mail qui sotto e aiutami a diffonderla!
Alla prossima!
ok allora ci sentiamo presto
Complimenti Stefano per l'interessante iniziativa che mi ha segnalato un nostro amico comune Camillo Vallauri,!!!!
Io sono un Data Governance domain expert e mi farebbe piacere dare un mio contributo sul senso dell'udito...."Organizzazione e cultura dei dati e algoritmi nelle organizzazioni"ritengo il tema fondamentale e quindi mi appassiona già da qualche anno. Alla prossima Mario