Formare un Team di Data Science di Successo: Skill preferenziali e Ruoli

Parliamo ora delle skill che devono caratterizzare un Data Scientist. Purtroppo, negli anni, il termine data scientist ha raggiunto un significato troppo esteso al punto da potersi considerare oggi troppo generico. Dopo la comparsa del Data Science all’interno del contesto di un business, non è stato sviluppato un set di skill da attribuire ai data scientist. Matthew Mayo, Data Scientist e Deputy Editor di KDNuggets afferma: “Quando sento il termine data scientist, tendo a pensare ad un unicorno, e a tutto ciò che esso comporta, e poi ricordo che non esistono, e che i data scientist reali svolgono molti ruoli diversi nelle organizzazioni, con diversi livelli di business, competenze tecniche, interpersonali, di comunicazione e di dominio”. Di seguito, ecco quali skill dobbiamo considerare quando decidiamo di assumere uno specialista di Machine Learning:

Ci sono molti ruoli all’interno del contesto di Data Science. Riportiamo di seguito le due tipologie proposte da Michael Hochster in Stitch Fix: Tipologia A e Tipologia B.

La Tipologia A sta per Analisi. Questo individuo è un esperto di statistica che dà un senso ai dati senza necessariamente avere una solida conoscenza dell’attività di programmazione. I Data Science di tipo A eseguono attività di pulizia, predizione, creazione di modelli e visualizzazione dei dati.

La Tipologia B sta per Costruzione (Building). Coloro che rientrano in questa tipologia utilizzano i dati in campo produttivo. Sono per lo più ingegneri software con competenze di base nel settore della statistica, in grado di costruire sistemi di raccomandazione, casi di utilizzo delle personalizzazioni.

Raramente un esperto rientra in una sola categoria. Ciascuno presenta personali punti di forza che devono essere considerati quando si spartiscono i ruoli all’interno del team. Nella maggior parte dei casi, l’acquisizione di talenti comporterà un ulteriore addestramento a seconda del loro background. È da tenere a mente che le persone ed i loro ruoli sono cose distinte. Per esempio, se la struttura del tuo team è di tipo integrata, una sola persona potrebbe ricoprire più ruoli contemporaneamente. Quindi, tralasciando quanti esperti compongano il nostro team, concentriamoci sulla definizione dei ruoli.

Chief Analytics Officer / Chief Data Officier. Il CAO è definito come “Business Translator”, colma il divario tra Data Science e competenza di dominio agendo sia come visionario che come tecnico.
Skill preferenziali: Data Science e analitica, abilità nell’attività di programmazione, competenza di dominio, capacità di leadership e vision.

Data Analyst. Il ruolo del Data Analyst include attività di raccolta ed interpretazione dei dati. Un analista garantisce che i dati raccolti siano pertinenti ed esaustivi e allo stesso tempo interpreta anche i risultati dell’analisi. Alcune aziende, come IBM o HP, richiedono ai propri Data Analyst di avere capacità di visualizzazione per convertire numeri alienanti in idee tangibili.
Skill preferenziali: R, Python, JavaScript, C/C++, SQL

Business Analyst. In genere, la figura del Business Analyst compie la funzione del CAO ma da un punto di vista operativo. Ciò implica la conversione delle aspettative di business in analisi dei dati. Quando il Data Science non ha competenza di dominio, il Business Analyst interviene per colmare questa lacuna.
Skill preferenziali: visualizzazione dei dati, business intelligence, SQL

Data Scientist. Tale figura compie attività di business attraverso l’utilizzo di tecniche di Machine Learning e Data Mining. Il ruolo può essere limitato alla preparazione e pulizia dei dati, con ulteriori attività di allenamento dei modelli e valutazione.
Skill preferenziali: R, SAS, Python, Matlab, SQL, noSQL, Hive, Pig, Hadoop, Spark Solitamente la figura del Data Scientist è suddivisa in due ruoli: Machine Learning Engineer e Data Journalist.

– Il Machine Learning Engineer combina capacità e conoscenze nel campo dell’ingegneria del software e tutto ciò che riguarda la scelta di utilizzo dei dati e modelli più appropriati. Tra le sue mansioni rientrano anche le attività di allenamento, monitoraggio e implementazione dei modelli.
Skill preferenziali: R, Python, Scala, Julia, Java

– Il Data Journalist aiuta a dare un senso ai dati di output collocandoli nel giusto contesto. Si occupa, inoltre, della risoluzione di problematiche di business complesse, trasforma ed interpreta i risultati. È richiesta esperienza in ambito di codifica e statistica e la capacità di presentare idee e risultati anche a coloro i quali non hanno familiarità con tali discipline.
Skill preferenziali: SQL, Python, R, Scala, Carto, D3, QGIS, Tableau Tel. 0365 520098

Data Architect. Questa figura è fondamentale quando si lavora con una grande quantità di dati, i Big Data. Le sue mansioni riguardano l’archiviazione dei dati, la definizione dell’architettura del database, la centralizzazione dei dati e il saper garantire integrità fra le diverse fonti. Di fronte a sistemi complessi e grandi set di dati, il Data Architect è anche responsabile delle prestazioni.
Skill preferenziali: SQL, noSQL, XML, Hive, Pig, Hadoop, Spark

– Il Data Engineer si occupa di implementare, testare e mantenere tutte le componenti infrastrutturali progettate dal Data Architect. Entrambi i ruoli possono essere rivestiti da una singola persona.
Skill preferenziali: SQL, noSQL, Hive, Pig, Matlab, SAS, Python, Java, Ruby, C++, Perl

Application/Data Visualization Engineer. Questo ruolo, in genere, è richiesto solo nel caso di una struttura di Data Science specializzata. Negli altri casi, intervengono i software engineer provenienti dalle unità IT. È molto probabile che, un ingegnere applicativo, o altri sviluppatori delle unità forntend, supervisionino ciò che riguarda la visualizzazione dei dati da parte dell’utente finale.
Skill preferenziali: programmazione, JavaScript (per la visualizzazione), SQL, noSQL

Altri Articoli:

Inserisci i tuoi dati qui sotto per continuare a leggere il contenuto: