Foto di rawpixel su Unsplash

Come assumere uno scienziato di dati

Volevo scrivere un post su come ottenere un lavoro come data scientist. Ma mio dio, ce ne sono già tanti là fuori. Ci sono consigli sulla costruzione del portafoglio. Ci sono elenchi pieni di abilità suggerite. Ci sono risposte modello alle domande più frequenti dell'intervista. Leggere tutto ciò mi ha fatto pensare: che tipo di candidati sta creando questa comunità?

Da dove mi trovo, non ha un bell'aspetto.

Certo, non ho mai lavorato in un grande team di data science. Inoltre, ero un po 'nonno nel campo della scienza dei dati, avendo lavorato per un po' in analisi dei dati e BI. Ma mi sembra che quegli articoli pieni di competenze e consigli di portfolio stiano costruendo candidati medi. Questo non importerebbe così tanto se la scienza dei dati fosse mercificata come la contabilità. Ma non lo è.

Il valore che il primo o il secondo fornitore di analisi può avere su un'azienda è folle. Può (e dovrebbe) essere come accendere le luci. Ci sono così tante aziende al buio e sono tutte alla ricerca di analisti eccezionali, interessanti e fiduciosi. Se non lo sono ancora, lo saranno presto.

Se sei un'azienda che sta cercando di assumere un contratto di grande impatto, ecco il mio consiglio:

Formazione scolastica

L'istruzione non ha importanza. Sono stufo di vedere annunci di lavoro che dicono che è necessario un dottorato di ricerca. Sii onesto con te stesso - se non hai bisogno di queste persone per fare ricerche (e in alcuni casi anche se lo fai), lascia che i dottori siano soli.

Potrebbe apparire bene sulla tua organigramma ma è dannoso per l'umanità. Ci vuole molto lavoro per ottenere un dottorato. Queste persone sono (o almeno erano) guidate dalla passione per la scoperta, per il lavoro ai margini. Se hai intenzione di farli scrivere codice e spostare il grafico di crescita verso l'alto e verso destra, lascia che la scienza li mantenga. Per favore, la scienza ha bisogno di loro.

Naturalmente è la loro scelta cosa fanno delle loro carriere. Ma lo stipendio di uno scienziato di dati di dottorato sembra molto convincente per qualcuno che ha appena trascorso 4 anni con uno stipendio. Chiedi loro se avrebbero accettato il lavoro con metà del denaro. Se dicono di sì, pagali più di quanto richiesto: vale la pena mantenerli e la tua missione è ovviamente importante.

Non dovresti tagliare gli stipendi della scienza dei dati. Sarebbe sciocco. Tuttavia, non ti ingannare, il motivo per cui queste persone lavoreranno per aumentare il tuo CTR è lo stesso motivo per cui l'ultima generazione di dottori di ricerca STEM è andata a lavorare su Wall St.

E i MOOC?

I migliori data scientist che ho visto hanno imparato le loro abilità nei corsi online. Questo è totalmente vero ma ha un avvertimento importante. Queste persone hanno lavorato in un'azienda, hanno sviluppato competenze di dominio, hanno seguito corsi di apprendimento automatico e statistiche e hanno unito queste abilità con le loro conoscenze per avere un impatto straordinario.

Non ho visto molte persone con un background solo MOOC che provengono da una società per fare grandi onde al suo interno. Penso che abbia meno a che fare con la qualità dell'istruzione e più a che fare con la mancanza di esperienza specifica per le imprese (o forse affari in generale).

Quindi cosa dovresti fare?

Bene, lascia che ti chieda questo. Hai mai assunto un assistente delle risorse umane che non ha studiato per una laurea in Risorse umane? Hai mai assunto uno sviluppatore di software che ha studiato musica o un commercialista con un Master in Geografia? Hai mai assunto un capo del servizio clienti che non è andato affatto all'università ma ha secchi di esperienza di vita?

Assumendo solo quelli con laurea in informatica o statistica stiamo costruendo una monocultura. Fare affidamento sulle qualifiche è l'impostazione predefinita quando non si ha idea di cosa farà la persona. Quindi impara. E poi giudica i candidati con la stessa euristica che useresti per qualsiasi altra posizione.

portafogli

Il successo di Kaggle è il fallimento della curiosità. Hai idea di quanti problemi di dati voglio risolvere in un dato momento? Un sacco.

Il mondo degli affari, la scienza, lo sport, i social network, le notizie, la finanza, le risorse naturali, la politica, l'economia e la medicina sono pieni di problemi aperti. Qualsiasi scienziato di dati che non è abbastanza curioso da recuperare, pulire, gestire e analizzare i dati e raccontare una storia su un problema a loro importante non è uno che dovresti assumere.

Se chiedi a un candidato di descrivere un progetto recente e non riesci a farli smettere di parlare per 15 minuti, assumili.

Set di dati puliti e obiettivi predefiniti sono un anatema per lo scienziato. Dovresti chiedere ai candidati come hanno trovato i problemi da risolvere. Se la risposta è Kaggle e ti piace quella risposta, preparati a dare sempre da mangiare al tuo nuovo assunto nuovi problemi su cui lavorare.

Potresti pensare che, poiché sono così ovviamente a sostegno dello sforzo scientifico, ti consiglierei di guardare oltre i grafici, i grafici e le visualizzazioni. No. Il modo in cui i data scientist comunicano la loro soluzione a un problema è una delle cose più importanti (se non la più importante) che faranno nel loro lavoro.

Guarda le classifiche. Fare domande. Se non capisci cosa stai guardando entro la fine del colloquio, non assumere quella persona.

Competenze trasversali

Questo ci porta a competenze trasversali. Alcuni anni fa, le persone hanno visto i dottorandi che entravano nell'industria con sospetto. Pensavano che sarebbero stati difficili da gestire, che potrebbero essere un rischio di volo. Si sono protetti pagando loro un sacco di soldi e lasciandoli per lo più autogestiti.

Questo è il valore predefinito.

Le aziende della Silicon Valley competono per i migliori talenti nel machine learning e nelle immersioni di razza. Ora tutti gli altri stanno facendo la stessa cosa.

Le persone di talento sono sempre le più difficili con cui andare d'accordo, no?

Questo ovviamente non è vero.

Non assumere qualcuno che non ti piace.

Interesse

Perché vuoi lavorare qui? È una domanda che le organizzazioni di assunzione pongono sempre. Ma se stai assumendo per un primo o un secondo scienziato di dati, la risposta che di solito ottieni è tutta la loro opportunità di creare un team o sviluppare una nuova tecnica: l'opportunità greenfield e blue sky di usare la tua azienda sana come un ospite per la loro ambizione. Come un virus

Se il modo in cui un candidato vede la tua azienda è tutto su di loro e nulla sulla tua missione, non assumerli. Se ne andranno quando il campo verde diventerà marrone.