Un métier d’avenir : le scientifique des données
Publié le 8 septembre 2014Le déluge de données dans lequel nous vivons actuellement amène de nouvelles perspectives d’emploi. Il faut pouvoir analyser, rechercher et faire parler toutes ces données qui affluent à un rythme effréné dans nos entreprises. Depuis maintenant quelques années, un nouveau métier suscite de plus en plus d’intérêt et l’on s’arrache même ses candidats : le scientifique des données (data scientist).
Mais en quoi consiste ce métier ?
Le scientifique des données est un hybride (assez rare) entre le programmeur, le statisticien et l’analyste de données. Il résout des problèmes complexes basés sur une expertise scientifique solide. C’est un métier du numérique qui concerne aussi bien la finance que le milieu bancaire, l’assurance, le marketing ou les ressources humaines.
Le scientifique des données est un métier issu de la science des données (data science). Il s’agit d’une nouvelle discipline qui réunit les éléments de différents domaines incluant les mathématiques, les statistiques, l’informatique, la visualisation et la modélisation de données. En fait, la science des données fait de l’extraction de connaissances à partir des données autant internes qu’externes à l’organisation.
Le profil de compétences du scientifique des données
Ce métier étant très nouveau, il n’existe pas de profil universel, mais plutôt des profils adaptés à chaque entreprise. Le scientifique des données est le résultat de l’évolution rapide de plusieurs métiers tels l’analyste et l’explorateur de données.
Ce professionnel doit posséder une connaissance approfondie du métier auprès duquel il intervient. Ainsi, le scientifique des données travaillant dans le milieu bancaire se doit essentiellement de tout connaitre du fonctionnement d’une banque. Il doit posséder une imagination et une curiosité sans borne, ce qui lui permet de poser les bonnes questions.
Il doit être en mesure de travailler avec de grandes quantités de données non structurées, non nettoyées et provenant de différentes sources. Il connait les techniques d’exploration de base de données (data minnig) permettant d’y extraire des connaissances. Il est aussi au fait de l’apprentissage machine (machine learning) qui cherche à prédire les comportements futurs sur la base de données connues. Il possède des compétences en analyse sémantique et en traitement de langage naturel. Cependant, un scientifique des données ne fait pas seulement que collecter et rapporter les données : il doit être en mesure de les regarder sous tous les angles, de déterminer ce qu’elles signifient et ensuite, de recommander des décisions en lien avec ces données.
En résumé, il doit avoir une triple compétence opérationnelle :
- la maîtrise des techniques d’exploration des données et des statistiques ;
- un fort penchant pour les technologies et les outils informatiques de bases de données;
- un savoir-faire métier dans le secteur d’application des données analysées (marketing, finance, ressources humaines, par exemple).
Concrètement, le scientifique des données aura à mettre en œuvre les tâches suivantes : traduire un problème d’affaires en problème mathématique ou statistique; trouver les sources de données pertinentes; proposer des recommandations sur les bases de données ; concevoir des entrepôts de données; évaluer les données, les traiter et les restituer. Enfin, il est essentiel de pouvoir communiquer facilement le résultat de ses trouvailles.
Éducation et opportunités de carrière
Il n’y a encore que très peu de formations dédiées au métier ou aux fonctions de scientifique des données. Cependant, les diplômés spécialisés en ingénierie et les études en mathématiques ou en statistiques ne sont pas négligeables. Sur le plan des universités, on retrouve plusieurs programmes aux États-Unis (malheureusement très peu au Québec). Par exemple, l’Université de Washington a produit des cours vidéo pour ceux qui aspirent à une carrière en exploration de données. Les recruteurs engagent surtout des étudiants provenant de Stanford, MIT, Berkeley, Harvard, Carnegie Mellon. Cependant, on voit de plus en plus de candidats provenant d’universités moins prestigieuses telles que l’Université de la Caroline du Nord, du Maryland, de Washington et d’Austin au Texas.
Les scientifiques des données sont jeunes et ont en moyenne 9 ans d’expérience sur le marché du travail. Ils sont à 88 % des hommes, donc 12 % de femmes seulement. Ils sont très instruits : 88 % possèdent au moins une maîtrise et 46 % ont un doctorat. Bien que le principal champ d’études des scientifiques des données soit les mathématiques, plusieurs ont un diplôme en ingénierie ou en informatique. Près de 43 % des postes se retrouvent sur la Côte Ouest américaine (avis à ceux qui aiment le surf ). Près de 35 % des scientifiques des données aux États-Unis sont des immigrants. Finalement, le secteur qui recrute le plus de scientifiques des données est l’industrie des technologies.
Le scientifique des données peut évoluer dans différents secteurs, toutefois beaucoup d’entreprises de technologies réclament leur expertise. Par exemple, LinkedIn, Google et Facebook sont des grands consommateurs de ce nouveau métier. Mais, il y a aussi d’autres organisations telles qu’Intuit, GE, Zynga ou Netflix qui recrutent actuellement des scientifiques des données.
Une étude de McKinsey Global Institute estime qu’en 2018, les États-Unis feront face à une pénurie de 140,000 à 190,000 personnes possédant des compétences analytiques ainsi qu’à un manque de plus de 1,5 million de gestionnaires capable d’utiliser l’analytique et le Big Data afin prendre de meilleures décisions.
Les salaires : en lien avec la demande !
La firme de recrutement Robert Half a publié la liste des 6 emplois en or pour 2014 et 2015 et il s’avère que le scientifique des données en fait partie. Selon Google, il s’agit d’un métier d’avenir et on peut le constater au niveau de la rémunération. Un bon scientifique des données aura plusieurs portes ouvertes devant lui et les salaires seront en forte croissance. Aux États-Unis, il n’est pas rare de voir des salaires d’entrée dans les six chiffres pour quelqu’un tout droit sorti du doctorat. Selon une étude récente publiée sur le site de DataJobs, l’échelle salariale varie de 85,000 $ à 170,000 $.
Une personne avec les mots « data science » sur son profil LinkedIn peut recevoir jusqu’à 100 courriels par jour en provenance de différents recruteurs. La rareté se reflète dans les chiffres. Ainsi, des sites comme SimplyHire.com et LinkedIn listent présentement de 24 000 à 36 000 postes disponibles en science des données. À la fin de l’an dernier, plus de 6 000 organisations recrutaient pour de tels talents.
J’ai pour ma part remarqué une croissance du nombre de candidats sur LinkedIn. En effet, en septembre 2013, il n’y avait seulement que 5 695 profils qui affichaient le titre de scientifique des données. En août 2014, j’en comptais plus de 229 372.
Pour en savoir plus, je vous invite à lire un article paru dans le Harvard Business Review paru en 2012 et intitulé « Data Scientist : The Sexiest Job of the 21st Century ».
Un titre fort révélateur, n’est-ce pas ?