Le secteur de la Data et notamment du big Data est en pleine explosion depuis plusieurs années. Depuis près de 10 ans, le big data a pris de plus en plus de place dans les entreprises liées notamment à l’explosion de la quantité de données émises, récoltées et exploitables. On comprend facilement ce phénomène quand on sait qu’en 2019, 95% des français possédaient un smartphone : soit un outil de génération d’une quantité phénoménale de données.
Selon Valuates Reports, le marché mondial du big data était évalué à 193,14 milliards de dollars en 2019 et prévoit 420,98 milliards de dollars en 2027. Les parts de marché sont tellement importantes que la concurrence est devenue très féroce entre les différents services du Cloud comme Microsoft, Amazon, Oracle, IBM, etc. De nombreux métiers ont donc émergé grâce à ce secteur. C’est le cas des métiers de Data Analyst, Data Scientist et Machine Learning Engineer. Si ces métiers ne vous sont pas familiers, alors vous êtes au bon endroit : on vous explique tout.
Pour réaliser cet article, nous avons interviewé Clément Renault, Data Analyst chez Uni-Médias, filiale presse du groupe Crédit Agricole S.A, Amine Hadj-Youcef, Data Scientist à la SNCF et Flavien Gelineau, Machine Learning Engineer chez Deeplife, startup spécialisée dans la biotech.
Par définition, un Data Analyst traite différentes données du produit, des clients ou bien de l’entreprise elle-même et de ses performances afin d’en dégager des indicateurs qui vont permettre ensuite la prise de décision pour l’entreprise.
“Chez Uni-médias, je vais étudier le comportement des internautes pour ensuite en tirer des directives stratégiques. Cette analyse de la data est spécifique au secteur de la presse, mais on analyse des données différentes en fonction du secteur dans lequel on travaille. De manière générale, j’interviens après le Data Scientist.” nous dit Clément.
Des compétences techniques, pour être Data Analyst, il n’y en a presque pas besoin. En effet, il est possible d’apprendre la data analyse en pratiquant “sur le tas”. Il est cependant nécessaire de savoir maîtriser des outils de traitement de données (Microsoft Excel) ou des outils de data-visualisation (Microsoft Power BI, Tableau, Powerpoint etc.).
La data analyse requiert des compétences qui sont plutôt de l'ordre des soft skills comme : la communication, la curiosité, l’ouverture d’esprit, etc. Il ajoute qu’il y a beaucoup de choses que l’on apprend dans le cadre de l’entreprise dans ce métier et qui sont propres à un secteur d’activité.
“Mon métier, je l’ai appris sur le tas. Je sors d’une école web “classique” dans laquelle j’ai fait du code, du SEO, du web marketing etc. C'est seulement au sein d'Uni-Médias que j'ai développé toutes les compétences spécifiques aux besoins du secteur des médias. J’ai donc commencé par capitaliser sur mes soft skills.” explique Clément
Flavien, machine learning engineer ajoute, “Pour moi, savoir quel chiffre ou quel graphique choisir pour illustrer une situation, c’est une vraie compétence technique propre au Data Analyst et qui a une grande valeur. C’est prendre une situation compliquée et sortir les 4 chiffres qui expliquent cette situation tout en étant clair et concis avec seulement ces 4 chiffres.”
Pour Clément, la meilleure partie de son métier de Data Analyst c’est le sentiment d’être utile qui lui apporte une grande satisfaction.
“Lorsque j’ai extrait les insights, on me demande de faire une recommandation pour l’entreprise en fonction des résultats que j’ai analysés et de la veille concurrentielle que j’ai effectuée. Donc, à la fin d’une présentation, ma recommandation est discutée puis validée. C’est à ce moment-là que je me sens vraiment utile. La plus grande satisfaction que je peux avoir, c’est quand mon N+2, mon N+3 ou même le Directeur Général me disent après ma présentation “Ce que tu as dit, c’est validé, on y croit et on va le faire.”"
Un Data Scientist croise les données issues de sources différentes (propres au secteur d’activité et aux besoins de l’entreprise) et permet à l’entreprise de disposer d’une vue plus globale. Il présente ensuite ses résultats de façon visuelle via des rapports ou des graphiques.
“À la SNCF, il y a des appareils qui collectent la data. De mon côté, une fois qu’elles sont remontées, je vais les exploiter pour avoir un aperçu de comment on va effectuer certaines actions comme la maintenance des appareils de voies par exemple.” précise Amine.
Au niveau des compétences techniques pour un Data Scientist, Amine nous explique qu’il est plus que nécessaire d’avoir des notions de programmation (maîtriser les langages comme Python, savoir installer un environnement de travail ou un package) mais aussi des notions de visualisation et de développement mathématiques (probabilités et statistiques notamment).
Clément, Data Analyst précise à son tour “Je crois que l’un des points communs entre nos métiers, c’est que ce sont tous des fonctions qui nécessitent des compétences mathématiques notamment au niveau des statistiques et des probabilités.”
Cependant, en fonction du type de données traitées, il peut y avoir des compétences méthodologiques spécifiques. C’est pour cette raison qu’on parle de “Data Scientist spécialisé dans tel ou tel domaine” et en fonction de cette spécialisation on n’attend pas le même bagage de compétences.
En termes de soft skills, les plus importants sont : la communication, la curiosité et le travail d’équipe. Ce type de profil ne travaille jamais seul, il faut donc impérativement savoir travailler en équipe.
“Avoir des résultats, c’est très bien, mais il faut savoir les communiquer. À la SNCF, je dois communiquer mes résultats aux équipes de maintenance or c’est un public qui ne connaît pas la data science donc il faut que je communique de façon simple et claire, avec des outils de visualisation synthétiques et faciles à comprendre.” précise Amine.
Selon Amine, la meilleure partie de son métier dépend de l’entreprise dans laquelle il travaille. Dans le cadre de son expertise de Data Scientist à la SNCF, la meilleure partie de son travail, ce sont les sujets et les problématiques sur lesquels il est amené à réfléchir.
“À la SNCF, je travaille sur des sujets d’avenir comme les trains autonomes, l’optimisation du budget de maintenance, la sûreté des voyageurs, etc. Ce que j’aime, c’est que ce sont des projets qui sont porteurs de sens.”
Le Machine Learning Engineer quant à lui, conçoit des logiciels qui permettent d’automatiser des modèles prédictifs (on parle de logiciels “self-running”).
À savoir : Le terme “machine learning”, vient du fait qu’à chaque opération effectuée par le logiciel, celui-ci réutilise le résultat pour réaliser des opérations à venir en augmentant à chaque opération son niveau de précision.
“Je vais mettre en production un logiciel de machine learning et le déployer afin de permettre à toute l’équipe de l’utiliser.” ajoute Flavien.
Un ingénieur en Machine Learning, à l’instar d’un profil de Data Analyst, est un métier où l’on apprend beaucoup sur le tas.
“Pour moi, il y a beaucoup de choses qui s'apprennent sur le tas et donc il faut aimer apprendre, aimer lire quelque chose et comprendre aussi vite que possible 80% du problème.”
Les ingénieurs en Machine Learning peuvent utiliser leur expertise dans de nombreux domaines c’est pour cette raison, qu’à l’image d’un Data scientist, ils précisent le secteur d’activité de l’entreprise dans laquelle ils travaillent.
“Dans ce métier, on doit toujours s’intégrer dans un système. Par exemple, aujourd'hui, je fais de la modélisation de cellules et donc j’ai dû apprendre et comprendre la biologie, en tout cas, suffisamment pour pouvoir travailler dans ce domaine.” nous dit Flavien.
Pour être un bon ingénieur en Machine Learning, il faut donc aimer apprendre, aimer bricoler, aimer coder et surtout avoir un bagage scientifique et mathématique assez solide. Mais il y a aussi une grande exigence en termes de vélocité dans ce métier.
Flavien explique que ce qu’il préfère, c’est l’aspect créatif de sa mission.
“Créer un service de zéro, ça me plaît beaucoup. Je vais prendre une idée et la comprendre puis voir comment je vais pouvoir y amener de la valeur et comment la mettre en place. Une fois qu’elle est mise en place, je suis satisfait quand je me rends compte que ce que j’ai créé existe vraiment et que des gens l’utilisent et que ça leur sert.”
NB : Les métiers de Machine Learning Engineer et de Data Scientist sont des métiers proches en termes de compétences notamment sur de la gestion de larges volumes de données et de modélisation de celles-ci. Nous avons donc interrogé Amine et Flavien sur les différences qui pouvaient exister entre leurs deux métiers.
Selon Flavien, Machine Learning Engineer, “Ce sont des métiers qui sont très proches en termes de notion. Cependant, on va me demander moins de modélisation qu’un Data Scientist. On va plutôt me demander d’être rapide dans la production d’un outil fonctionnel. Je vais donc tester une idée, la mettre en production, la faire tourner sur différentes données et couper ou non le projet.”
Pour Amine, Data Scientist “Il y a une différence claire entre les deux métiers. Le machine learning, c’est une technique d’analyse de données et donc l’Ingénieur en Machine Learning est spécialisé dans cette méthode. Le Data Scientist quant à lui, n’est pas contraint d’utiliser uniquement cette méthode d’analyse pour traiter les données.”
Chez Urban Linker, les métiers de la data et en particulier Data Analyst, Data Scientist et Data Engineer font partie des métiers les plus recherchés par nos clients. Ce sont des métiers qui évoluent d'année en année. On peut le voir dans nos Études de Salaires annuelles : en 2020, un Data Scientist junior gagnait en moyenne 46.000€ en IDF et 35.000€ en Région. Pour aller plus loin, téléchargez nos Études de Salaires Tech en Ile-de-France et en Région.