Panorama des métiers de la data

Panorama des métiers de la data

Panorama des métiers de la data


L’expression « Big Data » fait partie des buzzwords de ces derniers mois. Derrière ce terme se cachent des professionnels qui œuvrent au quotidien pour recueillir des données, les analyser et prendre des décisions ou déployer des solutions techniques. Pour en savoir plus sur les métiers de la data, nous avons rencontré Benjamin Cohen Boulakia, enseignant-chercheur au sein de l’école d’ingénieurs exia.CESI. Il présente ces nouvelles professions, très recherchées par les entreprises, ainsi que les compétences à acquérir pour les exercer.

Typologie des métiers de la data



On retrouve dans les propositions d’offres d’emploi plusieurs dénominations concernant les ingénieurs informatiques, qui se recoupent parfois (et qui s’appuient sur des anglicismes la plupart du temps difficiles à traduire). Les plus répandus sont Data Scientist et Data Architect, parfois appelé Big Data Architect.. D’autres métiers, tout aussi importants, s’appuient souvent plus sur une expertise métier, voire juridique, et moins sur l’aspect scientifique et technologique. On va retrouver le Data Analyst, le Master Data Manager, le Chief Data Officer, le Data Protection Officer… Les dénominations ne manquent pas !

Tous ces profils interviennent de manière plus ou moins rapprochée dans le processus de traitement de la data. Au début de ce process, on collecte de la donnée brute, qui peut être plus ou moins structurée, en plus ou moins grande quantité, et issue de sources parfois hétérogènes. On la transforme ensuite en information en nettoyant, en catégorisant, en corrélant, bref, en interprétant ces données brutes. On doit ensuite transformer cette information en connaissance, en la contextualisant, en la comparant avec d’autres informations. De cette connaissance peuvent alors être tirées des décisions, des actions.

Data Scientist



Le Data Scientist intervient essentiellement dans la transformation de la donnée en information, et en connaissance. Il s’appuie pour cela sur ses compétences scientifiques importantes, sur sa maîtrise des outils technologiques associés, et sur une bonne connaissance du domaine d’application concerné.

Big Data Architect



Le Big Data Architect va quant à lui créer et optimiser les infrastructures de stockage, de manipulation, et de restitution des données brutes. Son rôle est fondamental lorsque cette donnée brute est présente en très grande quantité et manque de structure (par exemple lorsqu’il s’agit d’indexer l’ensemble du web mondial). C’est un interlocuteur important du Data Scientist, à qui il fournira les données brutes que celui-ci va traiter.

Data Analyst



Le Data Analyst est lui aussi un interlocuteur important du Data Scientist, mais de l’autre côté de la chaîne de traitement. C’est à lui que revient la tâche d’exploiter les informations ou les connaissances pour en tirer une analyse menant à une prise de décision. Son expertise métier est pour le Data Scientist une ressource importante, qui lui permettra de traiter la donnée de la manière la plus adaptée aux besoins de l’entreprise.

Les autres profils, Master Data Manager, Chief Data Officer, Data Consultant, Data Protection Officer, jouent un rôle transverse dans l’entreprise, et travaillent en général sur des considérations à moyen terme concernant la stratégie de gestion et/ou de protection de la donnée, que ce soit au niveau métier ou technologique. Ils sont souvent au contact du top management de l’entreprise.

Data Analyst

Les compétences à acquérir pour exercer ces métiers



Le référentiel de compétences du Data Scientist s’organise autour de 3 axes.

Modéliser



Il s’agit de structurer logiquement la donnée en vue de son exploitation. Sur cet axe, le Data Scientist est un expert. Il s’appuie sur des concepts déterministes (graphes, modèles linéaires…) ou probabilistes (chaines de Markov, processus stochastiques…), ainsi que sur des outils techniques adaptés (NoSQL, MongoDB) pour organiser la donnée, les corrélations ou les rapprochements permettant de créer l’information et la connaissance.

Exploiter



Créer les outils permettant d’extraire l’information, de créer la connaissance. Là aussi, le Data Scientist fait preuve d’une maitrise avancée. Il s’appuie sur ses connaissances en algorithmique et en programmation scientifique, en intelligence artificielle, en calcul hautes performances, ainsi que sur sa maitrise des outils techniques (R, Python, MapReduce, Spark) pour parcourir les données et trouver les regroupements, les corrélations etc. qui construiront à terme la connaissance.

Déployer



Mettre en place une réponse technique, une infrastructure permettant de déployer les outils conçus. C’est le domaine où le Data Scientist est le moins expert. Il se positionne surtout comme « client » de ces compétences. Ses connaissances techniques ainsi que sa vision très fine des besoins auxquels il faut répondre lui permettront d’appuyer l’activité du Big Data Architect et du Chief Data Officer, notamment pour sélectionner et paramétrer les outils d’infrastructures les plus adaptés (Hadoop, MongoDB).

dataserver

Des métiers porteurs sur le marché du travail



Les métiers de la data sont extrêmement recherchés depuis environ 3 à 4 ans. Cela s’explique en grande partie par l’explosion de la puissance de calcul, qui a rendu le domaine accessible aux entreprises. De nombreux outils et méthodologies utilisés dans ces métiers de la data existent depuis longtemps (bases de données semi-structurées, méthodes par apprentissage, algorithmique et architectures parallèles…), mais l’évolution récente des capacités de calcul a permis de regrouper tous ces outils, de les faire fonctionner sur des quantités de données parfois extrêmement grandes, et de les placer à portée de l’entreprise pour un usage quotidien. Or, les spécialistes du domaine se font encore rares sur le marché du travail.

De nombreux grands groupes sont à la recherche de ces profils d’experts de la data pour leur activité cœur de métier. On retrouvera par exemple les constructeurs automobiles qui conçoivent des systèmes autonomes d’aide à la conduite, voire des voitures totalement autonomes, des sociétés de finance de marché qui conçoivent et utilisent des algorithmes de trading à haute fréquence, des groupes industriels qui utilisent la Data Science et le machine learning pour faire de la maintenance prédictive, des géants du commerce ou du marketing qui cherchent à anticiper dans les grands volumes de données de vente les tendances des consommateurs, et bien d’autres applications industrielles ou dans le service. Par ailleurs, on voit émerger depuis peu l’idée d’un « Big Data managérial », dont l’idée générale est d’utiliser la data et son analyse pour le pilotage stratégique de l’entreprise. Une sorte d’évolution de la Business Intelligence, en quelque sorte. Si cette évolution est finalement assez prévisible, l’explosion des capacités de calcul a été telle qu’elle a eu une conséquence bien plus importante, et qui est l’un des effets les plus marquants de cette évolution : les métiers de la data ne sont plus l’apanage de ces grands groupes, même si ceux-ci en restent les premiers « consommateurs ». Une PME, voire une petite start-up technologique à forte culture disruptive, peut tout à fait se positionner sur ce marché, et proposer des outils, des services, des modèles économiques nouveaux, avec une forte valeur ajoutée. Les plus grands acteurs ne s’y trompent pas, et Google, par exemple, est l’un des plus gros « racheteurs » de start-up dans le domaine de l’Intelligence Artificielle.

L’option Data Science de l’exia.CESI

L’option Data Science de l’exia.CESI



L’option Data Science de l’exia.CESI, à destination des étudiants en dernière année du cycle d’ingénieur, est composée de 240H de formation, soit 7 semaines. L’ensemble de la formation s’appuie sur plusieurs séquences pédagogiques, une exposition à la recherche (très active en la matière), des activités pratiques (sous forme de workshops), le tout positionné sur les deux principaux silos de compétences du Data Scientist : la modélisation, et l’exploitation. La question des outils de déploiement est traitée de manière transverse, essentiellement dans l’optique de permettre aux étudiants de travailler dans un environnement technique concret et réaliste. Les compétences développées sur ces silos de compétences abordent autant les aspects scientifiques que technologiques. La question du pilotage d’une unité stratégique est aussi abordée, de manière à positionner systématiquement la formation dans un contexte économique et industriel représentatif du marché du travail.

Enfin, cette option est totalement en phase avec la méthode pédagogique de l’exia.CESI, et s’articule donc intégralement autour un projet d’application transverse. Ce projet est déployé en fil rouge, avec un jalon intermédiaire. Le but de séparer le projet en deux parties est d’identifier de manière très claire les deux axes de compétences principaux, et leurs interactions. Ce projet peut par exemple consister à créer un logiciel de reconnaissance du langage naturel (pour un moteur de recherche documentaire), un logiciel d’analyse de chaines d’ADN (pour calculer par exemple la probabilité d’apparition d’une maladie), un outil de reconnaissance faciale, un système de prévision de trafic routier etc.




{{titrenews}}

- Ce champ est obligatoire !  - Le nom doit contenir au moins 4 caractéres  
- L'adresse email n'est pas valide !  - Ce champ est obligatoire !  - Cette adresse email est trop court ! 

{{titrecontact}}

Téléphone

{{tel}}

Suivez-nous

Addresse

{{adress}}