#DataJobs : LA rencontre de Blue DME et des data scientists

DJ

 

 

 

L’équipe de Blue DME a été prendre la température, le 26 novembre dernier, au salon de recrutement Data Jobs, organisé par Quantmetry, afin de recruter de nouveaux membres data scientist et développeur. Ce salon a été une expérience très enrichissante qui nous a permis d’accroître notre visibilité, via le stand que nous tenions, auprès des candidats (nous avons reçu un grand nombre de CVs)  et nous vous remercions de votre intérêt pour Blue DME- et des autres entreprises. Cela a été également une incroyable opportunité d’assister à des conférences menées par des intervenants de renom, d’une grande qualité, sur le Big Data et ses grandes tendances.

Le Big Data apparaît comme la tendance de fond des entreprises aujourd’hui et le demeurera au cours des vingt prochaines années : la #data-to-action semble être un phénomène majeur, c’est-à-dire analyser et utiliser la data de sorte à ce qu’elle permette d’améliorer la performance d’un service, d’un business, d’une organisation. Une véritable culture de la data se met en place et se confronte à un cadre réglementaire relativement strict.

Trois idées majeures se sont dégagées au cours du salon. Tout d’abord, le métier de data scientist se montrera au cœur des organisations de demain. Ensuite, les sources de données analysées sont de plus en plus variées et croisées. Enfin, le machine et le deep learning permettent d’accéder à des données de qualité au forts pouvoirs analytique prédictif.

 

 

triangleDJ

 

  1. Le data scientist : l’informaticien statisticien

 

Le métier de data scientist dispose de compétences à la fois de leadership et techniques, plus ou moins importantes selon l’âge du data scientist. Selon les points de vue, présents à la conférence « Emploi : une bulle autour des Data scientists », le métier de data scientist prend souvent en compte les compétences du data engineer, du data manager et du data architect. Le métier de data engineer est souvent inclus dans celui de data scientist car ce dernier code, fait des modèles, nettoie les données, les stocke, les analyse et les visualise. Selon Cédric Villani, Médaille Fields, 2010, le data scientist est à l’interface entre l’informatique et les mathématiques. Il est alors nécessaire d’implémenter des modèles qui permettent de s’approcher au plus près de la réalité, d’utiliser les statistiques adaptées aux problématiques étudiées.

Néanmoins, les compétences du data scientist dépendent de la taille, du profil de l’entreprise et de la quantité des données disponibles. Le data architect serait alors une fonction à laquelle on ferait référence, lors du changement des systèmes d’informations d’une entreprise alors que le data scientist prendrait un rôle important pour analyser les différentes données de l’entreprise lorsque celle-ci aura modifié son système d’informations.

Les data scientists sont, selon les conférenciers, des individus capables de s’adapter et de se former rapidement sur de nouvelles technologies. C’est pourquoi ils intègrent pour 58% d’entre eux des start-ups.

Ils sont également à même de gérer des problématiques complexes comme la sécurisation des données. En effet, des principes européens, mis en place en 2015, imposent que les données personnelles soient privacy-by-design, dès la création des produits. Selon le secrétaire général de la CNIL, Edouard Geffray, les réglementations devraient se mettre en œuvre en concertation avec les data scientists afin de répondre à leurs propres problématiques de traitement et d’analyse des données.

Enfin, les data scientists font face à des problématiques métiers car ils travaillent en étroite collaboration avec un département particulier, marketing,  risque, production… En effet, ils doivent comprendre le marché, le produit avant de mettre en œuvre des modèles pour analyser et prédire les performances business.

 

  1. Des sources de données variées au croisement de données Tierces

 

Les données analysées par les data scientists sont de plus en plus non structurées (photo, vidéo, messagerie, conversations téléphoniques…) et dès lors davantage complexes à traiter et exploiter.

De plus, les données sont de plus en plus collectées en temps réel et disponibles en Open Source. L’Open Source se développe rapidement : L’Open Data présente d’importants bénéfices pour les entreprises qui ont accès facilement à des données externes et pour les consommateurs qui peuvent optimiser leurs comportements d’achat. Par exemple, accéder à des données ouvertes sur le prix du carburant dans les différentes stations autour de nous peut permettre au conducteur de choisir le prix le plus bas. L’Open Data permet également de croiser les données internes aux entreprises avec des données externes accessibles à tous. Cela est une source de performance supplémentaire, via une amélioration des modèles de scoring et un enrichissement des bases de données initiales.

 

  1. L’importance nouvelle du machine learning et du deep learning

 

Le deep learning semble constituer la tendance majeure du Big Data aujourd’hui. Bouygues utilise, par exemple, des réseaux de neurones pour structurer leurs données service client. . Le deep learning est également une technique utilisée dans le domaine de la santé pour réaliser des diagnostics sur l’épilepsie, par exemple, prédire des risques de crise cardiaque. Le deep learning est largement utilisé pour trouver la meilleure métrique de qualification des données et pour améliorer ce que l’on mesure Les CPU (unité centrale de traitement) sont remplacés par des GPU (processeurs graphiques) qui permettent de faire des analyses plus précises. Le deep learning met en place des modèles hiérarchiques pour arriver à des meilleurs modèles de décision qui minimisent les scores d’erreurs et qui permettent de mieux comprendre le consommateur. Ces modèles ont pour but de réaliser des analytics et des prédictions de plus en plus précises via des données de très bonne qualité. Ainsi, grâce au deep learning, les clients auront accès à des offres très personnalisées qui répondent à leurs besoins ou envies. En effet, l’offre produits devient quasi infini et s’adapte au besoin du consommateur : le machine learning permet de prédire le futur à partir du passé.

 

 

Le salon Data Jobs du 26 juillet nous a permis d’être au cœur des enjeux et tendances actuelles auxquelles faisait face le Big Data, de rencontrer de nombreuses personnes intéressées par Blue DME et son concept novateur d’Enterprise Data Exchange. Nous avons également découvert des candidats data scientists et développeurs très motivés, aux profils très variés. En bref, ce salon a été une très belle opportunité pour nous faire connaître ! Merci beaucoup à Quantmetry @DataJobs Paris.