X

Data Scientist : une espèce déjà en voie de disparition ?

Ces têtes chercheuses très demandées qui doivent combiner des connaissances statistiques, en développement de scripts logiciels, mais surtout des connaissances sur le métier de l’entreprise, occupent pourtant près de 60 % de leur temps à nettoyer ou à préparer des jeux de données avant même de pouvoir tester leurs algorithmes apportant la valeur à l’entreprise. Au vu de leurs salaires, certains commencent à se dire que ces étapes pourraient être réalisées par d’autres beaucoup moins cher, voire directement par des logiciels ou des machines auto-apprenantes.

Ils sont les nouveaux héros de l’économie de l’information. Gartner en avait fait le métier le plus sexy du XXIe siècle. Plus récemment, le cabinet Glassdoor l’a listé parmi les 25 métiers les plus recherchés. Data scientist est un des titres les plus enviés du moment, comme une sorte d’idéal alliant à la fois l’intelligence et la créativité et des connaissances scientifiques de haut niveau. Souvent qualifiés de moutons à 5 pattes, ils restent rares et très demandés.

Sur 4,4 millions d’emplois proposés en 2015, seulement 40 % ont été pourvus. En France pour la même année, c’est la moitié des postes qui n’ont pas trouvé preneurs. Ce manque pourrait même s’accentuer quand on sait que seules 20 % des entreprises utilisent les outils sur lesquels travaillent les data scientists. En 2018, il est estimé qu’il va manquer entre 140 000 et 190 000 spécialistes des données rien que pour les États-Unis.

Au passage, comme tout ce qui est rare est aussi cher, le data scientist bénéficie d’un salaire attrayant. En France, il peut toucher 35 000 € en début de carrière et gagner 65 000 € avec 5 ans d’expérience sans oublier près de 10 % de rémunération variable selon les entreprises et le secteur d’activité. On est loin des 120 000 $ proposé aux débutants aux États-Unis qui sont eux-mêmes bien loin du 1 % de rémunération sur les publicités de certains data scientists chez Google si leur algorithme permet d’augmenter le nombre de clics sur les adwords, selon les dires d’un ancien de la maison qui travaille désormais dans une entreprise faisant du partage de fichiers.

Des propositions de « next best actions »

Les acteurs du secteur ne s’y trompent pas et embarquent désormais des outils d’automatisation des tâches fastidieuses. Trifacta est une jeune entreprise qui s’est totalement dédiée à cette mission et propose une plate-forme qui réalise presque automatiquement ces différentes opérations. Datameer est un autre exemple d’une plate-forme offrant des opérations de préparation des données de manière automatique. Pentaho, un autre acteur acquis par Hitachi Data Systems, propose aussi des fonctions d’intégration de données. Ce ne sont que quelques exemples d’éditeurs dans ce domaine. D’autres veulent aller encore plus loin avec l’intégration dans leurs outils de logiciels de machine learning ou auto-apprenant.

L’idée sous-jacente est clairement de se passer de ces profils de haut niveau pour donner à de simples analystes des données ou à des employés avec des connaissances du métier de l’entreprise la possibilité d’avoir accès à des outils leur apportant les connaissances et les résultats apportés par ces logiciels d’aide à la décision. Einstein, la plate-forme de machine learning de Salesforce.com est de ce calibre et va rapidement être intégrée dans tous les Clouds de l’éditeur. Les vendeurs et marketeurs de tous poils vont avoir à disposition des fonctionnalités extrêmement puissantes pour prendre des décisions et surtout orienter ce qu’ils doivent faire ensuite avec des propositions de « next best actions ». Pega CRM, un autre logiciel, propose le même type d’actions mais en s’appuyant sur des règles.
Autre exemple, Watson d’IBM compile et analyse des millions de documents sur un sujet et devient le « Pic de la Mirandole » de l’oncologie ou de la cuisine chinoise et peut ainsi conseiller médecin ou chef cuisinier dans leurs traitements ou recettes et améliorer ces derniers.

Ne pas confondre Business Analyst et Data Scientist

À partir de là on peut s’interroger sur l’utilité pour beaucoup d’entreprises de l’embauche de spécialistes des données alors que de multiples outils vont leur apporter la possibilité d’avoir les résultats sans les inconvénients et les charges inhérentes à tout investissement dans des technologies analytiques impliquant le Big Data ou des analyses pointues sur certains modèles de données. Les Data Scientists vont-il alors disparaître avant même d’avoir connu leur réelle heure de gloire ?

La réponse à cette question est non. Ils vont toujours être aussi recherchés. Car les outils que nous venons de nommer ne s’adressent pas aux data scientists mais aux analystes métier qui sont dans un contexte très vertical ou bien défini : les ventes, le marketing, et pour certains cas précis, la prévision ou le scoring des opportunités sur lesquels peuvent s’appliquer des algorithmes standard et bien connus. Et encore, ce point n’est pas si évident et demande bien souvent des possibilités de personnalisation par l’entreprise. Ce sera bientôt la seule possibilité de différenciation, car quand tous les clients de Salesforce auront Einstein et l’utiliseront, quel sera l’avantage compétitif à secteur d’activité et algorithme égal ? Ce débat a déjà eu lieu lors de la montée en puissances des ERP où on se demandait quelle différenciateur pouvaient avoir deux entreprises ayant le même ERP.

Le data scientist est là pour développer les algorithmes qui vont s’appliquer aux jeux de données qui lui sont mis à disposition. Si sa valeur n’est pas dans les étapes préliminaires s’assurant de la qualité des données, le data scientist est nécessaire pour développer ces nouvelles applications analytiques et bien souvent il est le seul capable de tester et de comprendre le sens des résultats provenant de l’algorithme développé.

De nouveau, l’industrie réalise un abus de langage et se sert de mots-valises parfois dénués de sens pour nous faire prendre des vessies pour des lanternes. Ces nouveaux outils automatiques de préparation des données vont évidemment simplifier la vie des analystes métier et leur permettre d’utiliser de nouvelles technologies décisionnelles de manière simple. Mais ce ne sont pas des outils pour les data scientists, qui eux, comme des artisans, vont peaufiner inlassablement leurs scripts et jeux de données pour tester des algorithmes spécifiques. ❍

Chronique parue dans le n°151 de L'Informaticien (novembre 2016).


Inscription gratuite à la newsletter de L'Informaticien.

Noter cet article (de 1 = Nul à 5 = Excellent) Valider

Actuellement à la Une...
Offres d'emploi
RSS
12345

Lancez votre recherche sur notre rubrique Emploi avec notre partenaire

Fil Twitter de L'1FO






LIVRES BLANCS

Détecter & supprimer les menaces avancées, un Livre Blanc Malwarebytes. 

Ce livre blanc présente les stratégies que doivent employer les entreprises dans l'ensemble des composants de leur système d'information afin de se prémunir contre les APT (Advanced Persistent Threats) qui sont aujourd'hui de plus en plus dangereuses et peuvent causer des dégâts considérables à l'entreprise. 


Malwarebytes : un acteur de référence dans l'APT, un Livre Blanc Malwarebytes. 

Créée en 2008, Malwarebytes a démarré l’activité Entreprises en 2012 avec la solution Endpoint Security.

En moins de 4 années, Malwarebytes est devenu un acteur incontournable du marché des applications de nouvelle génération dans la protection des terminaux.


Les recommandations du FBI pour se protéger des attaques Ransomwares, un Livre Blanc Cegedim-Outsourcing-Landesk. 

Les incidents liés aux ransomwares ont augmenté de près de 26 % en 2016 par rapport à 2015 (Sources FBI). Il devient urgent de protéger vos données sensibles et vos utilisateurs. Il faut assurez la sécurité IT partout et tout le temps !

Découvrez les recommandations du FBI en téléchargeant le livre blanc de notre partenaire LANDESK.  


La technologie des firewalls doit évoluer avec l’entreprise sans frontières, un Livre Blanc Fortinet.
MENACES ÉVOLUTIVES : CHANGEMENT DES ATTENTES ENVERS LES SOLUTIONS DE FIREWALL D’ENTREPRISE
Les solutions de firewall d'entreprise (Enterprise Firewall) doivent être sans frontières, comme l’entreprise.  


Cas client du Swiss Economic Forum, un Livre Blanc Intralinks. 

Le Swiss Economic Forum utilise Intralinks VIA® comme moyen sûr, économique et conforme pour partager des documents confidentiels avec ses partenaires lors de l’examen des stratégies de croissance des PME demandant un financement.  


Tous les Livres Blancs
Le Kiosque

PÉPITES DE L'IT : Ces start-up vont faire du bruit en 2017 ! - Sécurité SI 2017 : bien se préparer face aux attaques redoutées - Architectures hyperconvergées : les avantages selon Nutanix - Secure by Design : la sécurité pensée de A à Z - Rencontre Tristan Nitot : "Facebook est un CRM géant" - Devenir développeur web en 5 mois, c’est possible !...

 

RÉALITÉ VIRTUELLE : Ce que vous pouvez en attendre - ESPORT : l'informatique derrière le phénomène planétaire - Windows et Android, les meilleurs ennemis - Les promesses de Java 9 - OpenStack : une plateforme Cloud mature mais ambiguë - Shopping Tech : nos coups de coeur vont à Cubetto, Orbi et Thingz...

 

Afficher tous les derniers numéros
Derniers commentaires
Fil AFP
Techno et Internet
Yahoo!: la vente du coeur de métier à Verizon repoussée au 2e trimestreYahoo! a annoncé lundi un report de la vente de son coeur de métier au géant des télécoms Verizon, une opération sur laquelle des doutes se sont accumulés après la révélation de cyberattaques massives contre le groupe internet.  [Sommaire]

Le siège du groupe L'Oréal à Clichy, près de Paris, le 26 août 2010Le géant français des cosmétiques L'Oréal et l'incubateur de start-up basé à Londres, Founders Factory, ont annoncé lundi la sélection de 5 start-up de la beauté connectée qui bénéficieront d'un "programme d'accélération" visant à soutenir leur développement. [Sommaire]

Le directeur général de SFR, Michel Paulin, à Paris le 23 janvier 2017L'opérateur de télécoms SFR, filiale du groupe Altice, a réaffirmé lundi, par la voix de son directeur général Michel Paulin, sa stratégie dans le très haut débit fixe et mobile, promettant à la fois une amélioration de la couverture mais également de la qualité du réseau. [Sommaire]

Une navette électrique et sans-chauffeur EZ10 de la RATP circule à Paris le 24 septembre 2016Des minibus électriques et sans chauffeur circulent depuis lundi et jusqu'au 7 avril à Paris entre les gares de Lyon et d'Austerlitz, des navettes accessibles gratuitement dans le cadre d'une expérimentation menée par la RATP. [Sommaire]

Le pape François, entouré des membres du corps diplomatique accrédités au Saint-siège, dans la Chapelle Sixtine dont les trésors sont désormais accessibles sur internetLa Chapelle Sixtine ou les Chambres de Raphaël en mode virtuel, et plus facile: c'est désormais possible grâce au nouveau site internet des Musées du Vatican, qui ambitionne d'accroître ainsi l'accès du public à l'ensemble de ses riches collections. [Sommaire]

Le Parti communiste chinois renforce son contrôle sur internet en Chine, notamment en encadrant les possibilités d'accès aux sites étrangers déjà bloqués comme Facebook ou GoogleLa Chine a lancé une campagne pour "mettre de l'ordre" parmi les fournisseurs d'accès à internet, visant en particulier les logiciels qui donnent accès aux sites étrangers bloqués dans le pays, comme Facebook ou Google.  [Sommaire]

Photo prise le 17 novembre 2016 de statistiques de la compagnie de financement participatif KissKissBankBank au siège à Paris"Explicite", média d'information créé par une cinquantaine d'anciens d'iTELE, a lancé lundi une campagne de financement participatif afin de lever 150.000 euros, "première étape de son financement", a indiqué à l'AFP son dirigeant Olivier Ravanello. [Sommaire]

Des Chinois consultent internet sur leurs smartphones, le 12 mars 2014 dans le métro de ShanghaiLe nombre d'internautes en Chine, déjà le plus élevé au monde, s'établissait fin décembre à 731 millions de personnes, soit l'équivalent de la population du continent européen, ont annoncé les autorités. [Sommaire]

Une femme, qui consulte son smartphone, passe devant une publicité pour le Samsung Galaxy Note7, le 11 octobre 2016 à Séoul, en Coréeu du SudSamsung a tenté lundi de tourner la page du fiasco du Galaxy Note 7 en imputant formellement à un défaut de batterie les problèmes survenus sur cet appareil phare dont la production avait été arrêtée en octobre. [Sommaire]

Des manifestants tiennent des panneaux montrant l'évolution du foetus lors d'une marche contre l'avortement à Paris le 22 janvier 2017"Garder son bébé, c'est la vraie liberté", "IVG tous concernés": plus de 10.000 opposants à l'avortement selon la police, 50.000 selon les organisateurs, ont défilé derrière ces slogans à Paris dimanche, pour leur "Marche pour la vie", particulièrement "politique" à trois mois de la présidentielle. [Sommaire]

Toutes les dépêches AFP

L'1FO sur Facebook
AgendaIT

FIC

Plus d'infos

Forum International de la Cybersécurité à Lille

Le 9ème Forum International de la Cybersécurité occupe les 24 et 25 janvier 2017 le Grand Palais de Lille. Organisé par la Région Nord-Pas de Calais et Euratechnologies, la Gendarmerie Nationale et CEIS.

CIL

Plus d'infos

11ème Université des CIL, Correspondants Informatique & Libertés, futurs DPO

La 11ème Université des CIL, l’événement incontournable des professionnels de la conformité à la loi Informatique et Libertés, a pour cadre le mercredi 25 janvier 2017 la Maison de la Chimie, à Paris. Organisée par l’AFCDP (Association Française des Correspondants à la protection des Données à caractère Personnel)

MOBILE WORLD CONGRESS

Plus d'infos

Congrès mondial de la mobilité (MWC)

Le congrès mondial de la mobilité (MWC) se tient à Barcelone  du 27 février au 2 mars 2017. Organisé par GSMA Association.

BIG DATA

Plus d'infos

Un événement leader du Big Data en France

Conférences et exposition sur le Big Data les 6 et 7 mars à Paris, Palais des Congrès de la Porte Maillot. Organisé par Corp Agency.

ROOMN

Plus d'infos

Une place d'affaires dédiée à la mobilité et au digital

Pour sa 5ème édition, la rencontre d'affaires Mobilité et Digital a pour cadre à nouveau Monaco (Grimaldi Forum) du 7 au 9 mars 2017. Organisée par Comexposium.
RSS
123