X

Data Scientist : une espèce déjà en voie de disparition ?

Ces têtes chercheuses très demandées qui doivent combiner des connaissances statistiques, en développement de scripts logiciels, mais surtout des connaissances sur le métier de l’entreprise, occupent pourtant près de 60 % de leur temps à nettoyer ou à préparer des jeux de données avant même de pouvoir tester leurs algorithmes apportant la valeur à l’entreprise. Au vu de leurs salaires, certains commencent à se dire que ces étapes pourraient être réalisées par d’autres beaucoup moins cher, voire directement par des logiciels ou des machines auto-apprenantes.

Ils sont les nouveaux héros de l’économie de l’information. Gartner en avait fait le métier le plus sexy du XXIe siècle. Plus récemment, le cabinet Glassdoor l’a listé parmi les 25 métiers les plus recherchés. Data scientist est un des titres les plus enviés du moment, comme une sorte d’idéal alliant à la fois l’intelligence et la créativité et des connaissances scientifiques de haut niveau. Souvent qualifiés de moutons à 5 pattes, ils restent rares et très demandés.

Sur 4,4 millions d’emplois proposés en 2015, seulement 40 % ont été pourvus. En France pour la même année, c’est la moitié des postes qui n’ont pas trouvé preneurs. Ce manque pourrait même s’accentuer quand on sait que seules 20 % des entreprises utilisent les outils sur lesquels travaillent les data scientists. En 2018, il est estimé qu’il va manquer entre 140 000 et 190 000 spécialistes des données rien que pour les États-Unis.

Au passage, comme tout ce qui est rare est aussi cher, le data scientist bénéficie d’un salaire attrayant. En France, il peut toucher 35 000 € en début de carrière et gagner 65 000 € avec 5 ans d’expérience sans oublier près de 10 % de rémunération variable selon les entreprises et le secteur d’activité. On est loin des 120 000 $ proposé aux débutants aux États-Unis qui sont eux-mêmes bien loin du 1 % de rémunération sur les publicités de certains data scientists chez Google si leur algorithme permet d’augmenter le nombre de clics sur les adwords, selon les dires d’un ancien de la maison qui travaille désormais dans une entreprise faisant du partage de fichiers.

Des propositions de « next best actions »

Les acteurs du secteur ne s’y trompent pas et embarquent désormais des outils d’automatisation des tâches fastidieuses. Trifacta est une jeune entreprise qui s’est totalement dédiée à cette mission et propose une plate-forme qui réalise presque automatiquement ces différentes opérations. Datameer est un autre exemple d’une plate-forme offrant des opérations de préparation des données de manière automatique. Pentaho, un autre acteur acquis par Hitachi Data Systems, propose aussi des fonctions d’intégration de données. Ce ne sont que quelques exemples d’éditeurs dans ce domaine. D’autres veulent aller encore plus loin avec l’intégration dans leurs outils de logiciels de machine learning ou auto-apprenant.

L’idée sous-jacente est clairement de se passer de ces profils de haut niveau pour donner à de simples analystes des données ou à des employés avec des connaissances du métier de l’entreprise la possibilité d’avoir accès à des outils leur apportant les connaissances et les résultats apportés par ces logiciels d’aide à la décision. Einstein, la plate-forme de machine learning de Salesforce.com est de ce calibre et va rapidement être intégrée dans tous les Clouds de l’éditeur. Les vendeurs et marketeurs de tous poils vont avoir à disposition des fonctionnalités extrêmement puissantes pour prendre des décisions et surtout orienter ce qu’ils doivent faire ensuite avec des propositions de « next best actions ». Pega CRM, un autre logiciel, propose le même type d’actions mais en s’appuyant sur des règles.
Autre exemple, Watson d’IBM compile et analyse des millions de documents sur un sujet et devient le « Pic de la Mirandole » de l’oncologie ou de la cuisine chinoise et peut ainsi conseiller médecin ou chef cuisinier dans leurs traitements ou recettes et améliorer ces derniers.

Ne pas confondre Business Analyst et Data Scientist

À partir de là on peut s’interroger sur l’utilité pour beaucoup d’entreprises de l’embauche de spécialistes des données alors que de multiples outils vont leur apporter la possibilité d’avoir les résultats sans les inconvénients et les charges inhérentes à tout investissement dans des technologies analytiques impliquant le Big Data ou des analyses pointues sur certains modèles de données. Les Data Scientists vont-il alors disparaître avant même d’avoir connu leur réelle heure de gloire ?

La réponse à cette question est non. Ils vont toujours être aussi recherchés. Car les outils que nous venons de nommer ne s’adressent pas aux data scientists mais aux analystes métier qui sont dans un contexte très vertical ou bien défini : les ventes, le marketing, et pour certains cas précis, la prévision ou le scoring des opportunités sur lesquels peuvent s’appliquer des algorithmes standard et bien connus. Et encore, ce point n’est pas si évident et demande bien souvent des possibilités de personnalisation par l’entreprise. Ce sera bientôt la seule possibilité de différenciation, car quand tous les clients de Salesforce auront Einstein et l’utiliseront, quel sera l’avantage compétitif à secteur d’activité et algorithme égal ? Ce débat a déjà eu lieu lors de la montée en puissances des ERP où on se demandait quelle différenciateur pouvaient avoir deux entreprises ayant le même ERP.

Le data scientist est là pour développer les algorithmes qui vont s’appliquer aux jeux de données qui lui sont mis à disposition. Si sa valeur n’est pas dans les étapes préliminaires s’assurant de la qualité des données, le data scientist est nécessaire pour développer ces nouvelles applications analytiques et bien souvent il est le seul capable de tester et de comprendre le sens des résultats provenant de l’algorithme développé.

De nouveau, l’industrie réalise un abus de langage et se sert de mots-valises parfois dénués de sens pour nous faire prendre des vessies pour des lanternes. Ces nouveaux outils automatiques de préparation des données vont évidemment simplifier la vie des analystes métier et leur permettre d’utiliser de nouvelles technologies décisionnelles de manière simple. Mais ce ne sont pas des outils pour les data scientists, qui eux, comme des artisans, vont peaufiner inlassablement leurs scripts et jeux de données pour tester des algorithmes spécifiques. ❍

Chronique parue dans le n°151 de L'Informaticien (novembre 2016).


Noter cet article (de 1 = Nul à 5 = Excellent) Valider

Vient de paraître

Ce Livre Blanc vous permet de découvrir toutes les étapes nécessaires pour choisir le prestataire informatique adapté à votre entreprise et ses enjeux.


Aujourd'hui, les Directeurs Comptables et Financiers ont envie de dématérialiser leurs factures fournisseurs. C'est plutôt l'idée de devoir s'intégrer à un environnement multi-ERP déjà existant qui les freine. Mais est-ce réellement une barrière ? Dans son nouveau Livre Blanc, Esker explore ce sujet. En le téléchargeant, vous découvrirez comment la dématérialisation peut être une aubaine plutôt qu'un fardeau.


Actuellement, il existe un gouffre entre les environnements informatiques traditionnels des entreprises et le cloud public. Tout diffère : les modèles de gestion, de consommation, les architectures applicatives, le stockage, les services de données.


Les avantages de l’architecture hyperconvergée étant de plus en plus reconnus, de nombreuses entreprises souhaitent l’utiliser pour des types d’applications variés. Cependant, son manque de souplesse pour une mise à niveau des ressources de calcul indépendantes de celles de stockage ne lui permet pas d’être utilisée plus largement.

Au cours de l’événement HPE Discover qui s’est tenu en juin 2019, HPE a répondu à cette préoccupation en présentant la plateforme HPE Nimble Storage dHCI.

Ce Livre Blanc IDC se penche sur les exigences du marché ayant stimulé le besoin de solutions HCI plus flexibles, puis il examine brièvement la solution HPE Nimble Storage dHCI en expliquant pourquoi elle répond à ce besoin.


Tous les Livres Blancs
Serverless

Serverless

En quelques années, le Serverless – ou informatique sans serveur – est devenu une nouvelle corde à l’arc des architectes logiciels et développeurs afin de créer des applications. La technologie est...

Le Cybercrime as a Service

Le Cybercrime as a Service

Le ministère de l’Intérieur a évoqué, dans son rapport annuel 2019 sur les menaces liées au numérique, le développement d’outils malveillants « clés en main ». Le...

Intégration continue

Intégration continue

Les entreprises sont de plus en plus nombreuses à adopter les pratiques DevOps pour leurs projets informatiques. L’intégration continue (CI), le déploiement et la livraison en continu (CD) sont devenus partie...

RSS
hardcore black fuck
Afficher tous les dossiers

STOCKAGE : NVMe s'impose, Fichier et Objet se rapprochent, Solutions de stockage pour TPE/PME - La 5G... et après ? - Le LiFi au lycée - L'IA au service du recrutement - Cybersécurité : externaliser jusqu'où ? - Windows et Linux, la fusion continue - Les meilleurs outils pour les cours à distance - YesWeHack à l'assaut du monde - Rencontre avec Armand Thiberge, CEO de SendInBlue...

 

SÉCURITÉ DU SI ? UNE PRIORITÉ ! SASE, Ransomware, Cyberformation - Le cybercrime as a service -Supinfo : Pourquoi un tel naufrage ? - Comment Nvidia s'est imposé dans les datacenters - Accélérer le développement Python avec Hydra - PME et Multicloud : où en sommes-nous ? - Le Serverless s'impose dans les architectures applicatives...

 

POSTMORTEM cyberattaque région Grand Est - OUTILS : Endpoint Detection & Response, quel rôle doit jouer l'EDR pour protéger un parc informatique ? - Appliances firewall, l'essor de la virtualisation - CONFORMITÉ : Quelles conséquences pour les entreprises après l'annulation du Privacy Shield ? TECHNO : ORC, outil open source de collecte de données forensiques - TRIBUNE : Comment protéger les données à caractère personnel de ses collaborateurs tout en favorisant le télétravail ? - PROJETS : Campus Cyber, ça se précise !...

 

Afficher tous les derniers numéros
Derniers commentaires
Quelque 70 acteurs du numérique, dont les géants Google et Facebook, s'engagent, dans le cadre du collectif Quelque 70 acteurs du numérique, dont les géants Google et Facebook, s'engagent, dans le cadre du collectif "Tech For Good" lancé par Emmanuel Macron, à "prendre leurs responsabilités" pour "une juste contribution aux impôts" dans les pays où ils exercent. [Lire la dépêche...]

Des manifestants place Tahrir, au Caire, le 1er février 2011Jamais révolution n'avait autant rayonné. Grâce aux réseaux sociaux et aux smartphones, l'esprit du Printemps arabe a déferlé au Moyen-Orient et contribué à renverser des dictatures vieillissantes. Depuis, la contre-offensive numérique des Etats autoritaires a fait taire nombre de militants.  [Lire la dépêche...]

L'application TousAntiCovid sur un smartphone, le 28 octobre 2020 à ToulouseL'application TousAntiCovid a passé le cap des 10 millions d'utilisateurs, a souligné samedi dans un tweet Jean Castex, alors que les critères de distance pour alerter les personnes contacts avec des cas positifs de Covid-19 ont été élargis. [Lire la dépêche...]

Capture d'écran du producteur de musique qui s'exprime devant les médias, le 26 novembre 2020 pour raconter son tabassage par des policiersLancé début 2018 sur le modèle de Brut et d'AJ+, le jeune média en ligne Loopsider, 100% vidéo, vient de battre des records de viralité avec les images choquantes d'un homme noir passé à tabac par des policiers. [Lire la dépêche...]

Le coordinateur de l'UE pour la lutte contre le terrorisme Gilles de Kerchove lors d'un entretien à l'AFP à Bruxelles le 25 novembre 2020Les jeux en ligne peuvent servir à propager des idéologies extrémistes et même à préparer des attentats, alerte le coordinateur de l'UE pour la lutte contre le terrorisme Gilles de Kerchove dans un entretien à l'AFP, prônant une réponse européenne. [Lire la dépêche...]

Amazon Web Services (AWS), la filiale d'Amazon spécialisée dans les services de cloud à la demande pour les entreprises et particuliers, connaît une panne technique aux Etats-UnisAmazon Web Services (AWS), la filiale d'Amazon spécialisée dans les services de cloud à la demande pour les entreprises et particuliers, connaissait mercredi une panne technique, selon un avis posté sur son site internet. [Lire la dépêche...]

TikTok a jusqu'au 4 décembre pour vendre ses actifs américainsL'administration Trump a de nouveau accordé mercredi un délai supplémentaire d'une semaine à ByteDance, propriétaire chinois de l'application de vidéos légères TikTok, pour faire passer ses activités aux Etats-Unis sous pavillon américain. [Lire la dépêche...]

Les élections américaines sont un terrain miné pour Facebook, le réseau social déterminé à prouver qu'il est devenu un acteur responsable du processus démocratiqueL'élection américaine est passée, la transition avec le nouveau président timidement amorcée, mais cette période de tensions post-électorales a mis en évidence le problème des "super propagateurs" de désinformation sur Facebook, ces comptes qui amplifient des rumeurs infondées sur des fraudes électorales organisées par les démocrates. [Lire la dépêche...]

Toutes les dépêches AFP
AgendaIT

Salesforce convie ses utilisateurs et partenaires à sa conférence annuelle Dreamforce dans un format 2020 100% online et gratuit avec deux temps forts : dès le 2 décembre pour le keynote de Marc Benioff et du 14 au 17 décembre pour DreamTX, 4 jours d'ateliers et de démonstrations. En revanche pas de sessions de formation et de certification cette année. Organisé par Salesforce.

DREAMFORCE TO YOU : DREAMTX

Salesforce convie ses utilisateurs et partenaires à sa conférence annuelle Dreamforce dans un format 2020 100% online et gratuit avec deux temps forts : pour le keynote de Marc Benioff et du 14 au 17 décembre pour DreamTX, 4 jours d'ateliers et de démonstrations. En revanche pas de sessions de formation et de certification cette année. Organisé par Salesforce.

FIC

FIC FIC
Ayant pour thème cette année "Pour une cybersécurité coopérative et collaborative", le Forum International de la Cybersécurité occupe les 6, 7 et 8 avril 2021 le Grand Palais de Lille. Organisé par la Région Hauts-de-France et Euratechnologies, la Gendarmerie Nationale et CEIS.

READY FOR IT

La nouvelle édition de Ready For IT se déroule du 17 au 19 mai 2021 à Monaco (Grimaldi Forum) : conférences, keynotes, ateliers et rendez-vous one-to-one. Organisé par DG Consultants.
RSS
hardcore black fuck
Voir tout l'AgendaIT