X
News Partenaire Paessler
Les solutions de surveillance réseau

Ce que vous devez savoir sur les solutions de surveillance des infrastructures informatiques des PME. [Lire l'article...]

Data Scientist : une espèce déjà en voie de disparition ?

Ces têtes chercheuses très demandées qui doivent combiner des connaissances statistiques, en développement de scripts logiciels, mais surtout des connaissances sur le métier de l’entreprise, occupent pourtant près de 60 % de leur temps à nettoyer ou à préparer des jeux de données avant même de pouvoir tester leurs algorithmes apportant la valeur à l’entreprise. Au vu de leurs salaires, certains commencent à se dire que ces étapes pourraient être réalisées par d’autres beaucoup moins cher, voire directement par des logiciels ou des machines auto-apprenantes.

Ils sont les nouveaux héros de l’économie de l’information. Gartner en avait fait le métier le plus sexy du XXIe siècle. Plus récemment, le cabinet Glassdoor l’a listé parmi les 25 métiers les plus recherchés. Data scientist est un des titres les plus enviés du moment, comme une sorte d’idéal alliant à la fois l’intelligence et la créativité et des connaissances scientifiques de haut niveau. Souvent qualifiés de moutons à 5 pattes, ils restent rares et très demandés.

Sur 4,4 millions d’emplois proposés en 2015, seulement 40 % ont été pourvus. En France pour la même année, c’est la moitié des postes qui n’ont pas trouvé preneurs. Ce manque pourrait même s’accentuer quand on sait que seules 20 % des entreprises utilisent les outils sur lesquels travaillent les data scientists. En 2018, il est estimé qu’il va manquer entre 140 000 et 190 000 spécialistes des données rien que pour les États-Unis.

Au passage, comme tout ce qui est rare est aussi cher, le data scientist bénéficie d’un salaire attrayant. En France, il peut toucher 35 000 € en début de carrière et gagner 65 000 € avec 5 ans d’expérience sans oublier près de 10 % de rémunération variable selon les entreprises et le secteur d’activité. On est loin des 120 000 $ proposé aux débutants aux États-Unis qui sont eux-mêmes bien loin du 1 % de rémunération sur les publicités de certains data scientists chez Google si leur algorithme permet d’augmenter le nombre de clics sur les adwords, selon les dires d’un ancien de la maison qui travaille désormais dans une entreprise faisant du partage de fichiers.

Des propositions de « next best actions »

Les acteurs du secteur ne s’y trompent pas et embarquent désormais des outils d’automatisation des tâches fastidieuses. Trifacta est une jeune entreprise qui s’est totalement dédiée à cette mission et propose une plate-forme qui réalise presque automatiquement ces différentes opérations. Datameer est un autre exemple d’une plate-forme offrant des opérations de préparation des données de manière automatique. Pentaho, un autre acteur acquis par Hitachi Data Systems, propose aussi des fonctions d’intégration de données. Ce ne sont que quelques exemples d’éditeurs dans ce domaine. D’autres veulent aller encore plus loin avec l’intégration dans leurs outils de logiciels de machine learning ou auto-apprenant.

L’idée sous-jacente est clairement de se passer de ces profils de haut niveau pour donner à de simples analystes des données ou à des employés avec des connaissances du métier de l’entreprise la possibilité d’avoir accès à des outils leur apportant les connaissances et les résultats apportés par ces logiciels d’aide à la décision. Einstein, la plate-forme de machine learning de Salesforce.com est de ce calibre et va rapidement être intégrée dans tous les Clouds de l’éditeur. Les vendeurs et marketeurs de tous poils vont avoir à disposition des fonctionnalités extrêmement puissantes pour prendre des décisions et surtout orienter ce qu’ils doivent faire ensuite avec des propositions de « next best actions ». Pega CRM, un autre logiciel, propose le même type d’actions mais en s’appuyant sur des règles.
Autre exemple, Watson d’IBM compile et analyse des millions de documents sur un sujet et devient le « Pic de la Mirandole » de l’oncologie ou de la cuisine chinoise et peut ainsi conseiller médecin ou chef cuisinier dans leurs traitements ou recettes et améliorer ces derniers.

Ne pas confondre Business Analyst et Data Scientist

À partir de là on peut s’interroger sur l’utilité pour beaucoup d’entreprises de l’embauche de spécialistes des données alors que de multiples outils vont leur apporter la possibilité d’avoir les résultats sans les inconvénients et les charges inhérentes à tout investissement dans des technologies analytiques impliquant le Big Data ou des analyses pointues sur certains modèles de données. Les Data Scientists vont-il alors disparaître avant même d’avoir connu leur réelle heure de gloire ?

La réponse à cette question est non. Ils vont toujours être aussi recherchés. Car les outils que nous venons de nommer ne s’adressent pas aux data scientists mais aux analystes métier qui sont dans un contexte très vertical ou bien défini : les ventes, le marketing, et pour certains cas précis, la prévision ou le scoring des opportunités sur lesquels peuvent s’appliquer des algorithmes standard et bien connus. Et encore, ce point n’est pas si évident et demande bien souvent des possibilités de personnalisation par l’entreprise. Ce sera bientôt la seule possibilité de différenciation, car quand tous les clients de Salesforce auront Einstein et l’utiliseront, quel sera l’avantage compétitif à secteur d’activité et algorithme égal ? Ce débat a déjà eu lieu lors de la montée en puissances des ERP où on se demandait quelle différenciateur pouvaient avoir deux entreprises ayant le même ERP.

Le data scientist est là pour développer les algorithmes qui vont s’appliquer aux jeux de données qui lui sont mis à disposition. Si sa valeur n’est pas dans les étapes préliminaires s’assurant de la qualité des données, le data scientist est nécessaire pour développer ces nouvelles applications analytiques et bien souvent il est le seul capable de tester et de comprendre le sens des résultats provenant de l’algorithme développé.

De nouveau, l’industrie réalise un abus de langage et se sert de mots-valises parfois dénués de sens pour nous faire prendre des vessies pour des lanternes. Ces nouveaux outils automatiques de préparation des données vont évidemment simplifier la vie des analystes métier et leur permettre d’utiliser de nouvelles technologies décisionnelles de manière simple. Mais ce ne sont pas des outils pour les data scientists, qui eux, comme des artisans, vont peaufiner inlassablement leurs scripts et jeux de données pour tester des algorithmes spécifiques. ❍

Chronique parue dans le n°151 de L'Informaticien (novembre 2016).


Inscription gratuite à la newsletter de L'Informaticien.

Noter cet article (de 1 = Nul à 5 = Excellent) Valider

Actuellement à la Une...
Enquête Express Présidentielle
Parmi les candidats à l'élection présidentielle quel est celui qui accorde selon vous le plus d'importance au numérique, à l'IT et à la high tech dans son programme et les réformes envisagées ?











Voter  Afficher les résultats
Votre vote, unique, reste confidentiel.
Dossier L'1FO

Sécurité SI : 4 menaces à la loupe

Les cybercriminels possèdent bien souvent une longueur d’avance sur les solutions technologiques de sécurité. Sensibiliser les collaborateurs à certaines bonnes pratiques constitue donc une mesure préventive incontournable face aux ransomwares, à l’ingénierie sociale ou aux APT.

Afficher tous les dossiers
Offres d'emploi
RSS
12345678910Last

Lancez votre recherche sur la rubrique Emploi avec notre partenaire



LIVRES BLANCS

Visualisation et gestion des projets et des connaissances avec MindManager Enterprise et Microsoft SharePoint, un Livre Blanc Mindjet-Corel.

Découvrez dans ce Livre Blanc comment vous bénéficiez, en tant qu’utilisateur, de l’intégration entre MindManager Enterprise et Microsoft SharePoint. Deux des principaux domaines d’application sont mis en évidence : d’une part les maps d’informations, de navigation et de connaissances, et d’autre part les maps de gestion de projet avec des tâches SharePoint synchronisées. 

 


HPE 3PAR : Le stockage 100%  flash de référence, un Livre Blanc HPE.

Avec un volume de données augmentant de 40% par an dans l’ensemble des entreprises et une demande des utilisateurs de pouvoir y accéder depuis n’importe quel terminal (PC, tablettes, smartphones), les solutions Flash tendent à devenir incontournables. Découvrez dans ce livre blanc pourquoi HPE 3PAR est devenue la solution de référence pour les entreprises soucieuses de réaliser leur transformation numérique dans les meilleures conditions possibles.

 


Déployer rapidement un micro datacenter, un Livre Blanc Schneider Electric. 

Ce document traite de la mise en place d'améliorations réalistes au niveau de l'alimentation, du refroidissement des racks, de la sécurité physique, de la surveillance et de l'éclairage. Il se concentre sur les petites salles serveurs et succurscales de 10kW de charge informatique maximum.


Apporter des solutions aux préoccupations relatives à la cybersécurité
des plates-formes de surveillance à distance des datacenters
, un Livre Blanc Schneider Electric. 

Les services de surveillance à distance numérique permettent de surveiller et d'analyser en temps réel, les données des systèmes d'infrastructures physisques des datacenters.

Ce document décrit les aspects de sécurité clés liés au développement et à l'exploitation de plates-formes de surveillance à distance reposant sur le cloud qui protègent la confidentialité des données et la sécurité des systèmes d'infrastructures contre les attaquants. 


Le stockage flash au service des applications cloud, Un Livre Blanc PureStorage.

Le cloud computing transforme la façon dont les organisations développent et distribuent des applications. Les équipes de développement peuvent utiliser des clouds privés, publics ou hybrides afin de configurer rapidement de nouvelles infrastructures qui n'interfèrent pas avec les ressources ou opérations existantes. 


Tous les Livres Blancs
Le Kiosque

GESTION DES SERVICES IT / ITSM : la DSI face à ses multiples défis - Cyberdéfense : la France renforce son arsenal - Nantes Tech : on y joue collectif ! - Solutions analytiques : quels besoins pour quels métiers ? - Le BASIC se découvre une nouvelle jeunesse - Quelles compétences recherchent les ESN en 2017 ? - Rencontre avec Laurent Leloup, auteur de «Blockchain : la révolution de la confiance»...

 

CLOUD SOUVERAIN : mythes et réalités - Cas pratique : quand les données partent en balade... - Choisir sa solution d'Emailing - Apps mobiles : créez-les sans coder ! - Bootstrap : l'étincelle qui va faire briller vos sites Web - Rencontre avec Ludovic Le Moan (Sigfox) : "Il n'est pas possible d'ignorer la transformation sociale liée à l'IoT" - Les technos grand public qui vont percer en 2017...

 

Afficher tous les derniers numéros
Derniers commentaires
Fil AFP
Techno et Internet
Le candidat à la présidentielle du parti Les Républicains François Fillon avant l'Emission politique sur France 2 le 23 mars 2017 à ParisLa passe d'armes entre l'écrivain Christine Angot et le candidat LR à la présidentielle François Fillon dans l’Émission Politique connaît un grand succès sur les réseaux sociaux et divisait toujours samedi presse et commentateurs. [Sommaire]

La justice annule une décision interdisant les ventes d'iPhone6Un tribunal pékinois a annulé vendredi la décision d'une autorité administrative, qui avait reconnu Apple coupable d'avoir enfreint le brevet d'un fabricant local et avait enjoint l'américain de cesser la vente en Chine de son smartphone iPhone6. [Sommaire]

Un voyageur met son ordinateur dans son sac avant de s'envoler pour Londres à l'aéroport de Tunis le 25 mars 2017Fini les ordinateurs en cabine: l'interdiction imposée par les Etats-Unis et la Grande-Bretagne sur certains vols en provenance de pays arabes et de Turquie est entrée en vigueur samedi, au grand dam des voyageurs d'affaires et de certains parents. [Sommaire]

La star des Cavaliers LeBron James monte au panier contre les Lakers au Staples Center, le 19 mars 2017 à Los AngelesLa diffusion de matches de sport en direct reste le dernier domaine réservé pour les diffuseurs traditionnels, mais à l'heure des smartphones et du streaming, les choses pourraient bien basculer prochainement. [Sommaire]

La fronde des annonceurs publicitaires contre Google et sa filiale YouTube aura un impact financier pour le géant internet La fronde grandissante des annonceurs publicitaires contre Google et sa filiale de vidéo YouTube ne devrait pas avoir un impact financier suffisant pour ébranler le coeur d'activité du géant internet américain, mais elle pourrait remettre en question certaines pratiques sur le marché. [Sommaire]

Un enfant souffrant de malnutrition nourri par sa mère à l'hôpital de Baidoa, en Somalie, le 15 mars 2017Un jeune Français installé aux Etats-Unis et star des réseaux sociaux a réuni en quelques tweets 2 millions de dollars de dons pour affréter un avion chargé de nourriture vers la Somalie, menacée de famine par une grave sécheresse. [Sommaire]

Un visiteur du salon Grâce à la démocratisation de la réalité virtuelle (VR), les professionnels s'engouffrent sur le marché prometteur du divertissement: sports virtuels, jeux vidéo, cinéma et attractions, ces expérimentions en tous genres sont exposées jusqu'à dimanche au Salon Laval Virtual. [Sommaire]

La police israélienne a arrêté un adolescent juif soupçonné de dizaines de fausses alertes antisémites à la bombe dans le mondeLa police israélienne a annoncé jeudi l'arrestation d'un adolescent juif soupçonné de dizaines de fausses alertes antisémites à la bombe dans le monde, notamment aux Etats-Unis où une flambée de menaces a nourri les spéculations sur une montée de l'antisémitisme sous Donald Trump. [Sommaire]

Visite virtuelle de l'antique demeure de Néron à Rome, me 22 mars 2017C'est une visite virtuelle à couper le souffle, tellement réaliste qu'on pourrait presque sentir les odeurs de lavande... A Rome, les visiteurs peuvent désormais déambuler dans l'antique demeure de Néron et ses jardins, tels que l'empereur lui-même pouvait les admirer. [Sommaire]

La platine Technic SL-1200 présentée lors du Consumer electronic Show 2016 au Mandalay Bay Convention Center à Las Vegas (Nevada) le 5 janvier 2016Mythique série choyée des DJ du monde, les platines vinyle SL-1200 Technics sont de retour, prouvant un regain d'intérêt pour la haute-fidélité audio, à rebours de la pourtant récente tendance MP3. [Sommaire]

Toutes les dépêches AFP

AgendaIT

LAVAL VIRTUAL

Salon des nouvelles technologies et usages du virtuel (réalité virtuelle et augmentée), Laval Virtual se tient du 22 au 26 mars 2017 à Laval (salle polyvalente, place de Hercé). Organisé par l'association Virtual Laval.

ACCESSECURITY

AccesSecurity, salon méditerranéen de la sécurité globale, se tient à Marseille (Chanot) du 29 au 31 mars 2017. Organisé par Safim.

DOCUMATION

Congrès et exposition Documation et Data Intelligence Forum, deux événements pour réussir sa digitalisation, les 29 et 30 mars 2017  à Paris Porte de Versailles Hall 2.2. Organisé par Reed Expositions.

SIDO

La 3ème édition du SIdO, le Showroom de l’industrie IoT, aura lieu les 5 et 6 avril 2017 à la Cité Internationale de Lyon. Organisé par CObees.

DEVOXX

Devoxx France, la conférence pour les développeurs passionnés, tient sa 6ème édition du 5 au 7 avril 2017 à Paris au Palais de Congrès de la Porte Maillot. Organisée par Quantixx.

CYBER PAIX

« Construire la paix et la sécurité internationales de la société numérique », un colloque sur ce thème est organisé à l'Unesco les 6 et 7 avril 2017 à l'initiative de l'Anssi, en lien avec le ministère des Affaires étrangères et du Développement international. Organisé par l'Anssi avec l'agence Isobar.
La 9ème Journée Française des Tests Logiciels se tient à Montrouge (Beffroi) le 11 avril 2017. Organisée par le CFTL (Comité Français des Tests Logiciels).
Voir tout l'AgendaIT