X
News Partenaire
Les solutions de surveillance réseau

Ce que vous devez savoir sur les solutions de surveillance des infrastructures informatiques des PME. [Lire l'article...]

Data Scientist : une espèce déjà en voie de disparition ?

Ces têtes chercheuses très demandées qui doivent combiner des connaissances statistiques, en développement de scripts logiciels, mais surtout des connaissances sur le métier de l’entreprise, occupent pourtant près de 60 % de leur temps à nettoyer ou à préparer des jeux de données avant même de pouvoir tester leurs algorithmes apportant la valeur à l’entreprise. Au vu de leurs salaires, certains commencent à se dire que ces étapes pourraient être réalisées par d’autres beaucoup moins cher, voire directement par des logiciels ou des machines auto-apprenantes.

Ils sont les nouveaux héros de l’économie de l’information. Gartner en avait fait le métier le plus sexy du XXIe siècle. Plus récemment, le cabinet Glassdoor l’a listé parmi les 25 métiers les plus recherchés. Data scientist est un des titres les plus enviés du moment, comme une sorte d’idéal alliant à la fois l’intelligence et la créativité et des connaissances scientifiques de haut niveau. Souvent qualifiés de moutons à 5 pattes, ils restent rares et très demandés.

Sur 4,4 millions d’emplois proposés en 2015, seulement 40 % ont été pourvus. En France pour la même année, c’est la moitié des postes qui n’ont pas trouvé preneurs. Ce manque pourrait même s’accentuer quand on sait que seules 20 % des entreprises utilisent les outils sur lesquels travaillent les data scientists. En 2018, il est estimé qu’il va manquer entre 140 000 et 190 000 spécialistes des données rien que pour les États-Unis.

Au passage, comme tout ce qui est rare est aussi cher, le data scientist bénéficie d’un salaire attrayant. En France, il peut toucher 35 000 € en début de carrière et gagner 65 000 € avec 5 ans d’expérience sans oublier près de 10 % de rémunération variable selon les entreprises et le secteur d’activité. On est loin des 120 000 $ proposé aux débutants aux États-Unis qui sont eux-mêmes bien loin du 1 % de rémunération sur les publicités de certains data scientists chez Google si leur algorithme permet d’augmenter le nombre de clics sur les adwords, selon les dires d’un ancien de la maison qui travaille désormais dans une entreprise faisant du partage de fichiers.

Des propositions de « next best actions »

Les acteurs du secteur ne s’y trompent pas et embarquent désormais des outils d’automatisation des tâches fastidieuses. Trifacta est une jeune entreprise qui s’est totalement dédiée à cette mission et propose une plate-forme qui réalise presque automatiquement ces différentes opérations. Datameer est un autre exemple d’une plate-forme offrant des opérations de préparation des données de manière automatique. Pentaho, un autre acteur acquis par Hitachi Data Systems, propose aussi des fonctions d’intégration de données. Ce ne sont que quelques exemples d’éditeurs dans ce domaine. D’autres veulent aller encore plus loin avec l’intégration dans leurs outils de logiciels de machine learning ou auto-apprenant.

L’idée sous-jacente est clairement de se passer de ces profils de haut niveau pour donner à de simples analystes des données ou à des employés avec des connaissances du métier de l’entreprise la possibilité d’avoir accès à des outils leur apportant les connaissances et les résultats apportés par ces logiciels d’aide à la décision. Einstein, la plate-forme de machine learning de Salesforce.com est de ce calibre et va rapidement être intégrée dans tous les Clouds de l’éditeur. Les vendeurs et marketeurs de tous poils vont avoir à disposition des fonctionnalités extrêmement puissantes pour prendre des décisions et surtout orienter ce qu’ils doivent faire ensuite avec des propositions de « next best actions ». Pega CRM, un autre logiciel, propose le même type d’actions mais en s’appuyant sur des règles.
Autre exemple, Watson d’IBM compile et analyse des millions de documents sur un sujet et devient le « Pic de la Mirandole » de l’oncologie ou de la cuisine chinoise et peut ainsi conseiller médecin ou chef cuisinier dans leurs traitements ou recettes et améliorer ces derniers.

Ne pas confondre Business Analyst et Data Scientist

À partir de là on peut s’interroger sur l’utilité pour beaucoup d’entreprises de l’embauche de spécialistes des données alors que de multiples outils vont leur apporter la possibilité d’avoir les résultats sans les inconvénients et les charges inhérentes à tout investissement dans des technologies analytiques impliquant le Big Data ou des analyses pointues sur certains modèles de données. Les Data Scientists vont-il alors disparaître avant même d’avoir connu leur réelle heure de gloire ?

La réponse à cette question est non. Ils vont toujours être aussi recherchés. Car les outils que nous venons de nommer ne s’adressent pas aux data scientists mais aux analystes métier qui sont dans un contexte très vertical ou bien défini : les ventes, le marketing, et pour certains cas précis, la prévision ou le scoring des opportunités sur lesquels peuvent s’appliquer des algorithmes standard et bien connus. Et encore, ce point n’est pas si évident et demande bien souvent des possibilités de personnalisation par l’entreprise. Ce sera bientôt la seule possibilité de différenciation, car quand tous les clients de Salesforce auront Einstein et l’utiliseront, quel sera l’avantage compétitif à secteur d’activité et algorithme égal ? Ce débat a déjà eu lieu lors de la montée en puissances des ERP où on se demandait quelle différenciateur pouvaient avoir deux entreprises ayant le même ERP.

Le data scientist est là pour développer les algorithmes qui vont s’appliquer aux jeux de données qui lui sont mis à disposition. Si sa valeur n’est pas dans les étapes préliminaires s’assurant de la qualité des données, le data scientist est nécessaire pour développer ces nouvelles applications analytiques et bien souvent il est le seul capable de tester et de comprendre le sens des résultats provenant de l’algorithme développé.

De nouveau, l’industrie réalise un abus de langage et se sert de mots-valises parfois dénués de sens pour nous faire prendre des vessies pour des lanternes. Ces nouveaux outils automatiques de préparation des données vont évidemment simplifier la vie des analystes métier et leur permettre d’utiliser de nouvelles technologies décisionnelles de manière simple. Mais ce ne sont pas des outils pour les data scientists, qui eux, comme des artisans, vont peaufiner inlassablement leurs scripts et jeux de données pour tester des algorithmes spécifiques. ❍

Chronique parue dans le n°151 de L'Informaticien (novembre 2016).


Inscription gratuite à la newsletter de L'Informaticien.

Noter cet article (de 1 = Nul à 5 = Excellent) Valider

Actuellement à la Une...
Dossier L'1FO

Solutions analytiques : quels besoins pour quels métiers ?

Poussées par la recherche de la productivité et les meilleurs résultats financiers, les entreprises sont de plus en plus dans une approche « Data Driven ». Les managers veulent des tableaux de bord temps réel de l’activité. Une exigence qui a fait émerger une nouvelle race de logiciels : la BI Agile.

Afficher tous les dossiers
Offres d'emploi
RSS
12345678910Last

Lancez votre recherche sur la rubrique Emploi avec notre partenaire



LIVRES BLANCS

Stockage Flash : 1 000 utilisateurs témoignent, un Livre Blanc HPE.

1 000 responsables informatiques ont été interrogés à l'initiative d'HPE afin de relater les "surprises", bonnes et mauvaises qu'ils ont rencontré lors du déploiement puis l'utilisation de solutions de stockage Flash. L'essentiel des configurations et des utilisations ont été passées en revue pour ce qui constitue la plus grande enquête jamais réalisée sur ce thème et qui permet à chacun de préparer au mieux sa propre voie d'évolution, ceci en évitant les écueils qu'ont pu rencontrer les professionnels interrogés. 


Gouvernance des identités et des accès, un Livre Blanc Micro Focus.  

Sous le joug des menaces informatiques et des réglementations rigoureuses qui lui sont imposées, votre entreprise a plus que jamais besoin d’instaurer une gouvernance des identités et des accès afin de se prémunir contre tout risque. Vous devez savoir précisément quels utilisateurs ont accès à quelles ressources et si leurs niveaux d’autorisation sont adéquats. 


Guide des meilleures pratiques de DevOps mainframe, un Livre Blanc Micro Focus.  

Souhaitez-vous distribuer de nouveaux services via des périphériques mobiles et le Web ? Rationaliser des processus pour remporter de nouvelles parts de marché ? Ou renforcer votre présence à l'échelle internationale ? Ou encore améliorer l'efficacité et la qualité du mainframe pour augmenter vos marges ? Les priorités peuvent sembler diverger, mais elles sont toutes réalisables. 


Sécurisation du cloud public, un Livre Blanc Fortinet.  

Un déploiement rapide, une réduction des coûts et une utilisation efficace des ressources ne sont que quelques-unes des raisons pour lesquelles les entreprises et les services informatiques du monde entier portent autant d’intérêt à Amazon Web Services. Avec un offre riche en fonctionnalités et une myriade de formats et d’options informatiques, de plus en plus d’entreprises sont attirées par cet univers où les termes agilité et flexibilité revêtent une nouvelle signification. 


Le cloud d'entreprise pour les nuls, un ebook offert par Nutanix

Découvrez comment :

1- Préparer votre entreprise à la nouvelle ère des infrastructures IT.

2- Bénéficier des avantages incontestées des clouds publics sans pour autant perdre le contrôle sur l'infrastructure interne.

3 - Exploiter les nouvelles bonnes pratiques en matière de stockage d'entreprise, de virtualisation et de technologies du cloud. 


Tous les Livres Blancs
Le Kiosque

LES ENJEUX DE LA 5G - Présidentielle : le numérique pour séduire les indécis - Lille Is French Tech - Comment l'Automatisation as a Service simplifie le quotidien - Foundation : le framework web front-end de Zurb - Solutions de sécurité Nex-Gen - Messageries sécurisées - Rencontre avec Benoît Thieulin, co-fondateur de la Netscouade (groupe Open)...

 

GESTION DES SERVICES IT / ITSM : la DSI face à ses multiples défis - Cyberdéfense : la France renforce son arsenal - Nantes Tech : on y joue collectif ! - Solutions analytiques : quels besoins pour quels métiers ? - Le BASIC se découvre une nouvelle jeunesse - Quelles compétences recherchent les ESN en 2017 ? - Rencontre avec Laurent Leloup, auteur de «Blockchain : la révolution de la confiance»...

 

Afficher tous les derniers numéros
Derniers commentaires
Fil AFP
Techno et Internet
Entrée de la Cour de justice de l'UE à Luxembourg le 5 octobre 2015La Cour de justice de l'UE a jugé illégal mercredi un lecteur multimédia commercialisé aux Pays-Bas qui permet d'accéder depuis un téléviseur à une multitude de sites internet proposant frauduleusement des films en streaming. [Sommaire]

Netflix a conclu un accord avec une filiale du groupe internet chinois Baidu, ce qui pourrait lui permettre de percer enfin en ChineNetflix a conclu un accord avec une filiale du groupe internet chinois Baidu, a annoncé mercredi cette dernière, ce qui pourrait permettre au service américain de vidéo en ligne de percer enfin en Chine, un énorme marché potentiel. [Sommaire]

Google va s'attaquer aux fausses informations et aux contenus inappropriés en changeant la manière dont le moteur de recherche livre et classe les recherches sur internetGoogle va s'attaquer aux fausses informations et aux contenus inappropriés en changeant la manière dont le moteur de recherche livre et classe les recherches sur internet, a annoncé mardi le géant américain. [Sommaire]

Uber a annoncé mardi une série de partenariats grâce auxquels il espère réaliser d'ici 2020 de premières démonstrations d'un système futuriste de transport à la demande utilisant de petits appareils aériensLe service américain de réservation de voitures avec chauffeur Uber a annoncé mardi une série de partenariats pour réaliser d'ici 2020 de premières démonstrations d'un système futuriste de transport à la demande utilisant de petits appareils aériens. [Sommaire]

La petite voiture signée Google au salon Viva de Paris, le 30 juin 2016Le groupe américain Alphabet, maison mère de Google, a donné un nouveau coup d'accélérateur à son programme de voitures sans chauffeur en annonçant mardi qu'il a commencé à tester ses véhicules avec de vrais passagers. [Sommaire]

Emmanuel Macron prononce un discours à PAris après avoir remporté le premier tour de la présidentielle, le 23 avril 2017Le mouvement En Marche! d'Emmanuel Macron, arrivé en tête du premier tour de l'élection présidentielle française dimanche, a été la cible de tentatives de hameçonnage ("phishing") attribué à un groupe russe en mars, selon un rapport présenté mardi par l'entreprise japonaise de cybersécurité Trend Micro. [Sommaire]

Centre de recherches et développement Sanofi Pasteur de Marcy-l'Etoile, près de Lyon, le 7 juillet 2016 Le crédit d'impôt recherche (CIR) "a un effet positif" sur les dépenses en recherche et développement des entreprises et y dope le nombre de chercheurs, selon un rapport remis au ministre de l'Enseignement supérieur et de la Recherche. [Sommaire]

Un Samsung Galaxy S8 présenté à Séoul le 13 avril 2017Le géant sud-coréen Samsung a annoncé lundi une prochaine mise à jour de logiciel pour les acheteurs de son tout nouveau Galaxy S8 après des plaintes de consommateurs concernant des écrans qui seraient teintés de rouge. [Sommaire]

Toshiba, englué dans une situation financière catastrophique, cherche à rétablir la confianceLe conglomérat industriel japonais Toshiba a annoncé lundi le placement de ses différentes activités dans autant de sociétés séparées, une mesure présentée comme un gage de meilleure gestion donné aux actionnaires. [Sommaire]

Peter Levachov a pu contrôler jusqu'à 100.000 ordinateurs grâce à des programmes malveillantsLa justice américaine a émis vendredi un acte d'accusation contre le pirate informatique russe Peter Levachov, arrêté en Espagne début avril et soupçonné d'avoir orchestré un vaste réseau de vol de données personnelles, selon le parquet fédéral du Connecticut. [Sommaire]

Toutes les dépêches AFP

AgendaIT

ADOBE SUMMIT

La conférence du marketing digital d'Adobe pour la région Europe Moyen-orient et Afrique se tient à Londres (ICC ExCeL) les 10 et 11 mai 2017. Organisée par Adobe.
A l'occasion de l'assemblée générale du CRIP et de l'assemblée générale de l'IMA, Fête de l'IT et du Digital le 11 mai 2017 au Pavillon Royal dans le Bois de Boulogne à Paris. Organisé par Itiforums.

JOOMLADAY

La rencontre annuelle  de la communauté francophone des utilisateurs du système de gestion de contenu (CMS open source Joomla a lieu les 12 et 13 mai 2017 à Marseille (école de commerce et de management EMD). Organisée par l'AFUJ (Association Française des Utilisateurs de Joomla).

INNOROBO

Sommet européen de la robotique, Innorobo 2017 se tient du 16 au 18 mai 2017 à Paris sur 3 halls d'exposition (aux Docks de Paris à La Plaine-Saint-Denis). Organisé par Impact Consulting.

WWDC17

Conférence développeurs d'Apple, la WWDC17 se tiendra du 5 au 9 juin 2017 à San José (McEnery Convention Center) en Californie. Organisée par Apple.

DATACLOUD EUROPE

Le congrès et exposition Datacloud Europe a lieu à Monaco (Grimaldi Forum) du 6 au 8 juin 2017. Organisé par BroadGroup.

FUTUR EN SEINE

Festival international, gratuit et ouvert à tous, dédié aux innovations technologiques, Futur en Seine tient sa 8ème édition du 8 au 10 juin 2017 à la Grande Halle de La Villette à Paris sur le thème des nouvelles intelligences. Organisé par Cap Digital et soutenu par la région Ile de France.
Voir tout l'AgendaIT