vendredi 9 décembre 2016
 
Pourquoi HPE 3PAR est la solution de référence (2ème partie)
Les plateformes de stockage Flash HPE 3PAR disposent de caractéristiques uniques et exceptionnelles qui en font la plateforme de référence pour mettre en œuvre rapidement, efficacement et à coût réduit des solutions de stockage qui améliorent l’efficacité du système d’information de l’entreprise. Dans cette seconde partie, examinons le rôle des puces ASIC, de la virtualisation et la gestion du cache. [Lire l'article...]

Data Scientist : une espèce déjà en voie de disparition ?

Ces têtes chercheuses très demandées qui doivent combiner des connaissances statistiques, en développement de scripts logiciels, mais surtout des connaissances sur le métier de l’entreprise, occupent pourtant près de 60 % de leur temps à nettoyer ou à préparer des jeux de données avant même de pouvoir tester leurs algorithmes apportant la valeur à l’entreprise. Au vu de leurs salaires, certains commencent à se dire que ces étapes pourraient être réalisées par d’autres beaucoup moins cher, voire directement par des logiciels ou des machines auto-apprenantes.

Ils sont les nouveaux héros de l’économie de l’information. Gartner en avait fait le métier le plus sexy du XXIe siècle. Plus récemment, le cabinet Glassdoor l’a listé parmi les 25 métiers les plus recherchés. Data scientist est un des titres les plus enviés du moment, comme une sorte d’idéal alliant à la fois l’intelligence et la créativité et des connaissances scientifiques de haut niveau. Souvent qualifiés de moutons à 5 pattes, ils restent rares et très demandés.

Sur 4,4 millions d’emplois proposés en 2015, seulement 40 % ont été pourvus. En France pour la même année, c’est la moitié des postes qui n’ont pas trouvé preneurs. Ce manque pourrait même s’accentuer quand on sait que seules 20 % des entreprises utilisent les outils sur lesquels travaillent les data scientists. En 2018, il est estimé qu’il va manquer entre 140 000 et 190 000 spécialistes des données rien que pour les États-Unis.

Au passage, comme tout ce qui est rare est aussi cher, le data scientist bénéficie d’un salaire attrayant. En France, il peut toucher 35 000 € en début de carrière et gagner 65 000 € avec 5 ans d’expérience sans oublier près de 10 % de rémunération variable selon les entreprises et le secteur d’activité. On est loin des 120 000 $ proposé aux débutants aux États-Unis qui sont eux-mêmes bien loin du 1 % de rémunération sur les publicités de certains data scientists chez Google si leur algorithme permet d’augmenter le nombre de clics sur les adwords, selon les dires d’un ancien de la maison qui travaille désormais dans une entreprise faisant du partage de fichiers.

Des propositions de « next best actions »

Les acteurs du secteur ne s’y trompent pas et embarquent désormais des outils d’automatisation des tâches fastidieuses. Trifacta est une jeune entreprise qui s’est totalement dédiée à cette mission et propose une plate-forme qui réalise presque automatiquement ces différentes opérations. Datameer est un autre exemple d’une plate-forme offrant des opérations de préparation des données de manière automatique. Pentaho, un autre acteur acquis par Hitachi Data Systems, propose aussi des fonctions d’intégration de données. Ce ne sont que quelques exemples d’éditeurs dans ce domaine. D’autres veulent aller encore plus loin avec l’intégration dans leurs outils de logiciels de machine learning ou auto-apprenant.

L’idée sous-jacente est clairement de se passer de ces profils de haut niveau pour donner à de simples analystes des données ou à des employés avec des connaissances du métier de l’entreprise la possibilité d’avoir accès à des outils leur apportant les connaissances et les résultats apportés par ces logiciels d’aide à la décision. Einstein, la plate-forme de machine learning de Salesforce.com est de ce calibre et va rapidement être intégrée dans tous les Clouds de l’éditeur. Les vendeurs et marketeurs de tous poils vont avoir à disposition des fonctionnalités extrêmement puissantes pour prendre des décisions et surtout orienter ce qu’ils doivent faire ensuite avec des propositions de « next best actions ». Pega CRM, un autre logiciel, propose le même type d’actions mais en s’appuyant sur des règles.
Autre exemple, Watson d’IBM compile et analyse des millions de documents sur un sujet et devient le « Pic de la Mirandole » de l’oncologie ou de la cuisine chinoise et peut ainsi conseiller médecin ou chef cuisinier dans leurs traitements ou recettes et améliorer ces derniers.

Ne pas confondre Business Analyst et Data Scientist

À partir de là on peut s’interroger sur l’utilité pour beaucoup d’entreprises de l’embauche de spécialistes des données alors que de multiples outils vont leur apporter la possibilité d’avoir les résultats sans les inconvénients et les charges inhérentes à tout investissement dans des technologies analytiques impliquant le Big Data ou des analyses pointues sur certains modèles de données. Les Data Scientists vont-il alors disparaître avant même d’avoir connu leur réelle heure de gloire ?

La réponse à cette question est non. Ils vont toujours être aussi recherchés. Car les outils que nous venons de nommer ne s’adressent pas aux data scientists mais aux analystes métier qui sont dans un contexte très vertical ou bien défini : les ventes, le marketing, et pour certains cas précis, la prévision ou le scoring des opportunités sur lesquels peuvent s’appliquer des algorithmes standard et bien connus. Et encore, ce point n’est pas si évident et demande bien souvent des possibilités de personnalisation par l’entreprise. Ce sera bientôt la seule possibilité de différenciation, car quand tous les clients de Salesforce auront Einstein et l’utiliseront, quel sera l’avantage compétitif à secteur d’activité et algorithme égal ? Ce débat a déjà eu lieu lors de la montée en puissances des ERP où on se demandait quelle différenciateur pouvaient avoir deux entreprises ayant le même ERP.

Le data scientist est là pour développer les algorithmes qui vont s’appliquer aux jeux de données qui lui sont mis à disposition. Si sa valeur n’est pas dans les étapes préliminaires s’assurant de la qualité des données, le data scientist est nécessaire pour développer ces nouvelles applications analytiques et bien souvent il est le seul capable de tester et de comprendre le sens des résultats provenant de l’algorithme développé.

De nouveau, l’industrie réalise un abus de langage et se sert de mots-valises parfois dénués de sens pour nous faire prendre des vessies pour des lanternes. Ces nouveaux outils automatiques de préparation des données vont évidemment simplifier la vie des analystes métier et leur permettre d’utiliser de nouvelles technologies décisionnelles de manière simple. Mais ce ne sont pas des outils pour les data scientists, qui eux, comme des artisans, vont peaufiner inlassablement leurs scripts et jeux de données pour tester des algorithmes spécifiques. ❍

Chronique parue dans le n°151 de L'Informaticien (novembre 2016).


Inscription gratuite à la newsletter de L'Informaticien.

Noter cet article (de 1 = Nul à 5 = Excellent) Valider

Actuellement à la Une...

Le Kiosque

RÉALITÉ VIRTUELLE : Ce que vous pouvez en attendre - ESPORT : l'informatique derrière le phénomène planétaire - Windows et Android, les meilleurs ennemis - Les promesses de Java 9 - OpenStack : une plateforme Cloud mature mais ambiguë - Shopping Tech : coups de coeur pour Cubetto, Orbi et Thingz...

 

UN FUTUR SANS WINDOWS ? : Comment les entreprises s'émancipent peu à peu - Vendée Globe : l'informatique hors-normes - Ces SSII et ESN où il ne fait pas bon être informaticien - "Il faut un ministère du Numérique" (Bertrand Diard, président de Tech In France)...

 

Afficher tous les derniers numéros




/// LIVRES BLANCS

Détecter & supprimer les menaces avancées, un Livre Blanc Malwarebytes. 

Ce livre blanc présente les stratégies que doivent employer les entreprises dans l'ensemble des composants de leur système d'information afin de se prémunir contre les APT (Advanced Persistent Threats) qui sont aujourd'hui de plus en plus dangereuses et peuvent causer des dégâts considérables à l'entreprise. 


Malwarebytes : un acteur de référence dans l'APT, un Livre Blanc Malwarebytes. 

Créée en 2008, Malwarebytes a démarré l’activité Entreprises en 2012 avec la solution Endpoint Security.

En moins de 4 années, Malwarebytes est devenu un acteur incontournable du marché des applications de nouvelle génération dans la protection des terminaux.


La technologie des firewalls doit évoluer avec l’entreprise sans frontières, un Livre Blanc Fortinet.
MENACES ÉVOLUTIVES : CHANGEMENT DES ATTENTES ENVERS LES SOLUTIONS DE FIREWALL D’ENTREPRISE
Les solutions de firewall d'entreprise (Enterprise Firewall) doivent être sans frontières, comme l’entreprise.  


Tous les Livres Blancs


/// L'agenda des événements IT
L'International Consumer Electronics Show (International CES) se tient du 5 au 8 janvier 2017 à Las Vegas (LVCC, Westgate, Renaissance, Sands/Venetian,...). C'est le plus grand salon mondial professionnel dédié aux technologies grand public : 3600 exposants et 150000 visiteurs attendus. Organisé par la CTA (Consumer Technology Association).

Le 9ème Forum International de la Cybersécurité occupe les 24 et 25 janvier 2017 le Grand Palais de Lille. Organisé par la Région Nord-Pas de Calais et Euratechnologies, la Gendarmerie Nationale et CEIS.

Le congrès mondial de la mobilité (MWC) se tient à Barcelone  du 27 février au 2 mars 2017. Organisé par GSMA Association.

Pour sa 5ème édition, la rencontre d'affaires Mobilité et Digital a pour cadre à nouveau Monaco (Grimaldi Forum) du 7 au 9 mars 2017. Organisée par Comexposium.

Le CeBIT, plus grand salon européen de l'IT, a lieu du 20 au 24 mars 2017 à Hanovre (Allemagne). Organisé par Deutsche Messe.

Salon des nouvelles technologies et usages du virtuel (réalité virtuelle et augmentée), Laval Virtual se tient du 22 au 26 mars 2017 à Laval (salle polyvalente, place de Hercé). Organisé par l'association Virtual Laval.

Voir tout l'agenda
Derniers commentaires