Gestion de l'information : Structurer le non structuré !

La gestion de l’information s’est imposée depuis dix ans comme un pan important de la transformation numérique des entreprises. Comment satisfaire un client si vous ne le connaissez pas finement par des informations fiables à partir de différentes données, elles aussi, de qualité ? C’est pourquoi le secteur est devenu stratégique et dépasse la simple gestion documentaire du début de ce siècle. Les entreprises produisent de plus en plus de contenu sous des formes variées allant du simple fichier Word aux vidéos ou fichiers audio. Le premier rôle des outils de gestion de l’information est de regrouper et collecter l’ensemble de ces éléments pour les mettre à disposition du plus grand nombre dans l’entreprise en dépassant les silos créés par les différents registres existants ou nouveaux comme ceux accompagnant l’utilisation d’applications sous forme de services. Un autre but visé par les outils de gestion de l’information est d’appuyer de nouveaux processus numériques ou de nouvelles activités qui reposent sur le contenu présent dans l’entreprise ou à l’extérieur de l’entreprise. De plus, ces nouveaux outils renouvellent l’espace de travail des salariés habitués désormais à des interfaces utilisateurs ou des logiciels grand public largement disséminés dans les foyers qui apportent de nouvelles possibilités d’interagir avec des documents. De nombreux logiciels comme ceux de Dropbox, Box ou d’autres logiciels collaboratifs apportent ce genre de fonctions. Que les systèmes soient adaptés pour des secteurs verticaux ou généralistes, de grandes tendances se dégagent autour des logiciels. Pour gérer le volume, la plupart des solutions se tournent vers le Cloud et profitent des possibilités de partage que le Cloud peut offrir. Cela permet de plus de dépasser les limites de taille des fichiers dans les systèmes de messageries classiques ou sur les systèmes traditionnels de «file and share». Les entreprises sont de moins en moins réticentes à placer des données dites «sensibles» dans le Cloud, ce qui profite aux acteurs du marché qui ont développé une solution en SaaS ou proposant une forte gouvernance des informations ou d’importantes fonctions de sécurité.

Des interfaces simples de type grand public

Autre tendance importante, l’ajout d’éléments d’Intelligence artificielle ou d’apprentissage machine dans les logiciels pour automatiser la classification des documents, augmenter la productivité et automatiser certains processus ou scénarios d’utilisation. La plupart des outils de gestion de l’information ont revu leur interface utilisateur non seulement pour satisfaire les utilisateurs mais aussi pour apporter une certaine consistance lors de l’utilisation en mobilité ou dans l’espace de travail habituel. Ces nouvelles interfaces ont de plus l’avantage d’accélérer l’adoption de ces outils par les utilisateurs du fait de leur simplicité d’usage comparable à ce que peuvent trouver les employés dans des applications plus grand public. L’autre aspect de cette tendance est d’apporter rapidement une valeur métier avec des applications préconçues ou développées dans des environnements Low Code/No Code. Les plates-formes actuelles ajoutent pour beaucoup des fonctions collaboratives ou de partage de documents afin d’accélérer la diffusion de l’information dans l’entreprise. C’est également une des grandes tendances dans les intranets des entreprises afin de fournir aux employés les informations nécessaires à leur travail. Dernière tendance importante, la sécurité devient embarquée directement dans les plates-formes sous différents aspects. Tout d’abord la gestion des identités et des accès aux documents devient une fonction quasi évidente. Certaines plates-formes ajoutent des fonctions de DLP (Data Loss Protection), de chiffrement des documents, de gestion du caractère personnel des données et des règles de gouvernance des documents. Ces différentes fonctions visent à la fois à se protéger des attaques mais aussi à répondre aux évolutions réglementaires de plus en plus fréquentes. Les différents stades de la transformation numérique et la gestion de l’information.

Une verticalisation accrue

Pour accélérer la mise en œuvre, les plates-formes proposent des packages préconçus pour divers secteurs d’activité. D’ailleurs on constate une certaine spécialisation et une diversification du marché avec des outils spécifiques par exemple pour les laboratoires pharmaceutiques ou les instituts de sous-traitance de recherche cliniques, le secteur public, la finance, la santé, les assurances, l’énergie… Il est possible d’ailleurs de distinguer différentes catégories dans les systèmes de gestion d’information : gestion des documents, gestion des informations produits ou PIM, la gestion des informations en mobilité ou MIM… En dehors d’éditeurs généralistes qui dominent le marché de la gestion des informations d’entreprises, de nombreux acteurs se concentrent sur de telles niches avec une forte connaissance métier et des fonctionnalités totalement adaptées.

Une étude sur les tendances des participants à Documation

Archimag a réalisé une étude sur les tendances des participants au salon Documation et comment ils voyaient le marché. Selon eux, 2019 a été un bon cru, bien meilleur que 2018. Leur enthousiasme ne se tempère pas et majoritairement ils pensent que le marché est favorable. À 73%, le secteur va recruter et 21% des personnes interrogées indiquent avoir des projets de croissance externe; 39% souhaitent se développer en Europe ou dans diverses parties du monde. Les autres visent des partenariats technologiques ou commerciaux. Les principaux axes de développement sont le Cloud, la dématérialisation et l’offre de services et de conseils. L’Intelligence artificielle ne vient qu’en 4ème position. Si la transformation digitale et l’innovation restent les deux priorités d’investissement, les API et la gouvernance de l’information suivent juste derrière, loin devant la conformité ou la sécurité. L’impact des grèves de fin d’année a été léger et les répondants sont enthousiastes pour les années à venir. Pour les technologies, les tendances sont assez marquées avec la progression du RPA avec les ETI et les PME qui commencent à s’équiper. La signature électronique est une autre tendance perçue par Archimag que ce soit par des solutions classiques ou de blockchain. On peut corréler ce dernier point avec la mise en avant de la sécurité des données et de l’information. Vient enfin la gestion des actifs multimédias.

Gestion des documents : la collaboration s'affirme

On parlait jusqu’à présent de gestion documentaire ou de plates-formes de services de contenus. La grande tendance aujourd’hui est plutôt de définir le marché comme celui des plates-formes collaboratives de contenus. Selon le Gartner, le marché va rapidement croître jusqu’en 2022 pour les plates-formes alliant services de contenus et collaboration : 20% des entreprises devraient avoir déployé ce type de plate-forme à la même date. La croissance déclinerait ensuite pour rejoindre celle du marché des plates-formes plus classiques, soit 8% par an. Quatre grands acteurs dominent. Microsoft, Hyland, OpenText et IBM sont les éditeurs distingués par le cabinet d’analystes américains. OpenText domine ce lot avec sa présence sur le Cloud et sa capacité à devenir une véritable plate-forme à l’image d’un backbone pour gérer l’ensemble des contenus de l’entreprise. Hyland suit derrière. Moins connu en Europe qu’aux États-Unis, l’éditeur profite de l’acquisition de Brainware et de ses fonctions d’Intelligence artificielle. La couverture fonctionnelle est moins large que celle d’OpenText. L’éditeur travaille sur l’ouverture de sa plateforme par des API (REST). Microsoft complète le podium avec la forte présence de Sharepoint. Il manque cependant des applications plus verticalisées du produit pour devenir un solide leader du secteur. Les fonctions de suivi du cycle de vie du document et les fonctions collaboratives lui permettent cependant de figurer parmi les solutions les plus utilisées dans le monde. IBM complète les grands acteurs du secteur et peut s’appuyer sur une large base installée provenant de FileNet et Datacap, deux acquisitions antérieures dans le domaine. La gestion de l’information d’IBM apporte un support à sa technologie Watson. Depuis peu IBM propose ce service sur son propre Cloud.

La collaboration s’installe

Si 2019 a été l’année de la conversion au SaaS par la majorité des éditeurs dans le secteur, 2020 devrait être celle de la mise en œuvre de fonctions collaboratives ou de partage des documents de manière plus simple. Ces fonctions vont être embarquées directement dans la plate-forme ou offertes par des partenariats avec des outils spécialisés comme Slack, Box, Dropbox ou des «drives». Peu d’outils permettent cependant de collaborer en temps réel sur un document partagé. Des fonctions comme Paper, chez Dropbox, s’en approchent mais pour l’ensemble les échanges et la collaboration restent asynchrones avec de multiples échanges autour du document ou du workflow, qui sous-tend l’utilisation du document. OpenText conserve sa place de leader dans la gestion documentaire.

La généralisation de l’Intelligence artificielle

Autre point marquant pour les évolutions des plates-formes de gestion des documents, le recours à l’Intelligence artificielle. L’apprentissage machine se généralise et prend plusieurs formes. Tout d’abord ces technologies sont utilisées pour comprendre comment et par qui sont utilisés les documents. Le deuxième aspect de l’utilisation de ces technologies avancées est l’automatisation dans le but d’augmenter la productivité. Les tâches récurrentes peuvent ainsi être traitées par un robot (RPA ou robot Process Automation) ce qui permet de dégager du temps pour les salariés afin de s’occuper de tâches à plus forte valeur ajoutée (Case Management par exemple). Au bilan, longtemps vu comme un projet un peu accessoire, la gestion des documents devient un élément important dans les plans de transformation numérique des entreprises en proposant d’apporter les bonnes informations au bon moment à la bonne personne pour que cette dernière exécute son travail de manière optimale.

Gestion de données : la base d'une bonne information

Le mot «donnée» est souvent employé, à tort, pour «information» et vice versa. Il y a cependant des différences même si l’une ne fonctionne pas bien sans l’autre. Les données sont des données brutes, non analysées, non organisées, non liées, non interrompues, utilisées pour obtenir des informations après l’analyse. Tandis que, l’information est perceptible, interprétée comme un message d’une manière particulière, qui donne un sens aux données. Sans les données pas d’information, il convient donc de bien agencer les données pour pouvoir en tirer des informations pertinentes. Chaque jour, les collaborateurs d’une entreprise perdent une heure à rechercher les bonnes données pour obtenir l’information dont ils ont besoin. Une étude réalisée pour le compte de Veritas en 2019 estimait que cela coûtait aux entreprises 1,3 million d’euros en moyenne du fait de défaillances dans le système de gestion des données. Les entreprises interrogées indiquent que la difficulté à venir à bout de ces problèmes affecte leur prise de décisions stratégiques (19%), leur agilité (29%) et leur compétitivité sur leur marché (25%). Un quart a même noté une diminution de ses revenus et 27% parlent de mécontentement de leur clientèle. Ces chiffres n’incluent pas les problèmes que peuvent rencontrer les entreprises face à différentes réglementations en cas de ces mêmes défaillances. Les différents éléments de la gouvernance des données.

De multiples acteurs

De la collection des données à leurs analyses pour apporter de l’information, il existe de nombreuses solutions. Seules quelques-unes proposent la gestion de l’ensemble du cycle de vie de la donnée. L’annexion des termes gestion des données par les industriels du stockage ajoute encore plus à cette confusion autour de la notion même de gestion des données, qui représente l’ensemble des outils, pratiques et architectures techniques permettant d’accéder ou d’utiliser les données sur l’ensemble des sujets et sur l’ensemble des types de données pour satisfaire aux besoins des applications et des processus métier dans les entreprises. Les solutions sur le marché proviennent donc de multiples sources, des spécialistes de la donnée ou de l’analytique aux spécialistes de l’intégration de ces données ou tout simplement des solutions pour conserver et stocker ces données.

Des défis importants à surmonter

Le premier défi de la gestion des données est le volume qui ne ces se d’augmenter au fil des années. Le volume des données devrait atteindre des Zettaoctets ou des Exaoctets d’ici à 2025, soit des volumes principalement constitués de données non structurées – hors des bases de données de l’entreprise. Les solutions continuent leur migration vers des offres cloud qui permettent d’atteindre le niveau de capacité nécessaire pour stocker et gérer ce volume. Comme dans la gestion de l’information, le recours à l’Intelligence artificielle pour automatiser est à son début, mais progresse rapidement. La plupart des solutions actuelles embarquent ce type de fonction.

Intégration de données : pour des informations riches !

Pour beaucoup, les données résident dans de multiples silos et référentiels différents, et sous des formats différents. Que ce soit manuellement ou par des outils, il est difficile de tirer des informations pertinentes de ce magma indistinct. L’intégration de données permet à la fois d’uniformiser les données mais aussi d’enrichir les données existantes dans l’entreprise. En termes simples, l’intégration de données consiste à combiner, nettoyer et présenter des données sous une forme unifiée. Cela implique de rassembler des données provenant d’une grande variété de systèmes source avec des formats variés, de supprimer les doublons, de nettoyer les données en fonction de règles métier et de les transformer au format requis. Le terme couvre également divers domaines de la gestion de données volumineuses, tels que la migration de données, l’intégration d’applications et la gestion de données maîtres. Des outils sans code aident les utilisateurs professionnels à accéder à leurs réserves de données volumineuses en temps réel et à parcourir leurs réserves de données et leurs référentiels pour obtenir plus rapidement des informations décisionnelles. L’intégration de données a beaucoup évolué. Si des outils comme l’ETL (Extract Transform Load) sont toujours présents, ils évoluent et la tendance est aujourd’hui à l’ELT (Extract Load Transform). Fivetran, une start-up américaine, est emblématique de cette tendance qui répond à différents cas d’usages comme la consolidation de données, l’amélioration des analyses, ou pour migrer des données dans le Cloud. La solution permet d’intégrer des données de plus d’une centaine de sources différentes.

Comprendre la data gravity

La plupart des entreprises ne peuvent suivre la vitesse à laquelle les données sont générées et doivent gérer des données en provenance de multiples sources qu’il est difficile de migrer ou d’utiliser efficacement. Les entreprises tenteront donc de remédier au problème de Data Gravity en approchant leurs applications des sources de données. Une vue du data pipeline de Saagie.

Vers la Data Fabric

La Data Fabric est un nouveau type de plate-forme qui procure un écosystème complet pour la gestion de données, de l’extraction au traitement, en passant par la consommation des données. Elle vient se placer à l’intersection des plates-formes de Data Science, de Data Management et du Datalake. Tout est ainsi rassemblé au même endroit. Ce regroupement permet d’offrir un accès facile et rapide aux données pour tous les profils. Les profils métier peuvent ainsi exploiter les solutions mises en place sans se soucier de la technique. Quant aux profils techniques, ils trouvent une plate-forme compatible avec n’importe quel langage qui leur permettra de développer facilement. Pour beaucoup, cette technologie représente l’avenir de la gestion des données et autorise l’ouverture des données vers les métiers. De plus, l’ensemble du processus d’intégration de données réside dans la plateforme. Talend, MapR ou le Français Saagie sont des solutions s’appuyant sur ce concept pour démocratiser à la fois une culture des données en entreprise et simplifier l’architecture nécessaire pour mettre à disposition les données dans l’entreprise.