Le monde du stockage connaît des évolutions rapides sous l’effet de deux adaptations majeures, le Cloud et l’intelligence artificielle sous toutes ses formes. Le premier demande une mise à niveau de la gestion et de la gouvernance des données, ainsi qu’un renforcement de la sécurité. La seconde tendance, face au volume de données nécessaires pour réaliser des fonctions d’IA, nécessite des performances et des latences, faisant des baies de stockage une infrastructure de choix pour conserver les données nécessaires et soutenir les manipulations des données. La plupart des fournisseurs axent d’ailleurs leur discours sur l’infrastructure de stockage nécessaire à cet effet. Tour d’horizon de ces tendances fortes qui structurent l’offre aujourd’hui. Article paru dans L'Informaticien n°227 (juin 2024).
Selon un rapport de Fortune Business Insights de mars dernier, le stockage dans le Cloud se porte bien, voire très bien. De 132 mds$ de chiftre d'affaires en 2024, celui-ci devrait atteindre 665 Mds$ en 2032. Le taux de croissance pondérée durant la susdite période serait de 22,4 %. Selon une étude plus ancienne de LogicMonitor's Cloud, 95 % des workdoads IT seront dans le Cloud dès 2025. Si cette vision de 2020 est optimiste, elle reflète cependant la tendance constatée dans les entreprises qui se numérisent à marche forcée avec pour corollaire une croissance rapide des données non ou semi-structurées provenant d'applications loT, d'intellgence artificielle, de collaboration... Cette tendance a été accélérée les années précédentes avec la pandémie de la Covid 19 et le recours du travail à distance.
« La grande différence aujourd’hui est le nombre d’endroits où les entreprises hébergent des données critiques. Cela est particulièrement évident si l’on considère l’utilisation accrue des applications SaaS. L'entreprise moyenne utilise plus de 200 applications SaaS, mais il existe très peu d'options disponibles pour fournir une protection des données capable d'évoluer pour protéger ces applications et fournir une restauration rapide et granulaire » a declaré Kim King, directeur marketing produit chez l'éditeur de logiciels de sauvegarde HYCU. Selon K.King, plus de 50 % des attaques ransomware réussies commencent par cibler les applications SaaS.
Le passage aux applications nativement Cloud
La proportion de workloads dans le nuage s'accompagne d'un vaste plan de migration des applications d'un environnement virtualisé vers les containers et les architectures reposant sur Kubernetes. Selon une étude de Dimensional Research pour Pure Storage, la majorité des nouvelles applications seront construites sur des plateformes cloud-natives au cours des cinq prochaines années, 80 % des personnes interrogées ont confirmé que toutes ou la plupart de leurs nouvelles applications seront créées dans des plateformes cloud-natives. Côté technologie, ils préfèrent la flexibilité du déploiement dans des environnements cloud hybrides, 86 % confirmant quils exécutent leur technologie cloud-native à la fois sur des clouds publics et privés. Plus de la moitié des organisations (58%) prévoient de migrer certaines de leurs charges de travail de VM vers Kubernetes, et 65 % d'entre elles prévoient de migrer des charges de travail de VM au cours des deux prochaines années. La quasi-totalité des répondants (98 %) exécutent des charges de travail à forte intensité de données sur des plateformes cloud-natives, avec des applications critiques comme des bases de données (72%), l'analytique (67 %) et des charges de travail Al/ML (54 %) étant construites sur Kubernetes.
Le passage à de nouveaux modes de consommation
Le recours au Cloud ou à un modèle s'appuyant sur celui du Cloud est aussi fortement poussé par les fournisseurs de stockage qui proposent à peu près tous désormais des pos-sibilités de souscriptions à un abonnement et de paiement à l'usage du stockage dans le nuage. Dell avec Apex, HPE avec Greenlake, NetApp avec l'adaptation d'ONTAP sur les principales plateformes des hyperscalers ne sont que des exemples de ce modèle qui permet à la fois aux entreprises de lisser leurs investissements en stockage et d'obtenir les avantages habituels de ce type d'infrastructures: agilité, évolutivité, accès à distance avec une robustesse et une longévité qui permet des rétentions de données sur un temps long.
Cependant, les entreprises ne choisissent pas qu'un seul fournisseur de stockage en ligne en adoptant une approche multicloud pour répondre à différents besoins, comme l'optimisation des coûts, la localisation des données ou des services spécialisés ou spécifiques à une industrie. Dans le même ordre d'idées, certaines entreprises, principalement celles ayant une forte régulation réglementaire, optent pour un modele hybride qui allie à la fois du stockage sur site ou dans un cloud privé et des données dans le Cloud public.
Cela autorise les entreprises à conserver un certain contrôle sur les données dites sensibles et les applications héritées qui ne sont pas dans le cloud tout en conservant pour les autres données la flexibilité et la mise à l’échelle du Cloud. Le point spécifique des contraintes réglementaires peut être clairement un frein dans la croissance du stockage en ligne. Les lois et règlements sur le respect de la vie privée, la confidentialité et la résilience demandée aux entreprises peuvent véritablement faire hésiter des entreprises à se rallier à des solutions dans le Cloud. De la même manière, les considérations autour de la sécurité des données inquiètent. Les entreprises, avec une compréhension parfois faible du modèle de responsabilité partagée sur les données, restent le plus souvent hésitantes quant à mettre certaines données dans le Cloud. Cependant, de nombreuses entreprises se rendent compte que la présence dans le Cloud améliore le plus souvent leur posture de sécurité et de résilience sur leur infrastructure de données.
Un secteur dominé par les hyperscalers
Dans le Cloud public, la question ne se pose même plus : les grands acteurs du Cloud dominent le marché loin devant les acteurs historiques du stockage. Le meilleur exemple est l’API S3 qui est devenue un standard de fait dans le stockage objet. La plupart des solutions de stockage objet aujourd’hui proposent une compatibilité avec S3, qu'il s'agisse de Cloudian, Scality, ou d'autres. Tous les acteurs du marché sont désormais présents sur ce segment de marché.
Le Cloud privé devrait conserver une croissance régulière dans les années à venir en raison du désir de contrôle et de confidentialité des données. Cependant, le Cloud hybride reste le modèle privilégié par les entreprises, car il apporte à la fois la flexibilité nécessaire pour les données et certaines applications, ainsi que le contrôle que l’on peut atteindre sur site ou dans le Cloud privé. En clair, les entreprises cherchent à associer le meilleur des différents mondes tout en conservant la visibilité et le contrôle de leur infrastructure de stockage des données. Cela peut se révéler complexe, et le manque de ressources spécialisées est un facteur de risque entraînant parfois l’externalisation de tout cela auprès de fournisseurs de services.
En termes de technologies, le stockage en bloc reste de loin majoritaire, mais le stockage de fichier (File Storage) connaît la plus forte croissance. Toutes les tailles d’entreprises sont concernées, avec une forte demande provenant des secteurs de la banque, de la finance et de la santé dans les grands comptes, ainsi qu'une demande généralisée de stockage en Cloud par les PME.
L’IA un miroir à deux faces
L’IA joue un double rôle dans le stockage, les offreurs visent à apporter l’infrastructure nécessaire pour soutenir les initiatives d’IA des entreprises, et l’utilisent dans leur système afin d'optimiser et d'automatiser les opérations de stockage.
Selon Guillaume Crapart, VP Global Channels chez Quantum, « l'élaboration d'un modèle d’IA performant repose sur la qualité, la quantité et la variété des données utilisées pour l’entrainer. En outre, l’utilisation de données générées par l'organisation elle-même (plutôt que des données publiques) améliore la précision de I'IA. Il s'agit généralement de données non structurées- documents, pages web, enregistrements audios, vidéos et images — et en quantités massives, nécessitant des espaces de stockage beaucoup plus important. Avec l’augmentation des réglementations et la reconnaissance par les entreprises du risque inhérent à l’utilisation de l’IA, la conservation des données d'entraînement des modèles et des données d'entrée est également importante pour documenter les solutions, expliquer les modèles et leurs résultats, se conformer aux politiques internes et atténuer les risques juridiques. La révolution de l'IA n'est possible que grâce aux progrès rapides des solutions de stockage haute performance. Les ensembles de données qui doivent être traités pour former ces modèles nécessitent une faible latence et des performances élevées à grande échelle pour alimenter les clusters GPU gourmands en données ; les anciens systèmes de stockage ne peuvent tout simplement pas suivre. Les organisations doivent désormais se tourner vers une nouvelle génération de systèmes de stockage conçus spécifiquement pour le monde de l'IA à forte intensité de données. Ces solutions bénéficient d'architectures scale-out massives combinant le stockage flesh et le réseau RDMA (Remote Direct Memory Access) pour permettre des performances et une réactivité ultrarapide des applications - parfaites pour les charges de travail d'lA ».
De nouvelles solutions taillées pour l'IA
Il n'est pas seul à penser ainsi. HPE a introduit de nouvelles solutions allant dans ce sens dans son offre Greentake. La nouvele version de hire Greentaxe to Block Storage basée sur HPE Alletra MP supporte désormais une capacité NVMe évolutive allant jusqu'à 5,6 Po, ainsi que des analyses transversales Infosight AlOps, offrant une visibilité accrue sur les charges de travail, des performances améliorées, une disponibilité renforcée et une utilisation optimisée des ressources. Le programme HPE Timeless permet la mise à niveau vers un contrôleur de nouvelle génération, sans interruption, lors d’un renouvellement d’abonnement, pour les clients qui choisissent le stockage en bloc sur HPE Alletra MP.
Chez Huawei, l’OceanStor A800 permet d’augmenter de 30 % le taux d’utilisation des clusters d’IA. S’agissant de sa performance, ce système offre des débits quatre fois supérieurs et des IOPS huit fois supérieurs à l’offre du marché actuelle. En ce qui concerne l’évolutivité d’OceanStor A800, ce système peut être doté d’une capacité de plusieurs EB et comporter jusqu’à 512 contrôleurs, ainsi que d’un maximum de 4 096 cartes graphiques. Du point de vue de l’économie d’espace et d’énergie, ces équipements atteignent une densité de stockage exceptionnelle de 1 PB/U et une efficacité énergétique de 0,7 Watt/TB. Ils offrent également un nouveau paradigme de données avec indice vectoriel, données de tenseurs, et RAG. En termes de résilience des données, la précision de la détection des ransomwares est portée de 99,9 % à 99,99 %. Par ailleurs, la capacité de fabrique de données facilite la gestion du capital données.
Wasabi, le fournisseur de stockage objet, a ajouté Wasabi AiR récemment à son portefeuille de produit. Ce logiciel combine le stockage d’objets à faible coût et à haute performance de Wasabi avec le tagging automatique avancé des métadonnées de l’IA et la transcription multilingue consultable speech-to-text. Les fichiers vidéo uploadés sur Wasabi AiR sont immédiatement analysés et un index de métadonnées est créé seconde par seconde, ce qui permet aux utilisateurs de trouver rapidement ce qu’ils recherchent.
Ce ne sont que des exemples d’annonces récentes. Dell, Panasas, DDN et d’autres sont dans le même mouvement pour fournir les infrastructures de stockage aux entreprises afin de mettre en œuvre, à un coût raisonnable, leurs initiatives en matière d’intelligence artificielle. D’ailleurs, le coût de l’inférence est assez faible comme le remarque Benoît Vautrin, IBM Storage France Business Development, lors d’un entretien.
Dans une tribune récente, Pierre Aguerreberry, VP Sales EMEA de DataCore, explique : « l’utilisation de l’AIOps représente une avancée significative en ce qui concerne la gestion du stockage des données, et notamment la façon dont les entreprises gèrent des référentiels de données en forte croissance. Dans le monde actuel où la donnée est une valeur cruciale pour les entreprises, l’efficacité, la fiabilité et la sécurité des systèmes de stockage sont primordiales. Pour cela, l’AIOps apporte une nouvelle dimension au stockage en appliquant des analyses basées sur l’intelligence artificielle et l’apprentissage automatique en vue d’optimiser les performances du stockage et la gestion de la capacité. Cette intégration, associée aux technologies d’IA et de ML dans les systèmes de stockage, permet de mieux hiérarchiser les données et d’élaborer des stratégies d’allocation plus abouties pour une utilisation optimale et rentable des ressources. L’AIOps améliore, en outre, la capacité des systèmes de stockage à s’adapter à l’évolution des modes d’utilisation et des charges de travail, garantissant ainsi des performances et une disponibilité élevées. Les avantages apportés par l’AIOps en matière de stockage des données sont ainsi très nombreux ». Il ajoute : « de l’autre côté, la mise en place de l’AIOps permet de réduire sensiblement les coûts opérationnels de gestion du stockage des données. Tout d’abord, en ce qui concerne la maintenance prédictive, l’AIOps exploite l’analyse prédictive pour anticiper les pannes matérielles avant qu’elles ne surviennent, réduisant ainsi les temps d’arrêt et les coûts de maintenance ». De plus, il met en avant l’automatisation possible pour la résolution d’incident.
Résilience et sécurité
Reste que sous la pression réglementaire et le contexte de la cybercriminalité, les entreprises redoutent en premier les attaques de type ransomware. Sur ce point, l’IA joue aussi son rôle. IBM dans sa gamme Flash System a ajouté une fonction de détection de corruption en ligne qui utilise les services d’IA et de ML pour détecter les changements de données pouvant indiquer des menaces ou des attaques directes sur les ensembles de données en temps quasi réel. Ces capacités ont été étendues aux supports de stockage flash brevetés — les modules FlashCore — afin de rapprocher la détection des données, ce qui réduira encore le temps de détection.
Des exemples récents de mise en œuvre
Plus que la rhétorique et le discours des offreurs, les exemples récents de mise en œuvre apportent un éclairage sur les besoins et solutions que mettent en place les entreprises.
NOVOMATIC, un fournisseur de jeux en Italie, Infinidat a mis à jour avec son succès son infrastructure de stockage d’entreprise avec la solution IntiniBox d'Infinidat. Le géant italien du jeu a abandonné ses anciens produits de stockage pour moderniser ses capacités de stockage. Cette modernisation vise à améliorer les performances, simplifier la gestion du stockage, reduire les coûts, intégrer une automatisation autonome et obtenir un meilleur service et support. Avant de se tourner vers Infinidat, NOVOMATIC Italia avait besoin d'un rafraichissement de son système de stockage, après avoir lutté contre la lenteur des performances, la complexité de la gestion et le support limité de l'implémentation de son système de stockage obsolète provenant d'un ancien fournisseur. NOVOMATIC risquait de payer trop cher pour le service et le support si elle ne changeait pas de fournisseur. Après une évaluation des meilleurs produits de stockage du marché, l'entreprise de jeux a choisi Infinidat comme premier fournisseur de solutions de stockage haute performance et cyber-résilientes.
La solution a été installée mi-2022, avec le support d'un conseiller technique sans frais supplémentaires. NOVOMATIC a immédiatement constaté une amélioration remarquable des performances de son infrastructure de stockage après l'installation de la plateforme InfiniBox. L’automatisation autonome a éliminé la complexité et optimisé à la fois les performances et l'efficacité de la gestion d'une variété de charges de travail et d'applications. Le modèle de capacité à la demande proposé Infinidat a également permis de réaliser des économies significatives. La solution de stockage d'entreprise d'Infinidat a réduit la latence de 68% pour NOVOMATIC, passant de 1 ms sur son système de stockage précédent à seulement 0,32 ms.
De plus, Infinidat a augmenté le taux de réussite du cache à 98,8% — contre seulement 50% sur son système de stockage précédent. Infinidat a également répondu aux exigences de NOVOMATIC en matière d'interopérabilité avec Hyper V, ainsi que de compatibilité entre InfiniBox et les serveurs Cisco UCS. Ce support a permis de créer une opération plus transparente entre ses capacités de stockage et d'outres parties importantes de son infrastructure informatique. A l'avenir, NOVOMATIC envisage d'utiliser Infinidat pour ses futures extensions, en particulier pour augmenter sa capacité, au fur et à mesure que son activité se développe avec des volumes de données croissants.
Andra se tourne vers Pure Storage
L'Andra, Agence nationale française pour la gestion des déchets radioactifs, s'est tournée vers Pure Storage pour moderniser son infrastructure IT avec une plateforme de stockage de données sécurisée, fiable et résiliente qui répond aux réglementations et aux exigences en matière de développement durable. Andra mène des missions sensibles concernant la gestion à long terme de substances radioactives dangereuses. En raison de la nature des données qu'elle gère et de l'augmentation des cyberattaques, l’Agence avait besoin d'une solution moderne, facile à gérer et répondant aux besoins de sécurité et de fiabilité.
La plateforme de Pure Storage a aidé l’Andra a réduire la consommation totale d'énergie de son datacenter de 20 %, à réduire son empreinte physique de 80 % (de 30U à 6U) et à réduire ses émissions de CO2 de 4 tonnes par an. En outre, l'architecture Evergreen de Pure aide l'Andra à mieux gérer le cycle de vie des produits et à réduire les déchets électroniques en permettant des mises à niveau logicielles et matérielles sans interruption. Pure1, la plateforme de gestion du stockage des données basée sur le cloud et pilotée par les AIOps, permet à l’Andra d’exploiter l’analyse prédictive pour répondre de manière proactive aux conditions dynamiques. Avec Pure1, l’Andra peut intégrer vCenter et bénéficier de la planification de la capacité, ainsi que des instantanés SafeMode de Pure Storage. S’appuyant sur des baies FlashArray, la solution prévient les temps d’arrêt et contribue au plan de continuité des activités de l’Andra, tandis que les snapshots SafeMode de Pure Storage améliorent la stratégie de protection des données de l’Andra en permettant de restaurer des copies propres des données en cas de cyberattaque. Le choix effectué par l’Andra est celui d’une exploitation de long terme de la solution pour les dix prochaines années.
La solution de Scality a été choisie par le laboratoire de génomique pour optimiser et accélérer le cycle de vie de ses données. Sélectionné dans le cadre du Plan France Médecine Génomique 2025, SeqOIA est l’un des deux laboratoires français réalisant le séquençage complet du génome humain au profit des patients atteints de maladies rares et de cancer. SeqOIA a adopté Scality RING pour agréger des données génétiques à l’échelle du pétaoctet, utilisées pour mieux caractériser les pathologies et orienter le traitement des patients. RING offre aux biologistes de SeqOIA un accès efficace depuis des milliers de nœuds de calcul à près de 10 pétaoctets de données tout au long de leur cycle de vie, de la donnée de laboratoire à la donnée traitée, à des vitesses accélérées et à un coût 3 à 5 fois inférieur à celui du stockage de fichiers tout-flash. La solution est sur deux niveaux avec un accès tout-flash pour les ensembles de données temporaires et un stockage persistant à long terme dans RING qui a pour mission de protéger les pétaoctets de données critiques.
La Croix-Rouge a recours à Cohesity
Disposer de copies de sauvegarde et d’archivage des données est une exigence réglementaire, mais surtout un impératif pour la Croix-Rouge française qui a choisi Cohesity. La Croix-Rouge française a fait confiance à Cohesity pour la migration, la sauvegarde et la protection de ses données en environnement sur site et dans le cloud. À la clé, une performance accrue pour l’ensemble du système et des applications, des fenêtres de sauvegarde respectées, et un investissement en temps réduit pour l’équipe chargée du SI.
Dès 2019, l’institution de la Croix-Rouge française a entrepris un chantier de modernisation de ses systèmes et processus. Ce travail a consisté notamment à repenser la manière dont les données et leur stockage étaient gérés. La Croix-Rouge française a ainsi virtualisé le stockage et s’est interrogée sur la solution la plus appropriée pour la gestion des données de sauvegardes. Elle désirait simplifier cette gestion en conformité avec des SLAs faciles à surveiller, l’automatiser le plus possible, et souhaitait également tirer parti des avantages offerts par le cloud, notamment en exportant des données sur Amazon S3 en cas de besoin et en gérant les données dans le cloud. Elle souhaitait aussi pouvoir étendre les fonctionnalités existantes grâce à une solution proposant des API. Le tout, en conservant le contrôle sur le budget. La solution Cohesity fait vite l’unanimité. Un premier accord est signé pour migrer vers un système cloud « on-premise » avant de convertir la licence en mode Software as a Service au début de l’année 2022. La Croix-Rouge française adopte initialement Cohesity DataProtect et DataPlatform, dans un projet piloté et implémenté par Skill Partner, qui a aussi la responsabilité du service de maintenance. La transition a pris environ deux semaines au cours desquelles les données ont été chiffrées et transférées en toute sécurité, à des fins de reprise après sinistre. La prise en main s’est faite rapidement. L’opération de sauvegarde présente un taux de réussite de 100 % et le système est autonome dans 95 % des cas. L’ensemble des flux et toutes les données transmises depuis les différentes applications utilisées par les personnels soignants, administrateurs et urgentistes sont chiffrés, stockés, protégés et accessibles instantanément en cas de besoin.

