X
HPE NIMBLE STORAGE
HPE / mercredi 21 novembre 2018 / Thèmes: HPE

HPE NIMBLE STORAGE

Le stockage du futur

En collectant des millions de données chaque seconde, les baies HPE Nimble Storage équipées de processeurs évolutifs Intel® Xeon® atteignent aujourd’hui un taux de disponibilité proche de 100%, un chiffre unique sur le marché.

« Dans le cadre de la transformation numérique, les entreprises sont de plus en plus tributaires des applications pour leurs activités. En conséquence, la disponibilité des systèmes et l'élimination des temps d'arrêt non planifiés sont des aspects vitaux », déclare Elie Sebaali, directeur des ventes stockage au sein de la division Hybrid IT, chez HPE France. « A titre d’exemple, le coût moyen d'une heure d'arrêt est estimé à environ 500 000 $USD, et cette évaluation ne fait qu'augmenter ». Dans ce contexte, HPE s'est donné comme mission de doter ses produits d'une disponibilité maximale et envisager l'amélioration continue de cette disponibilité au fil du temps. Les baies de stockage HPE Nimble Storage offrent une disponibilité proche de 100 % (99,999928 %), soit une indisponibilité globale de moins de 25 secondes sur un an (et une amélioration multipliée par 4 en un peu plus de deux ans).

Quel est le secret de HPE Nimble Storage ?

« Cette disponibilité s’appuie à la fois sur une plateforme et un système d’exploitation de stockage robustes, et des technologies d’Intelligence Artificielle qui préviennent les problèmes. Elle fait l'objet de mesures reposant sur des valeurs réelles et constatées, et non sur des projections théoriques, sur l'ensemble de la base installée (tous modèles et toutes versions d'OS) et fait l’objet d’améliorations en continu sans conditions spéciales ou contrats de service particuliers », précise Christian Laporte, chef produits Stockage au sein d’HPE.

La fiabilité des systèmes HPE Nimble Storage commence par l'architecture de la plateforme de stockage. Aucun point de défaillance unique/SPOF (tolérance aux pannes assurée par des composants redondants). Des contrôleurs doublés fonctionnant en mode actif/passif permettent d'exécuter des mises à niveau non disruptives et de ne pas subir de baisse de performances en cas de défaillance de contrôleur. L'architecture logicielle des solutions HPE Nimble Storage est tolérante aux pannes et elle garantit l'intégrité des données même en cas de perte simultanée de trois disques (RAID à parité Triple+ et validation de l'intégrité de bout en bout).

Comment HPE Nimble Storage mesure la disponibilité ?

Les données collectées par HPE au niveau des baies de stockage HPE Nimble Storage permettent de mesurer la disponibilité à la microseconde près. Bien que la plupart des baies ne subissent jamais aucun temps d'arrêt non planifié, toutes les périodes d'indisponibilité qui surviennent sont automatiquement identifiées, catégorisées et archivées, ce qui permet à HPE de suivre la disponibilité dans l'ensemble de la base installée et sur différents critères, dont le modèle matériel, la version du logiciel ou autre. Ces informations archivées font l'objet d'une maintenance rigoureuse et tous les temps d'arrêt sont soigneusement étudiés pour garantir que l'impact subi par le client est correctement capturé. Toutes les baies sont incluses, à l'exception des systèmes internes utilisés pour le développement et les tests. En outre, tout incident qui se traduit par un temps d'arrêt non planifié est inclus, même s'il est la conséquence d'un incident ayant affecté un système tiers. Les périodes pendant lesquelles on peut s'attendre à ce qu'une baie ne soit pas disponible sont exclues par filtrage, par exemple une interruption secteur générale ou le cas où un client désactive une baie et l'installe dans un autre emplacement.

Quelles sont les technologies et services sous-jacents ?

Les baies de stockage HPE Nimble Storage ont adopté une approche unique : intégrer des capteurs de diagnostic dans chaque module de code pour établir un socle permettant de disposer d'un système analytique capable d'évaluer l'état et les performances des systèmes en temps réel. Au stade actuel, chaque baie HPE Nimble Storage intègre plusieurs milliers de capteurs, et l'analyse prédictive HPE InfoSight collecte et corrèle des millions de données de capteurs par seconde dans l'ensemble de la base installée, ce qui permet de disposer d'une visibilité globale sur les systèmes et d'assurer leur « auto-formation » continue. Dès qu'un nouveau problème est détecté dans l'ensemble de la base installée, des signatures d'intégrité prédictive lui sont attribuées. HPE InfoSight applique des algorithmes de reconnaissance de structure, puis recherche ces signatures dans les systèmes.

Chaque fois qu'une signature est détectée, HPE InfoSight empêche le problème de se produire ou le résout de manière proactive par application d'une résolution prescriptive, même si le problème se situe à l'extérieur des systèmes de stockage. Les fausses alertes disparaissent, dans la mesure où l’apprentissage automatique (machine learning) normalise les variations de performances constatées dans l'ensemble de la base installée. Sur la durée, chaque système devient de plus en plus intelligent car il enrichit ses connaissances à l'aide des informations collectées dans l'ensemble de la base installée, et les événements de temps d’arrêt sont de plus en plus souvent évités

 « L’IA et le « machine learning » apportés par HPE Infosight jouent un rôle clé dans la finesse de l’analyse du comportement des VM (virtual machines) et de l’ensemble de la couche infrastructure au sein des baies de stockage HPE Nimble Storage. Les remontées liées à l’état de santé des infrastructures de la communauté sur un portail central sécurisé, sont analysées, ce qui nous permet de fournir des recommandations et des partages d’expériences entre utilisateurs. Ceci permet également de « corréler » différents clients opérant des configurations équivalentes (à partir de « templates » de référence) et de résoudre simplement ou automatiquement les problèmes. L’analyse porte en partie sur le comportement interne des baies elles-mêmes (« capacity et performance planning », etc.). En pratique, elle peut conduire à déclencher un « upgrade » des contrôleurs, qui peut s’opérer à chaud », conclut Elie Sebaali.


HPE INFOSIGHT en 5 points

1. Analyse des données : HPE InfoSight supervise et analyse en continu la télémétrie des capteurs à partir d'une base installée dans le monde entier, soit des millions de capteurs par seconde en provenance de plus de 10 000 clients.

2. Création de cas : HPE InfoSight prédit un incident potentiel ou un client déclare un cas (remarque : 90 % des cas sont créés automatiquement et 86 % d'entre eux sont résolus automatiquement et clôturés avant même que le client subisse un incident).

3. Analyse des causes premières : pour les incidents complexes, un ingénieur PEAK dédié est affecté au cas. Il travaille avec l'équipe IT du client et avec InfoSight pour diagnostiquer rapidement la ou les causes premières de l'incident, y compris pour les incidents extérieurs au stockage. Une signature est créée pour identifier les paramètres tels que : système d'exploitation, indicateurs de performance, profil des applications et des charges de travail et configurations tierces.

4. Résolution des incidents : l'ingénieur PEAK est chargé d'élaborer le plan de résolution, de contrôler l'application des correctifs et de clôturer le cas.

5. Prévention des incidents dans la base installée : HPE InfoSight applique des algorithmes de reconnaissance de structure à la signature pour identifier l'incident, prédire sa survenue et éviter  à d'autres systèmes de subir le même incident.

Print
3081

x