Disque dur : A-t-il encore un avenir ?

Un laser est monté sur la tête de lecture/écriture pour chauffer la surface du plateau au moment de l’écriture : voilà le principe de base de la technologie HAMR. Celle-ci devrait permettre d’obtenir des disques atteignant les 100 To d’ici à 2025. Bousculé par la vitesse des mémoires Flash, le disque dur semble condamné. Pourtant, la demande en capacité ne faiblit pas,  au contraire, elle s’envole, portée par les besoins infinis du Cloud… Si les SSD ont clairement vocation à remplacer les disques durs traditionnels sur les postes clients, les serveurs et les infrastructures de stockage des entreprises, le disque dur est loin d’avoir tiré sa référence. Mieux, la demande du marché continue de croître à un rythme extrêmement soutenu. Les analystes de Techno System Research accordent même à ce marché du bon vieux disque dur un taux de croissance annuel de + 27 % par an sur la période 2019 à 2023. La question est de savoir qui achète autant de disques durs aujourd’hui alors que le full flash est le nec plus ultra du stockage ? Aucun mystère, ce sont les opérateurs d’infrastructure cloud, les Hyperscalers, qui sont en train d’aspirer une part de plus en plus importante de la production mondiale de disques magnétiques. En 2019, les fabricants – qu’il s’agisse de Seagate, Western Digital ou Toshiba – ont livré pour 869 exaoctets de disque dur, soit 89,6 millions de disques de 10 To. En 2023, cette production aura quasiment doublée et atteindra 1 558 exaoctets ! La demande de disques, actuellement majoritairement tirée en volume par les postes clients, aura alors définitivement basculée du côté des entreprises et des Cloud Service Providers. En dépit du carton des disques SSD auprès des entreprises, la demande en disque dur traditionnel ne faiblit pas, bien au contraire. Les opérateurs cloud tirent vers le haut une croissance annuelle qui atteint les 27 % !

Pressurisés à l’hélium

Le disque dur magnétique – ou mécanique comme aiment à l’appeler les fournisseurs de SSD – n’est pas mort. Mieux, pour faire face à cette insatiable demande en capacité des Hyperscalers, les fabricants doivent continuer à innover pour augmenter la capacité unitaire des disques ainsi que, plus marginalement si on les compare aux SSD, leurs performances. Lors de sa dernière conférence de presse, Hiroshi Fukuchi, président et CEO de Toshiba, a livré quelques pistes de recherche pour les années à venir. Le Japonais travaille à la fois sur des disques à très haute densité pour les Hyperscalers, mais espère aussi satisfaire l’émergence d’un marché de petits et moyens datacenters qui correspond à l’Edge Computing.  Plus hasardeux, celui-ci espère aussi placer ses disques sur le marché de la sécurité et plus particulièrement des caméras connectées. Toshiba a agrandi son usine aux Philippines pour augmenter ses capacités de production et, du point de vue technologique, il continue à innover. La majorité des disques livrés en 2020 seront pressurisés à hélium, une technique qui permet de réduire les frottements et donc l’échauffement du disque. Annoncée en 2012, cette technique devient dominante aujourd’hui. En outre, Toshiba fut le premier à introduire des disques avec 9 plateaux et va devoir passer à 10 pour accroître encore la capacité du disque et passer la barre des 20 To.

La technologie SMR booste de 25 %

Pour augmenter encore la densité des données stockées sur chaque plateau, les fabricants exploitent de plus en plus l’enregistrement de type Shingled Magnetic Recording (SMR). Sachant que l’écriture des données sur le disque nécessite plus d’espace sur le plateau que la lecture, l’idée était de faire se chevaucher les pistes au moment de l’écriture. Cette astuce est aujourd’hui largement adoptée chez les Hyperscaler car elle a permis de booster de 25 % la capacité d’un disque grâce à cette meilleure exploitation de la surface du plateau. Pour les fabricants de disques, le SMR a permis d’augmenter le nombre de pistes de chaque plateau à moindre frais. Dropbox a été le premier à déployer des disques Western Digital SMR de 14 To sur une infrastructure de stockage dont la capacité est de l’ordre de l’exaoctet. En optimisant encore le positionnement des pistes, le constructeur américain est parvenu à tirer 14 To de ses disques Ultrastar et espère atteindre la barre des 20 To en 2020. Néanmoins, le SMR impose de nouvelles contraintes, notamment celle de devoir gérer le disque par zone. Tout comme les zones d’effacement des mémoires flash, il n’est plus possible d’effacer et d’écrire des données de manière totalement libre et aléatoire sur la surface du disque. Les pistes se chevauchant, gérer l’effacement et la réécriture de données sur une piste devient un vrai casse-tête pour ne pas effacer les pistes voisines, ce qui impose une gestion des écritures par zone. Cette complexité est telle que les Hyperscalers sont conduits à aller vers des disques SMR où certaines zones restent sur un mode d’écriture des pistes traditionnelle, CMR (Conventional Magnetic Recording), où l’on peut faire librement des lectures/écritures de manière réellement aléatoire et des zones SMR, avec des règles d’effacement et d’écriture strictes à observer. Pour ajouter un peu plus de complexité, les opérateurs cloud veulent pouvoir faire évoluer ces zones de manière dynamique, en fonction du besoin mais sans détruire de données et le tout en production dans le datacenter. Theodore Ts’o, développeur du kernel Linux chez Google, a présenté cette approche lors d’une conférence de l’Open Compute Project, preuve que les Hyperscalers suivent de très près les innovations réalisées sur les disques qu’ils consomment par millions. À l’image des disques Ultrastar de Western Digital, la barre des 10 To est désormais franchie pour les disques destinés aux data centers. La roadmap de Toshiba prévoit cette année l’arrivée de disques d’une capacité de 18 To, puis d’atteindre la barre des 20 To en 2021.

Chauffer pour stabiliser

Pour franchir la barre des 15 To, les fabricants doivent adopter la technique d’enregistrement magnétique développant encore cette technologie, les fabricants vont commercialiser dans les prochains mois des disques durs de plusieurs dizaines de Teraoctets puis, comme Seagate l’a promis il y a quelques mois, d’atteindre la barre des 100 To à l’horizon 2025. Plus de plateaux, plus de densité, les fabricants cherchent aussi à améliorer un paramètre où le disque dur fait pâle figure face au SSD, celui du temps d’accès. Les Hyperscalers ont besoin de capacités, mais ont aussi besoin de beaucoup d’IOPS. Leurs platesformes sont mutualisées à l’extrême et les applications type CDN, streaming vidéo, serveurs mails, Big Data, autant de workloads qui manipulent énormément de données et sont très sensibles à la latence des disques. S’il est courant de trouver des disques 10 000 tr/ min sur le marché Desktop, les disques à haute capacité plafonnent encore souvent à 7 200 tr/min, voire à 5 400 tr/ min. Maintenir un MTBF très élevé ne permet pas d’augmenter beaucoup la vitesse du disque. Pour répondre aux exigences de performance de ses clients et abaisser la latence de ses disques, Seagate a récemment déployé la technologie MACH.2 sur un premier disque 14 To, l’Exos 2X14. L’idée du fabricant est d’introduire du parallélisme dans son disque, une approche bien connue dans le monde du stockage : on augmente les IOPS en plaçant plusieurs disques en parallèle pour répondre à une requête. Seagate a appliqué ce principe au disque lui-même qui se comporte d’une certaine manière comme deux disques de 7 To. Le constructeur a découplé les têtes de lecture/écriture qui fonctionnent en deux groupes de quatre, des groupes qui fonctionnent de manière séparée contrairement aux disques classiques dont toutes les têtes se déplacent dans un même mouvement. Avec sa technologie de “ Multi-Actuator ”, baptisée MACH.2 par le marketing, Seagate, cherche à améliorer les IOPS de ses disques haute capacité.

MACH.2 testé par Microsoft

Le disque a été testé par Microsoft, notamment pour en équiper son serveur rack Project Olympus. Visiblement, le test a été concluant si on en croit les commentaires d’Aaron Ogus, architecte du stockage de Microsoft Azure : « Seagate va offrir une croissance exponentielle des capacités de stockage avec l’introduction des technologies EAMR comme HAMR, mais dans la plupart des applications de centres de données les gains de capacité supplémentaires ne peuvent être utilisés efficacement sans une amélioration de la capacité d’E/S des périphériques. La technologie à double actionneur permet de débloquer des IOPS supplémentaires et permet aux fournisseurs de Cloud Computing d’utiliser efficacement les nouveaux gains de capacité. » La promesse de Seagate de pratiquement doubler les IOPS de son disque avec sa technologie semble concrétisée si on en croit les tests menés par Microsoft en simulant la charge de serveurs Exchange 2013 et 2016 : « Nous avons simulé des charges de travail sur la durée et nous avons collaboré avec Seagate afin d’aider Seagate dans le développement de la technologie MACH.2. L’objectif était d’atteindre un débit près de deux fois supérieur aux disques actuels et nos essais montrent que MACH.2 a atteint cet objectif. » Si les analystes d’IDC estiment qu’en 2025 le volume total de données stockées par l’Humanité atteindra alors 175 zettaoctets (soit 175 milliards de téraoctets), nul doute qu’une technologie inventée dans les années 50 portera l’essentiel de ces informations, à savoir le bon vieux disque dur !