Grosse panne AWS aux Etats-Unis

Si nous avons en Europe été globalement épargné, c’était la panique hier outre-Atlantique. En cause, une panne des services d’AWS qui a entraîné des ralentissements, voire des indisponibilités, y compris des outils internes à Amazon de monitoring et de réponse à incident.

Il était 9h30 hier matin sur la côte Est des Etats-Unis quand les internautes ont commencé à remarquer des ralentissements sur de nombreux sites et services en ligne et quelques problèmes de stabilité ici et là (sur Disney +, Coinbase ou encore Tinder notamment). A 9h37, la page statut d’AWS vire au rouge. « Nous constatons un impact sur plusieurs API AWS dans la région US-EAST-1. Ce problème affecte également certains de nos outils de surveillance et de réponse aux incidents, ce qui retarde notre capacité à fournir des mises à jour » annonçait alors Amazon.

Une demi-heure plus tard, le géant ajoutait que le rétablissement de ses services avait débuté, mais sans être en mesure de fournir un horaire de retour à la normale. Car EC2, AWS Connect, DynamoDB, Glue, Athena, Timestream ou encore Chime étaient affectés par cette panne. Celle-ci était provoquée par « une altération de plusieurs périphériques réseau dans la région US-EAST-1 ». Deux heures plus tard, toujours pas de signe d’amélioration : « nous continuons de constater une augmentation des taux d'erreur d'API pour plusieurs services AWS dans la région US-EAST-1 ».

Peur sur les livraisons

Il faut attendre 14h, heure de la côte Est, pour que les mesures d’atténuation mises en œuvre par AWS commencent à porter leurs fruits. Si les ralentissements observés par les internautes ont quasi-disparu, c’est en interne, et sur les consoles AWS, que la situation reste catastrophique. Sur Reddit, des employés dans les entrepôts du géant et des livreurs signalent que leurs applications de logistique sont inaccessibles.

Il faut attendre 15h03 pour que la panne soit en majorité résolue, et ce n’est qu’une heure et demi plus tard qu’AWS annonce la résolution de son problème d’équipements réseaux. Heureusement pour nous, le problème semble avoir été circonscrit aux seuls Etats-Unis, quoique quelques internautes aient pu observer à travers le monde des ralentissements.