Comment la panne d'AWS d'Amazon a détruit d'énormes pans du Web

Comment la panne d'AWS d'Amazon a détruit d'énormes pans du Web

Si vous avez eu des difficultés à accéder à certains de vos sites Web et services préférés le 20 octobre, vous n'étiez pas seul. Une grande partie d’Internet a connu des heures de problèmes avec des pannes signalées sur de nombreux sites.

Un défaut des services AWS d'Amazon était à blâmer, avec de graves perturbations ayant des répercussions considérables sur des centaines, voire des milliers de services. Les propres services d'Amazon, tels qu'Alexa, Ring et Prime Video, rencontraient des problèmes, tout comme de grands noms du Web, notamment Disney+, Hulu, Roblox, Fortnite, Zoom, The New York Times, McDonald's et bien d'autres encore.

Après 15 heures de perturbation, Amazon a enfin pu signaler le feu vert, avec ses services entièrement rétablis.

Panne Internet AWS : mises à jour clés

  • 15h53 PDT: Amazon publie une déclaration détaillant ce qui s'est passé.
  • 15h01 PDT: Tous les services AWS ont repris leurs opérations normales.
  • 10h03 PDT: « Nous continuons d'appliquer des mesures d'atténuation pour la santé de l'équilibreur de charge réseau et la récupération de la connectivité pour la plupart des services AWS. » Cette perturbation dure maintenant depuis plus de 10 heures.
  • 09h13 PDT: Amazon déclare « visager la connectivité et la récupération des API pour les services AWS »
  • 08h48 PDT: Bonnes nouvelles! Amazon a « réduit la source des problèmes de connectivité réseau qui ont affecté les services AWS ».
  • 08h04 PDT: Davantage d'enquêtes sont requises par Amazon, car il examine les problèmes de connectivité
  • 07h29 PDT: Amazon confirme les problèmes de connectivité pour les utilisateurs.
  • 07h14 PDT: Euh oh ! Les choses semblent empirer. « Nous pouvons confirmer des erreurs d'API importantes et des problèmes de connectivité sur plusieurs services dans la région US-EAST-1. »
  • 06h42 PDT: Amazon confirme qu'il « rencontre toujours des erreurs élevées pour les lancements de nouvelles instances EC2 ».
  • 05h48 PDT: Amazon affirme « faire des progrès dans la résolution du problème avec le lancement de nouvelles instances EC2 dans la région US-EAST-1 ».
  • 05h10 PDT: Des actions plus réussies alors qu'Amazon continue de travailler sur le processus de récupération.
  • 04h48 PDT: Amazon confirme que de nombreux services sont toujours concernés tout en continuant à résoudre le problème.
  • 04h08 PDT: Amazon dit qu'il « continue de travailler vers une reprise complète »
  • 03h35 PDT: « Le problème DNS sous-jacent a été entièrement atténué et la plupart des opérations du service AWS réussissent désormais normalement »
  • 03h03 PDT: Les services continuent de se rétablir alors qu'Amazon continue de « travailler vers une résolution complète »
  • 02h27 PDT: « Nous constatons des signes significatifs de reprise » note Amazon. Dieu merci.
  • 02h22 PDT: Amazon déclare « observer les premiers signes de reprise pour certains services AWS concernés »
  • 02h01 PDT: Amazon affirme avoir « identifié une cause potentielle des taux d'erreur »
  • 01h26 PDT: Amazon affirme « pouvoir confirmer des taux d'erreur importants pour les requêtes adressées au point de terminaison DynamoDB dans la région US-EAST-1 »
  • 00h51 PDT: Amazon confirme « une augmentation des taux d'erreur et des latences pour plusieurs services AWS dans la région US-EAST-1 »
  • 00h11 PDT: Amazon confirme qu'il « étudie l'augmentation des taux d'erreur et des latences pour plusieurs services AWS dans la région US-EAST-1 »

Pourquoi les services AWS sont-ils tombés en panne ?

Amazon a publié une déclaration le 20 octobre à 15 h 53 PDT, détaillant les événements de la journée.

« Entre 23 h 49 PDT le 19 octobre et 02 h 24 PDT le 20 octobre, nous avons constaté une augmentation des taux d'erreur et des latences pour les services AWS dans la région US-EAST-1. De plus, les services ou fonctionnalités qui reposent sur les points de terminaison US-EAST-1 tels que IAM et DynamoDB Global Tables ont également rencontré des problèmes pendant cette période.  »

« À 00h26 le 20 octobre, nous avons identifié le déclencheur de l'événement comme des problèmes de résolution DNS pour les points de terminaison du service DynamoDB régional. Après avoir résolu le problème DNS de DynamoDB à 02h24, les services ont commencé à se rétablir, mais nous avons eu une déficience ultérieure dans le sous-système interne d'EC2 qui est responsable du lancement des instances EC2 en raison de sa dépendance à DynamoDB. Alors que nous continuions à travailler sur les déficiences du lancement de l'instance EC2, la charge réseau Les vérifications de l'état de l'équilibreur ont également été altérées, entraînant des problèmes de connectivité réseau dans plusieurs services tels que Lambda, DynamoDB et CloudWatch.

« Nous avons récupéré les vérifications de l'état du Network Load Balancer à 9 h 38. Dans le cadre de l'effort de récupération, nous avons temporairement limité certaines opérations telles que les lancements d'instances EC2, le traitement des files d'attente SQS via les mappages de sources d'événements Lambda et les appels Lambda asynchrones. Au fil du temps, nous avons réduit la limitation des opérations et travaillé en parallèle pour résoudre les problèmes de connectivité réseau jusqu'à ce que les services soient complètement rétablis.

« À 15h01, tous les services AWS ont repris leurs opérations normales. Certains services tels qu'AWS Config, Redshift et Connect continuent d'avoir un retard de messages qu'ils termineront de traiter au cours des prochaines heures. Nous partagerons un résumé détaillé post-événement d'AWS. « 

Combien de temps a duré la panne d'AWS ?

Au total, les services AWS ont été impactés pendant 15 heures le 20 octobre 2025, ce qui en fait la plus grande panne AWS d'Amazon depuis une décennie.

D'après nos recherches portant sur les pannes AWS précédentes, la panne la plus longue des 10 dernières années s'est produite en août 2019, lorsque les services ont été interrompus pendant huit heures.

Panne Internet AWS telle qu'elle s'est produite

Dernière mise à jour le 21 octobre 2025 à 01h24


    Rate this post
    Total
    0
    Shares
    Previous Post
    Les téléphones Samsung deviennent plus intelligents à mesure que Gemini commence à évoluer

    Samsung prépare son rival iCloud pour vous enfermer davantage dans l'écosystème Galaxy

    Next Post
    OnePlus 15 pourrait résoudre vos soucis de durée de vie de la batterie grâce à la confirmation de sa taille

    OnePlus 15 pourrait résoudre vos soucis de durée de vie de la batterie grâce à la confirmation de sa taille

    Related Posts