Qu’est-ce qui a causé la panne d’Amazon ? Y aura-t-il plus?
Les aspirateurs robots ne démarrent pas. Les caméras de sonnette ont cessé de surveiller les voleurs de colis, bien que certaines de ces livraisons aient été annulées de toute façon. Les films Netflix et Disney ont été interrompus et l’Associated Press a eu du mal à publier la nouvelle.
Une panne majeure du réseau de cloud computing d’Amazon le 7 décembre a gravement perturbé les services d’un large éventail d’entreprises américaines pendant des heures, soulevant des questions sur la vulnérabilité d’Internet et sa concentration entre les mains de quelques entreprises.
Cette incertitude a été soulignée mercredi lorsqu’Amazon a signalé une autre panne qui, bien que beaucoup plus courte et moins perturbatrice que le problème du 7 décembre, a quand même créé des problèmes pour bon nombre de ses clients cloud. Sur un tableau de bord d’état du service, Amazon a signalé qu’une panne de courant dans l’un de ses centres de données avait perturbé les clients dont les tâches s’exécutaient sur ses serveurs.
Le courant a été rétabli après environ 45 minutes, bien que la société ait déclaré que certains clients continuaient à rencontrer des problèmes près de 12 heures après la panne. Des pannes matérielles dans le centre de données concerné ont forcé certains clients d’Amazon à redémarrer entièrement leurs systèmes basés sur le cloud.
COMMENT EST-CE ARRIVÉ?
Amazon n’a toujours rien dit sur ce qui, exactement, s’est mal passé lors de la panne de début décembre. La société a limité ses communications à l’époque à des explications techniques laconiques sur un tableau de bord d’Amazon Web Services et à une brève déclaration délivrée par le porte-parole Richard Rocha qui a reconnu que la panne avait affecté le propre entrepôt et les opérations de livraison d’Amazon, mais a déclaré que la société « travaillait pour résoudre le problème aussi vite que possible. » Il n’a pas immédiatement répondu à d’autres questions mercredi.
L’incident survenu chez Amazon Web Services a principalement touché l’est des États-Unis, mais a toujours eu un impact sur tout, des réservations de compagnies aériennes et des concessionnaires automobiles aux applications de paiement et aux services de streaming vidéo en passant par la propre opération de commerce électronique massive d’Amazon.
QU’EST-CE QU’AWS ?
Amazon Web Services est une opération de service cloud – il stocke les données de ses clients, gère leurs activités en ligne et plus encore – et un énorme centre de profit pour Amazon. Il détient environ 40 % du marché mondial des infrastructures cloud de 64 milliards de dollars, une part plus importante que ses plus proches rivaux Microsoft, Alibaba et Google réunis, selon le cabinet d’études Gartner.
Il était auparavant dirigé par le PDG d’Amazon, Andy Jassy, qui a succédé au fondateur Jeff Bezos en juillet.
TROP D’OEUFS DANS UN PANIER?
Certains experts en cybersécurité mettent en garde depuis des années contre les conséquences potentiellement désastreuses de permettre à une poignée de grandes entreprises technologiques de dominer les opérations Internet clés.
« La dernière panne d’AWS est un excellent exemple du danger d’une infrastructure réseau centralisée », a déclaré Sean O’Brien, professeur invité en cybersécurité à la Yale Law School. « Bien que la plupart des gens naviguant sur Internet ou utilisant une application ne le sachent pas, Amazon est intégré à la plupart des applications et des sites Web qu’ils utilisent chaque jour. » O’Brien a déclaré qu’il était important de construire un nouveau modèle de réseau qui ressemble aux racines peer-to-peer de l’Internet des premiers temps. De grandes pannes ont déjà mis hors ligne d’énormes pans du monde, comme cela s’est produit lors d’un incident sur Facebook en octobre.
Même dans le modèle actuel, les entreprises ont certaines options pour répartir leurs services entre différents fournisseurs de cloud, bien que cela puisse être compliqué, ou au moins pour s’assurer qu’elles peuvent déplacer leurs services vers une autre région gérée par le même fournisseur. La panne de mardi a principalement affecté la région « US East 1 » d’Amazon.
« Ce qui signifie que si vous aviez des systèmes critiques uniquement disponibles dans cette région, vous étiez en difficulté », a déclaré Servaas Verbiest, évangéliste en chef du cloud chez Sungard Availability Services. « Si vous avez largement adopté l’écosystème AWS et que vous êtes contraint d’utiliser uniquement leurs services et fonctions, vous devez vous assurer d’équilibrer vos charges de travail entre les régions. »
CELA N’EST-IL PAS ARRIVÉ AVANT ?
Oui. La dernière panne majeure d’AWS a eu lieu en novembre 2020. Il y a eu de nombreuses autres pannes Internet perturbatrices et longues impliquant d’autres fournisseurs. En juin, le distributeur de contenu en coulisse Fastly a subi une défaillance qui a brièvement supprimé des dizaines de sites Internet majeurs, dont CNN, le New York Times et la page d’accueil du gouvernement britannique. Ce mois-là, un autre fournisseur a affecté Akamai pendant les heures de pointe en Asie en juin.
Lors de la panne d’octobre, Facebook – maintenant connu sous le nom de Meta Platforms – a blâmé un « changement de configuration défectueux » pour une panne mondiale de plusieurs heures qui a supprimé Instagram et WhatsApp en plus de sa plate-forme titulaire.
QU’EN EST-IL DU GOUVERNEMENT AMÉRICAIN ?
On ne savait pas comment ou si la panne de mardi avait affecté les gouvernements, mais beaucoup d’entre eux s’appuient également sur Amazon et ses rivaux.
Parmi les organisations les plus influentes pour repenser son approche consistant à dépendre d’un seul fournisseur de cloud figurait le Pentagone, qui a annulé en juillet un contrat de cloud computing contesté avec Microsoft qui aurait pu finalement valoir 10 milliards de dollars. Au lieu de cela, il poursuivra un accord avec Microsoft et Amazon et éventuellement d’autres fournisseurs de services cloud tels que Google, Oracle et IBM.
Plus tôt cette année, la National Security Agency a attribué à Amazon un contrat d’une valeur potentielle estimée à 10 milliards de dollars pour être le seul gestionnaire de la propre migration de la NSA vers le cloud computing. Le contrat est connu sous son nom de code d’agence « Wild and Stormy ». Le General Accountability Office a soutenu en octobre une protestation de la part de Microsoft, estimant que certaines parties de la décision de la NSA étaient « déraisonnables », bien que la décision complète soit classée secrète.
—-
L’écrivain AP Nomaan Merchant a contribué à ce rapport.