米Amazon傘下のAmazon Web Services(AWS)は12月10日(現地時間)、7日に発生した大規模なサービス障害の原因について説明した。この障害は主に米東海岸地域に影響したが、日本でも任天堂のネットワークサービスが影響を受けた。
この障害では、顧客への状況報告が伝わりにくく、「一部の顧客がこの問題に関する情報を見つけることが困難になったことが分かった」ので、「来年初頭に、Service Health Dashboard(ステータスページ)を改善し、新しいサポートシステムをリリースする」としている。
この障害はバージニア州北部地域で午前10時30分ごろに発生。原因は「メインのAWSネットワークでホストされているサービスの1つの容量を拡張する自動化機能で、内部ネットワーク内の多数のクライアントから予期しない動作が発生した」ことという。これにより、接続アクティビティが急増してネットワークデバイスのキャパを超え、ネットワーク間通信が遅延した。
この問題はシステムの問題を把握するための機能にも影響したため、監視システムも使えなくなった。これが、修正に時間がかかった主な理由だと説明している。問題が完全に解決されたのは、問題発生から約7時間後の午後5時22分だった。
この障害で、Disney+、Tinder、Venmo、McDonald's、Cash Appなどの米国でのサービスが影響を受けた。また、Amazonの配達員が使う配送アプリも影響を受け、米CNBCによると、荷物のスキャンや配達ルートの確認ができず、数時間にわたって配達できなくなっていたという。
任天堂のネットワークサービスで障害発生 AWSの影響で【復旧済み】
Chatworkのアクセス障害、原因は「AWSの異常」
AWSの大規模障害、原因はネットワークデバイス 新プロトコル処理に潜在的なバグ
AWS障害、5時間でほぼ復旧 気象庁Webサイトなどに影響【各サービス復旧状況を追記】
AWSで障害、「Nature Remo」「SwitchBot」などに影響 「電気消せない」と嘆く声【追記あり】Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR