AWS、12月7日の大規模障害について説明　ステータスページの改善を約束

» 2021年12月13日 07時04分公開

[ITmedia]

　米Amazon傘下のAmazon Web Services（AWS）は12月10日（現地時間）、7日に発生した大規模なサービス障害の原因について説明した。この障害は主に米東海岸地域に影響したが、日本でも任天堂のネットワークサービスが影響を受けた。

　この障害では、顧客への状況報告が伝わりにくく、「一部の顧客がこの問題に関する情報を見つけることが困難になったことが分かった」ので、「来年初頭に、Service Health Dashboard（ステータスページ）を改善し、新しいサポートシステムをリリースする」としている。

現行のステータスページ

　この障害はバージニア州北部地域で午前10時30分ごろに発生。原因は「メインのAWSネットワークでホストされているサービスの1つの容量を拡張する自動化機能で、内部ネットワーク内の多数のクライアントから予期しない動作が発生した」ことという。これにより、接続アクティビティが急増してネットワークデバイスのキャパを超え、ネットワーク間通信が遅延した。

　この問題はシステムの問題を把握するための機能にも影響したため、監視システムも使えなくなった。これが、修正に時間がかかった主な理由だと説明している。問題が完全に解決されたのは、問題発生から約7時間後の午後5時22分だった。

　この障害で、Disney+、Tinder、Venmo、McDonald's、Cash Appなどの米国でのサービスが影響を受けた。また、Amazonの配達員が使う配送アプリも影響を受け、米CNBCによると、荷物のスキャンや配達ルートの確認ができず、数時間にわたって配達できなくなっていたという。

任天堂のネットワークサービスで障害発生　AWSの影響で【復旧済み】
「Nintendo Switch Online」「ニンテンドーeショップ」など任天堂のネットワークサービスで障害が発生している。AWSの障害の影響という。
Chatworkのアクセス障害、原因は「AWSの異常」
Chatworkが運営するビジネス向けチャットツール「Chatwork」で9月17日に一時アクセス障害が発生していた問題で、同社は原因が「Amazon Web Services（AWS）の異常」だったと発表した。
AWSの大規模障害、原因はネットワークデバイス　新プロトコル処理に潜在的なバグ
9月2日に発生した、AWSの東京リージョンで大規模な障害で、同社が報告書を公開した。Direct Connectが接続される場所から東京リージョンのデータセンターへの途中にあるネットワークデバイスで障害が起きていたという。
AWS障害、5時間でほぼ復旧　気象庁Webサイトなどに影響【各サービス復旧状況を追記】
米Amazon Web Services（米AWS）が提供するクラウドサービス「AWS」の東京リージョンで、2月20日午前0時ごろに障害が発生した。発生から約5時間がたった午前5時ごろまでに大部分は復旧。AWSを利用するオンラインゲームなどに影響が出た他、気象庁の公式サイトも同時刻に一時接続できない状態になった。
AWSで障害、「Nature Remo」「SwitchBot」などに影響　「電気消せない」と嘆く声【追記あり】
AWSの米バージニア州北部のデータセンターで障害が発生。複数のサービスが正常に動作しない状況が続いている。日本では「Nature Remo」「SwitchBot」などのスマート家電向けデバイスで不具合が発生。「電気を消せない」などの声がTwitterに投稿されている。