AmazonのクラウドサービスEC2のトラブル、12時間後も完全復旧せず

北バージニアリージョンのEBSへの膨大な再ミラーリングが原因のトラブルは、1つのAvailability Zoneを除いてほぼ復旧したが、HootSuiteやAbout.meなど多くの顧客サイトはまだ機能していない。

» 2011年04月22日 07時19分 公開
[佐藤由紀子,ITmedia]

 4月21日の深夜(現地時間)に発生した米Amazon Web Services(AWS)のトラブルは、同日の午後2時(日本の22日午前6時)現在もまだ解消しておらず、同サービスを利用しているQuoraHootSuiteAbout.meなどの多数のサービスはダウンしたままだ(foursquareは復旧している)。

 AWSのAmazon Web Services Service Health Dashboardによると、トラブルが発生したのは北バージニアのデータセンターで提供する「Elastic Compute Cloud(EC2)」「Amazon CloudWatch」「Amazon Elastic MapReduce」「Amazon Relational Database Service(RDS)」「AWS CloudFormation」の各サービス。このうちEC2とRDSはまだ復旧中となっている。

 トラブルの発生は、21日未明に起きたあるネットワークイベントが、北バージニアリージョンでのElastic Block Store(EBS、EC2のストレージバックアップオプション)への膨大な再ミラーリングを引き起こしたことが原因とAWSは説明している。この再ミラーリングにより北バージニアのAvailability Zonでキャパシティー不足が生じたという。21日午後1時48分には1つのAvailability Zoneを除いて復旧した。

 影響を受けたAvailability Zoneでインスタンスのスナップショット/バックアップを利用している顧客は、他のゾーンにリストアできる。AWSは顧客に対し、新たなRDSインスタンスを作成したりリストアする際、特定のAvailability Zoneを指定しないよう勧めている。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ