ITmedia NEWS > 企業・業界動向 >

AWS障害、大部分の復旧完了 原因は「サーバの過熱」

» 2019年08月23日 21時55分 公開
[井上輝一ITmedia]

 8月23日午後1時ごろに発生した、米Amazon Web Servicesのクラウドサービス「AWS」の東京リージョンでの障害について、同社は午後8時18分、クラウドサーバの復旧がほぼ完了したことを明らかにした。制御システムの障害により、サーバの温度が上がりすぎたことが原因だったという。

 同社によると問題が起きたのは、「Amazon Elastic Compute Cloud」(EC2)の東京リージョンを構成する4つのデータセンター(アベイラビリティーゾーン、AZ)の内の1カ所。AZ内の制御システムに問題が発生し、複数の冗長化冷却システムに障害が起きたという。結果として、AZ内の少数のEC2サーバが過熱状態となり、障害として表面化したとしている。

米AWSによる障害についての説明

 冷却システムは午後3時21分に復旧。午後6時30分までに、ほぼ全てのストレージ(EBSボリューム)とインスタンスが復旧したという。

 同社は、障害の影響が残ったままの残りのインスタンスなどについて復旧を進めている。影響を受けた顧客に対し、「迅速なリカバリーには、可能であればインスタンスなどをリプレースすることを推奨する」とした上で、「影響を受けたインスタンスの中には、顧客からのアクションを必要とするものもあるだろう。該当する顧客に対しては、次のステップで対応していく」という。

 EC2とともに障害が起きていたクラウドデータベースの「Amazon Relational Database Service」(RDS)についても、午後8時46分時点で「大方の接続障害について復旧を完了した」としている。

Copyright © ITmedia, Inc. All Rights Reserved.