Amazonプライムデーのサーバ障害、原因は「OracleからAurora DBに乗り換えた」ではない――CTOがCNBCの報道を否定Publickey(2/3 ページ)

» 2018年10月29日 08時00分 公開
[新野淳一Publickey]

原因はデータベースではなく、アプリケーション側にある

 Vogels氏はTwitterで長文を公開するためにわざわざ文書を画像にしてツイートしています。冒頭の一部を翻訳し、引用しましょう。

 まず明確にしておきたいのは、AWSとAuroraはAmazonプライムデーの障害にまったく関係ないということだ。プライムデーのWebサイトの障害はAmazonリテール側のソフトウェアスタックの問題に起因するのだ。

 Vogels氏も当然ながらAmazon.com社内の報告書を見ています。その上で、障害の原因はセーブポイントにあったものの、それはアプリケーションに起因しており、アプリケーションを修正することで解決したと説明。

The application in question accidentally created an excessive number of savepoints, despite that team knowing that Aurora and Oracle handle savepoints differently. This created a temporary situation where the database was very slow and the application experienced intermittent timeouts. The problrem was quickly diagnosed and completely resolved by simply removing the unnecessary savepoints that had been inadvertently left in the retail application.

(チームはAuroraとOracleがセーブポイントを異なる方法で処理することを知っていたにもかかわらず、問題となるアプリケーションは大量のセーブポイントを作成してしまった。これによって一時的にデータベースは非常に遅くなり、アプリケーションは断続的なタイムアウトを発生するようになったのだ。しかし、この問題はすぐに解明され、リテールのアプリケーションが原因で不用意に残ってしまったセーブポイントを削除するだけで完全に解決された。)

 AWSは、AuroraがOracleと同等以上の性能を備えたデータベースであると常に主張してきました。OracleからAuroraに乗り越えたことで、処理能力が不足して障害の原因になった、という報道に対して敏感になるのは当然でしょう。

 では、CNBCの報道とVogels氏の発言、どちらが正しいのでしょうか。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ