検索
コラム

「X」や「ChatGPT」などが止まった――サービス停止の背後にある「CDN」の障害 ローカルアプリでも用心が必要(2/3 ページ)

11月18日、「X(旧Twitter)」や「ChatGPT」など複数のインターネットサービスにおいて、世界規模の障害が発生した。その背景には何があるのだろうか。

Share
Tweet
LINE
Hatena

Cloudflareのダウン原因は「バグ」 しかし「バグ」は排除しきれない

 今回のインシデントは、そのCloudflareが提供しているCDNのサービスがそのものが落ちてしまったため、クライアントからキャッシュサーバへのアクセスができなくなり、Cloudflareを利用しているXやOpenAIなどのサービスにアクセスができなくなったということだ。

 今回、CloudflareのCDNが落ちてしまったのはなぜなのか――先述の通り、Cloudflareは既に原因を特定し、CEO自らが詳細にブログで説明している。

Cloudflare
マシュー・プリンスCEOによるブログエントリー(日本語訳版)

 このブログエントリーの中で、プリンスCEOは原因を以下のように説明している。

この問題はサイバー攻撃や悪意のある行為によるものではなく、当社の行ったデータベースシステムに対する権限変更に起因するものであり、ボット管理システムで使用される「フィーチャーファイル」に複数のエントリが出力され、ファイルサイズが予想以上に倍増したことでした。大きくなったフィーチャーファイルは、ネットワークを構成する全ての機器へと伝播されました。

伝播先の機器上で動作するネットワーク全体のトラフィックをルーティングするソフトウェアは通常、このフィーチャーファイルを読み込んでボット管理システムを最新の状態に維持することで常に変化する脅威に対応しますが、伝播されたフィーチャーファイルのサイズがソフトウェアで設けられているファイルサイズの上限を超えており、結果、ソフトウェアが正しく機能しなくなる事態へと繋がりました。

 非常にざっくりいえば、同社が「ボット管理システム」と呼んでいる設定ファイルのコピーに同社が利用しているサードパーティツールの問題からエラーが発生し、通常の設定ファイルに比べて倍のファイル容量になり、ソフトウェアに設定されているファイルサイズの上限を超えてしまった結果、システムがダウンしてしまったということのようだ。

 今回の事案で“不運”が重なったこととして、Cloudflareの調査チームは当初、DDoS攻撃の可能性を疑い、それを前提に調査を続けたため、結果としてソフトウェアのバグであることを突き止めるのに5時間近い時間がかってしまい、復旧までに通常より時間がかかったのだという。

 こうしたソフトウェアのバグを起因とするインシデントは、別にCloudflareでのみ発生する訳ではない。「完璧なものは存在せず、完璧に見えるものはまだバグが発見されていないだけ」というソフトウェアの特性を考えると、どんなソフトウェアでも、もっといえばどんなクラウドサービスでも起こりうる

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る