輻輳とは、通信が極端に集中してしまう状態を指す。通信がつながらない、あるいは届いているか分からない場合に、通信内容の破棄と再送信が繰り返し発生する──などのメカニズムで、有効な通信帯域が極端に減ってしまう現象だ。
ちなみにVoLTE交換機は全部で18台あり、負荷を分けあう仕組みが導入されており、当然ながらそれぞれの処理能力は十分に高く設定されている。正常に動作していたシステムに切り戻せば、問題は収束へと向かうはずだった。
ではなぜ輻輳してしまったのか。KDDI自身「まだどのように障害が広がったのか、その機用順序は分析中」というようにトラブルの根っこは不明だ。
高橋社長は昨年起きたドコモのトラブル(5G/LTE回線が12時間にわたってダウン)について「他人ごとではない」と危機感をもって既存システムの再点検を行うと話していた。実際、大規模なシステムダウンが起きないよう対策をしてきたという。
そんな中での大規模障害だけに「実際に障害が起きている。言い訳できない(高橋社長)」というが、そこにはまだ明らかになっていない、つまりKDDIも結論へとたどり着けていない理由があるのだろう。分析はまだこれからだ。
VoLTE交換機への接続要求が15分遮断、それも全国一様にではなく、一部のネットワークセンターだけの話だ。15分の間にたまった端末からのリトライが集中したとはいえ、そんなに簡単に輻輳するようなことがあるのか? と疑問に感じる読者もいるかもしれない。
当然、われわれが考えているようなトラブルの原因はKDDIも考えており、何らかの対策は打っていたはずだ。しかし接続している端末の振る舞いの全てまで、把握できていない可能性はあるだろう。
今回のようなトラブルケースで輻輳した原因には、端末側の実装も関係しているかもしれない。いずれにしろ、記者会見時点ではまだトラブルの収束を図っていた段階だ。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR注目記事ランキング