KDDIを襲った多重のワナ 通信障害では結局、何が起きていたのか本田雅一の時事想々(3/5 ページ)

» 2022年07月29日 20時00分 公開
[本田雅一ITmedia]

負の連鎖で起こる「さらなる想定外」

 全国のVoLTE交換機には負荷を分散させるロードバランシングの仕組みがある。多摩以外のネットワークセンターにあるVoLTE交換機からの音声通話要求も流入していたが、通話処理を引き渡す要求に対して(接続はできているのに)応答がないため再送要求が繰り返され、多摩とそれ以外の地域にあるVoLTE交換機の間でも輻輳が発生していたという。

 まさに想定外がさらなる想定外を生み出す状況だ。ルーターの切り戻しをして正常なネットワーク設定に戻したものの、これだけではすぐには問題は解決しない。

 そこで音声通信の流量制限を行うことで加入者データベースへのアクセス負荷を軽減した。通常ならば、これで加入者データベースへの輻輳は収束へと向かい、しばらくすれば正常化できるはずだ。

 ところが完全解消までなかなか至らなかった。通信障害が発生、継続していた一連の現象の中で、VoLTE交換機の一部に異常が発生し加入者データベースへの認証処理が繰り返し行われたため高負荷が継続して発生していたのだという。

加入者DBの輻輳発生

 そこで全国に18台あるVoLTE交換機交換機のうち、異常状態になっていた6台を切り離すことで初めて異常状態を脱し、輻輳の解決へと至ったというわけだ。

VoLTE交換機6台のの切り離し

 復旧作業中(3日)の会見では、まだVoLTE交換機が異常状態になっていたところまでは把握できておらず、流入制限のみで輻輳が収まると考えられていた。4日朝の会見時、夕方でも東日本のネットワーク立て直しを行い、翌日までに回復させていくと話していたのが、5日になっても発話できない状況が続いていたのは、想定外の状況の中でVoLTE交換機そのものに異常が発生していたためだった。

Copyright © ITmedia, Inc. All Rights Reserved.