1つ目の不明点は、なぜ最初にVoLTE交換機が輻輳したのかということ。「スマートフォンは電話をかけていないときにも、50分に1回、(VoLTE交換機に)再登録のようなことをする」(同)ため、夜間でもトラフィックが発生するのは事実だが、KDDIはこうした事態も想定しており、計16台のVoLTE交換機には十分な容量を持たせていた。
実際、現時点では通常時より6台少ない12台で運用しているが、「もともとは半分の9台があれば十分という容量設計になっている」(技術統括本部 副統括本部長兼エンジニアリング推進本部長 山本和弘氏)という。
7月4日に判明したVoLTE交換機側からHSSへ送られていた異常な信号が発生した理由も判明していない。これが2つ目の不明点だ。機器の故障だったのか、ソフトウェアに不具合があったのか、復旧手順に予期していなかった落とし穴があったのか。こうした点は、事故発生から30日以内に総務省に提出される報告書で明らかになる見込みだ。
2021年10月には、ドコモもIoT用のHSSを移行させる工事に失敗し、大規模障害が発生した。ネットワーク内部の工事に伴う通信障害で、HSSが絡み、そこから音声通話へ波及した点はKDDIの一件と共通する。一方で、ドコモの通信障害を受け、対応策を含めた知見は他社にも共有されていた。ドコモの通信障害の教訓は生かせなかったという問いに対し、高橋氏は「われわれの経験として加えた方がいいものも入れて再検証し、対応したつもりだった」と語る。
実際、KDDIではドコモと同様のトラブルが起きないよう、スマートフォンとIoTのHSSは、分けて管理していたという。結果として、今回の通信障害で影響を受けた端末の内訳を見ると、スマートフォンが約3580万回線だったのに対し、IoTは約150万回線にとどまっていた。IoTの中にはSMSを何らかのトリガーにする端末もあり、こうした機器は通信障害に巻き込まれてしまったが、「データ通信だけのテレメーターのようなサービスには影響を与えていない」(同)という。
裏を返せば、ドコモの通信障害の教訓がある程度生かせていたからこそ、IoT回線への影響を最小限にとどめられたともいえる。仮に、1500万回線ものIoT機器が一斉に止まってしまった場合、社会生活への影響がさらに大きくなってしまった恐れもある。
センサーからのデータが取得できなくなったり、決済サービスが不通になったり、監視カメラからのデータが取れなくなったりなど、その影響は計り知れない。150万回線とはいえ、影響は受けてしまったことは事実だが、総回線数の約1割に影響をとどめられたことは、不幸中の幸いといえる。
Copyright © ITmedia, Inc. All Rights Reserved.