連載
» 2021年10月16日 06時00分 公開

ドコモの通信障害はなぜ長期化したのか? 障害の告知方法やMVNOの扱いには課題も石野純也のMobile Eye(1/3 ページ)

10月14日に、ドコモのネットワークで大規模な通信障害が発生した。緊急通報を含む音声通話やデータ通信に影響が出た他、位置登録自体ができず、圏外になってしまったユーザーもいたようだ。ここでは、その原因を解説するとともに、通信障害が長期化した理由を解説していきたい。

[石野純也,ITmedia]

 10月14日に、ドコモのネットワークで大規模な通信障害が発生した。緊急通報を含む音声通話やデータ通信に影響が出た他、位置登録自体ができず、圏外になってしまったユーザーもいたようだ。ドコモはネットワークに対する規制を徐々に緩和し、14日の19時57分に終了させたが、その後もユーザーの通信が集中する形で、通話やデータ通信がつながりづらい状況になった。

 4Gと5Gの障害が解消されたのは、翌15日の5時5分のことだ。15日には、ドコモが緊急会見を開催。障害発生の原因や影響の中身などを説明した。トータルで見ると約12時間に渡って発生していたドコモの通信障害だが、その具体的な理由は携帯電話がつながる仕組みを理解していないとなかなか理解しづらい。ここでは、その原因を解説するとともに、通信障害が長期化した理由を解説していきたい。

ドコモ 約12時間に渡って発生した通信障害を謝罪するドコモ幹部

時系列で見るドコモの通信障害、引き金になったIoT端末用の加入者/位置情報サーバ移行

 約半日に渡って続いたドコモの通信障害だが、まずはその中身を時系列に見ていきたい。直接的なきっかけになったのは、14日0時に始まったIoTサービス用の加入者/位置情報サーバ(HSS/HLR)を切り替える作業だ。IoT端末に限らず、携帯電話は通信を行うためにまず自身の居場所をHSS/HLRに登録する。どこにいてもすぐに端末が特定され、きちんと着信できるのはそのためだ。ドコモによると、このサーバの処理能力を上げる目的で、収容先を移行していたという。

ドコモ 14日0時に始まったIoT端末用のHSS/HLR移行に失敗したことが、通信障害の引き金になった

 ところが、移行作業中に不具合が発生した。ドコモのサービス運営部長 引馬章裕氏によると、海外で利用中のIoT製品がローミングでドコモ網に接続する際に、「それぞれの国からの信号に想定していないパラメーターが入っていた」などの理由で、新サーバへの登録が行えなかったという。そのため、同日7時26分の段階で、移行作業を中止し、もともと使っていたサーバへの切り戻しを開始した。この時点では、通信障害はまだ発生していない。

ドコモ 新設備への移行作業を行っていたが、不具合が発生。7時26分に、旧設備への切り戻しを開始した

 引き金になったのが、同日16時36分に実施したIoT端末に対する位置情報の再登録要求だ。一斉に再送が行われるとサーバの処理能力を超える恐れがあったため、端末を小分けにして「20万台ぐらいを新設備から旧設備に移し替えようとしたが、うまく移しきれず、(登録が弾かれた端末からも)大量に位置登録信号が来てしまった」(同)。20万台ずつでも、サーバの処理能力を超えてしまったのだ。

 結果として、位置情報の再登録要求を出した24分後の17時ごろにはトラフィックが急激に上昇。通信がしづらい状況に陥った。引馬氏によると、IoT用のHSS/HLRと一般のスマートフォン、ケータイ用のHSS/HLRは分けていたというが、位置情報を登録するための制御信号が多すぎたため、スマートフォンや携帯電話への影響が出てしまったようだ。

ドコモ 切り戻しの際にHSS/HLRがパンクし、IoT端末側からの位置情報登録要求を処理しきれなくなった。この信号が急増したことで、全端末を巻き込んだ輻輳(ふくそう)が発生している

 「このトラフィックを受け続けるとネットワーク全体が危なくなってしまう」(常務執行役員 ネットワーク本部長 小林宏氏)――そう判断したドコモは、影響範囲の広がりを抑えるため、ネットワークに対する規制を実施した。17時37分のことだ。ネットワーク規制は位置登録の要求を最大で100%遮断するというもの。この時点で、移動した端末は位置情報の変更ができなくなり、ドコモのネットワークに接続できない状態になった。この影響範囲は、200万回線に及ぶという。

 位置情報が登録できていない端末は圏外などになってしまうが、これと同時にネットワークが混雑したため、音声通話やデータ通信が一部つながりにくくなる事象も発生。17時ごろから、徐々にスマートフォンや携帯電話がつながりにくい状況になっていった。一方で、ネットワーク規制は徐々に緩和していき、19時57分に完了する。この時点で、位置登録をするための制御信号が通るようになった。

 一方で、ネットワーク規制の緩和後に通信ができるようになり、音声通話やデータ通信のトラフィックが再度急上昇した。「ピクト表示がおかしくなったのが正常に戻ったことを気がついた方がいたり、パケットやメッセージの受信が始まってトラフィックが流れ始めたりした」(引馬氏)ためだ。IoT端末向けのHSS/HLRを切り戻す作業も並行して行っていた結果、音声通話やデータ通信が利用しづらい状況は翌15日の5時5分まで続いた。

ドコモ 音声通話やデータ通信が利用しづらい状況は、ネットワーク規制解除後も続いた

 ただし、5時5分で回復したのは4Gと5Gのネットワークのみ。3Gが回復したのは同日22時だった。これは、IoT端末を収容する設備の切り戻しに時間がかかったためだ。「3Gをお使いの方は、4Gよりも細かい単位で見なければいけない利用方法をされている」(同)という。ドコモ側は明言を避けたが、具体的には、タクシーでの決済など、頻繁に移動するサービスに3Gのモジュールが多く使われているためだと考えられる。この切り戻しを細かく分けて行っている関係で、4G、5G以上に復旧の時間がかかったようだ。

       1|2|3 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

過去記事カレンダー