ドコモが10月14〜15日の「重大な通信障害」を総務省に報告 音声は約460万人、データは830万人以上に影響

» 2021年11月10日 16時30分 公開
[井上翔ITmedia]

 NTTドコモは11月10日、10月14日から15日にかけて発生した通信障害について、総務省に「重大な事故報告書」を提出した。同省ではこれを受領し、今後精査の上でNTTドコモへの対応を検討する。

 報告書の提出を受けて、ドコモは同日、当該の障害に関する説明会を改めて開催した。この記事では、10月15日の説明会からアップデートされた内容を中心に解説する。

小林常務 通信障害に関する解説を担当した小林宏常務(ネットワーク本部長)
質疑の様子 説明後の質疑には小林常務(中央)の他、音洋行執行役員(ネットワーク開発部長、左)と引馬章裕サービス運営部長(右)も対応した

障害の原因除去後の「接続不具合」の影響人数が明らかに

 当該の障害は、タクシーの電子決済や自動販売機で使われるIoTサービス用の「加入者/位置情報サーバ(HLR/HSS)」を旧設備に切り戻し(ロールバック)をしたことが原因で発生した。詳しい経緯は10月15日の説明会で説明があった通りである。今回の説明会では、影響したユーザー(契約)数の一部訂正と新規開示が行われた。

 14日17時37分頃から19時57分頃まで発生した通話やデータ通信が「利用できない状況」について、影響を受けた契約(回線)は当初「全国で約200万ユーザー」とされたが、精査を行った結果「一部の県(※1)を除く全国で約100万ユーザー」であると分かったという。一部のユーザー(状況的にはXi契約者の一部)は、3G(FOMA)に移行することで通話や通信を継続できたようだ。

(※1)石川県、富山県、福井県、奈良県、和歌山県

 14日16時54分から最長で15日22時まで続いた、通話やデータ通信が「利用しづらい状況」の影響を受けた人数は以下の通りとなった。

  • 音声通話を利用しづらいユーザー:約460万人
  • データ通信を利用しづらいユーザー:830万人以上
状況 障害に関する精査を行った結果、障害の中核となる「利用できない状況」の影響規模が約200万人から約100万人に訂正された。「利用しづらい状況」の影響人数は、今回の説明で初めて公開された
定義 今回の障害は、正確な影響人数を算出するのは困難だという。そのため、通常稼働時と障害発生時の各種数値の差分から影響人数(最大値)を推計している

齟齬(そご)が障害につながった?

 ドコモは「利用できない状況」を解消した19時57分過ぎに、ITmedia Mobileを含む一部メディアに対して「回復」の連絡を行い、それに基づき「ドコモの通信障害は回復した」という旨の報道もなされた。しかし、この「回復」は位置登録規制の解除であり、解除に伴い多くの端末が一斉に位置登録を試行したことで、今度は「信号交換機」に輻輳(ふくそう)が発生し、つながりづらい状況が発生してしまった。

 同社では利用できない状況が解消することを「回復」と見なしていた。確かに設備側の観点では障害の根本原因は取り除けたので回復といえるが、その直後に端末の位置情報登録が集中して通信できないとなると、ユーザー視点では回復とはいえない。ある意味で「回復」を巡る解釈に齟齬(そご)が生じていた状況だ。

 今後は設備の復旧ではなく、ユーザーの利用しづらい状況の解消をもって「回復」とすると共に、Webサイトでの障害告知の迅速化と高頻度化を図るという。

回復報 当該の障害では、設備面での障害を取り除いた時点で「回復」と判断してしまった。しかし、端末が一気に位置情報の登録/更新を試みた結果、信号交換機において輻輳が起こってしまった。今後は、通常の通信状態に戻った時点を「回復」とするという

 齟齬という観点では、当該の障害の根本原因となったIoTサービス用のHLR/HSSの切り戻し作業において、ドコモの担当者と実務を担うパートナー企業の担当者とのコミュニケーションにも齟齬が生じていたようだ。

 設備の切り替え工事では、その方法や手順はもちろん、障害が発生した際の切り戻し方法や手順についても事前に確認を行った上で作業が行われる。しかし今回の障害では、切り戻し手順の詳細を詰め切れていなかったため、切り戻し時に一気にIoTデバイスへの位置登録要求が行われてしまったようだ。事前準備に足りない面があったため、IoTデバイスの位置登録要求の調整も遅れてしまったようだ。

原因 HLR/HSSの切り替え時に、海外からローミング接続してくるデバイスが接続できない事象が発生したため、以前のHLR/HSSに切り戻した。切り戻し自体はパートナー企業との打ち合わせ通りに行われたが、打ち合わせの際の認識の齟齬によって大量のIoTデバイスへと“一気に”位置情報の登録を要求してしまった
原因 14日19時57分頃に位置登録規制の解除を行った所、スマートフォンなどIoTデバイス以外からも位置登録要求が相次ぎ、信号交換機が輻輳してしまった
原因 ネットワーク構成上、IoTデバイスのみ位置登録規制を行うことができなかったため、スマホや携帯電話にも影響が出てしまったという

再発防止策

 10月15日の説明会では、、再発防止策を10月下旬までに講じるとしていた。しかし、障害の内容を精査した結果、追加のものを含めて2021年11月下旬から2022年1月下旬にかけて順次再発防止策を講じることになった。時系列に並べると、以下の対策を行うという。

  • 11月下旬までに対応完了
    • 切り戻し手順における条件の明確化
    • 作業関係者側における手順を含めた「全体手順書」の作成
  • 12月下旬までに開発完了
    • IoTデバイスの海外ローミングに対応するソフトウェアの導入
    • 新旧HLR/HSSの機能差分の再確認
  • 2022年1月下旬開発完了
    • 「IoTデバイス」と「その他の端末」で信号交換機を分離する措置
  • 次回工事/障害発生時から対応
    • 短時間で復旧措置を実行できるような事前準備の実施
    • 回復報の告知基準の見直しと情報発信の迅速化/高頻度化
再発防止策 再発防止策

役員報酬の返上

 今回の障害を受けて、ドコモは社長や副社長を含む役員8人が役員報酬を自主返納することを発表した。返納額は以下の通りだ。

  • 井伊直之社長:月額報酬の20%を1カ月
  • 副社長(3人)および関係部署の執行役員(4人):月額報酬の10%を1カ月

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

最新トピックスPR

過去記事カレンダー

2024年