ニュース
» 2012年01月26日 17時56分 UPDATE

スマホ対応のインフラにしたはずが……:「処理能力の見極めを誤った」――ドコモ、大規模な通信障害を謝罪

原因はスマホ対応にしたはずの新型パケット交換機だった――都心で25日朝に起きた通信障害について、ドコモが原因の詳細説明を行った。急増するスマホ利用に対応した設備にもかかわらず、想定以上のトラフィックに耐えきれなかったという。

[平賀洋一,ITmedia]
photo 謝罪するドコモの岩崎氏、菊池氏、丸山氏

 NTTドコモは1月26日に記者会見を開き、25日に発生した通信障害についてその原因についての詳しい説明を行った。

 通信障害は朝8時26分に発生し、約4時間40分後の13時8分に復旧。対象エリアは東京都の14区(葛飾区・江戸川区・江東区・港区・新宿区・千代田区・中央区・品川区・文京区・墨田区・大田区・目黒区・渋谷区・世田谷区)で、最大252万人のユーザーに影響が出た。

 このエリアでは25日未明からパケット交換機の切り替えを行っており、通信障害はこの新型交換機の制御信号に関する処理能力を超えたこと(輻輳)が原因。輻輳によって設備の自律制御が働き、パケット網だけでなく音声網にも規制がかかったことで、音声通話もつながりにくくなってしまった。その後、パケット交換機を従来のものに戻すことで復旧させている。

 同社取締役常務執行役員の岩崎文夫氏は、「スマートフォンのネットワーク利用に合わせてパケット交換機を入れ替えたが、結果として想定を超えるトラフィック数に対処できなかった。我々の見極めが甘かったことで大勢のユーザーの皆さまにご迷惑をおかけしてしまった。誠に申し訳ない」と謝罪した。

ポイントは「制御信号」

photo ドコモの岩崎氏

 今回の通信障害は、新型のパケット交換機が制御信号の増加に対応できないことが原因だった。この制御信号とは、無線通信の準備のために端末とキャリア設備の間でやりとりされるもの。従来のiモードケータイ(フィーチャーフォン)では、発信・着信の際や、端末が移動して基地局が変わった場合に発生していた。基本的に、ユーザーが端末を操作しないと行われないため、「交換機の処理能力の中でも、制御信号はあまり重要な項目ではなかった」(ドコモ)という。

 一方、スマートフォンではユーザーが操作しない場合でも制御信号のやりとりが行われている。特にAndroidではOS自体が28分に1度通信しており、さらにVoIPやチャットなどのコミュニケーションアプリがインストールされていると、3分〜5分に1度の割合で制御信号を発生しているという。そのため、従来のパケット交換機では増加する制御信号の同時接続に対応できない恐れが出てきた。

photophotophoto 通信障害の原因となった、東京都心をカバーするパケット交換機の入れ替え状況(写真=左、中央)。新旧のパケット交換機の比較(写真=右)

photophotophoto Android OSは制御信号を常時通信しており、アプリによってはその回数がさらに増える(写真=左)。今後の対策(写真=中央)と1月25日の時系列(写真=右)

 今回の原因となった新型交換機は、個々の性能向上により台数も11台から3台に削減。スマートフォン利用に対応するため、処理できる制御信号の同時接続数がこれまでの88万台から180万台へと大幅に上がっている。しかし、1時間あたりに処理できる最大の信号量は、従来の2750万回から、半分程度の1410万回に下がっている。

 これについて岩粼氏は、「過去の交換機は、制御信号の“処理能力は高いが、同時接続数は低い”という性質のもの。これまでも同時接続数がボトルネックになることがあり、その都度、交換機を増強してきた。しかし処理能力については、“2750万回”とやや過剰な性能になってしまった。スマートフォンに対応するにはその性格付けを変える必要があり、“同時接続数を高めて、処理能力は十分なレベルまで下げる”という判断をした」と話す。

photophoto コアネットワーク部長の菊池太志氏(写真=左)。サービス運営部長の丸山洋次氏(写真=右)

 その際に想定されたのが、1時間あたり1200万回という信号量。新型交換機ではさらに余裕を持たせて、1時間に1410万回の通信能力を設定している。しかし実際には、1時間あたりに1650万回の制御信号が発生。最適化したはずの処理能力が足りなかったことで輻輳が起き、ユーザーが通信できない事態に陥ってしまった。

 また、交換機が輻輳によって自動的に接続を規制したことで、パケット網だけでなく、音声網も使えなくなった。サービス運営部長の丸山洋次氏は、「当日は朝8時半ころから軽い輻輳が起き始めた。普段であれば自然に解消するが、今回は交換機そのものが原因にあることから、そのままでは復旧しない。手動で操作で規制のかけ方をコントロールした」と振り返る。

 なお、同時接続数については想定通りの71万回で、新型交換機でも問題は起きない数値。また25日朝に発生した1650万回の制御通信は、従来の交換機が持つ処理能力の2750万回をかなり下回っており、「現在は安定した状態」(ドコモ)という。

 交換機性能の見極めを誤った要因の1つに、従来は制御信号の処理件数を正確に計測する機能がなかった点が挙げられる。そのため、サンプル調査などから推定した数値をもとに交換機のキャパシティを想定していたが、実情はそれを上回っていた。

 新型交換機は処理件数の実測ができるうえ、今回影響を受けたエリアの一部では20日から一部で部先行して導入されていた。しかし、コアネットワーク部長の菊池太志氏によると、「新しい設備ということで、動作の安定性のチェックを優先し、制御信号の増加傾向はモニターできていなかった」と釈明する。

コミュニケーションアプリの規制は考えていない

 NTTドコモは今回の通信障害を受け、2月中旬までに全国のパケット交換機約200ユニットを一斉点検し、それ以降に必要に応じた設備の増強を行う。また、今回の直接の原因でもあるパケット交換機のリソース配分を8月中旬から見直し、制御信号の処理能力を向上させる。スマートフォンを販売するキャリアとして、まずはインフラの増強で対処する方針だ。

 また、トラフィックを増大させているアプリの制御信号についても、GSMA(国際的な通信キャリアの業界団体)で課題となっており、今後はアプリ開発者などと協力して、なんらかの対策を行っていきたいとしている。

 ただし、コミュニケーションアプリの使用制限は考えていないと、岩崎氏は話す。「コミュニケーションアプリの増加は昨秋くらいから認識しており、課題にはなっていた。しかし、スマートフォンの利点はさまざまなアプリを使える点にあり、これに制約をかけることは考えていない。制御信号の増加についてはトラフィック側で対応していきたいと思う。どこまで効果があるかはまだ分からないが、設備側の対応で制御信号の回数を減らすこともできるかもしれない」(岩崎氏)

 ドコモは2011年12月にspモードのアドレスが入れ替わるという不具合があり、山田隆持社長を本部長とする「ネットワーク基盤高度化対策本部」を発足。全社横断的にインフラや運用方針の見直しを進めている。とはいえ、その矢先の大規模な通信障害に、同社のサービス品質に対する不安や疑問の声は多い。同社は年末から続く一連の不具合や通信障害への取り組みについて、山田社長と辻村清行副社長が出席しての記者会見を27日午後に開催する予定だ。

Copyright© 2016 ITmedia, Inc. All Rights Reserved.