RSS

ニュース

神尾寿のMobile+Views:ドコモに何が起きたのか 大規模障害に垣間見える、顕在化するスマホ時代の課題 (1/2)

1月25日に東京都内で発生した通信障害は、範囲は限定的だったものの、252万人のユーザーに影響を及ぼす大規模なものだった。障害の原因はスマートフォンの急速な普及と、それにともなうアプリケーションの変化にある。

 既報のとおり、1月25日に東京都内でNTTドコモの大規模通信障害が発生した。障害は朝8時26分に発生し、約4時間40分後の13時8分に復旧。対象エリアは東京都の14区(葛飾区・江戸川区・江東区・港区・新宿区・千代田区・中央区・品川区・文京区・墨田区・大田区・目黒区・渋谷区・世田谷区)であり、最大252万人のユーザーに影響が出た。東京都心部で、しかも平日の昼間に発生したため、かなり深刻かつ大規模な障害であったことは言うまでもない。

 25日の通信障害を受けて、NTTドコモは26日に報道関係者向けの緊急記者会見を実施。NTTドコモ 取締役常務執行役員の岩崎文夫氏が中心になり、障害の原因と今後の対策について説明した。

 ドコモの大規模通信障害はなぜ発生したのか。その原因と、背景にある問題や課題について考えてみたい。

想定数値の甘い見積もりと、交換機の構成変更が原因

Photo 謝罪するNTTドコモ 取締役常務執行役員の岩崎文夫氏

 「我々の見極めが甘かった」

 記者会見の席上、壇上にあがった岩崎氏は何度もそう謝罪した。

 今回の障害発生の直接的原因は、通信設備の処理能力が実際のトラフィックに追いつかなかったこと。専門用語でいう「輻輳 (ふくそう)」である。しかし、なぜ、25日の朝に“いきなり起きた”のか。

 巷間では、当日9時頃に起きたJR東日本 山手線のダイヤ乱れとの因果関係を問う声もあったが、このような日常的なトラフィック増は各通信事業者の設備計画では織り込みずみだ。ドコモでも、鉄道ダイヤとの関連性は繰り返し否定している。実際の原因は、岩崎氏が繰り返し語ったようにドコモ自身の見積もりの甘さやミスが重なった結果だった。

 大規模障害の発端は、この1月から導入・運用を開始した新型パケット交換機への切り替えから始まっている。この新型パケット交換機はスマートフォンによるトラフィック増に対応するため開発されたもので、厳しい導入前テストと試験運用を経て、1月20日から現行パケット交換機4台分をカバーする形で先行的な運用が始まっていた。25日は、20日からの先行運用の結果が順調だったことを受けて、さらに現行パケット交換機7台分の処理を新型パケット交換機に切り替える日だった。作業は24日深夜に実施され、25日未明には新型パケット交換機は本来の計画だった現行パケット交換機11台分の処理を担当。しかし、同日8時26分に新型パケット交換機は輻輳により動作が不安定になり、復旧まで約4時間40分におよぶ大規模障害が始まった。

 しかし、新型パケット交換機は「スマートフォンによるトラフィック増に対応する」ために導入されたはず。なぜ、現行機からの切り替えで輻輳状態を引き起こしたのか。ここにドコモの“計算ミス”があった。

 ドコモは新型パケット交換機の開発・導入にあたり、交換機と端末が常時接続できる「同時接続数」を重視していた。これはスマートフォンが従来のiモード端末よりも、常時接続でネットやアプリを利用するケースが多いからだ。全体的な容量拡大・性能向上の中でも、特に同時接続数を増やし、現行機1台あたり8万回線だった同時接続数を、新型機では60万まで引き上げている。だが、今回の大規模障害を引き起こしたのは、同時接続数ではなかった。ユーザー端末の位置登録やサーバとの接続確立で使われる「制御信号」が輻輳したのだ。

 なぜ、このような事態になったか。

 その理由は現行パケット交換機と新型パケット交換機の構成数にある。現行パケット交換機はスマートフォン急増にともなって同時接続数が逼迫していたため、同時接続数を増やすために構成数を11台にし、全体で88万の接続数を実現していた。この副次的な産物として、1時間あたりに処理できる制御信号数は2750万(1台あたり250万)にふくれ上がっていた。一方、新型パケット交換機は同時接続数の処理能力を重視した設計になっていたため、構成数を減らしても十分な同時接続数を確保できた。そこでドコモでは、交換機の構成数を従来の11台構成から新型パケット交換機では3台構成へと変更した。しかし、新型パケット交換機では同時接続数は劇的に増えていたが、1時間あたりの制御信号の処理能力は約2倍(現行機の250万から新型機は470万)にしか増えていなかった。あとは初級の算数の世界だ。“同時接続数が十分に確保できる”という理由で新型パケット交換機では現行機よりも構成数を11台から3台へと半分以下に減らしたため、1時間あたりの制御信号の処理能力が、全体で2750万から1410万に減少してしまったのである。

 むろん、ドコモでも新型パケット交換機の構成を考えるにあたり、全体の処理能力が不足しないように試算した。そこでドコモが当該エリアの制御信号量として想定したのが、1時間あたり1200万という数値だ。これは新型パケット交換機の構成では1時間あたり210万しか余裕がないが、「そもそも制御信号は、それほど使われるものではないという認識だった」(岩崎氏)。だが、25日朝の実際のトラフィックでは、1時間あたり1650万ほどの制御信号が発生。現行パケット交換機の構成では問題のなかったピーク時の制御信号の処理能力が、新型パケット交換機の構成では足りなくなり、制御信号が輻輳。大規模障害につながったのである。

       1|2 次のページへ

Copyright© 2012 ITmedia, Inc. All Rights Reserved.

Special

FEATURES

3月14日〜16日 東京ビッグサイト:
Mobile IT Asia
急激に変化するモバイル市場を支える技術・サービス・コンテンツ・ソリューションを紹介する展示会。モバイルITが築く新しい社会の姿がここに。


仕事に役立つAndroidアプリはここでチェック!「仕事アプリナビ」
日々の仕事をサポートするAndroidアプリをカテゴリー別に紹介するサイト「仕事アプリナビ」がオープン。

Special

スマートフォン

「Android」「Windows Mobile」「iPhone」の
最新記事をピックアップ

news111.jpg
しらすをかきわけて無我の境地に 「みんなのしらす」
しらすで覆いつくされた画面の中から、ただひたすらカニやタコを探し出す。地味なのにハマりやすく、いつのまにか無我の境地に――。そんなAndroidアプリをご紹介しよう。

契約者数

現在の携帯契約数(1月末)
NTTドコモ 5971万0200
(2in1:30万8000)
au 3447万9000
ソフトバンク 2806万1900
(DN:2万4700)
イー・アクセス 380万0000
(12月末)
携帯累計 1億2605万1100
(イー・アクセス含む)
ウィルコムPHS 435万9200
携帯・PHS累計 1億3041万0300
(イー・アクセス含む)
UQコミュニケーションズ 188万3900

Web閲覧端末数/MNP利用状況

Web閲覧端末数
iモード/spモード 5168万0400
EZweb/ISNET 2816万8100
Yahoo!ケータイ 2152万9000
EMnet 非公開
累計 1億0137万7500
MNP利用状況(差し引き 1月末)
NTTドコモ −9万9300
au 5万3300
ソフトバンクモバイル 4万6000
イー・アクセス 非公開

Pick Up! ホワイトペーパー

  • ビデオ会議はパーソナル・タブレットと相互接続の時代へ
     従来のビデオ会議は、会議と名のつく通り会議室同士だけのために存在していました。 近年、ビデオのマーケットはビジュアルコミュニケーションという大きな括りとなり、パーソナル型やスマートフォン、タブレット端末でも活用されるようになりつつあります。 シスコシ...
  • スマートフォンのセキュリティ対策は本当に必要なのか
     スマートフォンやタブレットといったスマートデバイスの急速な普及に呼応するように、スマートデバイスを標的にしたマルウェアが多数発見されるようになった。だがこうしたマルウェアは脅威ではないと考えるセキュリティ専門家は少なくない。 ユーザー企業は、スマート...
  • “使いやすさ”が大幅に向上! 多様なIT資産を一元管理できる最新クライアント運用管理ツール
     ハードウェア/ソフトウェアのIT資産管理(Mac OSやLinux OSにも対応)、操作ログ管理、セキュリティポリシーの運用、クライアントのリモートメンテナンスなどを支援し、USBデバイスやネットワーク機器なども一元管理できる「SKYSEA Client View」。 同製品に搭載する各...
  • 技術者が見せる。Google Appsでの開発・実装例
     これまでにGBSに寄せられたグループウェア選択の際のお客様の注目点、ご要望から浮かびあがる2つのポイント「ワークフロー」「データ連携」。 Googles Apps(TM)は、これらにどのように応え、改善を実現したのか? 外部サービスの利用を最小限に絞り、Google Apps機能...
  • スマートフォン/タブレットの業務利用の新提案。簡単な設定で外出先から社内データベース照会が可能に。
     スマートフォンの業務活用方法としては、メールやグループウェアなどが一般的だが、販売・生産・経理などの社内の各システムの既存データベースを自由に社外から活用できる仕組みは多くはない。 Business4Mobileは、ツールの簡単な設定だけで、iPhone、iPad、Androidな...
  • イグアスが提供する災害・障害対策&スマートフォンソリューション
     「災害対策、『きちんと』ご対応済みですか?」◇IBMiの二重化によりダウンタイムを最小限に抑えるHAソリューション◇IBMiの遠隔へのバックアップを低コストで実現する災害対策ソリューション◇Windowsの二重化でダウンタイムを最小限に抑えるHAソリューション  「昨今...
  • クラウド時代におけるエンドユーザ目線によるWebサイトのパフォーマンス管理の必要性
    今日、顧客やビジネスパートナーとのやり取りをWebベースのアプリケーションインフラに実装している企業は増加している。これまで以上にインフラの階層やコンポーネントが増えるだけでなく、クラウドやCDNなど、データセンター外部のインフラとの連携も考慮すべき対象とな...
  • 自社に最適なグループウェアの選定ポイント
    市場には数多くのグループウェアが存在する。スケジュール管理やWebメール、ワークフローなどさまざまな機能が搭載され、現在ではASP形式で提供されたり、携帯電話/iPhoneなどのスマートフォンからもアクセス可能になるなど、その提供形態や利用シーンも多岐にわたる。企...
  • 安否確認、スマートフォン対応、変化し続けるユーザーニーズを解決する情報基盤とは?
     TechTargetジャパンの読者調査によると、企業における情報共有ツール利用の条件として、「エンドユーザーが使いやすい」「運用コストが安い」などが多く挙がった。前者の解決には、豊富が機能なのことはもちろんのこと、それらがユーザーにとって分かりやすい画面構成で...
  • 今すぐできる認証強化
     オンラインサービスの提供や、事業継続およびビジネス推進を目的としたリモートアクセスの提供が増加するなか、不正アクセスによる情報や金銭詐取が相次いで発生しており、認証強化が重要な課題となっている。 しかし、常に課題になるのは、セキュリティ強化と利便性の...