連載
» 2013年06月07日 23時00分 UPDATE

石野純也のMobile Eye(5月27日〜6月7日):au通信障害の原因は?/使いやすさと軽さで勝負する京セラ/日本語化も進む「Firefox OS」 (1/3)

5月27日から6月7日の2週間で特に大きなニュースだったのはKDDIの通信障害。なぜ相次いで障害が発生したのか。その原因を聞いた。このほか、夏モデルの説明会を開催した京セラのスマートフォン戦略と、ワイヤレスジャパンで披露されたFirefox OSも解説する。

[石野純也,ITmedia]

 夏商戦が本格的に始まり、各社から新端末が続々と発売されている5月27日から6月7日の2週間。それに合わせ、メーカーの新製品説明会も相次いで行われた。一方で、5月29日と30日の2日連続でKDDIの通信障害が発生したことも、この2週間の大きなニュースだった。設備故障や通信の障害は現在起こっていないが、事態を重く見たKDDIは、万全を期すため今も復旧報は出していない。その意味で、KDDIの障害は現在継続中のトピックともいえるだろう。当初はLTEのみの通信障害という発表だったが、翌週の6月4日には、3Gの通話やSMSの受信に影響があったことも明らかになった。今回はこの通信障害に加え、メーカーの発表会からは京セラをピックアップした。これらに加え、5月29日から31日にかけて開催された「ワイヤレスジャパン 2013」に出展されていた「Firefox OS」についても取り上げていきたい。

相次ぐauの通信障害、原因はハード故障とソフトウェアのバグ

 KDDIの「4G LTE」で、通信障害が相次いでいる。5月29日は4時30分から23時13分にかけ、およそ19時間にわたり、LTEのデータ通信が利用しにくい状況になった。影響エリアは、東京都、神奈川県、山梨県の一部エリアに及び、影響回線数は最大56万に上った。6月4日には、この障害に伴い音声通話やSMS受信に大きな遅延が発生したことも明らかになっている。

 5月29日の通信障害は23時13分に収まり復旧報が出されたものの、翌30日にも再び同じLTEがつながりにくくなった。影響エリアは29日と同じ東京都、神奈川県、山梨県の1都2県で、影響数は最大64万。障害は13時4分から23時50分まで約11時間続いた。

※初出時に、5月29日の通信障害の発生期間を「4時30分から11時13分まで」としていましたが、正しくは「4時30分から23時13分まで」です。お詫びして訂正いたします(6/8 12:11)。

photo KDDIの通信障害を知らせるプレスリリースは第3報のままで、1週間以上経った7日現在も復旧報は出ていない。同社が事態を重く見ていることがうかがえる

 29日の障害は、基地局を制御するMME(モバイル・マネジメント・エンティティ)のハードウェアとソフトウェアの両方に原因があった。KDDIは4月27日にも、ソフトウェアのバグによるLTEの通信障害を起こしていた。4月30日の決算会見では、代表取締役社長の田中孝司氏が「フラグメント(分断化)されたパケットの長さが、ある一定より短い場合にエラーが起きるところまで分析が進んでいる」と原因を説明。「事象だけを見ると独立しているが、本当にKDDIの中で連続して障害を起こすことがないか、もう一度、私自身が先頭に立ち再チェックしていきたい」(同)と陳謝している。KDDIによると、5月29日の障害は、この不具合を改修しようとしていた際に発生したという。

photophoto 4月30日の決算会見で、同月27日の通信障害を謝罪する田中孝司社長。ここで判明したバグを修正する際に、5月29日と30日の通信障害を起こしてしまった

 障害の発生過程は次のとおりだ。まず、KDDIは4月27日の不具合を修正するために、ソフトウェアの改修作業を行っていた。その際に、ハードウェアである通信機器のカードに故障が発生した。そこで、改修作業をいったん中断したうえで、切り戻しを行っていたところ、4月27日と同様のバグが発生してしまった。通信設備はもしものことが起こったときのために、余裕を持たせた“冗長構成”を取っていたが、両方の設備で同じトラブルが起こり、通信障害につながってしまった。これは、5月29日の通信障害に関する原因で、30日については現在調査を進めているところだ。ただ、影響範囲や障害の内容が近いため、29日と30日の障害は関係性が高いと考えられる。

photo バグの改修中にハードウェアが故障。切り戻しの際に、ソフトウェアのバグが発生し、通信障害が起こった

 29日のLTE障害は、3Gの音声通話やSMSにも影響を与えていたが、この原因も現在調査中。ただし、3Gに起こった障害は、加入者情報管理システムに接続できなかったことが要因の1つと判明している。加入者情報管理システムは、ユーザーの現在地とは関係なく、契約したエリアごとに分けられている。そのため、基地局配下の端末が通信しにくくなったLTEの障害とは影響範囲が若干異なり、関東で契約しているユーザーの通話とSMSが利用しにくくなった。

 分かりやすく例えると、LTEの障害は関西契約のユーザーが出張などで東京に来ていた場合にも影響したが、通話やSMSは問題なく使えていた可能性が高い。逆のケースで、関東で契約していたユーザーが関西に出張していた場合、LTEではいつも通り通信できたが、通話やSMSには影響が及んでいた。KDDIは「早期究明に向けて、全力で取り組んでいる」(広報部)としているが、LTEが接続できなくなったため、端末が3Gに一斉に接続しようとした結果、加入者情報管理システムの処理能力を超えてしまったと推測される。

 音声通話とSMSへの影響についての発表が6月4日になったのは、「全通信のログや、設備の記録を分析していたため」(広報部)。システム自体がダウンしていなかったこともあり、ユーザーの報告を受け、影響規模を調査していたが、それが告知の遅れにつながった。

 このように時系列で見ていくと、5月に2回連続で起こった通信障害は、4月27日の通信障害とも強い因果関係があることが分かる。田中氏は4月30日の決算会見で「ソフトウェアの対策や修正を施していく」方針を掲げていたが、その作業で再び障害を起こしてしまうのはまさに本末転倒。「詳細は調査中だが、4月27日の通信障害を受け、復旧手順を確立していたので、当日(5月29日)もそれに従った」(広報部)というものの、ここにもまだ不備が残っていた可能性がある。

 なお、障害期間中の料金返還などの補償に関しては、現在「検討中」(広報部)だという。約款では連続24時間以上にわたり継続して通信ができなかった場合と定められているため、今回の通信障害はこれに該当しない。ただ、影響範囲の大きさに鑑み、何らかの例外的な措置が取られるかもしれない。

 あるベンダー関係者は「KDDIのネットワークはマルチベンダー(複数ベンダー)で独自に運用されているため、グローバルでLTEのネットワーク構築に関わっているシングルベンダーを使うキャリアに比べてバグを見つけにくい」と指摘していたが、障害の原因はソフトウェアだけに留まらない。また、同じ失敗を立て続けに起こしたことを考えても、そこが問題の本質ではないと感じる。むしろ、一連の通信障害からは、運用方法や早期復旧の手順が“準備不足”という印象を強く受けた。また、一部の原因が正確に解明されていないことは確かだが、KDDIとして、早期に、分かっている範囲で、ユーザーへのメッセージをもっと積極的に出していく必要もあった。

 KDDIは、LTEの通信障害に関する会見を10日に開催し、田中社長が説明する。ここで詳細な原因と、抜本的な対策が明かされることに期待したい。

       1|2|3 次のページへ

Copyright© 2016 ITmedia, Inc. All Rights Reserved.