既報の通り、12月20日12時22分から14時25分に、NTTドコモのスマートフォン向けメーラー「spモードメール」で、他ユーザーのアドレスが誤って設定されるという不具合が発生した。これを受け、ドコモは12月21日午前に記者会見を開き、その経緯と今後の対策について説明した。
不具合の概要については、代表取締役副社長の辻村清行氏が説明。山田隆持社長はインドへ出張中のため会見に出席できなかったが、「山田とは緊密に連絡を取り合い、まず復旧に取り組むこと、事実関係を早期に知らせることについて全力で対応している。お客様への対応にも怠りがないようにと話している」とのこと。
今回の不具合で影響を受けた可能性があるのは、spモードを利用する一部ユーザー。spモードは現在670万ほどの契約があるが、うち約10万ユーザーに影響があった可能性がある。後述する関西地区での伝送路の故障に起因するため、spモードのサーバは東京にあるが、関西ユーザーの方が多いという。不具合に該当する場合、例えばAさんからBさんにメールを送ったにもかかわらず、Bさんが受信したメールには異なるアドレスのCさんが差出人として表示される。その際にBさんが返信すると、メールはAさんではなくCさんに届いてしまう。この例では、AさんとCさんはspモードメールのユーザーだが、Bさんには他社のメールサービスやPCメールのユーザーが含まれる。辻村氏は「まずは被害を受けたであろうお客様の特定を急ぎ、AさんとCさんについてはログデータを分析することで1週間ほどで確認できる。Bさんについては他事業者さんの協力が必要になるが、さまざまな方法でアプローチしたい」と説明し、状況把握に努めることを強調した。
この例に照らし合わせると、CさんのメールアドレスがAさんに、Bさん(返信してしまった場合)のメールアドレスがCさんに流出することになる。影響を受けたユーザーを特定した後は「電話やDMなどでお詫びして経緯をお伝えする。(誤ったアドレスで)受信したメールの消去をお願いする場合もある」(ドコモ)とのこと。
12月21日7時30分時点で108件の苦情がドコモに寄せられており、「自分のメールアドレスを確認したら別のアドレスになっていた」「知らない人からメールが来た」「誤って返信してしまった」といった申告があったという。不具合を受けて、ドコモはspモードの各種設定変更(メールアドレス変更、メールアドレス入れ替えなど)や電話帳バックアップなど21のサービスを停止しているが、これに伴う苦情はないとのこと。
今回の事象では、自分のメールアドレスが第三者に流出することになる。「あってはならないこと」と辻村氏が話すように、このような通信サービスの根幹を揺るがす不具合がなぜ発生したのか。サービス運営部長の丸山洋次氏によると、引き金となったのは、関西地区で発生した光伝送路の故障だという。伝送路の回復作業を行う中で、光伝送路が一時的に全断した。2〜3分で回復したが、その後に輻輳が起きた。常時接続をするスマートフォンは常に交換機とつながっており、伝送路の故障に伴いネットワークがリセットされたことで、常時接続の状態が切断されてしまう。その後、端末からspモードシステムに再接続が要求され、一部サーバが輻輳状態に陥ったという。
このspモードシステムの詳細については執行役員 サービスプラットフォーム部長の澤田寛氏が説明。spモードシステムはユーザーを認証する「ネットワーク認証サーバ」、ユーザー情報を管理する「ユーザー管理サーバ」、端末の接続状態を管理する「セッション管理サーバ」から構成されている。今回、端末からの再接続によってユーザー管理サーバの能力を超える処理が発生し、輻輳、そして通信障害が起きた。この輻輳により、spモードサーバで電話番号とIPアドレスをひも付ける際に不符号(アンマッチ状態)が起き、他のメールアドレスが設定されてしまう不具合につながったという。
ただ、spモードシステムのサーバには自動補正機能があり、「不符号があった場合、アドレスを1時間に1回、付与し直す」(辻村氏)という。そのため、「メールアドレスのトラブルは12月20日18時ごろにおおむね解消されたと考えている」とのこと。ただしドコモは事態を重くみて、「念のため」新しい電話番号とIPアドレスがひも付けられるよう、スマートフォンの電源を1回オフ/オンするよう呼びかけている。さらに、ネットワーク側(パケット交換機)からもリセットをかけて万全を期す。このリセット作業は12月22日の午前に終わる見通しで、「これが完了すれば、不符号が完全に解消したと考える」(辻村氏)とした。停止中の21のサービスについても、リセットで完全解消を確認した上で再開される見通しだ。
再発防止について辻村氏は「今回の問題は、スマートフォンの急増に伴うネットワーク全体の処理能力と処理手順が十分ではなかったことに起因しており、もう1度総合的に見直したい」と説明した。同じ原因による通信障害は8月にも発生したが、なぜ再発生したのか。「8月の通信障害を受けて、全社をあげてネットワークの処理能力や、問題となったユーザー管理サーバについても確認した。そのときはサーバが十分な処理能力を持つと判断したが、現実には今回の事象でその能力が十分に発揮されていないことが分かった。なぜ8月にそこまで分からなかったのかについては、申し訳ないが、もう少しお時間をいただいて確認したい」とした。
当面の対策として、ユーザー管理サーバを最適化(チューニング)し、処理能力を増強することに注力する。加えて、サーバとパケット交換機の処理手順を、2〜3カ月かけて一新する。
光伝送路の全断は人為的ミスによるものだが、「保全作業上のミスが起こらないように、工事関係の人も含めて徹底したいが、仮に起きたとしても、サーバの処理能力が高ければ(今回の不具合は)発生しなかった」(辻村氏)とした。
今回の不具合を受けて、スマートフォンの販売計画(2011年度で850万台)を修正することは考えていないが、「現在は原因や影響の広がりを分析しているので、その上で考えたい」とした。
Copyright © ITmedia, Inc. All Rights Reserved.