連鎖トラブルで規模が拡大――KDDI、auのiPhone/iPadで発生した通信障害を謝罪新サービスの準備が裏目に(2/2 ページ)

» 2013年04月25日 23時26分 公開
[平賀洋一,ITmedia]
前のページへ 1|2       

 3度目の障害の原因となったメールボックスサーバの高負荷状態については、サーバ運用体制の見直しや流量調整ツールの導入、ストレージの増強とKDDI内のディスク処理能力の点検などを進める。特に、複数のサーバをほぼ同じタイミングで再起動したことで、メールを保存する共有ディスクのI/O部分で大幅な処理の遅延が発生した。

 こうした原因を踏まえ、障害復旧時の手順や一時的なトラフィックの集中に耐える対策を5月末までに行う予定だ。これらは継続的なインフラ増強の一環でもあるが、今回の障害を機にサーバへのトラフィックを調整するツールを約3億円で導入することも明らかにされた。

 なお、現在の設備がユーザーの増加に追いついていないのではないかという指摘に対しては、「メールボックスが高負荷状態になったのは、一度に起動するサーバが多かったためで、縮退運転の手順が不適切だったため。単に設備を増やせば解決する問題ではない」嶋谷氏)と否定。また障害時にサーバ構成が2重化されていたが、これは一時的な作業のために分割していたもので、本来は4重のシステムで稼働しているという。嶋谷氏は「本来は1系統でもまかなえる処理能力だが、手順のまずさからトラフィックが集中してダウンに至ってしまった」と、あくまで運用手順に問題があったと補足した。

 KDDIは、2012年12月31日と2013年1月1日2日に、4G LTEのデータ通信とau IDの認証決済システムで深刻な障害を発生させている。大規模な障害やトラブルが短期間に相次いでいることから、今回発表された対応策も1つの対症療法に過ぎないのでは? という疑念が残る。嶋谷氏はこうした指摘に対し、トラブルが奮発する根本的な問題は「フェールセーフの意識が不十分だった。フェールセーフの必要性を全社的に展開したい」と述べ、運用面や技術面での信頼回復に努めることを訴えた。

 また、今回の障害は総務省への法定報告が必要な「重大事故」ではあるが、約款上の補償・返金対応ではないという。しかし「対象になったユーザーには真摯に対応したい」(嶋谷氏)と説明した。

なぜ、iPhone/iPadだけでトラブルが発生したのか

 今回の通信障害は、auのiPhone/iPadでいわいる“キャリアメール”を利用するユーザーを対象に発生している。KDDIが提供しているAndroidやフィーチャーフォン向けのメールシステムと、同じiPhone向けでもMMSやIMAPのサービスには障害が起こっていない。また、auのiPhone/iPad向けEメールリアルタイム送受信システムは2系統あり、もう1系統は16日から19日にかけても正常に稼働していた。

 このリアルタイム送受信は、2012年3月から提供されたサービス。当初auのiPhoneはEメール(@ezweb.ne.jp)のリアルタイム受信ができず、ソフトバンクモバイル版iPhoneとの機能差が取りざたされていた。その後、KDDIが上記のような専用のシステムを用意し、さらにユーザーもiOS標準のメールアプリに専用のアカウントを追加することで、リアルタイム送受信機能を実現させた経緯がある。

 嶋谷氏は今回の通信障害について「AppleのサービスやiPhoneの端末仕様によるものではなく、KDDIの設備側の問題」と説明する。それだけに、auのiPhone/iPadを選んだユーザーにとっては、同社のサービス品質やサポート体制に不満と不安を覚えることになってしまった。

 今回の障害を招くことになったサーバのバージョンアップは、iOS端末向けのみに提供される“新サービス”に備えたもの。その作業規模は「かなり大規模なもので、通常なら2年に1度あるかないかの作業量」(嶋谷氏)という。だがその内容については「(サービスの)インパクトもあり、現時点では好評を控えたい」(嶋谷氏)と、明らかにされなかった。

 今後については、すでにトラブルの原因が判明していることもあり、予定通り今夏を目標に実装作業を進めるとしている。ユーザーの信頼をどう取り戻すのか、KDDIの今後の取り組みに注目したい。

関連キーワード

iPhone | iPad | 通信障害 | 障害対応 | システム障害


前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.

最新トピックスPR

過去記事カレンダー

2024年