関東甲信越地域のネットワーク障害、ドコモが原因と対策を発表

» 2011年06月14日 19時49分 公開
[富永ジュン,ITmedia]

 NTTドコモは、6月6日に関東甲信越地方で発生したネットワーク障害の発生経緯と対策を発表した。

 ネットワーク障害は、6月6日の午前8時27分から午後9時36分まで、関東甲信越地方で契約した一部のユーザーの音声通話とパケット通信がつながりにくい状況になったというもの。NTTドコモからMNP(モバイル番号ポータビリティ)を利用して他キャリアと契約したユーザーや、ドコモのネットワークを利用したMNVO事業者のユーザーも同じく影響を受けた。

 発表によると、サービス制御装置のうち、ユーザーの位置情報などを管理するハードウェア装置が故障したことがネットワーク障害の原因になったという。装置が故障すると、通常は故障した0系装置の一部のみが1系に切り替わって運用を続けるが、装置全体が1系システムに切り替わってしまったことがネットワーク障害の引き金になった。

Photo サービス制御装置の仕組み

 故障した装置は、システム切替が発生した場合、位置登録を行う信号が増加して装置に大きな負担がかかる。平日朝の通勤時間帯という位置登録の多い時間に故障によるシステム切替が重なり、過負荷によるソフトウェア処理能力が低下して輻輳状態となった。

 同社では、サービス制御装置の負荷を下げるために午前9時26分ごろから通信規制を実施。また、午後0時46分に故障した装置を修復し、1系から0系へのシステム切替を行った。しかし、高負荷状態が続いたため、通信規制を強化して負荷状況を見ながら段階的に規制解除を行った。

 午後6時52分にシステムが安定したため、通常の運用状態に移行したが、切替ソフトウェアの不具合により、0系から1系へのシステム切替が発生。再び輻輳状態に陥ったため再度通信規制を実施してシステムの安定化を図ったところ、午後9時36分にシステムが安定したという。

Photo 事象発生から安定化までの時系列

 今後の対策としては、ソフトウェア過負荷耐性を向上させ、設定値以上の信号を受けた場合でも輻輳状態にならないよう効率的な信号処理を行うプログラムを追加。また、複数条件が重なった場合の処理の負荷を考慮し、システム切替の判定処理を最適化した。

 さらに、通常の運用状態に移行した際にシステム切替抑止中の故障履歴を参照してしまう、システム切替ソフトウェアの不具合の修正を行ったとしている。

関連キーワード

NTTドコモ | 不具合 | 原因 | 位置情報


Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

最新トピックスPR

過去記事カレンダー

2024年