携帯ネットワークは複雑かつ社会インフラとしての重要性を増している。そんな中、KDDIの多摩ネットワークセンターは、ネットワーク設計や輻輳検出など異常対策に関しても、過去の事例を踏まえながら構築された最新のシステムだった。
NTTドコモやソフトバンクでも障害が起きているように、障害そのものを完全にゼロにすることはできない。障害発生をいかに素早く検知し、小さな規模にとどめ、長期的な障害を防ぐかの勝負といえるだろう。
しかし過去に学び、知恵を絞って対策したとしても、想定外のことは常にあるものだ。そして想定外の状況は別の想定外を誘引する。
高橋社長は障害の長期化に関して、VoLTE交換機の異常の発見までに時間がかかったことを挙げ「バックアップファイルが誤って生成されていたことに気付かず、状態を元に戻しても解決しないといったことが背景で発生していた」と話した。より詳細なレポートはいずれ公表されるだろうが、対策が後手に回ったというよりも、想定される障害の原因を追いかけていく中で、誘引された複数の障害に追い付いていけなかったという印象だ。
今回の経験を踏まえ、より緻密な輻輳検出機能を開発した他、輻輳制御の設計見直しをはかったという。さらにVoLTE交換機自身が輻輳を引き起こす可能性について、輻輳解消のためのツールも開発、実装したという。
どこまで対策をしても“十分”とはいえないのだろうが、この経験がKDDI、そしてライバルの携帯電話事業者の障害耐性を高めることにつながってほしい。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR注目記事ランキング