KDDIは通信障害をどのように検知してインフラを守っているのか ネットワークセンターに潜入(1/3 ページ)

» 2024年07月24日 16時45分 公開
[金子麟太郎ITmedia]

 KDDIは7月23日、東京・多摩市にある通信ネットワークの設備を公開した。名称は「多摩第5ネットワークセンター(多摩第5NC)」で、常にネットワークを監視・運用する。

 同日、KDDIが重要な社会インフラである通信ネットワークをどのようにして、24時間365日守るのか、通信障害などの対策をどのように行うのかを説明した他、通信ネットワークを監視するモニターや災害を支援する車載基地局などを公開した。

スマートオペレーションとAIによる自動化がもたらす効果

 多摩第5NCがある多摩は地盤が硬く揺れにくい地形で、水害リスクが低いエリアとなっている。加えて、建物を免震構造とすることで、地震発生時にも稼働できるようにしている。

KDDI ネットワーク設備 通信障害 災害対策 多摩第5NC内のネットワーク監視モニター。KDDIの通信サービスを24時間365日守るのに欠かせない
KDDI ネットワーク設備 通信障害 災害対策 多摩第5NCは建物と基礎の間に揺れを吸収するクッションのような役割を持った積層ゴムと、積層ゴムで吸収した揺れを抑えるブレーキのような役割を持ったオイルダンパーを組み合わせた免震構造となっている

 ネットワークセンターは日頃耳にしないため、聞き慣れない人が多いだろう。似た設備に例えると、地下鉄や新幹線の司令塔、航空機の管制塔だ。司令塔や管制塔では列車や航空機の運行状況や、位置の把握、トラブルの対応などを行う。ネットワークセンターの役割もこれに似ており、通信ネットワークの状況を監視したり、通信障害が起きた際に対応したりする。

 施設は外部からの侵入や攻撃から守るため、住所は非公開としている。これは他キャリアも同様で、鉄道の司令塔、航空機の管制塔も場所は非公開。国の重要なインフラを守る役割も担っているからだ。

 多摩第5NCは2021年7月15日に開設。それまでの新宿に代わる拠点だが、より高度な取り組みを導入している。コア技術統括本部 エンジニアリング推進本部 副本部長の鈴木信貴氏は、「新しい技術やシステムが複雑化していくことに伴い、人為的な運用の脱却が必要であり、2016年から運用の自動化に取り組んでいる」と前置きした上で、AIを活用した障害の検出やシステム運用を、さらに高度化させていることを説明した。

KDDI ネットワーク設備 通信障害 災害対策 コア技術統括本部 エンジニアリング推進本部 副本部長 鈴木信貴氏

 この自動化をKDDIでは「スマートオペレーション」を銘打ち、これまで熟練者が実行していた運用をより効率的に行うことで、監視者の稼働を削減できることに加え、サービスを迅速に復旧できる。結果、復旧までの時間短縮につながる。

 従来の運用では「設備の方から上がってくる情報をもとに、どこがおかしいかを切り分けて障害に対処する」(鈴木氏)手法を取っていた。

 これに対し、スマートオペレーションでは3つの基盤で構成される。1つは情報基盤で、障害や復旧対応履歴などの情報を扱う他、X(旧Twitter)を見ながら社内外に情報を通達する。次にサービスを監視するための基盤だ。設備から上がってきた障害を検知、分析する。最後の3つ目は自動化基盤だ。「すぐに復旧できるものをゼロタッチ、サービスの状況を見ながら復旧するワンタッチ」というように、状況に応じてオペレーションを変えている。

KDDI ネットワーク設備 通信障害 災害対策 スマートオペレーションはこれまで熟練者による人為的作業を自動化するもの。通信障害時に早期復旧を行えるよう、効率よくオペレーションをする

 そのスマートオペレーションに欠かせない監視モニターでは日付、時刻、テレビ、通信ネットワークの状況、通信障害が発生した場合の各種情報など、多岐にわたる情報を一覧で表示でき、それを複数人が同時に閲覧、把握できるようにしている。一般の人への公開が許されていないため、その全てをお見せすることはできないが、テレビ画面やPCのウィンドウがたくさん並んでいるようなイメージだ。

 障害検知は自動化を目的にAIを活用している。トラフィック量やCPU の使用率などを学習し、未来の推移を予測できるようにした。予測結果と実際の値が増えると異常と判定。固定のしきい値を利用する場合、サービス監視システムで検知できるような障害しか検知できない。例えば、「トラフィックは落ちているものの、サービスはまだ使えてるような状態」(鈴木氏)を検知可能だ。それに対し、AIの活用で小さな異常も検知できる他、パフォーマンスの低下、特定の端末だけ使えないような状況も把握できるという。

KDDI ネットワーク設備 通信障害 災害対策 AIでトラフィックデータなどの傾向を学習・予予測。障害の検知から復旧対処までのプロセスで自動化する
KDDI ネットワーク設備 通信障害 災害対策 AIの活用により監視できるデータ数が拡大したそうだ
KDDI ネットワーク設備 通信障害 災害対策 固定しきい値では検知できなかったパフォーマンスの劣化やトラフィックの変動は動的しきい値により検知できる

他事業者も24時間365日サービスの監視が可能に

 KDDIは2023年から同社保有のメールシステム、インターネット上でドメイン名を管理するシステムDNS(Domain Name Systemr)などをISP(Internet Service Provider)事業者に提供している。

 ISPの安定的な提供には堅牢(けんろう)性のある設備やそれにかかる投資、それに専門知識を持ったエンジニアが必要となり、ISP事業者にとっては負担の1つとなってしまう。そこで、KDDIがISP事業者に助け舟を渡すような形で、KDDI設備をそのまま利用してもらう。

 加えて、先のスマートオペレーションも利用してもらうことで、「アプリケーションをユーザーの要望に合わせてアップデートしていくことに集中できる」としている。スマートオペレーションやクラウドインフラの設計・構築は開発段階からKDDIが支援する。これにより、「電子決済サービス事業者などでも、KDDIのようにサービスの状況を24時間365日監視できる」(鈴木氏)そうだ。

KDDI ネットワーク設備 通信障害 災害対策 KDDIのスマートオペレーションを導入したサービス提供事業者はアプリの開発に集中可能。KDDIの強みを他社にも開放したのも見逃せないポイントだ
       1|2|3 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2025年03月13日 更新
  1. 「iPhone 16e」にまつわる7つの謎 「e」の意味は? LTE対応バンドはなぜ減った? Appleキーパーソンに聞く (2025年03月12日)
  2. 「iPad Air(M3)」の実力検証 変わらない良さと不満、刷新したMagic Keyboardの意外な効果も (2025年03月12日)
  3. 運転免許証の更新前に「マイナ免許証」を使うにはどうすればいい? 免許データの確認方法もチェック! (2025年03月12日)
  4. Huaweiよりも薄い3つ折りスマホ「TECNO PHANTOM ULTLMATE 2」実機を見た! 「期待を裏切らない価格で展開したい」 (2025年03月11日)
  5. povoは「究極的にはメイン回線」に TikTokやInstagramと提携する狙い、ローソンで「ギガ復活」の反響は? (2025年03月12日)
  6. 「iOS 18.3.2」配信 重要なバグ修正、ストリーミングコンテンツを再生できない不具合解消も (2025年03月12日)
  7. 「iPhone 16e」と「iPhone 16」は意外と違いが多い 外観やスペックの差をチェック (2025年02月20日)
  8. 3月24日からスタートする「マイナ免許証」にしない方がいい人は? メリットとデメリットをチェック (2025年02月07日)
  9. スマホの「モバイル運転免許証」を活用した実証実験 車が店舗に到着→即サービスを受けられる世界に? (2025年03月12日)
  10. 新色や謎のキーがある「Nothing Phone(3a)/(3a) Pro」にいち早く触れた 2モデルは何が違う? (2025年03月10日)
最新トピックスPR

過去記事カレンダー

2025年