ニュース

ドコモの通信障害に“AIエージェント”が先手 「SNSの投稿」も常時監視するオペレーションセンターの裏側(1/2 ページ)

NTTドコモは6月8日、都内の拠点でネットワークオペレーションセンター(NOC)を報道公開し、あわせて移動基地局車を含む災害対応機材を展示した。

 NTTドコモは6月8日、都内の拠点でネットワークオペレーションセンター(NOC)を報道公開し、あわせて移動基地局車を含む災害対応機材を展示した。

1日あたり約300万件のアラームが発生、Xの投稿も監視対象に

 ドコモは全国の基地局や交換局の稼働状況を24時間体制で監視するNOCを東西2カ所に設けている。片方の拠点が被災しても、もう一方が全国の監視を引き継げる体制を整えている。2拠点を合わせて1日あたり約300万件のアラームが発生し、基地局の障害は7~8割が自動処理で復旧する。一方、約400件は現地に技術者が駆け付けて対応している。


NOCの監視フロア。大型ディスプレイにダッシュボード型の監視画面が並んでいる

 監視の手法自体も変化している。従来は機器がエラーを通知するアラームを待って対応していたが、実際の通信量の変動を監視して異常を検知する方式への移行が進んでいる。アラームが出なくても通信量の落ち込みで障害に気付けるためだ。大画面のアラーム一覧は縮小され、ダッシュボード型の表示が増えた。4月にサービスを開始したStarlink Directの稼働状況を監視する画面も新たに加わった。

advertisement

ダッシュボード画面。音声・パケット・SMSの稼働状況やDowndetectorの数値を一覧で表示している

 Xの投稿も監視対象だ。「圏外」「つながらない」など特定の書き込みが集中した場合に自社ネットワークの異常を疑う端緒にしている。各社の通信障害をユーザー報告で可視化するサイト「Downdetector」の状況も常時表示している。


Xの投稿やアラーム状況を表示する画面。ドコモに関する書き込みをリアルタイムで監視している

 この仕組みが機能した実例がある。5月19日にMVNOの設備障害が発生した際、Downdetectorの数値が急上昇し、Xでも「ドコモがつながりにくい」という投稿が相次いだ。ドコモ側のトラフィックは低下していなかったが、原因を特定できなかったため、いったん障害情報を掲出。その後、MVNO側の不具合と判明して取り消している。アラームだけでは気付けない障害への対応力を高めるため、外部情報を組み合わせた監視が定着しつつある。

AIエージェントで障害対応を自動化 体感品質が低い箇所も判定

 このNOCに、2025年度第4四半期からAIが本格導入された。AI活用については、サービスマネジメント部の鈴木啓介担当部長が取り組みを説明した。トラフィックの変動から影響範囲を特定するAI、自動で電話をかけてつながるかを確認するAI、発生中の障害が計画工事に起因するかを判定するAIなど、用途別に5種のAIをオペレーターが対話しながら使う仕組みを整え、初動対応に要する時間を60%削減した。


NOCで運用している5種のAI。オペレーターが対話しながら使い、初動対応の時間を60%削減した

 さらに、複数のAIを束ねるAIエージェントも導入した。2025年2月のMWC Barcelonaで発表した技術で、異常の検知から障害原因の特定、対処方法の提案までを自動で実行する。無線基地局からコアネットワークまで100万台超の機器の構成や接続関係をソフトウェア上に再現し、障害の報告が集中している箇所をたどることで根本原因をアルゴリズムで絞り込める仕組みだ。


AIエージェントの分析画面。全国の異常分析状況を表示し、障害時には影響範囲と対処のレコメンドを提示する

 NOCでは24時間体制のオペレーターが障害の一次対応にあたり、複雑な事象は社内の専門チームに引き継ぐ。AIエージェントが対象とするのは、この引き継ぎが発生するような難度の高い障害だ。専門チームが行うデータ収集や原因の切り分け、対処方法の判断をAIが補助し、リカバリー時間を50%以上短縮した。

 ドコモの通信品質を巡っては、ユーザーからの不満が繰り返し話題になっている。質疑応答では通信品質の改善にAIを活用しているかとの質問も出た。鈴木氏は、基地局ごとにさまざまなデータを蓄積し、ユーザーの体感品質が低い箇所をAIで判定して改善につなげる取り組みを進めていると回答した。障害が起きていなくても「つながりにくい」と感じるエリアを検出し、先手を打てるようにする狙いだ。NOCが障害対応だけでなく、日常的な品質改善にも関与していることを示す取り組みといえる。

 AIには事実と異なる回答を生成してしまう「ハルシネーション」の課題がある。その対策として、AIが判断する際は根拠情報を提示させ、最終的な判断と実行は人が行っている。鈴木氏は「ある程度キュレーションされた情報をAIが出してきて、それを人が確認している」と説明した。将来的にはAIが主体的にネットワークを運用する構想を持つが、実現までの距離はまだ遠い。鈴木氏は「現状とのギャップは正直まだある。ネットワークオペレーションの失敗はお客さまへの迷惑に直結する」と話し、実現時期については「非常に難しい。安全に制御できるようにするため模索している」と述べるにとどめた。

 5Gに加え、ネットワーク機器の機能をソフトウェアに置き換える仮想化やvRAN、衛星通信を組み込むNTNなど、監視すべき対象は増え続けている。鈴木氏は、AIやデータの活用によって人員を増やさずに同等のオペレーション品質を維持できていると話した。

       | 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.