KDDIを襲った多重のワナ 通信障害では結局、何が起きていたのか:本田雅一の時事想々(2/5 ページ)
auの大規模通信障害では、結局何が起きていたのか。KDDIの高橋誠社長は7月29日、障害の概要などについて報告をした。報告によると、多重の想定外に見舞われ、障害が長期化した背景が見えてきた。ITジャーナリストの本田雅一が解説する。
ルーター設定ミスによる「想定外の輻輳」
障害に至った経緯については、筆者のコラムでも触れており、多くの分析記事が発表されている。おおまかな経緯説明に変化はないが、今回の会見ではより詳細な経緯が明かされた。
音声通信サービスを提供する「VoLTE交換機」のうち、主に関東地区の発話処理が集まるKDDI多摩ネットワークセンターにあるルーターが異常になったことを引き金に障害は始まった。異常の原因は、ルーター設定のミスによるものだったという。
ルーター設定に関しては、どのように設定するかの指示書を出し、設定が正しいかをチェックする社内プロセスを経て作業担当者に引き渡され設定作業を行い、設定内容を確認した上でルーターを切り替えるという手順を踏んでいた。
作業担当者にはミスがなかったものの、そもそもの指示書に誤りがあった。ネットワークセンター外からVoLTE交換機にはアクセスできるが、VoLTE交換機からネットワークセンター外には通信できない状態が15分間続いた。
高橋社長は「現場に行き状況の説明を受けたが、ルーター切り替えから1分後には大量のアラートが発生し、現場での作業そのものが膨大になっていた。これが、切り戻し(フォールバック)までに15分もかかった理由の一つ」と話す。「指示書作成の部分でミスが発生しないよう確認プロセスをもう1段階入れていれば防げる障害だった」と悔やんだ。
携帯端末が音声通信を始める際は、まず位置登録を加入者データベースに対して行うとともに、発話処理を行う際にVoLTE交換機が加入者データベースの認証処理を行う。
端末からVoLTE交換機に要求は正常に届くが、VoLTE交換機は加入者データベースに認証処理が行えない。加入者データベースはネットワークセンター外にあるためアクセスできないからだ。
このため同時並行して、2つの異なる輻輳(ふくそう、通信の過度な集中を指す)が発生していた。
1つは端末からのVoLTE交換機への要求で、VoLTE交換機にはアクセスできているはずのに応答がないため再接続を求める状況が続いた。もう1つは、発話要求を受け付けたVoLTE交換機から加入者データベースへの登録要求で繰り返し再送処理が行われ、こちらも輻輳が発生していた。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
au通信障害で起きた“負のスパイラル” 「おかけになった番号は現在……」に至るまで
7月2日、auで大規模な通信障害が発生した。KDDI高橋誠社長ら記者会見で語った経緯や調査状況から分かることとは? ITジャーナリストの本田雅一氏が解説する。
「氷河期の勝ち組」だったのに……40代“エリート課長”に迫る危機
自分をエリートだと信じて疑わなかったサラリーマンが、社内の方針転換により出世のはしごを外されることがある。エリート意識や、能力主義への妄信が生む闇とは──?
“スーツ姿の客”がネットカフェに急増 カギは「PCなし席」と「レシートの工夫」
コロナ禍で夜間の利用者が激減し、インターネットカフェ業界は大きな打撃を受けた。そんな中、トップシェアを誇る「快活CLUB」では、昼にテレワーク利用客を取り込むことに成功、売り上げを復調させた。そのカギは「PCなし席」と「レシートの工夫」にあるという。どういうことかというと……。
アマゾンの新しい返品方法 お金を返し、商品は回収しない──なぜ?
米国は、日本に比べて返品OKの小売店が多い。米アマゾンなどの大手小売りでは、返金するのに商品は回収しない「Keep it」という新しい返品方法が進められている。なぜ、このような手法を取るのか?
オンキヨー破産の反響に“大きな誤解” オーディオは「ノスタルジックなビジネスではない」と言えるワケ
オンキヨーが、5月13日に自己破産を発表した。この件に関連して、オンキヨーをかつてのオーディオブームに乗じ、今は勢いを失った日本ブランドの代表として“ノスタルジックな論調”で語る言論が多かった。しかし、筆者はオンキヨーは「伝統的なハイエンドブランド」という立ち位置ではなく、またオーディオビジネスの本質をつかんだブランドは今も求められていると指摘する。オーディオ業界で、何が起きているのか。

