「証明書の期限を確認すれば問題なかったのでは?」と疑問に思う人も少なくないだろう。事実、PCやスマートフォンなど、インターネットで用いられるTLS証明書(やその他のセキュリティ証明書)はユーザーが有効期限を確認できる。
しかし、ソフトバンクが導入したMME装置の新ソフトウェアでは、TLS証明書がソフトウェアの一部に埋め込まれており、オペレーター(管理者)がその内容を確認できない仕様だった。
「不具合が致命的な結果をもたらす機器のソフトウェア更新は一斉にやるべきではない」とも思う所だが、当然ソフトバンクもそれは心得ている。
MME装置のソフトウェア更新は2018年3月14日から順次開始し、旧バージョンのソフトウェアと並行稼働させて不具合の洗い出しを実施。特に問題がなかったことから、翌月26日に新バージョンに完全移行した。
それ以来、新バージョンのソフトウェアは障害発生直前まで正常に稼働し続けた。要するに正常に稼働したがゆえに、潜在する不具合を発見できなかったのだ。
ここでポイントとなるのが、複数のMME装置が一斉にダウンしたということ。複数の報道を総合すると、ソフトバンクのMME装置は1社(エリクソン)からのみ調達していた可能性が高い。
メーカー(ベンダー)を1社でそろえることは、コスト抑制や管理負荷の軽減といったメリットがある反面、問題が発生した場合の影響が大きくなりやすいというデメリットもある。PCやスマホにおいて、同一スペックのパーツを複数メーカーから調達する例があるが、それはこのようなデメリットを「回避」するためでもある。
ソフトバンクでは、MME装置を始めとするネットワーク機器を東日本と西日本で分散して設置・運用している。機器の処理能力には余裕を持たせており、災害や停電が生じてどちらか片方の設備がダウンした場合は、もう片方で補完できる構成となっている。
しかし、今回の障害は、分散して設置された同一メーカーの機器が一斉に不具合を起こしてしまった。メーカーを事実上1社で統一するデメリットが大きく出た結果ともいえる。
今回は4G LTEネットワークの不具合であって、3Gネットワークは正常に稼働していた。「それなら3Gネットワークにつなぎ変えれば、通信速度が遅くなるけれど大丈夫なのでは?」と思うだろう。
実際、ソフトバンク・Y!mobileの4G LTE端末はの多くは4G LTEネットワークのダウンを検知すると自動的に3Gネットワークへと「つなぎ替える」。フェイルセーフの一環だ。
しかし、今回の障害によって多数の4G LTE端末が3Gネットワークへの接続を試行した結果、輻輳(ふくそう)が発生。3Gネットワークを保護するための通信制限が発動してしまった。
Copyright © ITmedia, Inc. All Rights Reserved.