ファイルの損傷が原因でFAAの老朽システムがダウン:数千人の旅行者に影響(2/2 ページ)
連邦航空局の飛行計画管理用のITネットワークが8月26日、約2時間半にわたってダウンしたことで、全米40カ所余りの空港で航空機の離陸予定に支障が起き、数千人の乗客が影響を受けた。同システムは既に復旧しているが、老朽化が進んでいることもあり、近くリプレースされる予定だ。
このシステムは「NADIN」(National Aerospace Data Interchange Network)と呼ばれる。オランダに本社を置くNorth American Philipsが、1980年代初頭にFAAのために設計した。2台の「Philips DS714/81」メインフレームは1988年に運用が開始された。同社はその年に事業から撤退したため、FAAは部品在庫すべてを買い上げた。
このシステムは極めて長期間にわたって毎日24時間稼働してきた(稼働を開始したのはレーガン政権末期のころといえば、その長さが実感できるだろう)。しかし今週のシステムダウンが示しているように、そろそろ引退の時期が来たようだ。
タケモト氏によると、年末までにシステム全体が最新鋭のシステム(新しいハードウェアやソフトウェアなどすべて)にリプレースされる予定だ。「新システムは現在のものとは桁違いに大容量のメモリを搭載する。昨日のような負荷の急激な増大にも対応できる」と同氏は期待する。
ネットワーク管理ソフトウェアメーカー、SolarWindsで製品戦略責任者を務めるケニー・バンザント氏によると、ほとんどのネットワーク停止は、ファイルの損傷が原因ではないという。
「ほとんどのネットワーク停止の根本原因を見れば、その70%以上は人間による構成ミスで起きている。人間がコンピュータへの入力をミスするのと比べれば、コンピュータ自体に障害が起きる確率ははるかに低い。いかに頭脳明晰なネットワーク技術者といえども、その例外ではない」とバンザント氏は話す。
なお、FAAのプロプライエタリネットワークソフトウェアの構成は公表されていない。
障害検知とモニタリング
SolarWindsでは、「Orion Network Configuration Manager(NCM)」バージョン5という新しい構成ソフトウェアを提供している。これは、従来製品のCirrus Configuration Managerに新機能を追加したもの。Orionは、ネットワーク構成に変化が起きた場合、(携帯端末、携帯電話、ノートPC向けのWebベースのUIを通じて)ネットワーク管理者に通知するため、迅速に障害に対処することが可能だという。
テキサス州オースティンにあるディザスタリカバリソフトウェアベンダーのNeverfailで製品マーケティングディレクターを務めるジム・バッテンバーグ氏によると、同社のソフトウェアは2つの環境の間ですべてのデータを非同期に複製するとともに、毎日24時間ネットワークを監視するという。
「このため、ネットワークのダウン、サーバのダウン、ハードウェアの障害、プロセッサへの過大な負荷などの問題を検知することができる」とバッテンバーグ氏は話す。
「エコシステム内のあらゆる問題を検出できる。問題発生時の予備システムへのフェールオーバーも自動で行える」(同氏)
*** 一部省略されたコンテンツがあります。PC版でご覧ください。 ***
関連記事
- 米空港システムに障害、数百のフライトが遅延
- Weekly Memo:Googleのサービス障害にみるトラブル対策の勘所
- Gmailでまたもサービス障害
- 第三者視点でシステム監視:富士通が障害対策組織を新設 東証のシステム障害を受けて
- ゆうちょ銀行でシステム障害 4億5000万円の送金に遅延
- 7月7日、三菱東京UFJで大一番――システムの本格統合開始
- 不具合の原因は「カタカナでなく漢字だったから」――三菱東京UFJのシステム障害
関連リンク
Editorial items that were originally published in the U.S. Edition of “eWEEK” are the copyrighted property of Ziff Davis Enterprise Inc. Copyright (c) 2011. All Rights Reserved.