Gartner Column:第42回 ほとんどのシステム障害は人災である

【国内記事】 2002.4.08

 意外に思われるかもしれないが,ガートナーの調査では,システム障害の中でテクノロジー関連の要素を原因とするものは20%程度に過ぎない。残りはすべて人的要素を原因としたものなのである。

 より正確に言えば,(保守目的などを除く)予定外のシステム停止時間の中で,ハードウェアやシステムソフトウェアなどのテクノロジー的要素を原因とするものは約20%,アプリケーションソフトウェアのエラーを原因とするものが約40%,オペレーション(運用)のエラーを原因とするものが約40%であることが,米ガートナーのクライアントを中心としたサーベイから判明している。

 今後,クラスタリングなどのシステムの無停止稼動のためのテクノロジーがさらに進化するにつれ,テクノロジーを原因とするシステム障害はますます減少し,それに比して,人的要素を原因とするシステム障害の割合は増加していくだろう。

 この結果を意外とお考えの方も多いかもしれない。「うちの部門システムは毎週のようにOSのエラーで落ちているぞ」などと言いたい方も多いかもしれないが,このサーベイは,ガートナーのクライアント,つまり,大企業のデータセンターを中心としたユーザーに対するものである点に注意していただきたい。

 このようなユーザーでは,ハードウェアやシステムソフトウェアは十分にテストされており,またシステムの多重化構成などに十分な投資が行われているため,テクノロジーを原因とするシステム障害の頻度はもともと低いし,仮にそのような障害が起きても,バックアップ機が処理を引き継ぐことで,障害を外部に見せないことができるのである。

 典型的には,このような環境では99.9%のアップタイム,つまり,年間ダウン時間にして9時間程度の可用性が実現できている。で,この9時間の内訳が何なのかというと人間を原因としたもの,いわば,人災が大きいというわけだ。

 ゆえに,ガートナーは,システムの可用性を向上するためには,テクノロジー系の投資以上に,運用プロセスに対する投資(例えば,運用手順書のレビュー,トレーニング,自動運用監視ツールの採用など)やアプリケーションのテストプロセスに対する投資を行わなければならないことを繰り返し述べている。

 さらに言えば,システムダウンの原因となる人災も高度なものばかりとは限らない。

 SAN機器の大手ベンダー,ブロケードのアナリストブリーフィングに出席した時のことである。同社はまだ一般になじみがないSANの価値を聴衆に理解してもらうためにちょっとしたデモを行った。

 デモと言っても(ブロケード社員による)スキット(寸劇)なのだが,マシンルームの掃除夫がファイバーチャネルのケーブルを間違って抜いてしまったりしても,また,SANスイッチにコーヒーをかけてしまったとしても,リカバリー機能によりSANはちゃんと動き続けますよというようなものだった。

 目に見えるデモを行うことが難しいSANのデモとしては,まあご愛嬌というところだったのだが,注目すべきは,その後に続いたユーザー事例の講演者たち(みな,米国大手企業の情報システム部の運用責任者である)の発言だった。彼らは,「皆さん,先ほどのデモを作り事と思いませんでしたか? しかし,わが社でも実際に同じようなことがおきたことがありました。上階の配管工事のミスでデータセンターが水浸しになってしまったのです」というような発言を繰り返した。

 また,私が米国のデータセンターの電源専門コンサルタント(米国にはこういう職業があるのだ)と話した時にも,新米の掃除夫が掃除機をサーバと同じコンセントに挿して使ったために,誘電ノイズによりサーバがダウンとしたという事例を聞いたことがある。

 現在,問題となっている都銀のシステム障害もまた種類が違う人災と言えるだろう。現時点で報道等で伝えられる情報から判断する限り,問題の種はスケジュール管理上の意思決定ミスというかなり致命的な人災のように思える(元金融系SEの私としては,今の現場の状況はなんとなく想像がつくので,現場のSEやプログラマーの方には体を壊さぬよう,がんばっていただきたいと願うばかりである……)。

 日本の都銀系のシステムといえばテクノロジー面でも人的プロセス面でも世界最高峰(米国で言えばNASAや国防用のシステムに相当するだろう)であり,高可用性システム(通常,都銀の預金系オンラインでは99.999%の可用性が実現されていることが多い)のベストプラクティスとして米国アナリストに紹介することも多かったため,私としてはなんとも複雑な心境なのである。

 結局のところ,重要なポイントは,ITがどれほど進化しても,また,企業がいかにIT投資を拡大しても最後は人で決まるということなのだ。

[栗原 潔ガートナージャパン]