では、この事例の重要なポイントをまとめてみましょう。
◎障害対応と原因究明は基本的に異なる活動である
障害対応の基本は、障害箇所の特定と、その箇所の修理あるいは交換です。例えば「PCの電源装置がおかしい」と特定できれば、その電源装置を修理したり、交換したりすることで障害を取り除きます。しかし、原則として、障害対応に原因究明は含まれません。すなわち、障害対応だけだと同じ障害が再発してしまう可能性があるわけです。
◎原因究明の目的は、再発防止である
そこで、同じ障害の再発を防止するためには、障害の根本原因を特定し、排除しなければなりません。原因究明とは「同じ障害が二度と起こらないようにする(または起こりにくくする)ためのものだ」と、はっきりと認識しておく必要があります。
◎原因究明の活動は、障害対応と利害関係が対立する場合がある
ただし、ここで重要なことは障害対応の中に原因究明を含めてはならないということです。なぜなら、障害対応と原因究明の利害が対立する可能性があるからです。
障害対応の基本的な目的は、障害を取り除き、その情報システムを再び使えるようにする(通常の操作が行えるように戻す)ことです。ですから一刻も早く(あるいはあらかじめSLAで取り決められた範囲内で)情報システムを使えるようにするという迅速性が求められます。
一方、原因究明の基本的な目的は、さきほども書いた通り、再発の防止です。再発を防止するためには、障害発生の表面的な原因だけではなく、根本原因をとことん調べる必要があります。しかし、場合によっては該当する情報システムを止めないと、根本原因がつかめない可能性もあるわけです。事実、今回の例では、PCメーカーのサービススタッフが障害の根本原因の究明作業を開始し、最終的に「電圧のふらつき」を特定するまで、該当するPCは使えませんでした。PCが使えないということは「情報システムの通常の操作が行えない」ということです。すなわち、障害対応の目的と対立するわけです。
◎本当に原因究明が必要な時だけ、その活動を行うようにする
また、根本原因の特定にはそれなりのスキルが必要ですし、作業にもそれなりの時間を要します。外部のサービススタッフを利用する場合には、追加のコストが発生する可能性もあります。
従って、例えば「叩けば直る」というような一時解決策(ワークアラウンド)が確立されており、「そのワークアラウンドを適用すれば業務にさほど影響は出ない」と分かっている場合には「あえて根本原因を特定しない」という選択肢もアリです。つまり、時間とお金が掛かる「根本原因を特定し、再発を防止しようという活動」には、“それなりの理由”が必要なのです。
よって、「再発を繰り返すと業務に著しい影響が出る」「再発によって従業員のモチベーションが下がる」など、根本原因の特定と再発防止に、正当で妥当な根拠がある場合に限って、原因究明をするようにしましょう。どんな障害でも原因究明をやっていたのでは、ただでさえ忙しい情報システム部門の人たちの仕事とフラストレーションはいつまでたっても減りません。
さて、数回にわたって障害対応に関するお話をしてきましたが、「ただ障害に対応すれば良い」というわけではないことがお分かりいただけましたでしょうか。次回からは、また新しいトピックでお話を続けます。どうぞお楽しみに。
▼著者名 谷 誠之(たに ともゆき)
テクノファイブ株式会社 阪神支社 ラーニング・コンシュエルジュ。IT技術教育(運用系/開発系)、情報処理試験対策(セキュリティ、サービスマネージャ、ネットワークなど)、対人能力育成教育(コミュニケーション、プレゼンテーション、チームワーク、ロジカルシンキングなど)を専門に約20年にわたり、活動中。「講習会はエンターテイメントだ」を合言葉に、すぐ役に立つ、満足度の高い、そして講義中寝ていられない(?)講習会を提供するために日夜奮闘している。
ディジタルイクイップメント株式会社(現:日本HP)、グローバルナレッジネットワーク、ウチダスペクトラム、デフォッグなどを経由して現職。
テクニカルエンジニア(システム管理)、MCSE、ITIL Manager、COBIT Foundation、話しことば協会認定講師、交流分析士1級などの資格や認定を持つ。近著に『高度専門 ITサービスマネジメント』(アイテック、2009年6月)
がある。
Copyright © ITmedia, Inc. All Rights Reserved.