必ず起こり得るもの、「災害」「ウイルス」「人的エラー」ITILを究める! サービスデリバリ編(1/2 ページ)

どれだけ対策を施しても、予測できない災害は常に発生する危険性を持っている。システム停止は、「必ず起こるもの」として、対応策を計画するには?(攻めのシステム運用管理)

» 2005年09月07日 08時12分 公開
[インフォリスクマネージ,ITmedia]

 日常業務がITに依存していない企業はほとんどなくなった昨今、システムやITサービスの長期間停止は、ビジネスにとって取り返しのつかない損失が発生する可能性を秘める。ITの継続的な可用性確保が、組織の存続にとって非常に重要な要素だ。

 ところが、どれだけ対策を施しても、予測できない災害は常に発生する危険性を持っている。地震や台風、火災といった天災に限らず、DoS攻撃、ウイルス感染、人的エラーなどによるシステム障害についても同様である。また、自社のシステムが正常に稼動していたとしても、キャリア、ISPのトラブルや運用スタッフのストライキ、疫病などにより、ITサービスが提供できなくなる事態が発生するかもしれない。今や、ITサービスやシステムの停止は、そのまま「ビジネスの停止」を意味する。

 予測できない災害によるシステム停止は、「起こるかもしれないもの」ではなく、「必ず起こるもの」と想定して、あらかじめ対応策を計画しておくことが重要だろう。

 ITサービス継続性管理とは、システムやITサービス中断時のビジネスインパクトの分析/リスク評価/対応策の検討/リカバリプランの計画/定期的な訓練を行うことによって、システムやITサービスがなんらかの要因で中断した場合でも、あらかじめ合意された事業期間内で確実に復旧できるようにすること、最小の業務要件をサポートするために、事前に定義され合意されたITサービスのレベルを提供し続けることを目的とした活動である。

ITサービス継続性管理の導入

 ITサービス継続性管理を導入するためには、システムやITサービス停止時の事業継続性に対するリスクの評価と最低限容認できるレベルの事業の識別を行い、これらを維持する計画を整備する必要がある。これら計画は、事業が営まれている環境を正確に反映していることを確実にするため、定期的なレビューが必要になるだろう。

リスク評価

 前述したが、システムやITサービスを中断させうる要素は多岐に渡って存在している。事業に対して大きなインパクトを与えるものもあれば、そうではないものもある。これらすべてを同列のリスクと考え、個々に対応策とリカバリプランを検討し、定期的な訓練を実施した場合、これらの作業だけで膨大な時間と労力が割かれることになり、現実的ではないということは容易に想像できる。このため、個々のリスクのレベルを評価し、その評価によって対応策を決定する必要があるだろう。

 評価は図のようなマトリックスで行うと整理しやすいだろう。

図1 リスク評価マトリックス

 それぞれの軸は発生の可能性と事業へのインパクトとなっており、発生の可能性が「高」く、かつ業務へのインパクトが「高」い場合、かなりの確立でリスクが顕在化する可能性がある。その影響も大きいことから、早急に対応策とリカバリプランを検討する必要がでてくる。逆に発生の可能性が「低」く、業務へのインパクトも「低」い場合には、リスクを受容し、対策を講じないといった判断になるかもしれない。このような形でリスクを評価することで、効果的な対策やリスク低減手段を決定することができるようになるだろう。

対応策とリカバリプランの導入

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ