次にリスク評価において、対策が必要であると判断された事項について、対応策とリカバリプランを検討する。これには、UPS(無停電電源装置)とコンピュータのバックアップ電源の設置や、敷地外のストレージを含めた、包括的なバックアップおよび復旧戦略の策定といった、あらかじめリスクを低減させる手段と、万が一災害などによる予期せぬITサービスの中断が発生し、既存の設備でサービスの継続が困難になった場合の、予備の収容設備やシステムの準備といったスタンバイ対策を考慮する。
通常、ITサービスを継続的に供給することに対するリスクを可能な限り低く抑えることは、可用性管理によって達成されているが、これが十分に計画されたものだとしても、すべてのリスクを完全に排除することは不可能である。
例えば、東京で大きな地震が発生したとしよう(そういったことが起こらないことを祈っているが)。耐震、免震設備のあるファシリティにシステムが設置されている場合、システム自体は損害を免れるかもしれないが、外部のケーブルの断線によりネットワークの利用が出来なくなったり、交通機関の混乱により、そのシステムの運用者が設備に近づけないといったような事態は想定しておく必要があるだろう。
このような事態が発生した場合、どのレベルで、どういった手段でITサービスを復旧させるかを、あらかじめ計画しておくことが必要だ。究極の解決策は、遠隔地に同様のITサービスを提供可能なミラーサイトを持ち、ここで非常時にも同様のサービスを提供できる体制を構築することである。金融系のディーリングシステムのようなミッションクリティカルなシステムの場合にはこういった設備が必要となるだろう。
復旧計画と手順の作成
復旧計画は、予期せぬ災害でITサービスが中断した場合に、どのようにITサービスを継続して提供し続けるか、もしくは許容された期間内に回復することが可能になるように作成される必要がある。
非常時においては、そのシステムの担当者ではない技術者が復旧を行う可能性も考慮し、データの復旧ポイント、依存しているシステムのリスト、システムのハードウェアとソフトウェアの要件、ネットワーク構成、システムの基本情報といったような重要な詳細を計画に含むことが必要である。この計画には、システム復旧のすべての段階にわたって、必要な処理や対応を網羅しているチェックリストが含まれていることが重要だろう。システム復旧後、事業にシステムを引き渡す際に、このチェックリストによって、接続性のチェックや機能性のチェック、もしくはデータの一貫性や完全性のチェックが実行され、サービスを提供する為の要件が満たされていることを確認すべきである。
テスト
次に作成された復旧計画や手順が、期待通りに機能することを証明するために、より現実的なシナリオに従って、テストを実施する。このテストでは、ビジネスプロセスの復旧や外部組織の参画を含めたすべてのスタンバイ対策の発動を、可能な限り再現するべきであろう。このテストよって確認されるのは、主に以下の内容となる。
このテストにより、機能しないフローや回復想定時間と実際の回復時間の差異が発見された場合には、計画書自体の見直し、再度のテストが必要となるだろう。
運用管理
ひとたび導入と計画がしたら、これらが通常業務の一部として維持されることが必要である。これには、関連メンバーへの教育やトレーニングに始まり、定期的なテストの実施、定期的な復旧計画のレビュー、テスト結果や、日々の変更に応じての復旧計画のメンテナンスといったような業務が含まれる必要がある。この運用管理により、復旧計画や手順が期待どおりに機能することを保障できるのである。
最後に、ITサービス継続性管理は、重要なビジネスプロセスの中断や障害といったリスクを低減し、常に事業の利益を確保するために、業務要件に基づいて導入される活動である。これは、有事の際の事業の業績や究極的には会社の生き残りに大きく関わっているため、すべてのマネジメント層によって理解され、明確に支援されることが重要である。このため、導入やテスト、運用管理によって生成、改版されたアウトプットは、常にマネジメントがレビューを行い、承認を得ることが必要になるだろう。
Copyright © ITmedia, Inc. All Rights Reserved.