必ず起こり得るもの、「災害」「ウイルス」「人的エラー」:ITILを究める! サービスデリバリ編(2/2 ページ)
どれだけ対策を施しても、予測できない災害は常に発生する危険性を持っている。システム停止は、「必ず起こるもの」として、対応策を計画するには?(攻めのシステム運用管理)
次にリスク評価において、対策が必要であると判断された事項について、対応策とリカバリプランを検討する。これには、UPS(無停電電源装置)とコンピュータのバックアップ電源の設置や、敷地外のストレージを含めた、包括的なバックアップおよび復旧戦略の策定といった、あらかじめリスクを低減させる手段と、万が一災害などによる予期せぬITサービスの中断が発生し、既存の設備でサービスの継続が困難になった場合の、予備の収容設備やシステムの準備といったスタンバイ対策を考慮する。
通常、ITサービスを継続的に供給することに対するリスクを可能な限り低く抑えることは、可用性管理によって達成されているが、これが十分に計画されたものだとしても、すべてのリスクを完全に排除することは不可能である。
例えば、東京で大きな地震が発生したとしよう(そういったことが起こらないことを祈っているが)。耐震、免震設備のあるファシリティにシステムが設置されている場合、システム自体は損害を免れるかもしれないが、外部のケーブルの断線によりネットワークの利用が出来なくなったり、交通機関の混乱により、そのシステムの運用者が設備に近づけないといったような事態は想定しておく必要があるだろう。
このような事態が発生した場合、どのレベルで、どういった手段でITサービスを復旧させるかを、あらかじめ計画しておくことが必要だ。究極の解決策は、遠隔地に同様のITサービスを提供可能なミラーサイトを持ち、ここで非常時にも同様のサービスを提供できる体制を構築することである。金融系のディーリングシステムのようなミッションクリティカルなシステムの場合にはこういった設備が必要となるだろう。
復旧計画と手順の作成
復旧計画は、予期せぬ災害でITサービスが中断した場合に、どのようにITサービスを継続して提供し続けるか、もしくは許容された期間内に回復することが可能になるように作成される必要がある。
非常時においては、そのシステムの担当者ではない技術者が復旧を行う可能性も考慮し、データの復旧ポイント、依存しているシステムのリスト、システムのハードウェアとソフトウェアの要件、ネットワーク構成、システムの基本情報といったような重要な詳細を計画に含むことが必要である。この計画には、システム復旧のすべての段階にわたって、必要な処理や対応を網羅しているチェックリストが含まれていることが重要だろう。システム復旧後、事業にシステムを引き渡す際に、このチェックリストによって、接続性のチェックや機能性のチェック、もしくはデータの一貫性や完全性のチェックが実行され、サービスを提供する為の要件が満たされていることを確認すべきである。
テスト
次に作成された復旧計画や手順が、期待通りに機能することを証明するために、より現実的なシナリオに従って、テストを実施する。このテストでは、ビジネスプロセスの復旧や外部組織の参画を含めたすべてのスタンバイ対策の発動を、可能な限り再現するべきであろう。このテストよって確認されるのは、主に以下の内容となる。
- 復旧に関係するメンバーの心構えと自覚
- フロー、チェックリストが有効に機能したか
- サービスを回復するのに想定していた時間と、実際に回復した時間の差異
- 外部組織の対応についての有効性と認識
このテストにより、機能しないフローや回復想定時間と実際の回復時間の差異が発見された場合には、計画書自体の見直し、再度のテストが必要となるだろう。
運用管理
ひとたび導入と計画がしたら、これらが通常業務の一部として維持されることが必要である。これには、関連メンバーへの教育やトレーニングに始まり、定期的なテストの実施、定期的な復旧計画のレビュー、テスト結果や、日々の変更に応じての復旧計画のメンテナンスといったような業務が含まれる必要がある。この運用管理により、復旧計画や手順が期待どおりに機能することを保障できるのである。
マネジメントのコミットメント
最後に、ITサービス継続性管理は、重要なビジネスプロセスの中断や障害といったリスクを低減し、常に事業の利益を確保するために、業務要件に基づいて導入される活動である。これは、有事の際の事業の業績や究極的には会社の生き残りに大きく関わっているため、すべてのマネジメント層によって理解され、明確に支援されることが重要である。このため、導入やテスト、運用管理によって生成、改版されたアウトプットは、常にマネジメントがレビューを行い、承認を得ることが必要になるだろう。
関連記事
- 上手なキャパシティ管理
アクセス量やシステムの処理量に対してシステムリソースが不足すれば、システムの安定稼動は見込めない。最適なコストでキャパシティを改善するには、どうすうればよいのだろう? - 過剰なIT投資に陥らないコツ
ITサービスは、そのほかのサービスよりもコスト増大が早い。ビジネスに依存しているからには、それを超えるIT投資はない。管理できているだろうか? - サービスレベルを高める「発想の転換」
SLAという言葉に馴染み深い読者は多いのではないだろうか? これに対してSLMという管理手法がある。ITサービスの品質向上の観点からは、SLMの方がより実用的だ。 - ビジネスとITを結びつける
技術中心のアプローチから運用品質の改善/向上のアプローチへ。ビジネスがどのようなITサービスを要求するか、に焦点を当てた「サービスデリバリ」。6回にわたってそのプロセスを紹介していく。 - サービスレベル管理、7つの疑問
- そのシステム変更、大丈夫?
- 知らないと恥ずかしい、ITIL超基礎
- バックアップでトラブル! 自分たちにどんな責任があったのか?
- 特集:攻めのシステム運用管理
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.