これまで万全の災害対策を施すことは、金融業界などの極めて高い信頼性とデータ保護を必要とするユーザーに限られていた。しかし、最近は災害対策の実施例に広がりが出てきているという。災害対策の最新動向を、日本HPのITスペシャリスト若松和史氏が語る。
2005年は事業継続のトレンドとしてさまざまな出来事がありました。大規模な自然災害を目の当たりにし、前年の新潟中越地震の具体的な被害額も算出されました。政府も「事業継続ガイドライン」を出し、災害対策の推進を始めました。従来、災害対策ソリューションといえば、関心を持つのは主に金融関係などミッションクリティカル性の高いユーザーに限られていましたが、このような背景があったためか、昨年から多くの日本企業が災害に対する備えに敏感になってきています。経営側の課題として「事業継続計画」(BCP:Business Continuity Plan)の策定が必要となり、ITインフラに対する災害対策を講じておくことが必須となってきたのです。
中でもITインフラの観点から特に注目したいのは「ITコンソリデーション」というトレンドです。運用コストの削減を目指してITを統合し、効率的なインフラを構築しようというものです。企業は、これによって最適化されたインフラを最大限に活用して、業務やアプリケーションを「ユーティリティー化」「サービス化」していく方向へ動いています。しかし、コンソリデーションを行ったために、そのインフラが停止すると、すべての業務が止まってしまうというリスクも生じてきました。
BCPの策定に当たっては、ITだけでなく、建物、給電、空調といったファシリティ、社内の運用体制/手順といった幅広い要素で対応する必要があります。実際に災害を経験したIT管理者の話を聞くと、システム復旧の際に大切なことは、状況を的確に把握し、確実に復旧を行なうための手順が確立されていることだと指摘します。
災害対策は、ITのみでなく、プロセス、人、体制といったすべての側面から対策を求めらるものです。システムを熟知している高いレベルのIT管理者が災害に巻き込まれた場合でも、その場にいる人間だけで正常に業務復旧ができるよう、すべての対策が整えられた究極のハイアベイラビリティ(高信頼性)システムであると言えます。
これを実現するためには、IT、体制、プロセスと個別の対策を考えるのではなく、ビジネスにおけるリスクを中心に総括して検討する必要があります。
まず、リスクの認識として、業務プロセスを真剣に見直し、災害の際に最低限どのプロセスを守れば、自社としての事業継続が可能になるか、業務プロセスの重要度の区分を明確にします。そして、対象ITシステムを選定します。
守るべき業務プロセスが明確になれば、リスクを定量化し、復旧時点(RPO:Recovery Point Objective)/復旧時間(RTO:Recovery Time Objective)といった要素を検討します。RPOは災害発生時点からどのくらい前のデータが復旧できればよいかという指標で、RTOは災害発生時からどのくらいの時間で業務が再稼働できればよいかという指標になります。
この2つは、一定時間業務が継続できなかった場合を想定し、損害額など影響度とのバランスで判断します。例えば、守るべき業務が数日間停止しても企業の事業計画に大きな影響がないということであれば、その業務のRTOは数日以内と設定できます。そして、その影響度(RPO/RTO)に応じて、最適なITアーキテクチャを検討します。
対象システムのRPO/RTOが決まった際、それを前提に事業継続計画を策定します。ここで検討しなければいけないことは、さまざまな状況を想定し、限られた体制でも復旧可能な代替業務プロセスを設計することです。そして、そのプロセスに応じて、特定の個人のスキルに依存せずに復旧可能なITシステムの設計、必要なITリソースの検討を行います。
重要なのは、ビジネスの観点から要求を決定し、それを実現するために必要なITを選定・検討する、という流れです。さらに、業務停止の損害額とIT投資のバランスを考えることも重要です。例えば、技術的な観点からRPO/RTOを短くすることは可能ですが、それだけ初期投資額やデータコピー用WAN回線費用は上がります。
最初に述べたように、コンソリデーションによって従来、業務ごとに縦割りで局所最適化されたシステムから、共通化されたITインフラへの移行がトレンドになっています。そこでHPでは、災害対策をこのインフラ上のサービスの1つとして組み込む、というアプローチで災害対策ソリューションを提供しています。
復旧時間を「数時間レベル」「数日レベル」「数週レベル」と分け、業務の要求に応じて適切なサービスレベルを適用することで、投資対効果の優れた災害対策システムが提供可能になります。
この災害対策システムの選択肢は、RTOに応じて、以下の3パターンがあります。
復旧レベル | 災害対策システム構成 |
---|---|
数時間レベル | 「HP Continental Clusters」などの遠隔クラスターを使用した「Active-Hot Standbyシステム構成」 |
数日レベル | 遠隔地に用意したスタンバイサーバへ手作業で切り替える「Active-Cold Standbyシステム構成」 |
週レベル | 従来型のバックアップ媒体の外部保管/リストアで対応する「Active-No Standbyシステム構成」 |
遠隔地へのリモートコピー・ソリューションの選択肢としては、RPO、投資コスト、既存システム環境などに応じて、以下の4パターンがあります。
レイヤー | 説明 | 例 |
---|---|---|
アプリケーション層 | アプリケーション機能によるリモートコピー | 「Oracle 9i/10g Data Guard」 |
ファイルシステム層 | ミドルウェア、ソフトウェアによるリモートコピー | 「HP OpenView Storage Mirroring」 |
ストレージ層 | ストレージ機能による筐体間リモートコピー | HP Storage Works XPディスクアレイ筐体間コピー機能「Continuous Access XP」 |
バックアップ媒体層 | バックアップ媒体の物理的な移動といった運用管理体制によるサービス | 「HP OpenView Storage Data Protector」によるバックアップ媒体の外部保管運用 |
昨年、受注実績の多くは、ストレージ機能によるリモートコピー技術「Continuous Access XP(HP Storage Works XP ディスクアレイ筐体間コピー機能)」が採用されています。近年、ストレージ機能によるリモートコピーの採用が増えた理由としては、データ転送用WAN回線費用の低減化、RPOの短さや運用管理に手間が掛からないこと、そしてサーバ技術に依存しないため将来にわたって継続的な利用が可能という点が挙げられます。
さらに、数時間レベルのシステム復旧(RTO)の観点から推奨したいのが、国内導入実績のある遠隔クラスター「HP Continental Clusters」です。これはWANを介した遠隔クラスターで、災害発生時、数百キロメートル離れたコピーボリュームの整合性を的確に自動診断し、数時間レベルで対象システム全体のサービスの切り替えを実現します。
遠隔コピー/遠隔クラスターの技術は複数のベンダーから提供されています。しかし「HP Continental Clusters」の優れた点は、日々の災害対策運用の自動化、そして災害発生時にシステムに精通した運用管理者が不在でも早急かつ安全にシステム復旧が行えるという点です。
HPは、実績のある災害対策ソリューションを提供するだけでなく、サーバ、ストレージ、ネットワークなどシステム全体にわたった知識と豊富な導入経験を活かし、総合的に、企業にとって最適な災害対策システムを提案できると言えます。
Copyright © ITmedia, Inc. All Rights Reserved.
提供:日本ヒューレット・パッカード株式会社
制作:ITmedia エンタープライズ編集部/掲載内容有効期限:2006年6月30日