「実例」に見る意外な落とし穴ディザスタリカバリで強い企業を作る(2/3 ページ)

» 2006年08月30日 16時00分 公開
[村上智,ITmedia]

 読者の中には、シングルユーザーモードで止まっているUNIXサーバを即座にリカバリできる方々が少なくないはずだ。ただ、そうした方の多くは、若手のエンジニアではなかろうか。さて、仮に大災害が発生して、幼い我が子や親兄弟が被災して困っている時、その人たちはそれを放ってまで自社のデータセンターの復旧に来るだろうか? あるいは、復旧に来る意欲はあっても、その「足」は確保できているだろうか?

 一方、読者の中には、相当重大な個人的事情があったとしても、自社のデータセンターの復旧に責任を持って当たるべき立場にある上席の方もいるだろう。そうした方がシングルユーザーモードで止まっているUNIXサーバを見て、原因が光ファイバのケーブルが抜けてストレージが認識できないでいることを突き止め、ケーブルを刺し直し、OSを再び立ち上げることができるだろうか?

 つまりこのトラブルからは「属人性の排除こそ、ディザスタリカバリの基本である」という鉄則を学ぶことができる。災害発生時には、マシンやネットワークだけでなく、頼りにしていた「人材」も被災することを忘れてはならない。

 ここで、前回の記事で説明した3種類のソリューションを思い出してほしい。感の鋭い方なら、属人性が最も小さいのは「サイトフェイルオーバー」の方法であることに気付くだろう。

 サイトフェイルオーバーソリューションはさまざまなベンダーから提供されている。ほとんどの場合、その基本コンセプトは「サイトが被災した可能性が高いことをコンソールで確認し、『サイトフェイルオーバーを実行するかどうか』の確認をCIOに促す」というものだ。

 有事の際、災害対策サイトのコンソールには、本番サイトとのリンクが切れ、「被災」の可能性を示すメッセージが表示される。ここで、リンク切れの原因が本番サイトの被災なのか、それとも単なるネットワーク障害なのかを判断できるのは人間だけだ。

 多くのCIOにとっては、その判断は、「シングルユーザーモードで止まっているUNIXサーバを見て、原因が光ファイバのケーブルが抜けてストレージが認識できないでいることを突き止め、ケーブルを刺し直し、OSを立ち上げること」よりも、はるかに簡単なはずだ。

 仮に本番サイトが被災し、長時間のサイトダウンが必至であると判断した場合、CIOが行うべき作業は、災害対策サイトのコンソール上で点滅している「サイトフェイルオーバー実行」のボタンをクリックすること。この結果、あらかじめデータレプリケーションによって災害対策サイトにコピーされていたデータを使って、しかるべき順序でしかるべき前処理を伴って、災害対策サイトで業務アプリケーションが自動で立ち上がる。「これなら自分でもできそうだ」と考えられるCIOの方は多いだろう。

 もちろん、サイトフェイルオーバーの話は極端な例の1つだ。「属人性の排除」の解決策が高度なソフトウェアの導入を意味するものではない。「誰にでも分かる復旧マニュアル」を作ることも立派な属人性の排除になるし、衛星電話を技術のキーマンたちに配布し、有事の際の応答をコミットさせるのも有力な策である。

 実際、後者のフォーメーションは、筆者自身が1999年末から2000年の年始にかけて、2000年問題対応の現場で経験しており、「事前の備え」としてユーザーからの高い評価を得ている。

 これらの考え方をきちんと理解していれば、SLAに見合っているという前提付きではあるが、前述のどのソリューションでも十分属人性は排除でき、復旧時に発生しがちなトラブルの芽を摘むことができる。

実際の構築事例

 最後に、筆者のグループが過経験したストレージのディザスタリカバリ事例を紹介し、どんなことを考えながら構築を進めたかを紹介しよう。このケースでエンドユーザーが求めた要件は以下の通りだった。

顧客要件:第一段階としてデータレプリケーションを実現する。将来的にはサイトフェイルオーバーへと発展させる。


 エンドユーザーは、自社データセンターの一部でディザスタリカバリを導入することを考えていた。

 さまざまなソリューションを検討した結果、導入のターゲットとなるシステムに関しては、サイトフェイルオーバーまで考慮しなければならないという要件があったことから、とあるベンダーのデータレプリケーションソリューション(ソフトウェアベース)と、遠隔クラスタリングソリューションが選択された。この2つを組み合わせることで、容易にサイトフェイルオーバーまでアップグレードすることができた。

 近年では、クラスタソフトを提供するメーカーと、ディスクアレイベンダーとのアライアンスにより、ディスクアレイベースのデータレプリケーションが、サードベンダーの遠隔クラスタソフトと連携して動作するというソリューションも存在する。実際、EMCのデータレプリケーション(SRDF)とシマンテックの遠隔クラスタ(Veritas Cluster Server グローバルクラスタオプション:VCS GCO)オプションが連携して動作するエージェントが市販されている。

 しかし当時は、そのようなソリューションは国内では存在しなかった。このため、前述のソフトウェアベースで実現するディザスタリカバリソリューションのメリットが強調される形となった。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ