事業継続性を強化する「リカバリ視点のバックアップ」とは?保存だけでは不十分

今、改めて注目されている事業継続性。その重要な鍵を握るのが、ITシステムのバックアップとリカバリだ。たとえ災害・障害に見舞われても、ITシステムを迅速に復旧できれば、被害を最小限に食い止められる。その最善策をもう一度考えてみよう。

» 2011年06月22日 10時00分 公開
[ITmedia]
PR

事業継続性をIT視点で考える

 今やITシステムは、企業がビジネス活動を行う上で決して欠かすことのできない中心的な存在となっている。これは、ひとたび災害が発生してITシステムが被災すれば、企業のビジネス活動の継続が困難であることを意味している。だから、ITシステムを「守る」ことは、企業の事業継続性を実現する上で避けては通れない取り組みだ。

 事業継続性や災害対策については、これまでにも幾度となくIT分野におけるトレンドになってきた。今から5年以上前には、ディザスタリカバリ(災害復旧)というキーワードが注目されたことがあったが、当時はディザスタリカバリソリューションを「費用対効果が計測できない、保険のような投資」と考える向きも多かった。しかし、2011年春に発生した不幸な出来事――東日本大震災により、今現在は、ディザスタリカバリを含めた事業継続性の強化こそが、企業の存続に必要な危機管理の一つとして認識されている。

 災害発生時を想定し、ビジネスを継続するために策定する事業継続計画(BCP=Business Continuity Planning)は、ITシステムだけでなく全社的な施策である。だが、ビジネス活動をITシステムに依存している企業では、ITシステムに関する部分の重要度はおのずと高くなる。まずは、ITシステムをいち早く復旧させることが、企業の事業継続を支えることになるわけだ。

ITシステムが停止している時間が長ければ長くなるほど、企業の損失はかさんでいく。例えば 、年商300億円程度の企業であれば、ITシステムが3日間完全に停止してしまうだけで、約3億円もの売上機会損失になる。これが、災害ではなくシステム障害に起因するものであれば、風評被害を被ったり、信用が低下したりといった不確定要素が加わり、さらに損失が拡大するおそれもある。

ITシステムを守るために取り組むべきこと

 こうした事態を招かないために、ITシステムを守るにはどうすればよいのか。そのためには、守る対象に優先順位を付けておくことが必要だ。その中でも、企業の事業継続にとって最も重要なものは、データである。データは、ビジネス活動を行うことで生成・蓄積されていくものであり、事前に準備できない。また、一度失ってしまえば、購入することは不可能だ。それに対し、ITシステムを構成するハードウェアやソフトウェア、ネットワークなどの設備は、何らかの事態に備えた事前準備が可能だし、故障・破損しても再購入できる。運用手順のようなノウハウの蓄積、ITシステムの管理担当要員なども、再作成・再教育が可能だ。ところが、データだけはそうはいかない。

 もちろん、事業継続の観点からは、データだけ無事でもどうしようもないという場合もある。そのために、ビジネスに対するインパクトによってITシステムをいくつかの階層に分類し、それぞれに最適な対策を講じることが必要になる。例えば 、重要な基幹業務システムは、自動回復機能を備えたHAクラスタと遠隔地のサイト間ミラーリングを実現するソリューションを導入する。一般的なオフィス文書を保管するファイルサーバのように、復旧まで数時間〜1日かかってもよいシステムであれば、ディスクコピーやネットワーク転送によるレプリケーション、またはバックアップを行う。ほとんど更新されていないものの、保管期限内のデータをアーカイブとして保存しているシステムの場合は、1日1回程度のテープバックアップだけで十分なこともある。

 当然、RTO(Recovery Time Objective=復旧時間目標)が短ければ短いほど、ソリューションにコストがかかることになる。言い換えれば、ITシステムの重要性によって階層分けしなければ、とんでもない金額の莫大な投資が必要になってしまう。

特徴的な機能を備えたTSMとIBM FastBack

 階層分けしたITシステムは、前述のようにそれぞれ導入すべきソリューションは異なってくる。このうち、重要度の高い基幹業務システムは、すでに対策されていることが多い。ところが、オフィス業務で使用する文書ファイルを保存しているファイルサーバなどは、1日1回のテープバックアップだけで済まされているケースが少なくない。企業の第一線で働く社員にとっては、保存していたデータが消失しただけで仕事が滞ってしまうものだ。事業継続性を実現する上で今求められているのは、こうした部分のリカバリをどうするかという問題の解決なのである。

 そこで注目されているのが、バックアップレベルで対応している階層のITシステムを、出来る限り迅速に、かつ最新のデータに復旧させるためのソリューションである。IBMの「Tivoli Storage Manager」(以下、TSM)および「IBM Tivoli Storage Manager FastBack」(以下IBM FastBack)は、そうしたニーズに応えられるツールの1つだ。

 従来の一般的なバックアップの方法では、週次などの間隔で定期的に対象システムのフルバックアップを行い、日次では差分または増分をバックアップするというものが多い。この方法の課題は、データ量が膨大になるということだ。例えば 、毎週のデータの変更率が10%だとすれば、90%のデータはその前の週から変更がないはずだ。それなのに次週にフルバックアップすることは、すでにバックアップ済みのデータを、わざわざ長い時間をかけて何度もバックアップしていることになる。

 こうした無駄をなくすために、TSMは「プログレッシブ インクリメンタル バックアップ」という機能を搭載している。これは、初回にフルバックアップをとっておくだけで、その後は更新されたファイルのみをバックアップするという特徴的な増分バックアップ。ファイルごとにバックアップ情報を管理するため、柔軟な設定・運用が行えるほか、ネットワーク帯域やストレージプールを節約する効果がある。これにより、バックアップとリストアの時間は大幅に短縮され、運用効率化を実現できる。

プログレッシブ インクリメンタル バックアップと、他の方式でバックアップし続けた場合との比較。大きな差があることが分かる

 一方のIBM FastBackは、ブロックレベル インクリメンタル バックアップという手法が採用されている。これは、最新のバックアップ以降に変更されたファイル全体ではなく、データブロックだけをバックアップする方法だ。こちらもフルバックアップは初回の1回だけを想定している。

 また、いずれの製品にも標準機能として重複排除機能が備わっており、さらにバックアップデータの無駄を小さくすることが可能だ。

災害対策に有効なTivoliの機能

 TSMとIBM FastBackには、こうしたバックアップデータを最小化する特長に加え、災害時の事業継続を目的とした各種機能が搭載されている。例えば 、以下のようなレプリケーションの仕組みを構築しておくと、災害対策には非常に有効だ。

 TSMはバックアップの内容を記録・保存するデータベースエンジンとして「DB2」を搭載している。そのDB2の機能に「High Availability Disaster Recovery(HADR)」がある。これは、IPネットワークを使って遠隔地間のDB2を同期させるものだ。通常時は、本番サイトのTSMがIPネットワークを利用して災害対策サイトのNASに作成したコピーストレージプールにデータをバックアップする。同時に、コピーストレージプールの情報が入ったTSM DBのレプリケーションをHADRの機能を使い、災害対策用サイトに対して実行する。

 万一災害が発生した場合、災害対策用サイトで待機していたスタンバイTSMは、業務サーバに災害対策サイトのコピーストレージプールのデータを利用してデータをリストアし業務を再開させる。コピーストレージプールのデータを災害対策用サイトのTSMサーバのプライマリーストレージプールにリストアすることも可能だ。

 こうした使い方は、すべてのデータに対して行う必要はない。例えば 、ほとんど更新されないアーカイブデータなどは、災害発生時でも直ちに復旧する必要性はないので、そうしたデータは従来通りテープにバックアップし、それを災害対策用サイトへ搬送するという方法をとってもかまわない。

 さらに、TSM DBが大容量でなければ、データをコピーストレージプールへバックアップするのではなく、災害対策用サイト側に設置した仮想ボリュームに転送するという使い方ができる。

 IBM FastBackの場合、バックアップ対象サーバ(IBM FastBackクライアント)をIBM FastBackサーバへデータの重複排除を行った状態で一時的にバックアップし、そのデータをWAN経由でバックアップサイトへ転送するという方式が有効だ。障害発生時には、災害対策用サイトのIBM FastBackサーバから異機種ハードウェアへOSなどのシステム環境を含めたリストアをサポートするBMR(Bare Machine Recovery)、およびインスタント リストア機能によってIBM FastBackクライアントと同等の機能を持つサーバを再構築することができる。

災対でDRサーバからリカバリし、インスタントリストアでサーバを再構築する

災害対策のためのトータルソリューション

 IBMでは、TSMとIBM FastBackによる「Tivoli 災害対策ソリューション」も提供している。1つは、TSMを利用して大規模バックアップデータのネットワークによる転送災害対策用サイト構築を行うソリューションだ。ネットワークで災害対策用サイトへデータを転送することで、テープ搬送より短い時間で災害対策用サイトシステムを構築する。災害対策用サイトでのリカバリが迅速に実行できるほか、煩雑なテープ運用から解放されるという効果が得られる。

 もう1つは、IBM FastBackを利用して万一の時に簡単・シンプルにリモート拠点でサーバを立ち上げるというソリューション。容易な操作で災害対策用サイトへデータを退避することが可能になるほか、災害対策用サイト上で迅速に事業継続のためのシステム復旧が行えるようになる。

 企業にとって、このような事業継続性強化のためのパックアップ環境の構築は、もはや他人事ではない。自社で構築することが難しければ、こうしたIBMのソリューションを採用することもできる。自社の事業継続性を考慮した観点から現在のデータバックアップの体制を見直すところから始めてはいかがだろうか。

この記事に興味のある方におすすめのホワイトペーパー

 バックアップ運用をシンプルに!バックアップのデータ量をより抑える方法のご紹介

ホワイトペーパーのダウンロードページへ (TechTargetジャパン)

 バックアップのお悩みはこれで解決。バックアップも立ち直りも早すぎるIBM FastBack

ホワイトペーパーのダウンロードページへ (TechTargetジャパン)

 増え続ける仮想マシンにおいてデータをバックアップし、リストアすると、そのサーバー上の他のすべてのオペレーションが予期せず一時停止する可能性がある。有効なソリューションとは?

ホワイトペーパーのダウンロードページへ (TechTargetジャパン)

Copyright © ITmedia, Inc. All Rights Reserved.


提供:日本アイ・ビー・エム株式会社
アイティメディア営業企画/制作:ITmedia エンタープライズ編集部/掲載内容有効期限:2011年9月30日

注目のテーマ