組織に見合った適切なバックアップシステムを構築するには、いつ、どのくらいの容量のデータをバックアップするかという要件を明確にし、条件を絞り込んでいくことが重要だ。
バックアップ環境の構築は、現在のシステム環境やバックアップ要件を入念に調査することから始まる。これらを調べることで、バックアップ装置およびバックアップソフトウェアの種類、バックアップスケジュールなどが決定される。
まず、バックアップシステムの対象となるサーバを特定し、そのサーバの使用状況や物理的なロケーションなどを確認する。主な調査事項には、以下のようなものがある。なお、システム自体を新規で構築する場合には、システム設計の段階でバックアップ条件も同時に設定していく形となる。
これらの情報を収集したら、次にバックアップ要件の抽出を行う。ここでは、何時から何時までにどのような形態のバックアップを行うかを決定する。
例えば、あるサーバでの社内アプリケーションの稼働時間(社員へのサービス提供時間)が、月〜土曜日には午前8時〜午後10時、日曜日には全休だとしよう。この場合、バックアップに利用できる時間(バックアップウィンドウ)は、月〜土曜日が午後10時から午前8時まで、日曜日が24時間となる。
ただし、従業員の早朝出社や残業、休日出勤なども想定し、月〜土曜日は午前3時から午前5時まで、日曜日は午前0時から午前6時までをバックアップウィンドウに割り当てることにしよう。つまり、バックアップウィンドウは、月〜土曜日が午前3時からの2時間、日曜日が午前0時からの6時間ということになる(図1)。
次に、バックアップ形態の決定だが、バックアップの仕方にはフルバックアップ、差分バックアップ(ディファレンシャルバックアップ)、増分バックアップ(インクリメンタルバックアップ)の3種類がある。
フルバックアップは、対象のファイルシステム全体を取得するバックアップのことだ。全ファイルがバックアップ対象となるためバックアップには時間がかかるものの、それ自身が完全なデータを保持していることから、データの保護強度はきわめて高い。通常は、十分なバックアップウィンドウを確保できる日に採用され、今回の例では日曜日のバックアップに適していることが分かる。
差分バックアップはフルバックアップに対しての変更分、増分バックアップは前回のバックアップ時に対しての変更分をバックアップするもので、いずれもフルバックアップと併用する形がとられる。
差分バックアップの場合は、日を追うごとにバックアップの時間が長くなる傾向にある。ただし、フルバックアップからの変更分を直接保持しているため、フルバックアップと最新の差分バックアップのデータさえ用意すれば、何かあった場合も最新の状態にまで復元できる。
一方、増分バックアップは、日々のバックアップ時間は短縮できるものの、復元の手順が複雑になりやすい。例えば、フルバックアップの翌日より4日間の増分バックアップを行った場合、データの復元にはフルバックアップのデータに加え、4日分の増分バックアップのデータを必要とする(図2)。
ただし、テープライブラリを使用している環境下では、テープカートリッジの入れ替えなどに管理者の手をいっさい介さないため、差分バックアップでも増分バックアップでも、復元手順の負担はそれほど変わらない。したがって、日々のバックアップ時間をできる限り短縮したい場合に増分バックアップを、復元時間を可能な限り短縮したい場合に差分バックアップを選択するという単純な切り分け方で十分だ。今回の例では、月〜土曜日に2時間しかバックアップウィンドウをとれないので、増分バックアップを採用することにしよう。
バックアップの形態が決まったら、次にテープライブラリの選定を行う。ここでは、上記で決めたバックアップスケジュールと、バックアップ対象となるデータ量から、テープの種類やテープライブラリに搭載するドライブの台数、使用するテープカートリッジの巻数などを決定する。
テープライブラリの選定に当たっては、まず、バックアップの世代数を決めなければならない。これは、「どこまでのデータにさかのぼれるようにするか」を決定するものだ。日本ストレージ・テクノロジー パートナー営業本部 セールスサポートグループ ストレージコンサルタントの小田切隆氏は、基本的な世代数の決め方を次のように説明する。
「なるべく最新のデータに戻れればよい場合は、バックアップイメージにエラーが発生したケースを考慮して、最低限の2世代のバックアップをとればよいでしょう。それ以外のケースでは、どの時点までデータを復旧する必要があるかによって決まります。例えば、月次の処理が発生し、その更新前のデータに戻る必要がある場合には、最低でも1カ月分のバックアップを保存しなければなりません。つまり、毎週フルバックアップを行うのであれば、4世代または5世代のバックアップをとればよいことになります」(同氏)。
こうしてバックアップの世代数が決まったら、次にバックアップウィンドウ内でバックアップを完了させるために必要な最低ラインのデータ転送速度を算出する。
ここで、例えば全サーバの合計データ量が2000GB(約2TB)あり、毎日の更新率が平均して10%(更新量200GB)だったとすると、日曜日のフルバックアップには92.6MB/sec以上、月〜土曜日までの増分バックアップには27.8MB/sec以上のデータ転送速度が必要であることが分かる(M、G、Tなどには1000換算を採用)。
フルバックアップ: 92.6 MB/sec = 2000GB×1000÷6時間÷60分÷60秒 |
増分バックアップ: 27.8 MB/sec = 200GB×1000÷2時間÷60分÷60秒 |
これらのデータに基づき、テープライブラリに搭載するドライブの種類と台数を決定する。このとき、ドライブ1台のデータ転送能力×台数がバックアップに課せられるデータ転送速度の最低ラインを上回る形となればよい。
まず、ドライブの種類を選定する。テープライブラリに搭載されるドライブにはいくつかの種類があるが、ここでは多くのベンダーが採用しているLTO(Linear Tape Open)に絞ってみよう。
LTOは、IBMやHewlette Packard、Seagate Technologyなどの大手ベンダーが1998年に発表した大容量テープ規格である。当初は記録容量を重視した1リール方式の「Ultrium」とアクセス速度を重視した2リール方式の「Accelis」が発表されたが、最終的にはUltriumのみが商用化された。
現在発売されているLTOには、第一世代のLTO Ultrium Generation 1(以下、LTO-1)と第二世代のLTO Ultrium Generation 2(以下、LTO-2)がある。LTO-1の記憶容量は100GB、データ転送速度は15MB/sec、LTO-2の記憶容量は200GB、データ転送速度は30MB/secである。
これらはいずれもデータ非圧縮時の数値で、通常はハードウェア圧縮を適用した形でバックアップが行われる。したがって、データ圧縮を併用することで先述の数値を上回る記憶容量とデータ転送速度を達成できるが、「どれだけ圧縮できるかはバックアップデータの性質に大きく依存するため、さしあたり非圧縮で見積もっておいたほうが安全(小田切氏)」だという。
後編では、バックアップ速度を大きく左右するバックアップシステム側のボトルネック、テープライブラリやテープソフトウェアの選定にまつわる注意点、リストア検証の重要性などについて取り上げる。
Copyright © ITmedia, Inc. All Rights Reserved.