インターネットやITの普及によって、ビジネスで利用するデータ量は日を追うごとに増している。中でも、見積もりや受発注データ、メールなどはミッションクリティカルなデータといえるだろう。これらの重要データは、どのように保存・活用すればよいのか。今回はバックアップとアーカイブを使い分ける方法などを紹介する
インターネットの普及により、ビジネスで扱うデータ量は爆発的に増えています。そしてほとんどのビジネスがこれらデータのやりとりで成り立っています。取引見積もり、受注発注、在庫データ、メールでの情報交換など、業務を遂行するうえでもはや必要不可欠なものになっています。ビジネス上、最も重要な資産はデータであるといえるでしょう。
データ自体はコンピュータが扱うことのできる符号の集まりですが、これらデータをストレージデバイスに記録することで、必要なときに取り出すことが可能となり、データを情報として活用することができます。これらストレージデバイスに記録されたデータそのものの取り扱いは、ビジネス遂行における危機管理からも、また記録保管に対する法規制からも、そのデータの価値の上昇に伴って、今後もますます重要になっていきます。
データ消失の要因は身近に存在します。よくあるケースとしては、元ファイルを変更して別ファイルとして記録するつもりが上書きしてしまい、結果的に元ファイルを消してしまった。あるいは単純に間違えて消してしまったなど、人的ミスによるデータ消失も多くあります。
また十分な環境下で、信頼性の高いハードウェアを使用したとしても、ハードウェアの障害の可能性はなくなりません。コンピュータウイルスによるデータ破壊事例も増えています。通常私たちは、データの消失をそれほど意識せず、日常的にデータにアクセスして業務を遂行していますが、データの消失はある日突然に起こるものです。ハードウェアに代替はあっても、データの代替はバックアップでしか準備できないということを理解し、バックアップを日常業務に取り組むことが重要となります。バックアップはシステム運用の継続という目的でのデータ保護なのです。
一方、データの中でも、アクセスの頻度が少ないものや、古いバージョンのファイルで現在は必要ないデータなど、そのままディスクに残しておくとその容量や数によっては、リソースを占有するだけでなく、システムのパフォーマンス自体も低下させる要因となり得ます。こういったビジネスの継続上必要性はないが、記録保管しておくべきデータなどは、テープなどの別メディアに移して保存するのが一般的です。これがアーカイブと呼ばれるものです。アーカイブは“データを長期にわたって保存する”という目的でのデータ保護となります。
バックアップとは、システム運用継続のために別のメディアにデータの複製を取っておくことなのですが、あくまでも、システム障害時に確実にリカバリできることが要件となります。復元できたとしても、データが古過ぎてビジネスの継続ができないのでは意味がありません。別のメディアにバックアップを単に取るだけでなく、過去にさかのぼって任意のデータの復旧を可能にすることも重要です。それによって、「いつから重要なデータが消失したか分らない」といった場合でも対応することができるのです。
バックアップを取る際の1つの指標ですが、障害発生後、どの時点からのデータがリストアされるべきかのリカバリポイント(RPO)と、データをリストアするために必要な時間(RTO)があります。
この指標を基に許容範囲を設定し、その範囲によってテープバックアップを選択するか、スナップショットによるオンラインバックアップか、さらにはディスクサブシステムをそのまま複製するようなリプリケーションの手法といった要件に見合う選択をします。しかし、RPOやRTOともに短いのはクラスタリングやリプリケーションですが、現在各ベンダから提供されているクラスタリングやリプリケーションは、非常に高価です。
現在一般的な企業におけるバックアップ方法は、サーバに直接接続されたテープデバイスへバックアップを取るというのがまだ主流のようです。通常バックアップを取る場合に、バックアップ対象のデータ量が多いと、毎回それらすべてのデータのバックアップを取ることは、メディア容量、時間などの消費も多く、経済的にも運用的にも効率の悪いものになってしまいます。データの更新は必ずしもすべてのデータでなされるわけではないので、1度すべてのデータのバックアップを取った後は、その後更新されたデータだけのバックアップを取ることで、バックアップ容量も時間の消費も縮小できます。この手法が、差分バックアップや増分バックアップと呼ばれている方法です。
Copyright © ITmedia, Inc. All Rights Reserved.