最適なデータ保護を実現するために、認識しておくべき3つの要点担当者必見、データマネジメント最前線

データは今や企業経営に欠かせないものとなり、いかに保護して事業継続性を確保するかが重要だ。万が一の事態に備えて復元できるようデータを保護することは大切だが、その前に認識しておくべき3つのポイントを解説する。

» 2020年10月06日 10時00分 公開
[PR/ITmedia]
PR

 データと一口に言っても、その形式は多様だ。一般ユーザーにも身近なものとしては、家族の写真や業務資料などのドキュメントデータが挙げられる。ITシステムの環境そのものを保護しておいて災害対策として利用するデータもあれば、長期保存すべき歴史的に価値のあるデータ、電話会社の通話ログのようなデータもある。

 データは使い道や要件によって特性が異なり、その扱いも変わる。2020年8月26〜27日に開催されたWebセミナー「『形なき資産』をいかに守り、管理するか データガバナンスが切り開く企業の未来」(ITmedia エンタープライズ主催)で、ヴィーム・ソフトウェアの高橋正裕氏(システムズ・エンジニア本部 ソリューション・アーキテクト)は、データの保護に取り組む前に認識しておくべき3つのポイントを解説した。

データの特性と扱いの違いを理解する

 高橋氏は、まず保護したいデータの特性を認識しておくことが重要だと指摘する。

ヴィーム・ソフトウェアの高橋正裕氏

 例えば、航空機の飛行時データは、蓄積することで新しい価値が生まれる。航空機は燃料消費を最適化するために、どの高度でどのルートをどれくらいの速度で飛行すれば燃費効率の良い最適なルートになるのか予測して飛行している。その予測は何万ものセンサーから得た過去の飛行データを分析して導き出しているという。「一度のフライトで30TBものデータが得られます。それを航空機メーカーが収集して機体プログラムに反映し、最適なフライトプランを導き出しています」と高橋氏。

 データライフが短いものもある。新生児ICUでセンサーが収集している新生児のヘルスデータだ。そのデータは30分ほどで捨てられるという。「新生児が30分前に元気だったからといって、様子がおかしくなったときに今の状況を把握することには役立ちません。むしろ古いデータが医師の判断に影響しかねないため、意図的に捨てています」(高橋氏)

 保存形式がものをいうデータもある。ソフトウェアのソースコードをホスティングしてバージョン管理するGitHubのデータがその一つだ。GitHubに登録されているソースコードを取り出せば、それだけでもプログラムは動く。しかしどのような履歴、経緯でコードが生まれたのか分からなければソフトウェアの全体像を把握できない。そのため履歴を含むソースコードのツリー構造全てを保存しておく必要がある。重要なのは、保存したデータから元のGitHubの形を再現でき、必要なデータを適宜取り出せるかどうかだ。

データは保存が目的ではなく、利用することが目的

 「データがどのような形式で、どういった目的で扱うのか、扱うためには何が必要なのかを明らかにしなければ、最適な保管方法は分かりません。保管したデータを取り出す際の形式も考えておく必要があります。事前に考慮しておかなければリストアしても意味のないデータばかり保存されてしまいます」(高橋氏)

 データ保護の前に、どのような「データの保存方法」にすべきか、そこから取り出される「データの形式」は正しいか、どこにどのデータが保存されているかを明らかにする「データの保存管理」の3つを認識する必要があると高橋氏は指摘する。

 当然のことながら、データは保存することが目的ではなく、リストアして利用することが目的だ。そのため、リストア後のことを保存前に考えておく必要がある。

 ITシステムを保護する際、単体の仮想マシンを保存してリストアできるだけでは十分ではない。近年のITシステムは複数の仮想マシンで構成されることもあり、複数の仮想マシン全てを保存し、全て戻すことができて初めてITシステムが復旧する。必要な全ての仮想マシンが同じタイミングで保存され、リストアできなければならない。

 ファイルさえリストアできれば十分な場合もある。ファイルの中のデータを使って分析と計算を実行する場合は、ファイルをリストアできればよい。にもかかわらず、仮想マシン単位でデータを保存していると、一度仮想マシンをリストアし、そこから必要なファイルを取り出さなければならない。これでは必要なデータを得るのに多くの手間が掛かってしまう。

図1 データの形式とは(出典:ヴィーム・ソフトウェア)

 「OSとアプリケーションを毎日バックアップする必要はありません。Windows Updateなどで更新した際にバックアップを取得できていれば十分です。一方、アプリケーションで日々利用しているデータは、毎日バックアップが必要です。どのデータをどの頻度で保存するかは、データ形式を見極めて事前に考えておきましょう」と高橋氏は助言する。

データ保護の状況をモニタリングできることが重要に

 データを保存管理する方法には、主にバックアップチェーンとアーカイブの2つがある。バックアップチェーンは、テープバックアップ時代の名残だ。トラブルなどが発生した際に正常に稼働していた状態に戻すため、フルバックアップと増分、差分バックアップを組み合わせ、バックアップデータを取得するスケジュールを決めておく。通常は1週間を1つのサイクルとし、2週間分のデータを保持することが多い。この方法は、主にITシステムの環境保護に使われる。

 アーカイブは期間を決め、1日単位でデータを保存する方法で、データのリストア時はファイル単位で戻すのが一般的だ。アーカイブは長期のデータ保存方法としても優れている。長期にわたって保存する場合、仮想マシンごとデータを保存しても意味はない。なぜなら、10年前の環境を保存していても復元時にその環境を動かせるとは限らないからだ。

図2 バックアップの2つの方法(出典:ヴィーム・ソフトウェア)

 バックアップチェーンでもアーカイブでも、保存の次のステップでは「どのような状態でデータが保護されているか可視化すること」が重要となる。「リストアして利用するにはモニタリングが重要です。必要なデータは確実に保護されているのか、さらにそれがどこに保存されているかも常に確認しておく。データが保存されていても、それが整理されていなければ適切にリストアできません」(高橋氏)

 アプリケーションとファイルが保存されていても、データベースのバックアップを取得していない可能性もある。だとしても、バックアップの設定次第ではエラーにならずアラートも上がらない。アプリケーションとファイルは戻せても、データベースを戻せずシステムが復旧しないということも起こり得るのだ。これを防ぐために、全てのシステム要素のデータ保護状況をモニタリングしておきたい。「必要なデータが過不足なく確実に保護されて迅速に戻せることを、モニタリングして常に確認しておきます。そうすれば無駄なデータも発生しません。このデータマネジメントを容易に可能とするのが『Veeam Availability Suite』です」(高橋氏)

データマネジメントソリューションの活用で

 Veeamのバックアップ製品では、データを保存してリカバリーが可能なのはもはや当たり前のことだ。高橋氏によると、監視と分析によってコンプライアンスやガバナンスも確保した上でデータを活用することが、Veeam製品の強みだ。Veeam Availability Suiteを使えばデータ保護の状態をモニタリングできるだけでなく、オーケストレーション機能を使って処理の自動化も可能だという。

 Veeam Availability Suiteは、「Veeam Backup & Replication」にモニタリングやレポート機能を持つ「Veeam ONE」を加えたものだ。まずVeeam Backup & Replicationによって柔軟なバックアップで確実なデータ保護を実現する。保護されたデータにはモビリティー性があり、クラウドへの移行や災害復旧構成も容易に実現できる。Veeam Backup & Replicationは、アプリケーションはもちろんデータベースについてもきめ細かく条件を指定してバックアップを取得可能だ。

 「Veeam Availability Suiteでデータを保護して活用をする。単なるバックアップ製品ではなく、データマネジメントソリューションとして認識してほしいと思います」と高橋氏は話す。

図3 Veeam製品のアーキテクチャ構成図(出典:ヴィーム・ソフトウェア)

 Veeam製品の特徴として、目的に応じてデータのリストア手段を選ぶことができる。そのため、リストア手段をバックアップ時に1つに限定しなくてよい。イメージファイルでバックアップを取り、全体を戻したり、あるいは特定のファイルやデータベースの一部だけを戻したりするなど、後で柔軟に形式を選べるのだ。データベースファイルを取り出してそれを別環境にマウントすれば、すぐにデータベースとして利用できる。リストア時にデータをどう利用するかを考えてバックアップ方法を選ぶべきと先に指摘したが、Veeam製品であれば事前の判断は不要ということだ。

 Veeam ONEは、Veeam Backup & Replicationでデータを保護している状況をリアルタイムでモニタリングし、結果を自動でレポートにして提供することも可能だ。バックアップが確実に取得されているかどうか、どの時点のバックアップがどこに保管されているかなどをダッシュボードでリアルタイムに監視できる。ストレージ容量の残量が一目で分かるヒートマップも表示できる。個人情報といった慎重に扱うべきデータがどこに保存されているかも分かるため、個人情報部分だけをマスクした形でリストアすることも可能だという。

図4 Veeam ONEのダッシュボード画面(出典:ヴィーム・ソフトウェア)

 「Veeam ONEで実現していることは、スキルに長(た)けた技術者がログを監視し、それを収集して分析し、レポートにすれば同様なことが実現できるかもしれません。Veeam ONEは、専門スキルのある技術者が手間を掛けて実践することをソフトウェアが自動で実施し、見やすい形で提供しています。Veeam Availability Suiteを使ってもらえば効率的なデータマネジメントを技術者の手間なく実現します」(高橋氏)

 これまでのバックアップ、リカバリー製品の多くは、データ保護のオペレーション部分しか担えず、取得したバックアップデータの管理やリカバリー以降のデータ活用は人手で実行していた。「Veeam製品は、人手が掛かる管理と活用部分もソフトウェアで自動化します。Veeam製品はバックアップツールの域を超え、データマネジメント製品となりました。これからデータ保護を実施し、そのデータの活用まで考えているのであれば、ぜひデータマネジメント製品の利用を検討してください」と高橋氏は締めくくった。

Copyright © ITmedia, Inc. All Rights Reserved.


提供:Veeam Software Japan 株式会社
アイティメディア営業企画/制作:ITmedia エンタープライズ編集部/掲載内容有効期限:2020年11月5日