第11回 オブジェクトストレージを上手に使うチェックリスト(前編)クラウド社会とデータ永久保存時代の歩き方(1/2 ページ)

オブジェクトストレージをいざ使うとなると、具体的にどんな方法を選択すべきか悩んでしまいます。今回はオブジェクトストレージの上手に使うための10項目をご紹介します。

» 2016年03月09日 08時00分 公開

 前回までオブジェクトストレージを利用する際に覚えておきたい内容や、気を付けるべき点を幾つか紹介してきました。それでも、いざ使うとなると「どのような運用に向いているのか」「データ保存方法はレプリケーションか、イレージャーコーディング(消失訂正符号)手法が良いのか」といったように、これまで取り上げた方法をどう選択すべきかについて悩むことがあります。

 今回からはどのようなデータや運用がどのオブジェクトストレージの方式に向いているのかを、具体例を交えて説明していきます。

チェックポイント

 オブジェクトストレージを上手く使うためのポイントは、以下の10項目です。今回はまずポイント1〜5について解説します。

項目 確認事項 回答例
1 現在使用しているアプリケーションのインタフェースは何か? またその種類は今後拡張されるか? 現状―RESTful API(S3)、NFS/CIFS。将来―OpenStack (Swift, Cinder)
2 オブジェクトデータのアクセス特性は?  アクティブ・コールド・凍結データ
3 コンテンツの種類、容量 ファイルシェア・バックアップ・監視カメラ映像など
4 現在と今後3年〜5年の容量 現状1ぺタバイト、年率50%増加
5 単独サイトか、複数サイトか? 自然災害などからのデータ保護を目的に北米、アジア、ヨーロッパの3拠点に同一データを保存
6 データは複数の場所からアップロード/ダウンロードされるか? また、保存地域の制限があるか? 5カ所のブランチオフィスから2カ所のデータセンターに保存または読出しを行う。データ保管はヨーロッパ内限定。
7 DR(災害対策)またはバックアップ用途の場合、どのような要求事項があるか? RPOが24時間以内、RTOが2時間以内
8 個別の独立したオブジェクトストレージか、クラウドの一部として利用されるか? 外部クラウド間でのデータ移行が必須
9 どれくらいの技術レベルの人材が、オブジェクトストレージの実装と運用を行うのか? OpenStackベースで自社エンジニアが構築
10 現在までに利用したオブジェクトストレージの実績とフィードバック、今後の期待する技術はあるか? 従来の社内ファイルストレージからの置き換えでコストは下がったが、性能は低下

1.現在使用しているアプリケーションのインタフェースは何か? また今後拡張されるか?

例:現状――RESTful API(S3)、NFS/CIFS

  将来――OpenStack (Swift, Cinder)


 オブジェクトストレージアプリケーションの中には、ファイル(CIFS/NFS)を読み書きできるものもありますし、さらにブロックデータの読み書きができるものもあります。対応できていない場合はゲートウェイを用いることで解決できますが、将来的に対応できるインタフェースを考慮して全体設計をすることにより、無駄な投資を避けられます。

 また、多くのインタフェースに対応できているとしても、単純な○×表を鵜呑みにするのは禁物です。例えば、「オブジェクトが話せますよ」といった表現のものは、多くの場合は元々の設計アーキテクチャがブロックやファイルストレージであるケースが多く、最初からオブジェクトストレージとして設計されたものと比較して、意外と拡張性が低いケースや、サポートしている機能が少ないといったケースがあります。一方、オブジェクトストレージとして設計されたものは、ブロックやファイルアクセスに関して、専用のストレージよりも性能や機能の制限があることを考慮して利用する必要があります。ここは以前の記事も参照ください。

2.オブジェクトデータのアクセス特性は?

例:アクティブ・コールド・凍結データ


 データのアクセス頻度によって、アプリケーションや保存方式を選択します。例えば、頻繁にアクセスされるデータの場合は、容量効率が悪くてもレプリケーション方式を選ぶ方が、好ましいケースが多いのですが、コールドデータや凍結データ(何らかのイベント――監査などがない限り読み出しされることがないデータ)はイレージャーコーディング(消失訂正符号)による保存が経済的です。ここも以前の記事も参照ください。

3.コンテンツの種類、容量

例:ファイルシェア・バックアップ・監視カメラ映像など


 比較的アクセス頻度が低いバックアップやアーカイブなどは、イレージャーコーディングによるオブジェクトストレージの利用がより効果的でしょう。一方、ファイルシェアのような用途は、比較的頻繁にデータの読み書きが行われるケースが多いと想定されます。その場合は、できれば性能重視で、イレージャーコーディング方式よりはレプリケーション(単純に複数コピーを保存)の方をお勧めします。パリティ生成、またはデータ復元のための演算部分への負荷は少ないほうが理想だからです。

 ただし、近年はサーバCPUの高性能化が進み、従来に比べてオーバーヘッドが小さくなっていることも今後は考慮に入れる必要があるでしょう。もちろん高性能なCPUを採用すれば、コストも消費電力も増えるので、事前に容量効率によるコスト差と、サーバコスト、ランニングコストを比較することが重要です。

 オブジェクトストレージ製品の中には、圧縮機能や重複排除といった機能を実装するものも出てきていますが、これもまた注意が必要です。圧縮、重複排除ともにCPUへの負荷が多く、データによってはあまり効果がないこともあり得ます。

 圧縮、重複排除で容量削減効果があまり期待できないデータとしては以下のようなものがあります。

  • あらかじめ圧縮されているデータ(ZIPファイルなど)
  • MPEGやJPEGなどの映像、監視カメラ映像、音楽データ、医療分野のPACSデータもこの中に含まれます
  • 暗号化データ。データのランダム化が行われることが多いため
       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ