連載
» 2007年03月08日 12時00分 公開

これなら分かるストレージのキーワード(2):ストレージ容量を倍増させられる技術とは? (1/2)

ストレージに書き込まれるデータを自動的に圧縮することで、ストレージ容量を事実上増大することのできる製品が最近登場した。この製品の仕組みや効果を紹介する。

[三木 泉,@IT]

ネットワーク経由のディスクへの書き込みを圧縮する

 ストレージ機器上に保存されるデータを圧縮すれば、事実上既存ストレージ機器の容量を拡大できることになり、ストレージコストを節約することができます。しかしデータ圧縮の手法にはいくつかあり、利用目的によって向き不向きがあります。今回はアプライアンス(ボックス型機器)をストレージ機器の直前に置くことによって、ストレージに保存されるデータを自動的に圧縮し、読み出されるデータを自動的に伸長する手法を紹介します。この記事の執筆時点では、こうした手法でデータ圧縮をするのは米Storewizの製品のみです。

 国内では東京エレクトロンデバイスが販売している米Storewizのストレージデータ圧縮アプライアンスは、NAS(Network Attached Storage)に対して読み書きされるデータに手前で手を加える形でリアルタイムに圧縮するようになっています。本格的な販売は2007年3月発表の「STN-6000」シリーズからとなっています。

 STN-6000シリーズはイーサネットケーブルを接続するポートを複数持っていて、NASと社内LANの間に挟むようにして接続します。そして社内LANのクライアントPCやサーバからのデータの書き込みや読み出しのデータがこのアプライアンスを通過する際に、データを圧縮・伸長します。

 通信パケットが自分を通過する際に手を加えるという手法は、IPsecやSSLのVPN装置に似ています。STN-6000シリーズの場合は、NASに対するデータの読み書きで使われる通信プロトコル、つまりCIFS(Windows環境のファイル共有プロトコル)やNFS(UNIX環境のファイル共有プロトコル)の通信パケットだけに注目し、そのペイロード(運ばれる中身のデータ)に手を加えます。

 データ圧縮には「Lempel-Ziv」というデータ圧縮アルゴリズムを適用しています。これは基本的には画像圧縮などで広く使われているものです。CIFSやNFSはテキストや画像などの非定型データファイルを共有するだけでなく、データベースファイルへのアクセスにも広く使われています。STN-6000シリーズでは非定型データをファイルごとにパケット単位で圧縮しますが、データベースファイルについては技術的な詳細は不明ながらもカラム単位でも圧縮しているようです。つまりデータベースファイル全体を圧縮するのに加え、読み書きする部分も圧縮・伸長します。

ALT 米StorewizのSTN-6000

 圧縮率はデータの種類によって大きく異なります。圧縮アルゴリズムの性格からいって、冗長性の高いデータほど圧縮効果が高くなります。このため、CADデータやテキスト、オフィスアプリケーションのファイル、データベースなどで効果が高くなります。米Storewizでは一般的にSTN-6000の利用によって、データ量を3分の2から5分の1に減らすことができるとしています。国内の企業でNotes/Dominoのデータ量を75%削減できることが確認された例もあるということです。多くの動画ファイル形式を含め、一度圧縮がかけられたデータに対しては当然ながら効果が期待できません。

 なお、米StorewizではSTNシリーズの導入前に圧縮効果を事前検証するためのソフトウェアツールを提供しています。これを対象データに適用することで、どれくらいの圧縮効果が得られるかを知ることができます 。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ