EMC、企業のビッグデータ活用を支援する「Greenplum」製品群を説明

EMCジャパンはデータベース製品「Greenplum DB」や分散処理フレームワーク「Greenplum HD」の提供を通じ、“ビッグデータ”時代の企業のデータ活用を支援する。

» 2011年08月09日 18時27分 公開
[本宮学,ITmedia]
photo EMCジャパンの中村完氏

 「企業が抱える情報は今後10年間で50倍になる。企業は顧客価値を高めるため、こうした大量データを活用していくべき」――。EMCジャパンは8月9日、企業が持つ大量の構造化/非構造化データ(ビッグデータ)の活用を支援する製品群として、データベース製品「Greenplum DB」と、分散データ処理技術「Hadoop」を活用したフレームワーク「Greenplum HD」について説明した。

 Greenplum DBは、各サーバの並列処理によってデータソースからのロード/アンロードを高速に行うスケールアウト型データベース製品。同社はGreenplum DBを、ソフトウェアまたはアプライアンス製品「Greenplum Data Computing Appliance」として提供する。全てのハードウェアを汎用製品で構成するのが特徴で、「(ソフトウェアとしての提供であれば)ユーザーが既に所持しているハードウェアを活用してデータウェアハウス(DWH)を構築できる」(EMCジャパンの中村完 データ・コンピューティング事業本部 テクノロジー&プロフェッショナルサービス部 テクニカル・コンサルタント)という。

 またGreenplum DBは、大量データの分散処理を行うHadoopシステムとのデータ通信を高速化する機能も搭載した。DWHを構成する各サーバとHadoopシステムの各ノード間のデータ通信をパラレルに行うことで、Hadoopシステムを通じたビッグデータの読み込みを高速化するという。この連携機能はGreenplum HDのほか、Apache Hadoopにも適用できる。

photo Greenplum HDとHadoopシステムの連携機能

 Greenplum HDは、JavaベースのHadoopをCベースで再構築した分散処理フレームワーク。フリーウェアとして広く利用されている「Apache Hadoop」の3〜5倍の処理性能を実現したほか、システムの冗長化によって障害耐性を強化したという。また、インタフェース部分はJavaで構築しているため、「Apache Hadoopとの100%の互換性を実現した」(中村氏)。

 米EMCは現在、各国数社を対象にGreenplum HDのβ提供を行っている。EMCジャパンは同製品を8月下旬または9月上旬に国内の数社に提供し、今年末に一般向けに出荷する予定だ。

Copyright © ITmedia, Inc. All Rights Reserved.