2社のデータベースベンダーがデータ分析分野でGoogleに追随MapReduceをサポート

GreenplumとAster Data SystemsがMapReduceをサポートする。MapReduceは大量のデータを分析するためにGoogleが開発した手法。GreenplumとAster Data Systemsの両社は、MapReduceにより大量のデータを分析する能力の改善を狙っている。

» 2008年08月29日 08時00分 公開
[Brian Prince,eWEEK]
eWEEK

 Aster Data SystemsとデータウェアハウジングベンダーのGreenplumは、GoogleのMapReduceフレームワークのサポートを追加した。企業向けのデータ分析機能を提供するのが狙いだ。Aster Data Systemsは「In-Database MapReduce」を発表した。同製品は現在、評価用として提供されている。

 Asterのマヤンク・バワCEOは「従来、超並列処理型(MPP)データベースは通常のSQLを並列化することができたが、ユーザー定義関数として書かれたものであれ、PL/SQLなどのデータベースプログラミング言語で書かれたものであれ、一般的なプログラムを並列化するのには制約があった」と話す。

 「多くの場合、こういった機能はMPPデータベースの1つのノード上で動作するだけだった。しかしアナリストや開発者は現在、Java、Python、RなどでSQL/MR関数を作成することにより、通常のSQL内からMapReduceのパワーを利用することができる」(同氏)

 Greenplumの共同創業者のスコット・ヤラ社長によると、「Greenplum MapReduce」を利用すれば、キーワード分析やコンテンツ索引化などさまざまなアプリケーションで膨大な非構造型データを処理、分析できるMapReduceプログラムを、数行のPerlあるいはPythonで作成することができるという。「SQLはある程度の分析やデータマイニングが可能な表現力を備えているものの、SQLでは表現するのが難しい強力なマイニングツールやマシンラーニングツールは多数存在する」と同氏は指摘する。

 「その好例がベイズ理論に基づくマシンラーニング手法やクラスタリングアルゴリズム、自然言語処理などだ」とヤラ氏は話す。

 クラウドコンピューティングの普及が進む中、企業の分析ニーズに対する答えとしてのMapReduceの有効性は、次第にホットな話題となってきた。Gartnerのアナリスト、ドナルド・ファインバーグ氏は、MapReduceは複雑であるとしながらも、「膨大な量のデータを極めて迅速に処理する能力を企業に提供する」と付け加える。

 「これは極めて高度なプログラミングを必要とする。CやJavaなどでSQLプログラムを作成する平均的なプログラマーが手に負える代物ではない」とファインバーグ氏は語る。

 Monash Researchのカート・モナッシュ社長によると、MapReduceはデータの操作と分析のための強力なツールだという。

 「MapReduceとSQLを連携している企業は、その適用性を高め、開発者とDBA(データベース管理者)が共通の並列データ処理インフラの開発に共同で取り組むことを可能にしている」とモナッシュ氏は発表文で述べている。

過去のニュース一覧はこちら

Editorial items that were originally published in the U.S. Edition of “eWEEK” are the copyrighted property of Ziff Davis Enterprise Inc. Copyright (c) 2011. All Rights Reserved.

注目のテーマ