2社のデータベースベンダーがデータ分析分野でGoogleに追随MapReduceをサポート

GreenplumとAster Data SystemsがMapReduceをサポートする。MapReduceは大量のデータを分析するためにGoogleが開発した手法。GreenplumとAster Data Systemsの両社は、MapReduceにより大量のデータを分析する能力の改善を狙っている。

» 2008年08月29日 08時00分 公開
[Brian Prince,eWEEK]
eWEEK

 Aster Data SystemsとデータウェアハウジングベンダーのGreenplumは、GoogleのMapReduceフレームワークのサポートを追加した。企業向けのデータ分析機能を提供するのが狙いだ。Aster Data Systemsは「In-Database MapReduce」を発表した。同製品は現在、評価用として提供されている。

 Asterのマヤンク・バワCEOは「従来、超並列処理型(MPP)データベースは通常のSQLを並列化することができたが、ユーザー定義関数として書かれたものであれ、PL/SQLなどのデータベースプログラミング言語で書かれたものであれ、一般的なプログラムを並列化するのには制約があった」と話す。

 「多くの場合、こういった機能はMPPデータベースの1つのノード上で動作するだけだった。しかしアナリストや開発者は現在、Java、Python、RなどでSQL/MR関数を作成することにより、通常のSQL内からMapReduceのパワーを利用することができる」(同氏)

 Greenplumの共同創業者のスコット・ヤラ社長によると、「Greenplum MapReduce」を利用すれば、キーワード分析やコンテンツ索引化などさまざまなアプリケーションで膨大な非構造型データを処理、分析できるMapReduceプログラムを、数行のPerlあるいはPythonで作成することができるという。「SQLはある程度の分析やデータマイニングが可能な表現力を備えているものの、SQLでは表現するのが難しい強力なマイニングツールやマシンラーニングツールは多数存在する」と同氏は指摘する。

 「その好例がベイズ理論に基づくマシンラーニング手法やクラスタリングアルゴリズム、自然言語処理などだ」とヤラ氏は話す。

 クラウドコンピューティングの普及が進む中、企業の分析ニーズに対する答えとしてのMapReduceの有効性は、次第にホットな話題となってきた。Gartnerのアナリスト、ドナルド・ファインバーグ氏は、MapReduceは複雑であるとしながらも、「膨大な量のデータを極めて迅速に処理する能力を企業に提供する」と付け加える。

 「これは極めて高度なプログラミングを必要とする。CやJavaなどでSQLプログラムを作成する平均的なプログラマーが手に負える代物ではない」とファインバーグ氏は語る。

 Monash Researchのカート・モナッシュ社長によると、MapReduceはデータの操作と分析のための強力なツールだという。

 「MapReduceとSQLを連携している企業は、その適用性を高め、開発者とDBA(データベース管理者)が共通の並列データ処理インフラの開発に共同で取り組むことを可能にしている」とモナッシュ氏は発表文で述べている。

過去のニュース一覧はこちら

Editorial items that were originally published in the U.S. Edition of “eWEEK” are the copyrighted property of Ziff Davis Enterprise Inc. Copyright (c) 2011. All Rights Reserved.

アイティメディアからのお知らせ

注目のテーマ

あなたにおすすめの記事PR