「Sybase IQ」の最新版、カラムDBとHadoopの連携を大幅強化へ

Sybase IQ 15.4ではパフォーマンスの向上を図るとともに、HadoopおよびR言語と連携する機能を追加している。

» 2012年04月18日 19時26分 公開
[國谷武史,ITmedia]

 サイベースは4月18日、カラム型データベース製品の最新版「Sybase IQ 15.4 日本語版」を発表した。大規模分散データ処理基盤の「Hadoop」や統計解析のR言語との連携するための機能を追加し、パフォーマンスの高速化を図った。5月中旬から提供を開始する。

 最新版製品について米Sybase プロダクトマーケティング担当シニアディレクターのダン・ラール氏によれば、従前のバージョンから採用する「Shared Everything Architecture」(分散・連携処理が可能なリソース共有型アーキテクチャ)により、データベース内部で大量の構造化および非構造化のデータを統合的、効率的に分析できるようになった。

 具体的には、Hadoopとの連携のために(1)米Quest SoftwareのSQLツールを利用したSybase IQおよびHadoopからのデータ抽出、(2)オープンソースのETLツール「Toad」を利用してHadoop上のデータをSybase IQ上に転送、(3)HDFSにあるデータをSybase IQ上に仮想的にロード、(4)分散処理フレームワーク「MapReduce」をSybase IQ内のMapReduceおよびSQLと組み合わせてクエリを連携――という4つの手法を採用した。またSybase IQでの分析のためにソースコードを書き直す負担がないよう、ユーザー定義関数でMapReduceを扱えるようにした。

 R言語との連携ではRJDBCのインタフェースを介してSybase IQ上でのR言語処理に対応したほか、Predictive Model Markup Language(PMML)にも対応してSybase IQ上でSASやSPSS、R言語による分析モデルの作成、自動実行が可能になった。パートナーが提供する関数ライブラリが統合され、例えばFuzzy Logixの200種類以上の関数をSybase IQだけで利用できるという。

 パフォーマンス面ではODBCとJDBCのインタフェースを介してバルクロードデータを挿入することにより、ロードに要する時間を短縮。またテキスト圧縮機能を強化した。これにより、「データベースサーバやストレージの容量を節約しつつ、非構造化データなどの検索を高速に行える」(グローバルデータベースソリューションズ担当バイスプレジデント ゼネラルマネジャーのピーター・タウリー氏)という。

 製品価格は、エンタープライズ版が1コア当たり1008万円、スモールビジネス版が1チップ当たり840万円など。米国では2011年11月にリリースされ、「Web分析の米ComScoreでは1日に7〜8テラバイトの情報を収集しているが、データ圧縮を活用してその半分の容量をSybase IQで分析しており、好評を得ている」(ラール氏)といった導入事例がある。

ピーター・タウリー氏(左)とダン・ラール氏

関連キーワード

Sybase | Apache Hadoop | MapReduce


Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ