Special
» 2013年05月16日 10時00分 UPDATE

ビッグデータ時代の解:情報活用の新機軸、新たに分析エンジンを標準搭載したマルチワークロードDBとは

もはや企業経営において無視できない存在となったビッグデータ。ただし、特に中堅・中小企業にとって本格的なビッグデータの活用は、システム環境の整備などのコスト負担が大きく、ネックとなっていた。こうした状況を打破するために日本IBMが発表したのが、「BLUアクセラレーション」技術と、それを実装したデータベース管理ソフトウェアの最新版「IBM DB2 10.5」だ。

[PR/ITmedia]
PR

中堅・中小企業のデータ分析を阻む“壁”

 “ビッグデータ”に対する関心があらゆる企業で急速に盛り上がっている。他社との競争がし烈さを増す中で、よりいっそうの差別化策が求められているからだ。だが、製品やサービスのコモディティ化が進んだことで、それら単独での差別化はもはや困難なのが実情だ。つまり、単に良い製品やサービスを提供するだけでは、企業競争を生き抜くことが難しくなっており、プラスアルファの価値創出のためにも、ビッグデータがもたらす多様な“気付き”の重要性が、よりいっそう増しているのである。

日本IBM ソフトウェア事業 Information Management マーケティングマネジャーの中野雅由氏 日本IBM ソフトウェア事業 Information Management マーケティングマネジャーの中野雅由氏

 既にビッグデータを活用して成功を収めた企業はグローバルで数多く存在していることからも、これが他社との差別化の切り札になることは明らかだろう。日本IBMのソフトウェア事業 Information Managementでマーケティングマネジャーを務める中野雅由氏は、「顧客のニーズが日々、着実に変化する一方で、競合企業も矢継ぎ早に新たな施策を講じてくる。こうした環境下では、トライ・アンド・エラーを繰り返す余裕は残されていない。だからこそ、ビッグデータを基にした仮説検証によって潜在市場を突き止め、いち早く施策につなげる仕組みを構築することが、業種や業態を問わず至上命題となっているのだ」と強調する。

 もっとも、ビッグデータを活用する上での課題もある。とりわけ中堅・中小企業にとって悩ましい問題が、環境整備に必要とされるコストである。

 一方で、ビッグデータの活用に取り組んでいる大企業では、そのための高度な分析環境の整備が進められてきた。社内のデータを一元管理するためのデータウェアハウス(DWH)や、個々の分析用データマート(DM)、多様な切り口からの分析を可能にする分析ツールなどが代表的なものである。ただし、それらは高価で用途が限定されており、効果的な分析方法やそれをビジネスに活用するためのノウハウが乏しいため、IT予算の乏しい中堅・中小企業にとって導入は困難なのだ。このことが中堅・中小企業におけるビッグデータの活用を長らく阻んできたのである。

 こうした状況を打破すべく、日本IBMは2013年4月、独自開発の「BLUアクセラレーション」技術を搭載したデータベース(DB)管理ソフトウェアの最新版「IBM DB2 10.5」を発表した。その最たるブレークスルーは、データ分析向けのカラム型DB機能を新たに実装したことだ。

従来の行型RDBにカラム型を追加

日本IBM ソフトウェア事業 インフォメーション・マネジメント事業部 テクニカル・セールス&ソリューションズ 技術統括部長の大塚知彦氏 日本IBM ソフトウェア事業 インフォメーション・マネジメント事業部 テクニカル・セールス&ソリューションズ 技術統括部長の大塚知彦氏

 カラム型DBの特徴は、従来のデータベースが「行」をひと固まりのデータとして扱うのに対して、商品名や価格などの「列」単位でデータを扱う点にある。その技術特性から、従来のRDBが業務系システムにおけるデータ更新といったOLTP(オンライントランザクション処理)を得意とし、カラム型DBはオンライン分析や集計処理に長けているのだ。

 このように、用途に応じてアーキテクチャも大きく異なることから、一般的に両者はそれぞれ単独の製品として存在してきた。そうした中、IBMはインメモリ、カラム型、アクショナブル圧縮、データ・スキッピング、並列分散処理などの機能を持つBLUアクセラレーション技術によって、世界で初めて双方のDBの強みをワンパッケージで実現。

 日本IBMのソフトウェア事業 インフォメーション・マネジメント事業部 テクニカル・セールス&ソリューションズで技術統括部長を務める大塚知彦氏は、「これまで中堅・中小企業は、身の丈に合った製品が存在しないこともあり、ETLツールなどを用いて苦労しながらRDBでデータ分析を行ってきた。今回発表した最新のDB2 10.5では、機能とコストの両面でそうした企業の高度な分析ニーズを満たす現実的な“解”と言えよう。高価な専用ハードウェアを導入する必要もないのだ」と意気込む。

分析処理速度を30倍も高速化

 BLUアクセラレーションには、ビッグデータを扱うためのテクノロジーがいくつも包含されている。まずは、データをメモリ上に展開して動的な高速処理を可能にする、インメモリでのカラム型DBを実現した点だ。データをカラム単位で高速にアクセスすることで、集計に関係しないカラムデータを読み込む必要がないため、ストレージI/O性能に起因するパフォーマンスの問題に抜本的な対策を講じたという。また、すべてのデータをメモリに収める必要がない点も他社のテクノロジーとは大きく異なり、より柔軟なシステム構成が可能になるのだという。

日本IBM ソフトウェア事業 インフォメーション・マネジメント事業部テクニカル・セールス&ソリューションズ 主任 IT Specialistの佐々典子氏 日本IBM ソフトウェア事業 インフォメーション・マネジメント事業部テクニカル・セールス&ソリューションズ 主任 IT Specialistの佐々典子氏

 さらに、データ量を大幅に削減する独自のデータ圧縮機能も大幅に強化。データを圧縮したままメモリ内へ展開する処理が可能になった。以下では、DB2 10.5がどのようにデータ圧縮を行っているのか。そのプロセスを概観してみよう。

 データ分析にあたっては、まず通常のストレージ上の分析用のカラムテーブルを作成する。この段階でデータ順序を保持しつつデータを圧縮する独自アルゴリズム「アクショナブル・コンプレッション」により、約10分の1以下にまでデータを圧縮できる。その後、ストレージにカラムデータを保存後、改めてメモリ上に展開し処理を進めるが、その過程で、必要な列だけを抜き出す「列処理」や、必要なデータだけを効率的に読み取る「データ・スキッピング」により、読み取りデータ量をさらに削減できる。その上で、CPUの各コアによるデータの並列分散処理技術「SIMD(Single Instruction Multiple Data)」によって、極めて高速な処理を実現しているのである。

 日本IBMのソフトウェア事業 インフォメーション・マネジメント事業部 テクニカル・セールス&ソリューションズの主任でIT Specialistの佐々典子氏は、「BLUアクセラレーションは、動的なインメモリでのカラム型技術に加え、圧縮済みのデータを解凍することなく処理できるアクショナブル圧縮、マルチコアやSIMDといったCPUをフル活用するパラレルベクトル処理、効率的なデータスキャンを実現するデータ・スキッピングなど、数多くの先進技術を組み合わせている。これらの技術を実装したDB2 10.5の性能は従来のDB製品と一線を画しており、数倍から数十倍の高速処理を実現しているのだ」と自信を見せる。

 また、カラムデータは作成時に大幅に圧縮されることで、それを保管するストレージ容量の削減にもつながる。一方で、メモリの増強は必要に応じて行えるため、メモリやストレージの価格下落が急速に進む中で、まずは最低限の容量を搭載し、順次拡大させることで、初期の整備コストをできる限り抑えることも可能だ。

 使い勝手も極めて良い。分析処理を実施する際、従来、パフォーマンスを高めるためのインデックス作成やパーティションなど、DB側で高度な設計やチューニングが必要とされたが、DB2 10.5ではこうした作業は一切不要だ。また、カラム型テーブルの作成も、SQLのCREATE TABLE文とともに、「ORGANIZE BY COLUMN」という一文を追記するだけでよい。データ分析モデルもCognosなどのアプリケーションを利用することで手軽に作成可能だ。

 「分析環境を使いこなすには、これまで特別に技術者のトレーニングなどが必要であり、人材育成に時間とコストを要した。また、担当者の属人的なスキルが処理結果に影響を与えることも多かった。しかし、DB2は汎用的なRDBMSとして広く普及しており、わずかのトレーニングにより、あらゆる部門での活用を見込むことができる」(大塚氏)

 安定性の面でも、高信頼性を誇るクラスタリング機能「DB2 pureScale」の活用を通じて100以上のノードによる透過的な拡張が実現されており、オンラインで継続的にパッチのアップデートを行ったり、キャパシティーを増大することによって、ダウンタイムを排除することが可能だ。業務系システムとして汎用機並みの高い信頼性も兼ね備えている。

データ分析チームとの連携で顧客を支援

 日本IBMでは2013年6月から、DB2 10.5の提供を開始する計画。そこでの同社の強みは、多様なデータ分析製品の提供を通じて培ってきた技術力とノウハウである。

 「データ分析のニーズは企業ごと千差万別。そこで提案にあたっては、日本IBMのビジネスアナリティクス(BA)部門などとの連携を通じ、多様な知見を活用できる体制を整備し、分析にまつわる顧客の課題解決をあらゆる側面から支援する考えだ」(中野氏)

 加えて、同社はISVの提案にも期待を寄せている。顧客のシステム導入を支援してきたISVは顧客のIT環境に精通しており、どのデータがどのように格納されているのかまで把握している。それらの情報を分析用テンプレートの作成につなげることで、日本IBMでも把握しきれなかった分析ニーズの発掘も期待される。その実現に向け、ISVとのパートナーシップの強化を進めている最中だという。

 一方で、データ分析は中堅・中小企業にとって、まだ馴染みが薄いものであり、何をどう分析すべきかに戸惑う企業も多い。その点を踏まえ、日本IBMは“処理高速化”を切り口に訴求することでもDB2の拡販を図る考えだ。

 「DB2の利用を通じ、各種データ処理を抜本的に高速化できるようになる。ひいては、これまで必要とされたバッチプログラムを一掃でき、管理のためのコストと手間も大幅に削減できる。ビッグデータの分析処理時間の長さに悩む企業は決して少なくなく、こうした観点からも普及が進む可能性が高いはずだ」(中野氏)

 新製品の発表後、既に同社にはDB2 10.5の問い合わせが多数寄せられており、「何より処理が高速かつ扱いやすい点が、ベータ版を検証した顧客やパートナー企業から高く評価されている」(中野氏)という。

 「DB2によって、専門的な知識を要すことなく、誰でも分析が行えて、同一の結果を得られるようになる。利用を進めることで全社的な意思決定のさらなる短期化も実現されるのだ」(大塚氏)

 これまで長らく多くの企業の基幹業務に活用されてきたDB2。カラム型DB機能を実装したマルチワークロードDBに進化したことで、多くの企業にとってビッグデータの活用がさらに身近なものになることは間違いない。DB2 10.5の登場によって、従来のデータベースの選定基準は大きく変わろうとしている。

関連ホワイトペーパー

wp120.jpg

スピーディーな知見の獲得

部門レベルから全社レベルまで、アナリティクス機能を迅速に提供するには


Copyright© 2016 ITmedia, Inc. All Rights Reserved.


提供:日本アイ・ビー・エム株式会社
アイティメディア営業企画/制作:ITmedia エンタープライズ編集部/掲載内容有効期限:2013年6月15日

関連ホワイトペーパー

部門レベルから全社レベルまで、アナリティクス機能を迅速に提供するには

関連リンク