BIの第2波がやって来る?特集:データ経営でビジネスを制す(2/3 ページ)

» 2005年09月29日 21時53分 公開
[梅田正隆,ITmedia]

運動性能を決める分析プロセス

 分析プロセスは、ETL機能によって集めてきたデータについて、OLAP(オンライン分析処理)やデータマイニングを行って、データをハンドリングする、あるいは統計解析手法やマイニングアルゴリズムによってデータ間の関係性を導出するプロセスとなる。

 OLAPは大量データの高速ハンドリングを実現する。ハンドリングの基本として、ダイスとスライスとドリルがある。ダイスは、表の軸を切り替える操作であり、Excelのピボットテーブルと同じだ。スライスは、データを集計するときの切り口を変更する操作。ドリルには、表示されたデータ集計について、詳細レベルに掘り下げていくドリルダウンと、逆に上のレベルにたどっていくドリルアップがある。

 OLAPの操作は、たとえば、ある商品に関する売上高の集計を、年単位で集計した表があるとすると、まずドリルダウンして月単位で見てみる。次にダイスして、その月の地域別の売上高を見る。さらにドリルダウンして、その月の特定地域における販売店別の売上高を見る、といった操作になる。

 OLAPには、分析するデータをバッチ処理で下ごしらえして、キューブと呼ぶ多次元データベースを作成するMOLAP(Multi-Dimensional OLAP)モデルと、リレーショナル・データベースを直接参照するROLAP(Relational OLAP)モデルがある。

 ROLAPは更新されたデータがリアルタイムに分析操作に反映させることができる。反面、操作の都度、計算を行う必要があるためCPUパワーと大容量のメモリ空間を必要とするが、この問題は64ビットコンピューティング環境が解決してくれそうだ。また、MOLAPとROLAPの両方に対応し、必要に応じて使い分けられるHOLAP(Hybrid OLAP)モデルも増えている。

 一方、統計解析やデータマイニングは、統計解析手法やマイニングアルゴリズムを大量のデータに適用して、意味のあるのパターンを見出したり、データの変動モデルを適用して将来予測を行ったりする。最近は、解析やマイニングに詳しくないユーザーでも高度な解析を実施できるよう、ガイダンス機能が提供されるようになっている。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ