データマイニングも企業の意思決定を支援する、BIのソリューションの一つである。データマイニングの歴史は古く、多くの定義が存在するが、「データの集合の中から一定の相関関係やパターンなどを探し出す技術」を指すのが一般的である。
前回紹介した「紙オムツとビール」の例のほかにもう少し身近な例を挙げると、下記のような解析が可能である。
例えば1.の例ならば特定の製品Aに興味を持っている顧客の属性について、「女性が多く、特定の職種に就いている人が多い」という結果が得られたら、そのターゲットに限定したキャンペーンを張ることで、良い結果を得ることができるだろう。また、2.の場合、失注した案件の顧客属性は「企業の規模が大きく、特定の業種に属している」という関連性が分かれば、今後はより効率的な営業活動を行うことができるだろう。
このような有益な関連性を、人の経験やカンに依存することなく見つけ出すことがデータマイニングである。企業の意思決定のための分析手法としてぜひ活用するべきである。
しかし、データマイニングは下記のようなプロセスを踏むため、非常に手間がかかることが課題である。
具体的に何をしたいのか? 例えばダイレクトメールのレスポンス率が高そうな優良顧客を選定する、自社の有料サイトの退会者の傾向を特定したいなど。データマイニングの目的を検討する。
上記の目標に従って、さまざまなデータからデータマイニングを行うために必要なデータをETLツールなどでデータウェアハウスに取り込み、また不要なデータを削除するといった作業を行う。
回帰分析やクラスター分析など統計学的に裏付けされた分析手法を利用し、モデル作成する。
データマイニングのビジネスバリューは高いのだが、利用することが非常に困難である。有益なビジネス開発手法にも関わらず、専門的な知識を持つ一部のユーザにしか活用されないことになってしまうため、可能な限りこのようなプロセスを簡略化できるソリューションを選択するべきである。
Excel 2007およびVisio 2007のアドインとして動作するデータマイニングツールが、SQL Server 2005 Data Mining Add-ins for Office System (以下Data Mining Add-ins)である。従来のデータマイニングツールと比較しても非常に容易に導入でき、誰でも利用できる。
Data Mining Add-insそのものはデータマイニングエンジンを持たず、SQL Server 2005 Analysis Servicesと接続し、Analysis Servicesが備えているデータマイニングエンジンの解析結果をExcel上に表示させる。Data Mining Add-insの「テーブル分析」機能を利用すれば、データマイニングの結果をわずか3ステップで得ることが可能だ。
このツールを利用すれば、従来のデータマイニングのような事前準備は不要である。簡単に導入ができて、特別なスキルがないユーザーでも簡単にデータマイニングを行うことができる。
今回はBIのエレメントとして、Excelとレポーティング、そしてデータマイニングについて説明した。次回以降、残りのSTEPを説明する。
Copyright © ITmedia, Inc. All Rights Reserved.