第5章 データマイニングに取り組むためにマーケターのためのデータマイニング講座

» 2002年03月26日 12時00分 公開
[村田悦子,エス・ピー・エス・エス株式会社]

 このシリーズもいよいよ最終回を迎えました。これまで読んでくださった方々が、データマイニングを以前より身近に感じていらっしゃればうれしく思います。

 一方、まだ心理的障壁を取り払えないという方は、頭の中に下の式1のような数式が浮かんではいないでしょうか?

ALT 式1 自転車が前進する仕組みを表す物理式

 この式1は、自転車が前進する仕組みを表す物理式だそうです。そういわれたところで、これをきちんと理解できる人は、自転車に乗れない人よりも少ないのではないでしょうか。とはいえこの数式が分からなくても自転車に乗ることに何の障害もありません。自転車に乗る目的は、歩くより速く、楽に目的地に着くことです。そのために要求されるのは物理学の知識ではなく、運動神経や交通ルールでしょう。

 データマイニングも同様で、ビジネス問題の解決という目的達成のために必要となるのは、分析のアルゴリズムや数学の知識ではなく、ビジネスの知識や感覚です。難しい分析は、ツールをうまく利用することによって自動化できます。データマイニングはツールなしには行えません。あくまでも主役は人間ですが、どんなに足の速い人でも、車に乗っている人には勝てないように、ツールは人間の能力を飛躍的に向上させる点において必要不可欠です。さらに人間の能力が優れていれば、反対にツールの能力を引き出すこともできるのです。

 最終回では、データマイニングを成功させるツールの選び方を中心に、実践に向けての最後の仕上げをしていきましょう(ツールの画面説明にはSPSS社のClementineを使っていますが、要求事項をクリアしているものなら、もちろんClementine以外のツールでも構いません)。

1.ツール選びのポイント

ポイント1:ユーザーが使えるツールであること

 第1章「CRMとデータマイニングの必要性」で、データマイニングは仮説検証ではなく仮説構築のプロセスであると説明しました。何もないところからデータを頼りに仮説を構築していくには試行錯誤が必須です。行きつ戻りつの作業を、ユーザーがいちいちアナリストに依頼しながら進めていくのは現実的ではありません。ユーザー自身が使えるツールでなければ満足のいく投資対効果は得られないでしょう。アナリストは、ユーザーが行うマイニングの結果を統計的見地からチェックし、必要に応じて軌道修正を行うアドバイザーとして威力を発揮します。

 ユーザーが使いこなすためには、コマンド入力が前提のツールは好ましくないでしょう。第一にユーザー(例えばマーケティング担当者)がコマンドを習得する時間と労力は、スピードが不可欠のビジネスにおいて正当化されるものではありません。さらに大抵の場合コマンドは汎用的ではなく、ツールに特有のものですので、使い回しが利きません。習得できたとしても、下手をするとマイニングやマーケティングではなく、ツール依存のキャリアパスを歩むことになる危険性があります。1マイニング「ツール」の達人として企業人生を終えることになるかもしれません。

 操作は簡単であるに越したことはありません。思考プロセスを妨げることのない、ストレスフリーの操作性が選択の第1ポイントになります。ただし、どんなに優れたGUIよりもコマンド操作のほうがパワフルなのも確かです。理想的には、GUIに優れながら、必要ならコマンドも使えるという、2つのモードを備えたツールを選ぶのがよいでしょう。

ポイント2:ナレッジを継承しやすいこと

 変化の激しい企業においては、永続的にマイニングスタッフを確保することが困難な場合が多く、蓄積したノウハウをきちんと引き継げなければ、ツールの導入効果も短命に終わってしまいます。マイニングツールはほとんどの場合、保守契約によってバージョンアップが保証されていますので、長く使えば使うほどコストが抑えられる計算になります。それに対して、担当者が変わってツールを使えなくなってしまった、あるいは前任者と同じ時間と労力をかけてゼロから習得しなければならないというリスクがあれば、マイニングツール導入に対して及び腰になってしまうのも無理のないことでしょう。

 このような事態を防ぐには、使いやすさだけでなく、前任者、あるいは別の担当者の成果をツール内に蓄積する機能が必要です。ソフトウェア・プログラムのソースコードを想像してみてください。プログラム・コードの中にコメントを記述しておくことで、開発者の意図が分かり、引き継ぎの時間が大幅に短縮されます。マイニングは試行錯誤のプロセスであるので、なおさら担当者が“結果のモデル”にたどり着く思考経路の履歴が残されていなければ、そのモデルに不備があったとき、あるいはビジネスの状況が変わってしまったときに、一からやり直さなければならなくなってしまいます。

ALT 画面2 Clementineでは、画面上にノードと呼ばれるアイコンを並べ、矢印でつなぐことでストリーム(マイニングのプロセス)を構築できる。ストリームは分析者の思考の流れを表しているため、担当者以外にも容易に理解できる

 そのため、まずマイニングプロセス(Clementineではストリームと呼ばれます)が視覚的に表現され保存される必要があります。次に、プログラムのコメントに当たる注釈を残す機能が必要です。ストリームと、各ノードを記述する注釈がセットになっていれば立派な教育ツールが完成します。これに加えて製品自体に汎用的なサンプルストリーム(テンプレート)が装備されていれば万全でしょう。

画面3、画面4 Clementineはノードごとに注釈をつけることが可能。それぞれのノードで行う処理を注釈として記録することで、資産の継承が容易になる

 

ポイント3:オープン性

 最近、IT投資の是非が議論されています。ITの重要性はともかくとして、経済状況のいかんにかかわらず、不必要な出費はだれでも避けたいものです。追加の投資は、現在持っている資源をできるだけ活用することが前提となる場合が一般的でしょう。

 IT投資においても、導入済みのシステムをうまく活用するという流れがはっきりしてきています。マイニングを導入する場合も、ほかのITツールとの親和性が必要条件になります。データマイニングをはじめとするBI(Business Intelligence)テクノロジは進化が急速であるため、新しいソリューション、あるいは別のソリューションを採用したくなる場合が多々あるものと考えられます。そのため、全体の体系の中で個々のBIソリューションが部品として組み合わせ可能な形になっていなければ、最初の選択を誤った場合に新規のツールとは別々に運用するか、すべてをリプレイスするか、新規ツールの導入を我慢するか、いずれにしても後悔することになります。BIツールでは、オープンスタンダードに準拠したベスト・オブ・ブリードが賢明なIT戦略といえるでしょう。

 その意味で、最低でもデータソースに制限があってはいけません。データベースだろうがテキストファイルだろうが、ほかのマイニングツールのデータだろうが、何でも読み書きできるオープン性が重要です。

ポイント4:展開可能性

 マイニングの結果から何人の人が恩恵を享受できるかによって、ツールの価値は大きく変わってきます。

 マイニング結果の報告だけなら、ポイント3でのオープン性がクリアされていれば十分でしょう。問題は、マイニングの結果をスタティックなレポートやリストとして配信するのではなく、リアルタイムスコアリングやパーソナライゼーションといった形でダイナミックに利用したい場合です。

 その場合には、予測結果のリストや個々のモデルの出力でなく、ストリーム全体をマイニングツールに依存しない実行ファイルに変換する必要があります。それができれば、銀行窓口でのリアルタイムの与信や、コールセンターやオンラインショップでのリコメンデーションなど、マイニングをまったく意識しない形での展開が可能になります。マーケティングアクションを自動化することによって、対応可能な顧客/潜在顧客の数が飛躍的に増え、またどんなに複雑な条件が要求されても、One-to-Oneの対応が可能になります。それによる恩恵は計り知れないものがあるはずです。

ALT 図5 Clementineで構築したマイニングプロセスを展開するClementine Solution Publisherの仕組。マイニングの成果をフロントオフィスの業務に役立てることも視野に入れたツール選びが重要となる

ポイント5:サービス体制

 いくら使いやすいツールであっても、サービス体制が充実していなければ信頼して使用することはできません。テクニカルサポートに加え、トレーニングコースやコンサルティングなどのサービスがベンダによって提供されていれば安心です。また、見落としがちですが、海外のソフトの場合、本国の日本市場に対する理解とコミットメントは非常に重要です。日本特有の要求事項が製品に反映される可能性がないのなら、初めから日本のベンダを選択すべきでしょう。

 サービスに関しては、SEやコンサルタントのスキルだけでなくサービスポリシーをきちんと確認してください。ノウハウがユーザー側に蓄積されるようにプログラムされたサービスでしょうか? どんなに優秀なコンサルタントが立派な結果を出してくれても、ユーザーにスキルトランスファーされないのなら、一生そのコンサルタントにお金を払い続けることになります。それならツールを購入する意味はないでしょう。最短期間でユーザーを立ち上げてくれるサービスが最も優れたサービスと言えます。

ALT 写真6 SPSSユーザー会風景。最新情報の入手や他ユーザーとの情報交換の機会が充実していることも、ツール選びのポイントとなる

 また、ユーザーコミュニティーも重要です。ユーザー会やユーザー専用の掲示板、メーリングリストの有無がチェックポイントになるでしょう。

 最後に、外部の協力者をどれだけ抱えているでしょうか? IT、統計、マーケティングから特定業界の産業知識に至るまでのすべてを、1社で100%カバーできるベンダはありません。特にマイニングのグランドデザインは慎重に行わなければなりません。必要に応じてマーケティングや経営の研究者の助力が得られるとベストでしょう。

ポイント6:そのほか

 ビジネスで利用するマイニングツールは、当然、高度で最先端のマイニングアルゴリズムが搭載されていなければなりません。また、分析データの巨大化に対応できるように、大容量のデータを扱えるような高いスケーラビリティを備えている必要があります。

 しかし、主要なマイニングツールであれば、この2点は十分合格点に達しているはずです。ツールを選択する場合、アルゴリズムの詳細を比較したい衝動に駆られることがよくあります。しかし、上位数社のツール間でのアルゴリズムの違いによる影響は、それを扱う人間のセンスの違いで簡単に逆転されてしまう程度のマイナーなものでしかありません。また、バージョンアップのたびに新しいアルゴリズムが追加されますので、この点での各社の競合優位差は年々ゼロに近づいていきます。事実、かつてはClementineにしかなかったコホーネンネットワークという手法も、各社マイニングツールに取り入れられ始めています。

 スケーラビリティも同様です。さらに、第1章で「データマイニングはゼロから仮説を作り出す作業ですから試行錯誤が必須です。失敗を繰り返しながら最良と思われる結果にたどり着くプロセスは、どんなに高速なツールを使ってもギガ単位のデータでは軽快にこなせるものではありません」と言及しましたが、サンプルを使ってベストなモデルを確立したうえで、必要に応じてそのモデルに全データを流してみるという方法が推奨されるため、あまり神経質になる必要はありません。

 最後に、価格の比較にはもっと慎重になりたいものです。製品価格以外に何が必要になるのでしょうか?

  • 毎年の保守料
  • 上位機種への乗り換え価格
  • 使えるようになるまでに必要なサービスの料金
  • コンサルティング料は妥当か

など、これらすべてをトータルで考慮し、将来を見据えた判断を心掛けましょう。

2.マイニングの必要性とハードルを越えるためのヒント

 以上、マイニングを成功させるために心強いパートナーとなり得るツールの条件をご紹介いたしました。少しでも参考になれば幸いです。それでも迷ったら、最後は気に入ったものを選べばいいのです。高い買い物ですから、途中で使うのが嫌になるくらいなら、上記選択ポイントのいくつかが満たされていなくても、自分に合ったツールを選んだほうがずっとましです。ツール選択においても、現場の意見が一番重要といえるでしょう。

 さて、データマイニングも第2のブームを迎え、だいぶこなれてきた感があります。このシリーズでご紹介したソフマップギャガ・コミュニケーションズなどのような成功事例も着実に増えています。朗報は、学術の分野でもにわかに注目度が高まっていることです。今後、産学共同研究がさらに盛んになり、実務界が学者の研究成果から恩恵を享受する機会が増えるのは確かです。さらに、大学ではデータマイニングの授業が始まっています。今後、マイニングツールを自由に操れる学生が続々社会に送り出されていきます。マイニングを行う環境は整備されているのです。

 最終回を迎えるに当たり、弊社の営業に「顧客ユーザーからのオブジェクションで一番大きいものは何か」と聞いてみました。答えは、「ROI」(企業ユーザー)と「中身がブラックボックスなこと」(アカデミックユーザー)でした。くしくも、その2つに対する答えはこのシリーズの中で繰り返し示唆してきたように思います。ポイントは、

  1. データマイニングは実務に役立って初めて価値があること
  2. データマイニングの首尾は現場の知見に大きく左右されること

の2点だと思います。

 中身のブラックボックス性は、データマイニングの第1次ブームのときによく議論されましたが、最近では「使えればいい」という考えが主流です。なぜならマイニングの結果の背後にある因果関係は、いずれにしろ人間が考えなければならない部分だからです。われわれは、実務に役立つかどうかだけに興味があるので、ブラックボックス性の問題解決は専門家にお任せしてしまいましょう。

 データマイニングツールは、導入すればそれだけで業務効率が向上したり経費が削減できたりするものではありませんので、確かにROIは気になります。基本的な考え方に関しては、第2章でダイレクトメールを例にして説明していますが、同じツールを導入すればだれでも、どの企業でも同じ効果が上がるわけではありません。どれだけのROIが期待できるかは、まず、どのビジネス問題を解決するかにかかっています。ROIの計算は、それを明確にしたうえで、ビジネスの「現状」を熟知している人が行わなければ信頼のおける予測にはなりません。ベンダにROIの予測を要求する際には、必ずビジネスに一番詳しい人がベンダと一緒に行ってください。ROIは、ビジネス問題や環境が違えば、当然異なるため、ここで一般化して語れるものではありません。ただ、現状把握がきちんとできていればそれだけ、ビジネス改善の手段が見えやすくなります。つまりその分ROIが上がるという点は、一般的にいってもよいでしょう。

 いつかこのシリーズの第2弾でパワーアップしたデータマイニング論を展開できればと願っております。皆さまとともに、データマイニング市場を活性化していければ幸いです。


「マーケターのためのデータマイニング講座」は今回をもちまして最終回です。ご愛読ありがとうございました。


Profile

村田 悦子(むらた えつこ)

米国ボストン大学経済学部卒。ブラビス・インターナショナルにて機械翻訳システムの辞書開発。日本SEにて米国キャンドル社、BGS社の大型汎用機用運用管理システムのマーケティングに従事。1991年、日本SEと米国SPSS Inc.の合弁会社であったSPSSJapan Inc.に転籍。マーケティングマネージャを経て現在ビジネスインテリジェンス事業部担当上級副社長。ビジネス界でのデータマイニングの普及を推進するとともに、JACS-SPSS論文大賞特別審査員や学生を対象とした講演など、産学の橋渡しとなる活動に携わる。

エス・ピー・エス・エス株式会社

米国SPSS Inc.の日本法人として1988年に設立。設立以来、統計解析ツールSPSSを中心とした製品群と、関連サービスを提供。CRMなどの分野を中心にデータマイニングが注目される中、1999年5月、データマイニングツールClementineを発売。2001年からは、データマイニングプロジェクトの標準であるCRISP-DMに沿ったコンサルティングサービスの提供など、顧客のビジネスを成功に導くソリューションを提供している。

代表取締役:イアン・スタンレイ・デュエル

東京都渋谷区広尾1-1-39

ホームページ:http://www.spss.co.jp/


Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ