ニュース
» 2009年05月12日 07時00分 UPDATE

これからのビジネスマンに必須のツール:パーソナルBI入門 第二回 Excelで分析データを準備する (1/2)

個人でBIを操ることが、これからの厳しい時代を生き抜くための強力な武器になる。Excelを使ったBI体験の二回目は、分析すべきデータの作成方法を紹介しよう。

[米野宏明(マイクロソフト),ITmedia]

 誰でも手軽にできるExcelを使ったBI連載の二回目となるが、今回はいよいよ実際にExcelを使ってデータ分析の準備に入っていくことにしよう。

 前回ご紹介のとおり、ビジネスデータ分析のステップは大まかに以下のようになる:

  1. 課題設定:何が解くべき問題なのかを決める
  2. データ収集:データを集めてきれいにする
  3. 仮説設定:集めたデータの全体像を把握し因果関係を推測する
  4. 仮説検証:データを掘り下げて分析し推測が正しいかどうか検証する
  5. 意思決定:検証結果を整理し選択する

 データ分析の本質は「仮説検証」であって、統計計算やグラフの作成ではない。ある商品の売上が落ち込んでいるからと時系列の売上推移グラフを作ってみても、それは売上が落ちていることを再認識できるだけだ。実は自社の売上だけでなく業界全体が落ち込んでいるかもしれないし、運悪く中心顧客層だけに起きた一時的な事情によるのかもしれない。このような「仮説」すなわち原因から結果に至る道筋を予測し、それが正しいかどうかを検証するのがデータ分析の意義である。仮説が明瞭ならば確認はたやすく、高度な分析技術は不要だ。逆に仮説が無いとデータをいくら掘り返しても何もひらめかない。分析力とは、計算力やグラフ作成力ではなく、その前段階の仮説構築力にある。

 それではビジネスシーンを想定してステップを追ってみよう。「大型スポーツ用品店の営業担当者」を想定したシナリオで考えてみる。

Step 1. 何が解くべき問題なのかを決める(課題設定)

 分析を始める前に、どんな問題に対して意思決定するのかを決めよう。仮にあなたが売上減少に悩んでいたとしても(無論そのことは大問題なのだが)、それは単なる結果にすぎない。売上減少という結果をもたらす原因、つまり課題(解くべき本質的な問題点)が存在するはずだ。何が課題なのかを突き詰めないと、結果として表れた現象を眺めて終わりになる。課題設定は最重要ステップなのだ。

 では売上減少に至る課題を推察してみよう。手元に情報が足りないなら社内外の関係者にヒアリングすればよい。その結果、以下の3つの意見に集約されたとする。

意見その1:取扱商品の商品力が衰えた

意見その2:競合店が登場した

意見その3:顧客の嗜好が変わった

 「商品力が衰えた」はよく耳にしがちな主観的表現だが、実際にスポーツ用品の商品機能が時間とともに毀損するとは思えない。例えばこれを「現在の対価に見合う魅力」と読み替えてみると、価格や価値提案内容(メッセージや他商品との組み合わせなど)に課題がありそうだ。課題は全員が事実として共有可能、つまり客観的でなければならない。

 「競合が登場した」は結果に近い。競合が参入するのは、市場が拡大し魅力があるのか、あなたの会社のビジネス構造に欠点があるのかのどちらかだろう。あなたの売上は減っているのだから、たぶん課題は後者にある。

 「顧客の嗜好が変わった」はどうも課題のようだが、真偽の判別は難しい。顧客アンケートで嗜好を探ろうとしても、市場が成熟すると提供機能が顕在化ニーズを追い越し、顧客は自らの意思を表明しにくくなる。よって顧客や社内の(大きな)声だけでなく、データという純然たる事実からも、どう変わったのか裏付けを取る必要がある。

 このように、課題に疑問を持ち続け掘り下げていくことで、真の課題に近づける。難しければいろんな人に意見をぶつけて課題を引き出せばよい。

 さて、このように課題を整理しディスカッションした結果として、まずは「顧客の嗜好がシフトした」(そのために今までのアプローチが通用しなくなった)という課題に絞り込むとしよう。もちろん単なる憶測でありほかにも可能性はある。しかしすべての可能性を網羅的に分析していては時間が掛かりすぎるので、最もありそうで、かつインパクトの大きいところからすぐさま着手しよう。後で「顧客の嗜好がなぜ変わったのか=何をすれば解決するのか」という仮説を立てて検証するのだが、そこで理屈に合わないことが出てくれば、検証結果も踏まえてもう一度原点に立ち戻ればよいし、前回より良い分析ができるはずだ。何も公式を作りたいわけではない。ビジネスにはスピードが命なのである。

Step 2. データを集めてきれいにする

 ここからは手を動かす作業だ。顧客嗜好の変化を確認したいので、顧客属性に基づいた販売傾向の分類が可能な情報、つまり「顧客属性データ」と「顧客ごとの販売履歴データ」を用意する。データは詳細であるに越したことはないが、商品カテゴリといった粗いレベルでも分かることはたくさんあるので入手できる範囲でよい。経験分野なのだから足りない所は経験で解釈しよう。データ入手に時間をかけ過ぎても時間の無駄である。

データを集める

 顧客属性や販売履歴データは、ポイントシステムやクレジットなどを導入していれば比較的簡単に入手できるし、オンタイムでなければ間接販売企業でもある程度は集められるだろう。今回は次のような列を持つ表データ(テーブル)を作ることを目標にする。

顧客名、既婚/未婚、性別、年齢、年収、子供の数、自動車所有数、通勤時間、購入年、購入月、購入店、購入商品名、購入数量、購入金額


 これだと販売明細ごとに行が作られ、同じ顧客属性情報が繰り返し現れることになる。単体ではとても見づらい表になるのだが、後で説明する「ピボットテーブル」で多次元の集計をするにはこのほうが好都合なのだ。

 ところで顧客属性データや購入履歴データは、別々のシステムで管理されることが多く、運が悪ければ異なる顧客番号体系が使われている。この場合、各システムからデータを貰い、ユーザー自身で加工して連結しなければならない。本当はAccessを使うと随分楽なのだが、今回はExcelだけで頑張ってみよう。

2つのテーブルを連結する

 顧客台帳と販売管理システムから、以下の2つのExcel表が入手できたとする。

[顧客属性テーブル] 顧客番号、顧客名、既婚/未婚、性別、年齢、年収、子供の数、自動車所有数、通勤時間

[販売履歴テーブル] 顧客番号、取引番号、購入年、購入月、購入月、購入商品名、購入金額

 この2つを連結するには、販売履歴テーブルの顧客番号と一致するものを顧客属性テーブル内から探し出し、販売履歴テーブルに追記すればよい。ただし、2つのテーブルで顧客番号体系が異なりその対応表もない場合、連結用の共通番号(連結キー)を作る必要がある。例えば双方に顧客名と電話番号の列があれば「田中太郎0355334422」のように、各テーブル内で重複しない連結キーを作り顧客番号代わりに使う。なお、入力ミスなどで連結できない行が必ず出るものなので、あまり多くないなら削除してしまおう。こんなところでがんばりすぎても体に良くない。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

ピックアップコンテンツ

- PR -

注目のテーマ

マーケット解説

- PR -