これほど企業や社会の関心を集めている“ビッグデータ”だが、実際に活用に乗り出している企業はまだほんのひと握りだ。だが、分析で一番大切なことはデータサイエンティストの確保でもなければ、分析基盤への投資でもなく、ビジネスのプレーヤー自身がデータを生かす目を養うことではないのだろうか。
ビッグデータという言葉が社会に浸透し、多くの企業が分析に関心を寄せている。だが、複数のハードルがビッグデータ活用に踏み切る企業の足を鈍らせている。
1つはノウハウの問題だ。将来予測のような高度な分析を行うためには、統計解析の知識や高度なスキルが不可欠となる。だが、そうしたノウハウを持った人材は不足しており、育成に時間がかかるほか、外部からスカウトすることも難しい。
コストの問題もある。特に近年、BIが多くの企業に浸透したが、実績などを報告するレポーティングツールとして使われているケースが多く、「役には立っているが、明確なROIは測りにくい」という印象を抱いている経営層が多い。加えて、データベースが各部門に散在し、それぞれデータフォーマットが異なるなど、データ整備の問題も依然として横たわっている。こうしたこともBIに対する「現場の効率化には貢献しているが、経営の意思決定に足る結果は得にくい」という印象を強め、新たな分析基盤への投資をためらわせる一因となっているようだ。
だが、B to B、B to Cを問わず、市場の声をいち早く読み取り、俊敏に対応することが競争力の決定要因となりつつあることは間違いない。「既存のBIを生かし切れていないから」「高度な分析ノウハウも、投資する予算もないから」と、いつまでも足踏みをしているわけにもいかないのが現実だ。
では、自社のビッグデータ活用力の向上に向けて、有効な一歩を踏み出すためにはいったいどうすれば良いのだろうか?――その1つの現実解を、近年急速に導入実績を伸ばしているBIベンダ、米クリックテック シニアディレクター グローバルプロダクトマーケティングのエリカ・ドライバー氏に聞いた。
「欧米でもビッグデータという言葉がキーワードになっている。だが言葉の印象も手伝い、山のようなデータを何とかしなければ、と途方に暮れてしまう向きも多い。しかし大切なのは、データの“量”よりも、データ同士の“関連性”に着目すること。量に圧倒される必要はなく、必要なデータ同士を掛け合わせれば、必ずしも全データを対象に分析しなくてもビジネスに有効な未知の知見は得られる」
ドライバー氏はまずこのように語り、同社の導入事例の1つであるスウェーデンのゲーム会社の例を挙げる。
この会社ではゲームの提供やゲーム関連アイテムの販売をWeb上で行っているが、顧客がWeb中のどこをクリックし、どんなアイテムを買っているのかなど、Web上での顧客動向分析にクリックテックのBI製品「QlikView」を使用している。
QlikViewは社内のあらゆるデータソースから任意のデータを取り込み、グラフやチャートなどを使って一元的に可視化できる製品。詳しくは後述するが、インメモリでのデータ処理による高いパフォーマンスと優れた描画機能を持ち、ユーザーが見たい切り口から自在にデータを可視化できる点を特徴としている。
このゲーム会社の場合も、約16億行もの“ビッグデータ”をHadoopで管理しているが、「購買行動のトレンドを知る」という分析の目的ははっきりしていた。そこで「クリックした場所」や「各製品の販売数」「売上高」など、購買行動に関する計2億1100万行のデータソースをサンプリングしてQlikViewに展開。グラフやチャートを使って、さまざまな顧客行動を可視化することで、マーケティングキャンペーンのROIの分析、明確化に成功したという。
「ここで鍵となるのはデータの量ではなく関連性。分析によって得たい結果、知りたいことが明確なら、関連がありそうなデータソースを掛け合わせて一元的に可視化することにより、ビジネスの考察を行う上で必要な知見をスピーディに発見できる」
一方、英国の通信会社では、各家庭に引いている通信ケーブルの保守効率の向上にQlikViewを使っているという。従来は保守スタッフが各家庭に赴いてケーブルのチェックや修理などを行っていたが、一定のエリアごとに、各家庭にあるモデムなどの通信機器の稼働データを収集・蓄積するデータベースを入れたキャビネットを設けた。さらに、本社にある顧客データ、ネットワークトポロジのデータと、キャビネットにモバイルデバイスを接続することで得られる通信機器の稼働データを、QlikView上で掛け合わせて可視化する体制を築いた。
これにより、保守スタッフは各エリアの家庭を全戸訪問してチェックしなくても、キャビネットに立ち寄り、QlikViewで3つのデータを可視化することで、全家庭の通信機器の状況をその場で把握することが可能になった。故障も即座に発見し、迅速に対応できるようになったという。
「ここでも鍵になるのは関連性だ。通信機器のデータ、顧客データ、ネットワークトポロジのデータを組み合わせて可視化することで、保守作業の効率化に必要な知見を導き出している」
ただ、この関連性で重要なのは、この通信会社の例で言えば、「『各家庭に設置された機器の故障検知』という目的以外にも、故障の予兆の発見、異なるエリアへの影響など、複数のデータを一度に可視化することで、“予見していなかった、新たな発見も得られる”ことだ」という。
「企業でもこれと同じことが言える。現在、多くの企業では各部門が個別にデータベースを持ち、社内にデータが散在している。従って、これまではデータ間の関連性を把握することは難しかったが、必要なデータソースを掛け合わせて可視化できる環境を作れば、ビジネスの現況と同時に“これまで見えなかった関連性”が見えてくる。そこに新たな効率化策やビジネスチャンスが眠っている例が多い。すなわち、ビッグデータ活用の鍵は、『大量データをいかに効率よく分析するか』というより、『自分のビジネスに関連するデータを、どう取得し、どう見ていくか』にある」
むろん、全社のあらゆるデータを掛け合わせて将来予測を行うような高度な分析も重要だ。だが、何より大切なのは分析を行う目的と、目的の実現に向けて今あるデータを生かすことだ。ドライバー氏はそうした点を挙げて、「データを着実に生かしていく上では、“ビッグデータ”というより、日々増加・変動する“ムービングデータ”と捉え、それをどう集めて、どう見ていくかと考えた方が現実的かもしれない。まずは知りたいことに関連がありそうな複数のデータを、業務部門のユーザーが実際に目で見てみることが大切だ」とアドバイスする。
Copyright © ITmedia, Inc. All Rights Reserved.