ビッグデータ活用で、売上高と新規会員を増やした電子書店IBM Software Xcite Spring 2014 Report

5月21日に開催された「IBM Software Xcite Spring 2014」の事例講演の中から、ビックデータを活用して売り上げを拡大した電子書店の事例を紹介する。

» 2014年05月29日 15時41分 公開
[菊地原博,ITmedia]

 今や、ビッグデータは新しい経営資源と言われるようになっており、実際にビッグデータ活用で、売り上げを伸ばす企業も出てきている。ビッグデータの活用がどのようなアプローチで行われ、売り上げ拡大に貢献しているのか。IBMが5月21日に開幕した「IBM Software Xcite Spring 2014」の講演では、具体的な活用例とそれを支えるテクノロジー、ビッグデータ活用にあたってのポイントが語られた。

会員当たりの売り上げ増と新規会員獲得で、売り上げを拡大

 ビッグデータを活用することで、企業は売り上げを大幅に拡大することができる。

 電子書籍を取り扱うある企業では、会員当たりの売り上げ増加と新規会員の獲得が大きな課題だった。

竹島氏写真 日本情報通信株式会社 ソリューション推進本部 ソフトウェア・テクニカルセールス部 竹島勝史氏

 そこで同社は以下のような取り組みを行った。まず、会員当たりの売り上げを増やすために、会員を趣味や嗜好などでグループ化し、それぞれに合わせた施策を実施した。例えば推理小説好きなどの趣味・嗜好に応じたアプローチを行うと共に、興味のないアプローチを抑制し、迷惑メールと受け取られるのを避ける。また、クーポンも割引時のみ反応する顧客は避け、リピーターになり得る人に配り、割引コストを極小化する。さらに、顧客へのオファリングも何回か実施すると、反応する商品が分かってくるので、うまく選んでオファリングする。

 一方、新規会員の獲得では、次のようなやり方をした。

 まず一般的なレコメンデーションに、予測した年齢・性別の要素を加えたアプローチをする。「これは年齢と購買行動が強く結び付く電子書籍のような商品だから可能になるわけで、日用品や食品では不可能です。ですから、扱い商品の特徴をきちんとつかんで、それに合った施策を打ち出すことが重要です」と日本情報通信の竹島勝史氏は語る。

 その上で、膨大なタイトルについて、購入者の男女比率や年齢構成比率を分析し、グループ分けする。そして、会員の購入曜日や購入時間など行動特性を分析し、膨大な会員情報の中から、非会員の動きを予測した。そして、年齢や性別を区別して、施策を実施し、会員獲得に結びつけていく。

 こうした取り組みにより、その企業は売り上げを拡大したが、一連の施策を人手で行うのは難しい。そのため、その企業ではIBMの統計解析ソフト「SPSS」と高速データ分析処理機能「BLUアクセラレーション」搭載のデータベース「DB2」(以下DB2 BLU)を組み合わせ、データソースをDB2 BLUに格納し、SPSSで分析している。

カラム型とデータスキッピングで処理能力を飛躍的に向上

 ビッグデータの活用は、「データ分析で解決する課題の特定」「データ分析を用いた課題への対処」「ビジネスでの活用(実行、意思決定)」「評価」という4つのプロセスで行うことが重要だ。それを支えるテクノロジーがSPSSとDB2 BLUだが、ここではDB2 BLUについて見ていく。

 データベースではユーザーが要求を投げると、データはデータブロック単位で動く。かつてのDB2はロー型(行指向)で、データブロックの1行1行を見ていく。それに対して、カラム型(列指向)は列単位で、データブロックの中にデータ収めていき、1つのブロックの中には1つの列の情報しかない。

カラム型とロー型のベンチマーク結果写真 カラム型とロー型のベンチマーク結果

「DB2 BLUはカラム型をサポートしており、列の絞り込みが行われた場合、大きな効果を発揮します。例えば、データ量が1GBで列数5のレコード金額を集計する場合、ロー型では全レコードを読み込むので、処理データ量は1GBになります。それに対して、カラム型は列のみを読み込んで集計するので、5分の1の200MBとなり、処理性能は単純に5倍になります」(竹島氏)。

 さらに、DB2 BLUはデータブロックの中に統計情報を持つデータスキッピングというテクノロジーもサポートしている。例えば、アプリケーションから、4月10日付けの情報が欲しいという命令を出すと、DB2はまず統計情報を確認する。そこで、5月1日から21日の情報には存在しないことが分かるので、データを読み込まない。余分なデータを読まずに、条件に一致するデータだけ読み込むことで、処理性能を高めることができる。このように、データスキッピングは行絞り込みに大きな力を発揮する。

活用成功のカギは自社特性を考慮したメニューの作成

 ベンチマーク結果では、カラム型は21%の列選択率で、ロー型に対して約23倍高速となり、対象列数が少ないほど、性能が向上する。また、データスキッピングは行選択率8%で、ロー型に対して35倍以上高速となり、対象行数が少ないほど性能が向上する。

「2つのテクノロジーは万能ではなく、アップデート処理などは苦手です。そこで、DB2 BLUではロー型とカラム型を混在させたハイブリッドスキーマで、テーブルを作ることもできます」(竹島氏)。

 さらに、大きな効果を発揮できるのが、SPSSとの組み合わせによる利用だ。単体で使う場合には、SPSSで処理を実行する。それに対して、組み合わせて使うと、DB2 BLUで処理して結果だけを返し、分析をSPSSで行う。DB2 BLUは飛躍的に処理性能が向上しているので、組み合わせて使うことで、ツールの機能を最大化することができる。

 分析を支えるテクノロジーについて見てきたが、ビッグデータを活用するためにはいくつかのポイントがある。データ分析を料理に例えると、データ分析結果を使う人は食べる人、データ分析を行う人は作る人、データは素材、分析ツールやデータベースは調理器具である。

 ビッグデータは素材の1つであり、調理器具は使い方が分かれば十分、統計学など難しい理論は要らない。ただ食べる人は何をオーダーしてよいのか分からないので、作る人との間で、メニューを考える人が必要になる。「そこで注意すべきなのは、メニューを作る便利なサイトはありませんし、あったとしても、役に立たないということです。その企業の業種業態、自社の特性を考慮に入れて、まずはメニューを考えることが重要です」と竹島氏は最後に強調して、講演を終えた。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ