ソーシャルメディアセカンドステージ

レコメンデーションの虚実（2）～レコメンデーションの分類（1/2 ページ）

公開 2007年09月18日 12時04分

更新 2007年09月18日 12時00分

著者

佐々木俊尚

[ITmedia]

印刷する

レコメンデーションの代表的手法

　レコメンデーションには、いくつかのアプローチがある。とりあえずそのアプローチを俯瞰してみると、おおむね以下の5つに分類することができる。

（1）ルールに基づくレコメンデーション

（2）コンテンツベースのフィルタリング

（3）協調フィルタリング

（4）統計学的なアプローチ

（5）行動ターゲティング

（6）ソーシャルネットワーキング

　ひとつずつ説明していこう。

　（1）のルールに基づくレコメンデーションというのは、「ビジネスルール方式」とか「インテンショナル（意図的な）レコメンド」などと言った呼び方もある。例えば「美容室に髪を切りに来た人に、ヘアケア製品を勧める」「プリンターを買った人に、インクトナーを勧める」など、最初に「ある製品を買った人、ある行動をした人には、この製品やサービスを勧める」というルールを定めておく方法だ。このレコメンデーションはわかりやすいけれども、しかし事前にすべてのルールをきちんと決めておかなければならないために、運営側の手間がかかる。

“音楽ゲノムプロジェクト”が支えるコンテンツフィルタリング

　（2）のコンテンツベースのフィルタリングは、コンテンツの属性とユーザーの好みをマッチングさせて、お勧めを表示するアプローチだ。もっとも先端的な例としては、音楽レコメンデーションサービスのPandoraがある。現在、日本からは著作権の問題でレジストレーションできなくなってしまっているのが非常に残念だが、楽曲の中身を徹底的に解析し、利用者の好みに合わせて音楽を配信してくれるというサービスだ。サイトにサインインして「Create a New Station」というボタンを押すと、好きなアーティストや曲の入力を求められる。例えばポール・マッカートニーの「Dance Tonight」を入力すると、「Dance Tonight Radio」という仮想的なラジオ局が作成され、「Dance Tonight」と似た曲が次々に再生される。

　このサービスを支えているのは、“音楽ゲノムプロジェクト”という技術だ。それぞれの楽曲は、メロディーやリズム、傾向などのさまざまな要素によって構成されているととらえ、それらの要素を「ゲノム（遺伝子）」と呼んでいる。そしてひとつひとつの楽曲に対し、専門家が手作業で約400のゲノムに基づいて点数化し、最初にユーザーが選んだ楽曲と似たゲノム構造の曲を選んで、再生していくという仕組みになっている。さらにこのゲノムの類似性によって再生された曲に対して、ユーザーの側は「I Like it」と「I Don't Like it」というボタンで自分の好みを加えることもできる。これによって楽曲コンテンツとユーザーのマッチング精度をさらに高めている。

Amazonが採用する協調フィルタリング

　（3）の協調フィルタリングは、Amazon.comのレコメンデーションによってすっかり有名になった。Amazonのトップページには「○○さん、おすすめの商品があります」と勧められ、本を買うと「この本を買った人はこんな本を買っています」と同種の本のお勧めが表示される。これが協調フィルタリングだ。

　協調フィルタリングをごく簡単に説明すると、例えばAさんという人が、（あ）（い）（う）（え）の4つの商品を購入していたとする。これに対してＢさんは（あ）（い）（う）（お）の4つの商品を購入していた。AさんとBさんは、（あ）（い）（う）の3つの商品を購入したことで共通しており、趣味志向が似通っていることが予測される。そこでAさんには「（え）を購入したらどうですか」、Bさんには「（お）はいかがでしょう」とお勧めすることになる。実際にはもっと複雑なことが行われているが、思い切って簡略化してしまえば、上記のような考え方が協調フィルタリングの基本だ。

　この協調フィルタリングと、先の（2）のコンテンツフィルタリングは、ある種の補完関係にあると言ってもいいかもしれない。お互いの欠点を補いあうことが可能だからだ。まずコンテンツフィルタリングには、次のような欠点がある。