コラム
» 2007年09月18日 11時30分 UPDATE

ソーシャルメディア セカンドステージ:レコメンデーションの虚実(2)〜レコメンデーションの分類 (1/2)

ネットジャーナリスト佐々木俊尚氏が次世代ソーシャルメディアのかたちを探る新連載「ソーシャルメディア セカンドステージ」。第2回はレコメンデーション手法としてよく取り上げられる「コンテンツフィルタリング」と「協調フィルタリング」について掘り下げます。

[佐々木俊尚,ITmedia]

レコメンデーションの代表的手法

 レコメンデーションには、いくつかのアプローチがある。とりあえずそのアプローチを俯瞰してみると、おおむね以下の5つに分類することができる。

(1)ルールに基づくレコメンデーション

(2)コンテンツベースのフィルタリング

(3)協調フィルタリング

(4)統計学的なアプローチ

(5)行動ターゲティング

(6)ソーシャルネットワーキング


 ひとつずつ説明していこう。

 (1)のルールに基づくレコメンデーションというのは、「ビジネスルール方式」とか「インテンショナル(意図的な)レコメンド」などと言った呼び方もある。例えば「美容室に髪を切りに来た人に、ヘアケア製品を勧める」「プリンターを買った人に、インクトナーを勧める」など、最初に「ある製品を買った人、ある行動をした人には、この製品やサービスを勧める」というルールを定めておく方法だ。このレコメンデーションはわかりやすいけれども、しかし事前にすべてのルールをきちんと決めておかなければならないために、運営側の手間がかかる。

“音楽ゲノムプロジェクト”が支えるコンテンツフィルタリング

 (2)のコンテンツベースのフィルタリングは、コンテンツの属性とユーザーの好みをマッチングさせて、お勧めを表示するアプローチだ。もっとも先端的な例としては、音楽レコメンデーションサービスのPandoraがある。現在、日本からは著作権の問題でレジストレーションできなくなってしまっているのが非常に残念だが、楽曲の中身を徹底的に解析し、利用者の好みに合わせて音楽を配信してくれるというサービスだ。サイトにサインインして「Create a New Station」というボタンを押すと、好きなアーティストや曲の入力を求められる。例えばポール・マッカートニーの「Dance Tonight」を入力すると、「Dance Tonight Radio」という仮想的なラジオ局が作成され、「Dance Tonight」と似た曲が次々に再生される。

イラスト

 このサービスを支えているのは、“音楽ゲノムプロジェクト”という技術だ。それぞれの楽曲は、メロディーやリズム、傾向などのさまざまな要素によって構成されているととらえ、それらの要素を「ゲノム(遺伝子)」と呼んでいる。そしてひとつひとつの楽曲に対し、専門家が手作業で約400のゲノムに基づいて点数化し、最初にユーザーが選んだ楽曲と似たゲノム構造の曲を選んで、再生していくという仕組みになっている。さらにこのゲノムの類似性によって再生された曲に対して、ユーザーの側は「I Like it」と「I Don't Like it」というボタンで自分の好みを加えることもできる。これによって楽曲コンテンツとユーザーのマッチング精度をさらに高めている。

Amazonが採用する協調フィルタリング

 (3)の協調フィルタリングは、Amazon.comのレコメンデーションによってすっかり有名になった。Amazonのトップページには「○○さん、おすすめの商品があります」と勧められ、本を買うと「この本を買った人はこんな本を買っています」と同種の本のお勧めが表示される。これが協調フィルタリングだ。

 協調フィルタリングをごく簡単に説明すると、例えばAさんという人が、(あ)(い)(う)(え)の4つの商品を購入していたとする。これに対してBさんは(あ)(い)(う)(お)の4つの商品を購入していた。AさんとBさんは、(あ)(い)(う)の3つの商品を購入したことで共通しており、趣味志向が似通っていることが予測される。そこでAさんには「(え)を購入したらどうですか」、Bさんには「(お)はいかがでしょう」とお勧めすることになる。実際にはもっと複雑なことが行われているが、思い切って簡略化してしまえば、上記のような考え方が協調フィルタリングの基本だ。

 この協調フィルタリングと、先の(2)のコンテンツフィルタリングは、ある種の補完関係にあると言ってもいいかもしれない。お互いの欠点を補いあうことが可能だからだ。まずコンテンツフィルタリングには、次のような欠点がある。

(1)ユーザーの好みとコンテンツの属性をマッチングさせるため、ユーザーの可視化された好みから逸脱したコンテンツはお勧めされにくい。言い方を変えれば、ユーザーが「自分で気づいていない」好みに対しては、コンテンツフィルタリングではお勧めされることがない。

(2)コンテンツの属性を最初に解析し、分類しておかなければならない。上記のPandoraの例で言えば、まず膨大な数の楽曲をゲノムに基づいて点数化するという専門家の作業が必要になってしまい、これはコスト増になる。


       1|2 次のページへ

Copyright© 2016 ITmedia, Inc. All Rights Reserved.

Loading

ピックアップコンテンツ

- PR -