ITmedia NEWS >

レコメンデーションの虚実(2)〜レコメンデーションの分類ソーシャルメディア セカンドステージ(2/2 ページ)

» 2007年09月18日 11時30分 公開
[佐々木俊尚,ITmedia]
前のページへ 1|2       

協調フィルタリングの利点と“セレンディピティ”

 協調フィルタリングは、これらの欠点を補完することができる。まず第一に、協調フィルタリングは他のユーザーとの好みの類似性をベースにしているため、コンテンツの中身はいっさい考慮されない。このため、一見ユーザーの好みとは合わない予想外のお勧めが行われることがある。この予想外のお勧めによって、ユーザーは「あ、こんな良いものがあったのか」と驚き、「自分にもこんな好みがあったんだな」と新たな気づきを得る可能性がある。

 つまりはセレンディピティだ。すでにかなりポピュラーになっているこの言葉は、偶然をとらえて幸運に変えてしまう能力のことを指す。もともとは『セレンディピティ物語 幸せを招ぶ三人の王子』(エリザベス・ベンジャミン・ホッジス著、よしだみどり訳・画、藤原書店)というおとぎ話が語源だ。古代のスリランカにあったセレンディップ王国を舞台にしたこの物語で、3人の王子は竜を鎮める巻物を探し、インドからペルシャへと旅した。だが最後まで巻物は見つからず、しかしその課程で王子たちはさまざまな幸運に出会い、さまざまなものを見つける結果となった。その「偶然の幸運」の面白さに目を付けた18世紀のイギリスの文筆家、ホレース・ウォルポールが、偶然にも幸運を引き寄せる能力をセレンディピティと呼ぼう、と知人に当てた手紙の中で書き、そうしてこの言葉が英語圏で徐々に広がったとされる。よく語られる事例としては、ノーベル化学賞を受賞した白川英樹氏の話がある。白川氏がポリアセチレンの合成実験を行っていた際、触媒の量を100倍にしてしまい、この結果、予期せぬ「電気を通すプラスチック」が生まれてしまったという逸話だ。つまり求めていたものとはまったく異なる発見、発明が偶然に転がり込んでくる、そういう状況をセレンディピティと呼んでいるわけだ。

 このセレンディピティという言葉ができたのは18世紀であり、その後長らく、このセレンディピティは明示的に身につけられるものではなく、ある種の第六感のようなものか、あるいは超能力の一種のように思われていた。努力していれば身につくというわけでもなく、「そりゃ偶然に幸運を引き寄せられればそれは素晴らしいけど、でもどうすればそんなことができるわけ?」と半信半疑にしかとらえられていなかったのである。

 ところがインターネット時代に入り、検索エンジンやソーシャルブックマークなどのWeb2.0的なアーキテクチャによって、ユーザーの側が予期しない新たなデータと出会うことが可能になり、これがセレンディピティという言葉を一躍注目される結果となった。先の協調フィルタリングも同様で、ユーザーの側が想像もしていなかったような偶然の出会いを演出することが可能になったのだ。

利点と裏返しの協調フィルタリングの欠点

 これはコンテンツフィルタリングには不可能な能力であって、協調フィルタリングの強みともなっている。しかしこの強みは――後述するけれども、協調フィルタリングの欠点にもなる。

 またコンテンツフィルタリングの欠点の(2)についても、協調フィルタリングであれば、コンテンツの属性を最初に解析しておく必要がない。なぜなら協調フィルタリングは先に書いたように、コンテンツの中身をいっさい見ていないからだ。だがこれについても、裏を返せば協調フィルタリングの欠点にもつながる。つまり協調フィルタリングはコンテンツの中身を見る必要がない代わりに、当初から膨大な数の顧客データを必要とする。顧客データが集まっていなければ、満足のいく解析結果を得ることができないのである。

 協調フィルタリングの欠点を、まとめてみよう。以下のようになる。

(1)協調フィルタリングは、その商品の内容そのものについても関知していない。例えば映画のレコメンデーションで考えてみよう。協調フィルタリングでは、自分が購入した商品データに基づいて、他の顧客のデータと関連づけて「あなたにはこんなお勧めの映画があります」と勧めてくれる。だがこの場合には、自分がどんな監督や俳優、ジャンルの映画が好きかという属性はまったく考慮されていない。だから例えば、理系の人がよく買うような技術書をひんぱんに購入していると、そのような層の人たちが比較的好むアニメをお勧めされてしまうというようなことが起きてしまう。技術書は読むがアニメが好きではない人にとっては、このレコメンデーションは有効ではない。

(2)協調フィルタリングは、顧客のデータが数多く集まっていなければ的確なレコメンデーションができない。

(3)協調フィルタリングは、顧客同士の行動の類似性を見ているだけで、顧客の属性を見ていない。例えば、妻にプレゼントするために夫が女性用化粧品を購入すると、その後しばらくは女性用化粧品をさかんに勧められるような現象が起きてしまう。


 先にも書いたように、コンテンツフィルタリングであれば、(1)と(2)の問題はクリアできる。(2)の例で挙げた映画について言えば:

自分がどのような映画の好みかを事前に登録しておき、その好みに応じてお勧めしてもらうコンテンツフィルタリング的な手法を使えば、例えば好きな映画監督、好きな俳優、好きな音楽家などを登録しておくだけで、それらの監督や俳優、音楽家が起用された映画をお勧めしてもらえる。そしてこの方法では、(2)の欠点――顧客の数が少なくとも、レコメンデーションを的確に行える。サービス開始直後で客がまだ少ない「コールドスタート」と呼ばれているような段階では、コンテンツフィルタリングの方が有効なのだ。

 だが(3)の顧客属性の問題に関しては、コンテンツフィルタリングでも協調フィルタリングでもカバーできない。次回は、そのあたりについて検討してみよう。

関連キーワード

フィルタリング | Web2.0


佐々木俊尚氏のプロフィール

ジャーナリスト。主な著書に『フラット革命』(講談社)『グーグルGoogle 既存のビジネスを破壊する』(文春新書)『次世代ウェブ グーグルの次のモデル』(光文社新書)など。インターネットビジネスの将来可能性を検討した『ネット未来地図 20の論点』(仮題、文春新書)を10月に刊行予定。連絡先はhttp://www.pressa.jp/


前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.