ITmedia NEWS > 科学・テクノロジー >

レコメンデーションの虚実(4)〜ベイジアンは「Amazonを超えた」のか?ソーシャルメディア セカンドステージ(2/2 ページ)

» 2007年10月01日 12時30分 公開
[佐々木俊尚,ITmedia]
前のページへ 1|2       

ベイジアンフィルタリングと協調フィルタリングを組み合わせるzero-zone

 山崎氏の作ったベイズ理論レコメンデーションには、(1)ユーザー・アイテム・ベイジアン(2)ユーザー・ユーザー・ベイジアン(3)アイテム・アイテムベイジアンの3種類がある。

 ソーシャルブックマークを例にとって考えてみると、(1)は例えば100のサイトの中からあるユーザーが10のサイトをブックマークしていたとする。この時、ブックマークされた10のサイトに含まれているメタデータと、残りの90のサイトに含まれているメタデータを比較して、10のサイトを選んだユーザーが他の90のサイトを好む確率を計算する。

 (2)のユーザー・ユーザー・ベイジアンは、ユーザAが15のサイト、ユーザーBが18サイト、ユーザーCが13サイトをそれぞれブックマークしていたとすれば、それらのサイトのメタデータを比較することで、ユーザー同士の好みの近さを計算するという方法だ。また(3)のアイテム・アイテム・ベイジアンは、1個の商品が持っているメタデータを比較して、商品ごとの近さを計算するものだ。

 zero-zoneはこの3つのベイジアンレコメンデーションに加えて、2種類の協調フィルタリングも採用している。通常の協調フィルタリングが、「ユーザーごと」の関連性を調べるのに使われているのに対して、zero-zoneでは「商品ごと」の協調フィルタリングも行っている。例えば表1のようなマトリクスを考えてみてほしい。ユーザーごとの協調フィルタリングであれば、ユーザーAとユーザーCはかなり好みが似通っているので、同じ商品をレコメンドできる関係にある。一方で、商品の側から見ると、商品1と商品6は好むユーザーが似通っている。そこで商品1を購入した人には、商品6もレコメンドできるという考え方が成り立つ。これが商品ごとの協調フィルタリングだ。

表1 商品とユーザーの購入関係を表したマトリクス
  商品1 商品2 商品3 商品4 商品5 商品6
ユーザーA × ×
ユーザーB × × × ×
ユーザーC ×
ユーザーD × × ×
ユーザーE × ×

 山崎氏は話す。「zero-zoneでは、協調フィルタリング2種類と、ベイジアン3種類の計5種類のレコメンデーションエンジンを組み合わせています。複数のエンジンを使うのは、どのような場面でzero-zoneが使われるのか、どのようなレコメンデーションを行うのかというビジネスロジックによってレコメンデーションは味付けを変えなければならず、その部分の味付けを有機的に変更できるようにするためです」

 zero-zoneのシステムは、3つのフェイズに分かれている。まず最初に、ユーザーが顧客企業のECサイトを利用した場合、そのデータがどのようにレコメンデーションエンジンに橋渡しされるのかというAPIの部分。そしてこのデータをどう加工するのかというモデリングの部分。そのままレコメンデーションエンジンにデータを渡してしまうと、あまりにも計算量が多くなってパンクしてしまう可能性があり、例えば出現頻度の低いものを優先的に取り上げる(みんなが見ているものには価値がない、他の人が利用していないものをなぜその人が利用しているのかといったところに着目する。そこにおそらく価値があると判断するわけだ)といった前処理を行う必要がある。そしてこのようにモデリングした結果を、エンジンに渡して計算処理を行う。この計算処理も、顧客企業のビジネスモデルに合わせて、例えばアイテム・アイテム・ベイジアンとユーザーごとの協調フィルタリングを組み合わせたり、あるいはさらにそれに顧客企業の提案するルールを加えたりといった味付けを行って、最終的にレコメンデーションの出力を行うことになる。

 このベイジアン・レコメンデーションは、協調フィルタリングと同じような出力結果を出すことが可能だが、しかし協調フィルタリングと違って、顧客のデータが少ないコールドスタート(サービスイン直後で、顧客データが全然集まっていない状況のこと)でもレコメンデーションが可能といったメリットがある。ただ協調フィルタリングと異なり、事前に商品ごとにテキスト化されたメタデータをすべて用意しておかなければならないという面倒さはある。

 zero-zoneは、USENの音楽配信サイト「OnGen」などに採用されている。このモデルが果たして成功するのかどうかは、まだ分からない。過去、ベイズ理論を使ったサービスとしてはマイクロソフトがMicrosoft Officeに搭載したユーザー・アシスタントがあった。ベイズ理論に基づいて、必要な場面、必要な内容のヘルプを的確にユーザーに提供できるというふれこみだったが、しかし「何の脈絡もなく現れて、的外れなヘルプを言ってくる」とさんざんな評価で、その後姿を消している。ベイズ理論の応用は、まだ未開拓の分野であるのは間違いないようだ。

佐々木俊尚氏のプロフィール

ジャーナリスト。主な著書に『フラット革命』(講談社)『グーグルGoogle 既存のビジネスを破壊する』(文春新書)『次世代ウェブ グーグルの次のモデル』(光文社新書)など。インターネットビジネスの将来可能性を検討した『ネット未来地図 20の論点』(仮題、文春新書)を10月に刊行予定。連絡先はhttp://www.pressa.jp/


前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.