ITmedia NEWS >

検索エンジンが「ユーザーのその日の気分」を知る方法(上)ネットベンチャー3.0【第10回】(1/2 ページ)

» 2006年09月29日 11時00分 公開
[佐々木俊尚,ITmedia]

 少し古い話になるが、CNETに『パーソナライズド検索、グーグルが探し当てていない正解とは』という記事が掲載された。この記事の意味するものは、かなり重要だ。

個人の好みを完全に把握するには、単なるキーワードからの推測の域を超えて、その人が検索を実行しようとしている瞬間の意向をとらえる必要がある。時間が経っても変化しない振る舞い(例えば節約志向か贅沢志向か、冒険派か慎重派かなど)に加えて、そのときどきによって変化する振る舞い(新型コンピュータの購入、プロジェクトのリサーチ、休暇の計画など)も考慮するのが、本当の意味でパーソナライズされた検索というものである。個人のオンライン上での最近の振る舞い(可変要素)と個人の人物履歴とでもいうべきもの(不変要素)を組み合わせれば、その人の本当の好みと検索時点での意向を汲み取るためのコンテクストを検索エンジンに渡すことができる。

 インターネットのフラット化革命は、コンテンツや商品、人間関係などネット空間に転写されるすべての情報を、ひとつの大きなフラットな土俵の中に上下関係なしに並べてしまった。ユーザーはその玉石混淆の情報の大海原の中から、求める情報を的確に救い出さなければならなくなった。

 1990年代のWeb1.0の時代においては、そういう「玉石混淆から玉を選び取る」方法は個人の能力に帰結すると考えられ、それがインターネットリテラシーという言葉で呼ばれていた。しかし冷静かつ客観的に考えれば、そんなことをごく普通のインターネットユーザーが行うのは、不可能に近い。ひとりの個人にとってはそもそも、インターネット上にあるすべての情報にりーちすることさえできないし、その中からどのような基準で、どのようなガイドラインに沿って求める情報をすくい上げればいいのか、その手法さえさだかではない。

 そこで90年代の終わりから、その「玉をすくい上げる」方法を何らかのアーキテクチャーで行えないだろうかという考え方が、徐々に生まれてきた。

Web検索エンジンの登場と変遷

 その最初の試みが、検索エンジンだった。

 世界で最初のロボット型検索エンジンは、1994年1月に有料でスタートした「Infoseek」だった。有料では顧客はなかなか集まらず、その年の夏には無料サービスに移行している。この同じ年の4月には、後に「Yahoo!」の創設者となるジェリー・ヤンとデビッド・ファイロがディレクトリの原型となるリンク集を公開している。すべての原点は、この1994年という年から始まったと言っていいだろう。

 しかし黎明期のこの時代、検索エンジンの代名詞のように語られたのは、DEC(Digital Equipment)のラボラトリで開発された「AltaVista」だった。1995年にサービスインしたYahoo!が、公式の検索エンジンとしてAltaVistaを採用したからだ。また95年10月にサービスを開始した「Excite」もかなりの人気を集めていた。「Magellan」や「Webcrawler」といった検索エンジンもあった。だがこうした企業の多くは、今ではほとんどが姿を消してしまっている。MagellanとWebcrawlerは後にExciteに買収され、そのExciteも2002年に倒産。日本法人だけは生き残って伊藤忠商事の子会社となり、検索エンジンから若者向けのポータルサイトへと変わっている。

 またAltaVistaは、Yahoo!が「Inktomi」に乗り換えるのと同時に力を失い、DECがCompaqと合併するとともに切り離され、その後Overtureに買収された。そのInktomiもその後、Yahoo!がGoogleに乗り換えることで破たんの危機に瀕したが、やがてYahoo!とGoogleが決裂するに及んでYahoo!に買収される結末となった。

 世界初の検索エンジンだったInfoseekは、親会社であるDisneyによって閉鎖され、日本法人だけが“インフォシーク”の名称を引き継いで生き残った。日本法人は2000年に楽天に買収され、その後ライコスと統合し、現在は楽天のポータル戦略の一環として生き延びている。しかし独自の検索エンジン開発はもはや行っていない。

データベースとアルゴリズムの競争

 このように初期の検索エンジンの歴史を振り返ってみると、その合従連衡の激しさにあらためて驚かされる。まさに死屍累々、弱肉強食の世界だったのだ。黎明期の検索エンジンには、2つの大きな競争があった。ひとつはインデックスを他社よりも巨大化させ、Web世界をいかにして覆い尽くすかというデータベース構築競争である。世界中に存在するWebページの数は爆発的に増加し続け、時でもすでに数十億ページにまで達していた。その爆発に検索エンジンは追いつかなくなっており、検索結果に漏れが大量に生じていたのである。

 そして2つ目の競争は、ユーザーからの検索クエリーに対していかに適切に回答を返すかというアルゴリズム競争だった。初期の検索エンジンはきわめて貧弱なアルゴリズムしか持っておらず、SEO(検索エンジン最適化)スパムと呼ばれる悪質な手口に振り回された。どんなキーワードで検索しても、必ず検索結果上位に特定のポルノサイトやカジノサイトなどが表示されるという、信じがたい事態にまで陥ったこともあったのである。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.