異なる言語、異なる通信環境――グーグルとGoogle、日米の差

言語としての日本語は、ひらがな、カタカナ、漢字、場合によっては英文すら混じる。こうした文字種の多さに日本のグーグルはどのように対応しているのだろうか。また、米国では好評のサービス「GOOG-411」も日本ではウケるかどうか分からないという。

» 2008年06月09日 22時25分 公開
[鷹木創,ITmedia]

 1998年に米国で創業したGoogle。その2年後の2000年にはBIGLOBEに検索エンジンを提供するなど、日本国内にも進出し始めた。2001年にはグーグル株式会社を設立。国内検索市場ではYahoo!JAPANに次ぐ第2位のシェアを持つほか、auやNTTドコモの携帯電話にも採用され、モバイル端末においても影響力を増している。そんなGoogleだが、米国と日本でいくつかの違いがあるのだ。

あいしてる、アイシテル、愛してる

「マック版のパワーポイントでインデントの幅を変える方法」

 米国と比べると日本の“検索環境”は非常にユニークだ。言語としての日本語は、ひらがな、カタカナ、漢字、場合によっては英文すら混じる。グーグルで検索エンジンを担当するソフトウェアエンジニアの賀沢秀人氏は「あいしてる、アイシテル、愛してる。全部意味が違う」と指摘。同じような表現でも文字種に応じて的確な検索結果が求められるのだ。

 「黒ごまたまご」のような商品名の場合、「黒ごま卵」と本来ひらがなの「たまご」を漢字の「卵」に間違えた検索キーワードを入力しても、黒ごまたまごという商品名だと判断して、検索結果を表示する。先ほどの文字種の違いも同様の抽出を行い、前後につながる言葉などを判断しながら検索結果を表示しているのだという。

 日本語のローマ字入力も曲者だ。例えば、「アイティメディア」と入力する際、日本語変換機能がオフになっていると「aithimedhia」と入力してしまうことがある。そうした日本語への対応の苦労がよく分かるのが、“もしかして”機能だ。検索語をミスタイプしても、正しいかもしれない言葉を表示してくれるもの。aithimedhiaの場合も、Googleは「もしかしてアイティメディア」と教えてくれる。

「黒ごまたまご」の例(左)と「aithimedhia」と検索したところ

 入力したものを検索するという本来の役割からすれば、「黒ごま卵」や「aithimedhia」の検索結果をそのまま表示するのも「1つの方法」(賀沢氏)だろう。ただ、aithimedhiaと入力した利用者が次に「アイティメディア」と入力し直しているケースが多ければ、aithimedhiaをアイティメディアの打ち間違いと判断できる。こうして「書き間違いが多い単語を抽出し、自動的に判断する仕組みだ」。

 とはいえ、検索機能でGoogleが他社を引き離せていない分野もある。自然文検索がその1つだ。例えば「マック版のパワーポイントでインデントの幅を変える方法」という質問のような検索キーワード(むしろ文章と言えるかもしれない)。賀沢氏も検索したが目的のページにたどりつけなかった。想定していたページはWeb上に存在していたわけで、このような自然文であっても「ちゃんとページを表示できるようにしたい」という。国内でもgooなどが日本語の自然文検索サービスを始めているが、グーグルも日本語での自然文検索に注力する――というわけだ。

 なお、こうした分析は日々行っており、「どんどん検索してもらえれば、もっと精度が良くなるはず」という。一方、膨大なデータに「実はGoogleのデータセンターの処理能力がネックになる」と苦笑いした。

GOOG-411は日本でウケない!?

 普及率が8割を超えたブロードバンドのインフラや、インターネット可能なモバイル端末など、高度な通信インフラも日本の特徴だ。特にモバイルは目覚ましい。3G端末が普及し、HSDPAなどの3.5Gも商用サービスを開始しており、「米Googleのエンジニアを日本の家電量販店に連れて行くと、日本のモバイルのほうが自宅の回線よりもスピードが出ることに驚く。Googleの国別モバイル検索は日本からの利用者が最も多い」(岸本豪モバイル担当プロダクトマネージャー)

 だが、モバイル向けの検索にはそれなりの苦労もある。iモードなどのモバイルインターネットは、その通信事業者のゲートウェイ内で閉じているネットワークだ。つまり、Googleがモバイルサイトを検索データベースに登録しようとしても、携帯電話以外ではアクセスできなかったり、そもそもたどりつけないことも多い。

 モバイルサイトにおいてもPC向けサイトと同じようにPageRankで各サイトを評価している。基本的には被リンク数でのランキングになるわけだが、被リンクの正しさをチェックする作業が難しいという。というのも、モバイルサイトは1ページあたりのコンテンツが少ないからだ。機種に依存する絵文字の存在も見逃せない。

 「いずれも日本特有の課題だが、できるだけ頑張って、PCとモバイルを横断的に検索できるよう目指す」(岸本氏)

 携帯電話を通話端末とみると、米Googleでは面白い試みも始まっている。それは「GOOG-411」だ。音声認識技術を活用した地域情報検索サービスで、携帯電話などから「1-800-4664-411」に電話し、音声で検索キーワードを伝えると、その結果を音声で教えてくれるという無料サービスである。

 ただ、このサービスが日本人にウケるかどうかは微妙だ。マリッサ・メーヤー副社長は「渋谷の街はあんなに人でいっぱいなのに、とても静かだったわ」と笑う。日本人には携帯電話で通話して検索するよりも、携帯電話のブラウザで検索したほうが合っているのかもしれない。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ