ITmedia NEWS > ネットの話題 >

ケータイのマイクを検索の“耳”に Google音声検索、日本語に対応

» 2009年12月07日 17時12分 公開
[ITmedia]

 Google日本法人は12月7日、音声入力でネット検索できる「Google音声検索」を日本語に対応させた。まずAndroid端末とiPhoneで利用できる。日本語音声認識エンジンを独自開発し、実用的な精度の高さと速度を両立させているという。

 Androidでは「Google音声検索」アプリをインストール、iPhoneでは「Google Mobile App」の設定から音声検索をオンにすることで利用できる(iPhoneでは「音声検索は英語のみ」と表示されるが、問題なく利用可能になっている)。検索窓の右横のマイクアイコンをタップすると音声認識がスタート。電話で話すように口元のマイクで検索したい単語などを発音すれば、テキストに変換してGoogle検索を実行する。

photophoto 「赤坂見附から横浜 終電」と話せば終電時刻が表示される

 GPSと連動し、現在地に合わせた地域情報を表示する。東京・渋谷にいる場合に「映画館」で検索すれば、渋谷駅周辺の映画館リストを表示するといった具合だ。

 モバイルでニーズが高い地図や飲食店、乗り換え案内などの検索にも対応。「○○から×× 終電」などと話しかければ、その経路の終電時刻を検索するといったことが可能だ。

photophoto YouTube動画検索や「音威子府村」(おといねっぷむら)のような難読地名の認識も。「ゆーちゅーぶ」のようにカタカナ発音を正確なスペルの英単語に変換する機能もある

 まずAndroidとiPhoneから対応し、今後他のプラットフォームへの対応も検討している(英語版はBlackberryにも対応済み)。

「マイクが言葉を理解する耳になる」

photo 音声検索をデモする井上さん。電話で話す場合と同じように話すのが利用のスタイル

 音声検索は英語版が昨年秋にリリースされ、最近対応した中国語版に続き日本語版は3番目になる。サービス開始に当たり、日本語音声を認識するエンジンを新規開発。精度、スピード、検索を容易にするレベルの実用性とのバランスを調整しながらエンジンのブラッシュアップを進めてきたという。

 マイクから入力した音声はそのままサーバに送り、サーバ側で音声認識してテキスト変換する方法を採用した。「端末で処理すると速度は上がるが、エンジンを継続的に改善させていく場合には端末がネックになってしまう」(井上陸モバイル担当プロダクトマネージャー)ためだ。認識エンジンは、実際にGoogleで使われてきた検索クエリーなど、ネット上のキーワードを活用する「Googleらしいアプローチ」でトレーニング。最近公開した日本語入力システムと同様の技術も組み込んでいるという。

 認識エンジンには「かなりの規模」のサンプルを使ってトレーニングを行い、年齢や性別関係なく使用できるといい、関西弁のイントネーションも聞き分けて認識できたという。発話中にありがちな「えー」や「えーと」といった検索ではムダな言葉も、統計的手法を使うことで無視するようにした。

photo Google音声検索の特徴

 井上さんによると、Googleがモバイルで目指すのは、高性能なハードウェアとクラウドコンピューティングとの組み合わせだ。GPSやカメラ、加速度センサーなど「センサーリッチ」になってきている携帯電話の充実したハードと、クラウド的サービスを結びつけることで革新的なサービスを生み出すのがミッションだ。

 音声検索はその第1弾。「携帯電話に最初から付いていたマイクが、まるで私たちの言葉を理解する“耳”になる」というものだ。井上さんは今後のサービスについて、「ロードマップは公開できないが、楽しみにしていてほしい」と話している。

Copyright © ITmedia, Inc. All Rights Reserved.