コラム
» 2009年12月08日 16時50分 UPDATE

ふぉーんなハナシ:「白戸家」「ヒウィッヒヒー」もOK? 「Google音声検索」で遊んでみた

100億以上の言葉を学習させたという「Google音声検索」。音声認識のキモとも言える認識精度がどれくらいなのか、そしてどんな単語を読み取れるのかを試した。

[田中聡,ITmedia]

 グーグルが12月7日に提供を開始した「Google音声検索」(日本語版)は、スピーディで高精度な音声検索ができるツールとして話題を集めている。認識する単語については「日本ユーザーがGoogle検索で使った100億以上の言葉を学習させた」(グーグルモバイル担当プロダクトマネージャー 井上陸氏)とのことだが、実際のところどこまで認識できるのだろうか。固有名詞を中心に、「iPhone 3GS」で試してみた。

 「宇多田ヒカル」「スガシカオ」「Mr.Children」などのアーティスト名や、「おくりびと」「機動戦士ガンダム」「崖の上のポニョ」などの作品名のほか、「板橋区小茂根」「船橋市藤原」「千代田区大手町1-3-1」といった住所もしっかり認識できた。住所は番地を認識するのも優秀だ。

photophoto 中国の通信機器メーカー「Huawei」は「far away」と認識されることもあったが、検索ウィンドウから修正できる

 こうなると、もっと試したくなる。まずは携帯キャリアの公式キャラクター。「ドコモダケ」「ひつじのしつじくん」「auシカ」は一発で認識できたが、「白戸家(ほわいとけ)」は何度試しても「ホワイトデー」となり、懐かしいところで「しまクリ三兄妹」は「島国三兄弟」と出た(当たり前だが「お父さん」は普通に認識された)。「草食系男子」「ただしイケメンに限る」「こども店長」「マー君神の子」といった流行語もOK。カタカナとしてか、流行語としてかは分からないが、「ヒウィッヒヒー」が正しく認識されたのにも驚いた。

photophotophotophoto 流行語もしっかりカバーしている

 ケータイ関連では「セカイカメラ」「AQUOS SHOT 933SH」は成功したが、「BRAVIA Phone U1」は「ブラビアホームU1」、「Walkman Phone, Premier3」は「walkman phone premier 9区」と表示されるなど、不完全なものもあった。このほか、マンガの名ゼリフや早口言葉も忠実に認識することが多く、膨大な語彙をサポートしているというのはダテではないと感じた。

photophotophotophoto 早口言葉もゆっくり話せば正しく認識された(写真=左端、左中)が、「隣の竹やぶに竹立てかけたのは誰だ」は苦戦した。筆者が「た行」をうまく発音できなかったためか、「北野武 竹達彩奈」など“タケ”しか共通点がないものが結果に出たこともあった。「かえるぴょこぴょこ三ぴょこぴょこ あわせてぴょこぴょこ六ぴょこぴょこ」は、「かえるぴょこぴょこぴょこぴょこぴょこぴょこぴょこぴょこ」と認識。長文や紛らわしい発音の言葉はさすがに厳しいようだ。比較的新しいマンガのタイトルも認識された(写真=右中、右端)
photophotophotophoto
photophoto マンガの名ゼリフもご覧の通り。有名な誤植や語尾のカタカナ、擬音なども(ほぼ)忠実に認識された

 では、異なる環境下での認識精度はどうか。まず端末との距離だが、通話と同じくらいの至近距離から発声すれば、ほぼ問題なく認識された。普段端末を手にして画面を見る程度の距離(30センチほど)でも、やや大きく発声すれば成功した。早口でしゃべると、単語によっては誤認識されることが多かったが(「セカイカメラ」が「中村」になるなど)、早口でも滑舌よくしゃべれば問題なさそう。抑揚は「東京ディズニーランド」「アイティメディア」「携帯電話」などを複数のパターンで発声したが、正しく認識された。

 続いて、騒音の多い環境でも試した。音楽再生中のソニー製の小型スピーカー「SRS-D25」の真横で発声をしたが、しっかり認識された。外出先では大手町の駅構内で試したところ、室内よりは一発で認識できる確率は下がるものの、はっきり発声すればおおむね認識できた。周囲に人がいたため、(恥ずかしさから)やや声が小さかったのかもしれない。

 音声認識サービスは認識精度の高さが重要だが、Google音声検索は満足できるレベルだと感じた。認識できる単語も幅広く、「この言葉は正しく認識するのか?」というちょっとした遊びにも使えそう。(いろいろな意味で)新しい検索ツールとして活用してみてはいかがだろうか。

Copyright© 2016 ITmedia, Inc. All Rights Reserved.