今回ご紹介するのは「印籠」。App Storeで115円でダウンロードすることができる。時代劇ドラマ「水戸黄門」の決めぜりふを言うと、「ドーン」という効果音とともに、iPhoneに葵の御紋が表示される、“それだけ”のアプリである。しかし、ここに使われている技術には、ケータイの声によるインタフェースの可能性が感じられる。
言葉で紹介するよりも、動画を見て頂いた方が早いかもしれない。とにかくiPhoneで「印籠」アプリを起動して、「この紋所が目に入らぬか」と言うと、葵の御紋が浮かび上がる仕組みになっている。しかし、この音声認識はかなり厳密なモノだ。動画中でも「紋所」を「紋章」と言い換えてみると、とたんに反応しなくなることが分かると思う。
このアプリを開発したのはアドバンスト・メディア。AmiVoiceという音声認識ソリューションを開発している企業だ。代表取締役会長の鈴木清幸氏は、起業家表彰制度「アントレプレナー・オブ・ザ・イヤー」第6回大会「EOY JAPAN 2006」でグランプリを獲得した経験を持つ。
話を聞きに行ったアドバンスト・メディアの会議室では、「スライド」と受話器に向かって喋ると、照明が落ち、プロジェクターが起動し、PC入力に切り替わる。「テレビ」というとテレビ放送に切り替わり、「8チャンネル」あるいは「TBS」などと言えばそのチャンネルに切り替わる。声をインタフェースとしたコンピューティングの環境がそこにあった。
AmiVoiceはドコモの「らくらくホン プレミアム」で利用できる音声認識サービス「音声入力メール」(月額210円)にも採用されている。これまでは音声を言語としてとらえて認識していたのに対し、AmiVoiceでは音響モデルを活用している。つまり音声の特徴から言葉を認識するのだ。そのため、ケータイ本体で音声認識をせず、小さなサイズの特徴量データをサーバに送って、認識結果を瞬時に端末に返す仕組み。これにより、実用レベルの音声入力のサービスを実現している。
しかし鈴木氏は「iPhoneのようにパワフルな端末であれば、サーバで処理するアプローチだけでなく、端末内での処理でも十分なスピードと精度を実現できる」と話す。「印籠」やスプーン曲げができる「SPOON」「古今東西」、最新作の「地球防衛司令室」は、どれも声を使ったアプリケーションであり、音声認識技術が活用されている。「この紋所が〜」ではないフレーズで試したい場合は、印籠以外のアプリに触れてみるといい。
Google Mobile Appでも、米国英語で検索できる仕組みが話題を集めているが、音声入力メールのようなサーバとの通信を絡めたサービスは、日本のみならず、クルマ社会である米国でも市場性は高い。
「米国ではすでに『SpinVox』などの、留守番電話の要領で吹き込んだ声を文章化してメールやSMSで送信するサービスが人気ですが、AmiVoiceの仕組みは人を介さず、また認識した内容を手元ですぐに確認し、修正したり、さらに長文を認識させたりもできます。人と機械との間にあるコミュニケーションの断層を取り除き、誰でもがインタラクションの中で音声認識を活用していく未来像を持って取り組んでいます」(鈴木氏)
まさに、iPhoneが「人の言うこと」を聞いてくれる未来。技術的な用件はすでにフィールドに出されていて、どのようにサービスにしていくかが問題ということになる。
東京、渋谷に生まれ、現在も東京で生活をしているジャーナル・コラムニスト、クリエイティブ・プランナー、DJ(クラブ、MC)。慶應義塾大学SFC研究所上席所員(訪問)。1997年頃より、コンピュータがある生活、ネットワーク、メディアなどを含む情報技術に興味を持つ。これらを研究するため、慶應義塾大学環境情報学部卒業、慶應義塾大学大学院政策・メディア研究科修士課程修了。大学・大学院時代から通じて、小檜山賢二研究室にて、ライフスタイルとパーソナルメディア(ウェブ/モバイル)の関係性について追求している。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR