ニュース
話した言葉をその場で表示――米ベンチャー、携帯向け音声認識技術をβ公開
vlingoの技術は、ユーザー側が普通に話す言葉をその場で表示できる、高い精度が特徴。同技術を使った地域情報検索アプリがβ公開された。
米vlingoは8月21日、携帯電話向けの音声認識インタフェースを発表した。まず、地域情報検索用のアプリケーション「vlingo FIND」を、Sprintの携帯サービス利用者にβ公開している。
従来の音声認識技術では、認識できる単語が限られていたり、ユーザー側で話し方を変える必要があったりしたが、vlingoでは、ユーザーが自然に話した言葉をそのまま認識できるのが特徴で、発声した文章が、そのままテキストボックスに表示される。音声入力とキーパッド入力の併用も可能。学習効果があるため、利用が増えるほど精度が向上するという。
同技術は、大多数の3Gネットワークやマルチメディア携帯に対応可能だという。vlingoでは、地域情報検索のほか、テキストメッセージの入力やWeb検索など、さまざまな用途への応用を視野に入れている。
vlingoは、米SpeechWorks(現Nuance)の共同創業者マイク・フィリップス氏などが設立した企業。フィンランドNokia出身のデーブ・グラナン氏がCEOを務めている。
関連記事
- 音声技術のNuance、携帯向け入力システムのTegicを買収
Nuanceが「T9」で知られるAOL傘下のモバイル機器用組み込みソフト会社を買収する。 - 鼻歌サイト「midomi」が日本上陸 「あの曲は?」を歌って検索
「ふんふふふーん、あの曲、何だっけ?」――ちょっとイライラするそんな疑問を解決してくれる「midomi」が日本に上陸する。PCに鼻歌を吹き込めば、同じメロディーの曲を瞬時に検索。データベースもみんなが歌った鼻歌製だ。SNS機能もあり、人気鼻歌アーティストも目指せる。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.