メディア

ケータイメールは、声で入力――ATR-Trek、音声メール入力を披露：ESEC

» 2009年05月14日 00時05分公開

[後藤祥子，ITmedia]

ATR-Trekの音声メール入力システム。読点や句読点は「てん」「まる」などと発声しなくても、発声時の間などを判断して自動で入力する。絵文字や顔文字は、手動で変換する必要がある

　話した言葉が自動でテキスト化され、メールの本文として入力される――。5月13日、東京ビッグサイトで開幕した第12回組込みシステム開発技術展（ESEC）のATR-Trekブースで、こんな技術が披露された。

　ブースにはデモ用にマイクを装備した「WILLCOM D4」が用意され、説明員がマイクに向かって話すと、話した言葉がテキスト化され、画面に自動で入力される様子を見ることができる。

　「きゅうにざんぎょうになりました。ばんごはんはいらないよ」と声を発してから、ワンテンポおいたくらいのタイミングで、D4のメール画面上に「急に残業になりました。晩ご飯は要らないよ。」と表示されるなど、表示までにかかる時間は実用上問題ないレベル。1つの文章を読み上げてから認識や変換、入力の一連の処理を行うのではなく、読み上げるそばから実行するため、ストレスなく利用できそうだ。

世界初、サーバとローカルのハイブリッド音声システムを実用化

　音声がテキストとして入力されるまでのフローはどうなっているのだろうか。

　マイクを通じて入力された音声は、まず携帯端末側で音声を認識するのに必要な特徴量のみを抽出してデータを軽くした上で、音声認識サーバに送信される。サーバ側では受け取ったデータをテキスト化し、かな漢字変換を行って端末側にテキストデータとして送り返する。

　ユニークなのは、端末内のアドレス帳や送受信メールなどのデータを固有名詞の認識結果として利用する点だ。例えば、サーバ側での認識が困難な珍しい名字などは、端末側に戻す際に一時的にカタカナで表記し、アドレス帳データを元にした端末内辞書と照合する。ここで合致する固有名詞があれば反映させ、認識結果として表示する仕組みだ。これは、ローカル型音声認識（LSR）と分散型音声認識（DSR）のハイブリッド型音声システムで実現しており、同社によれば実用化されたのは世界初だという。

　標準的な話し言葉だけでなく、くだけた話言葉も認識できるなど、すでに商用化レベルの仕上がりだと説明員。なお、この技術は、ブラウザ検索のキーワード入力にも利用できるとしている。

技術の特徴と仕組み

端末側とサーバ側の構成

「しゃべって翻訳」の技術を応用

　ATR-Trekは、905iシリーズに搭載された「しゃべって翻訳」を手がけたことで知られる企業だ。しゃべって翻訳は、ケータイアプリを起動し、マイクに向かって日本語のフレーズを話すと翻訳結果が英語（などの外国語）で表示され、外国語を話すと日本語の翻訳結果が表示されるサービス。国際電気通信礎技術研究所（ATR）の音声認識と翻訳技術を、フュートレックの組み込み技術の組み合わせで実現している。

　今回、同社がデモを行っている音声メール入力システムは、このしゃべって翻訳のシステムを応用したものだという。

楽天ペイと楽天ポイントのキャンペーンまとめ【5月4日最新版】　1万ポイント還元や最大20％還元などの施策が充実（2024年05月04日）
4万円台からの「Nothing Phone (2a)」は誰向けか　Phone (2)との比較で分かったこと（2024年05月05日）
皆さんは「スマホにガラスコーティング」してますか？　私はしていません（2024年05月04日）
ダイソーで110円の「ガラスコーティング液」は本当に使える？　試してみた結果（2024年04月29日）
au PAYとPontaのキャンペーンまとめ【5月3日最新版】　最大20％や35％の還元施策あり（2024年05月03日）
最新デジアナ文具でスケジュールも手書きしてアップ!?　サラサラ書き心地の良いゲルインキタイプも登場──NeoLAB「Neo smartpen A1」（2024年05月04日）
楽天モバイルがeSIMの不正乗っ取りについて注意喚起――安心安全に使えるeSIM環境を業界を挙げて取り組むべき（2024年05月05日）
LINEの気になるトークや写真などを「Keep」する機能、8月28日で終了　同社がバックアップを呼びかけ（2024年05月04日）
ドコモ販売ランキング：「Pixel 7a」人気がじわり再燃、「Galaxy S24」は10位に後退　（2024年05月04日）
ガストやバーミヤンの「テーブル決済サービス」、楽天ペイも利用可能に　レジへ行かずに卓上会計（2024年05月05日）

ランキングトップ30

最新トピックスPR

過去記事カレンダー

2024年

2023年

2022年

2021年

2020年

2019年

2018年

2017年

2016年

2015年

2014年

2013年

2012年

2011年

2010年

2009年

2008年

2007年

2006年

2005年

2004年

2003年

2002年

2001年

Feed Back

利用規約

ITmediaはアイティメディア株式会社の登録商標です。