メディア

ケータイメールは、声で入力――ATR-Trek、音声メール入力を披露：ESEC

» 2009年05月14日 00時05分公開

[後藤祥子，ITmedia]

ATR-Trekの音声メール入力システム。読点や句読点は「てん」「まる」などと発声しなくても、発声時の間などを判断して自動で入力する。絵文字や顔文字は、手動で変換する必要がある

　話した言葉が自動でテキスト化され、メールの本文として入力される――。5月13日、東京ビッグサイトで開幕した第12回組込みシステム開発技術展（ESEC）のATR-Trekブースで、こんな技術が披露された。

　ブースにはデモ用にマイクを装備した「WILLCOM D4」が用意され、説明員がマイクに向かって話すと、話した言葉がテキスト化され、画面に自動で入力される様子を見ることができる。

　「きゅうにざんぎょうになりました。ばんごはんはいらないよ」と声を発してから、ワンテンポおいたくらいのタイミングで、D4のメール画面上に「急に残業になりました。晩ご飯は要らないよ。」と表示されるなど、表示までにかかる時間は実用上問題ないレベル。1つの文章を読み上げてから認識や変換、入力の一連の処理を行うのではなく、読み上げるそばから実行するため、ストレスなく利用できそうだ。

世界初、サーバとローカルのハイブリッド音声システムを実用化

　音声がテキストとして入力されるまでのフローはどうなっているのだろうか。

　マイクを通じて入力された音声は、まず携帯端末側で音声を認識するのに必要な特徴量のみを抽出してデータを軽くした上で、音声認識サーバに送信される。サーバ側では受け取ったデータをテキスト化し、かな漢字変換を行って端末側にテキストデータとして送り返する。

　ユニークなのは、端末内のアドレス帳や送受信メールなどのデータを固有名詞の認識結果として利用する点だ。例えば、サーバ側での認識が困難な珍しい名字などは、端末側に戻す際に一時的にカタカナで表記し、アドレス帳データを元にした端末内辞書と照合する。ここで合致する固有名詞があれば反映させ、認識結果として表示する仕組みだ。これは、ローカル型音声認識（LSR）と分散型音声認識（DSR）のハイブリッド型音声システムで実現しており、同社によれば実用化されたのは世界初だという。

　標準的な話し言葉だけでなく、くだけた話言葉も認識できるなど、すでに商用化レベルの仕上がりだと説明員。なお、この技術は、ブラウザ検索のキーワード入力にも利用できるとしている。

技術の特徴と仕組み

端末側とサーバ側の構成

「しゃべって翻訳」の技術を応用

　ATR-Trekは、905iシリーズに搭載された「しゃべって翻訳」を手がけたことで知られる企業だ。しゃべって翻訳は、ケータイアプリを起動し、マイクに向かって日本語のフレーズを話すと翻訳結果が英語（などの外国語）で表示され、外国語を話すと日本語の翻訳結果が表示されるサービス。国際電気通信礎技術研究所（ATR）の音声認識と翻訳技術を、フュートレックの組み込み技術の組み合わせで実現している。

　今回、同社がデモを行っている音声メール入力システムは、このしゃべって翻訳のシステムを応用したものだという。

小型スマホを使っている理由は？　選択肢のなさを嘆く声も：読者アンケート結果発表（2024年07月26日）
「ハンディファン」「ネッククーラー」の選び方とやってはいけないこと　炎天下での利用は要注意（2024年07月23日）
IIJ×OPPO、Xiaomi、モトローラが語るスマホ戦術　おサイフケータイは「永遠の悩み」、IIJmioは「モバイル業界の宝石箱」（2024年07月26日）
貼らない保護フィルムケース「スマハラ」、iPhone 15シリーズ向けに発売　丸洗いもOK （2024年07月26日）
スマホの充電でやってはいけないこと　夏に気を付けたいNG行為は？（2024年07月26日）
OPPOがFindシリーズを2024年内に国内発売へ　競合メーカー担当者の前でサプライズ告知（2024年07月26日）
外出先から自宅のエアコンを遠隔操作、部屋を先に涼しくして“真夏の天国”を作っておく方法（2024年07月25日）
KDDIは通信障害をどのように検知してインフラを守っているのか　ネットワークセンターに潜入（2024年07月24日）
中国の“音楽特化スマホ”「MOONDROP MIAD01」を試す　重厚なサウンドに驚き、作り手のエゴを存分に感じた（2024年07月25日）
さよなら「コンセントなし新幹線」500系　JR西日本、スマホ充電できるN700S系を追加投入（2024年07月26日）

ランキングトップ30

最新トピックスPR

過去記事カレンダー

2024年

2023年

2022年

2021年

2020年

2019年

2018年

2017年

2016年

2015年

2014年

2013年

2012年

2011年

2010年

2009年

2008年

2007年

2006年

2005年

2004年

2003年

2002年

2001年

Feed Back

利用規約

ITmediaはアイティメディア株式会社の登録商標です。