ITmedia NEWS > 科学・テクノロジー >

好みの声で携帯メール読み上げ KDDI研と名工大、携帯にダウンロードできる音声合成ソフト試作

» 2008年09月22日 07時00分 公開
[ITmedia]

 KDDI研究所は9月19日、名古屋工業大学と共同で、携帯電話にダウンロードして利用できる省メモリ・省データな日本語音声合成ソフトを試作したと発表した。好みの声優の音声をダウンロードしてメールやブログを読み上げたり、携帯小説を登場人物ごとに別の声で読み上げるといったサービスが可能という。

 省メモリ・省データで高品質な音声を合成できる日本語音声合成技術を新開発した。HMM(隠れマルコフモデル)と呼ばれる統計モデルを用いて音声波形の特徴を効率的に表すことで、音声合成に必要な情報を1Mバイト程度に圧縮。合成の元となる声の質や話し方も再現でき、発音も滑らかという。

 携帯で動作するレベルに高速化し、ファイルサイズやメモリ量などの制約が厳しい携帯端末のダウンロードソフトとして提供できるようにした。

 音声波形データから音声合成に必要な情報を作成するまでの処理のほとんどが自動化されているため、制作コストも抑えられるとしている。

 従来の音声合成システムは、あらかじめ収録した音声波形を断片化し、つなぎ合わせる方式のため、肉声感は高いが不連続感が目立つという弱点があった。数十Mバイトなど大量の音声波形データを用意すると不連続感を軽減できるが、データ量が膨大になるため、携帯に事前に組み込む必要があった。

 ソフトは「CEATEC JAPAN 2008」(9月30日〜10月4日、幕張メッセ)に出展する。今後「大規模な試験を行いながら、合成音声の自然性をさらに高めて行く」としている。

関連キーワード

音声合成 | 声優 | KDDI研究所 | 携帯電話 | CEATEC


Copyright © ITmedia, Inc. All Rights Reserved.