検索
ニュース

NTTの音声合成ソフト、深層学習で自然な声を実現 ナレーションや書籍の読み上げに期待

NTTテクノクロスが、NTTのAI技術corevoを活用した音声合成ソフトウェア「FutureVoice Crayon」の新バージョンを発表した。DNNによる深層学習を活用した音声合成によって、自然で滑らかな音声を実現した。

Share
Tweet
LINE
Hatena

 NTTテクノクロスは2017年12月5日、音声合成ソフトウェア「FutureVoice Crayon」をバージョンアップし、販売を開始した。

 新バージョンでは、NTTメディアインテリジェンス研究所が開発したDNN(Deep Neural Network)による深層学習と、イントネーションや声質の基となる40年以上蓄積した音声データベースを活用することで、人の声の特徴を忠実に再現した自然な音声を作成できるようになった。

 また、異なる話者の音声データから読み方やアクセントを補うことで、所望の話者の音声データが少量の場合でも、その話者の自然な音声合成を実現するという。

Photo
DNNを活用した音声合成のイメージ

 音声合成は、コンタクトセンターでの自動音声案内や、音声対話サービスやロボットによる受付案内など利用が広がっている一方、従来の技術では、人の声に近づけ、声のバリエーションを増やすためには、費用負担が大きくなってしまうことが課題になっていた。

 今回、音声合成にDNNを活用することで、少量の音声データから声のバリエーションを容易に増やせるとともに、従来の音声合成技術よりも自然な音声を実現できるようになった。このことから、NTTテクノクロスでは、これまで音声合成では置き換えが困難とされていたナレーションやガイダンス作成、電子書籍の読み上げなどへの用途拡大を見込めるとしている。

Photo
「FutureVoice Crayon」試聴体験サイトでは、5話者の合成音声による日本語の読み上げを試聴できる

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る