NTTテクノクロスが、NTTのAI技術corevoを活用した音声合成ソフトウェア「FutureVoice Crayon」の新バージョンを発表した。DNNによる深層学習を活用した音声合成によって、自然で滑らかな音声を実現した。
NTTテクノクロスは2017年12月5日、音声合成ソフトウェア「FutureVoice Crayon」をバージョンアップし、販売を開始した。
新バージョンでは、NTTメディアインテリジェンス研究所が開発したDNN(Deep Neural Network)による深層学習と、イントネーションや声質の基となる40年以上蓄積した音声データベースを活用することで、人の声の特徴を忠実に再現した自然な音声を作成できるようになった。
また、異なる話者の音声データから読み方やアクセントを補うことで、所望の話者の音声データが少量の場合でも、その話者の自然な音声合成を実現するという。
音声合成は、コンタクトセンターでの自動音声案内や、音声対話サービスやロボットによる受付案内など利用が広がっている一方、従来の技術では、人の声に近づけ、声のバリエーションを増やすためには、費用負担が大きくなってしまうことが課題になっていた。
今回、音声合成にDNNを活用することで、少量の音声データから声のバリエーションを容易に増やせるとともに、従来の音声合成技術よりも自然な音声を実現できるようになった。このことから、NTTテクノクロスでは、これまで音声合成では置き換えが困難とされていたナレーションやガイダンス作成、電子書籍の読み上げなどへの用途拡大を見込めるとしている。
レーザー照射で野菜の産地が分かる? NTTの新技術にびっくり
ドラレコの映像から危険運転をAIで検知、NTT Comなどが実証
損保ジャパン日本興亜、事故受付や支払いの対応にAI導入
農業と水環境分野で高度なIT活用を クボタとNTTが実証実験
Google、音声合成技術のPhonetic Artsを買収
ディープラーニングの開発環境を無料で ソニーが「Neural Network Console」を提供Copyright © ITmedia, Inc. All Rights Reserved.