メディア

NTTの音声合成ソフト、深層学習で自然な声を実現　ナレーションや書籍の読み上げに期待

NTTテクノクロスが、NTTのAI技術corevoを活用した音声合成ソフトウェア「FutureVoice Crayon」の新バージョンを発表した。DNNによる深層学習を活用した音声合成によって、自然で滑らかな音声を実現した。

» 2017年12月06日 12時00分公開

　NTTテクノクロスは2017年12月5日、音声合成ソフトウェア「FutureVoice Crayon」をバージョンアップし、販売を開始した。

　新バージョンでは、NTTメディアインテリジェンス研究所が開発したDNN（Deep Neural Network）による深層学習と、イントネーションや声質の基となる40年以上蓄積した音声データベースを活用することで、人の声の特徴を忠実に再現した自然な音声を作成できるようになった。

　また、異なる話者の音声データから読み方やアクセントを補うことで、所望の話者の音声データが少量の場合でも、その話者の自然な音声合成を実現するという。

DNNを活用した音声合成のイメージ

　音声合成は、コンタクトセンターでの自動音声案内や、音声対話サービスやロボットによる受付案内など利用が広がっている一方、従来の技術では、人の声に近づけ、声のバリエーションを増やすためには、費用負担が大きくなってしまうことが課題になっていた。

　今回、音声合成にDNNを活用することで、少量の音声データから声のバリエーションを容易に増やせるとともに、従来の音声合成技術よりも自然な音声を実現できるようになった。このことから、NTTテクノクロスでは、これまで音声合成では置き換えが困難とされていたナレーションやガイダンス作成、電子書籍の読み上げなどへの用途拡大を見込めるとしている。

「FutureVoice Crayon」試聴体験サイトでは、5話者の合成音声による日本語の読み上げを試聴できる

レーザー照射で野菜の産地が分かる？　NTTの新技術にびっくり
NTTテクノクロス、ザファーム、エス・アイテックスの3社が、野菜のネット販売のプロジェクトを共同で展開。この中でNTTテクノクロスが、野菜の産地を「科学的」に証明する新技術を使っている。高速通信を実現するための技術をどう転用したのだろうか。
ドラレコの映像から危険運転をAIで検知、NTT Comなどが実証
NTTコミュニケーションズと日本カーソリューションズは、ディープラーニングを活用し、一時停止違反など、交通違反につながるヒヤリハットを検知する技術を共同開発した。
損保ジャパン日本興亜、事故受付や支払いの対応にAI導入
損害保険ジャパン日本興亜は、保険金サービスの品質向上と業務効率化を目指し、NTTコミュニケーションズの音声認識技術を活用した「AI音声認識システム」を導入する。
農業と水環境分野で高度なIT活用を　クボタとNTTが実証実験
NTTグループのICTサービスやAI関連技術「corevo」を活用し、実証実験を行う。
Google、音声合成技術のPhonetic Artsを買収
Googeが、セガなどのゲームメーカーに音声合成技術を提供しているPhonetic Artsを買収した。キーボードも画面も必要としない、音声での端末との会話実現を目指すとしている。
ディープラーニングの開発環境を無料で　ソニーが「Neural Network Console」を提供
ソニーが、ディープラーニング（深層学習）の統合開発ツール「Neural Network Console」を公開。GUIによる直感的な操作で、ディープラーニングのプログラムを開発できる。