富士通研究所は5月27日、アニメキャラクターのような特徴的なしゃべり方も再現できるという音声合成技術を開発したと発表した。
人間の肉声からイントネーション、リズム、声の高さなどの「韻律情報」を高精度に抽出してデータベース化する技術を新開発した。富士通グループの音声合成ミドルウェア「FineSpeech」に同データベースを取り込むことで、人が話しているような自然で表現力豊かな音声を合成できるという。従来のFineSpeechの音声波形データベースとも組み合わせられるため、さまざまな種類の声を合成できるとしている。
アニメキャラクターのような特徴的なしゃべり方も簡単に再現できるほか、方言の再現も可能。親しみのある音声応答を作成できるとしている。韻律情報の追加登録や編集が簡単で、喋り方や声の高さなどを簡単に変えることができるという。
電話の自動応答を自然な音声にしたり、方言でその土地の観光情報を案内する、テーマパークの園内案内をキャラクター風の音声にする、などといった使い方が可能だ。今年中の製品化を目指す。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR