音声合成技術の開発を手掛けるテクノスピーチ(名古屋市)は7月22日、ディープラーニング技術を活用して人間らしい音声を合成するソフト「CeVIO AI」を年内に発売すると発表した。
ディープニューラルネットワーク(DNN)や畳み込みニューラルネットワーク(CNN)といった技術を採用。実在する歌手などの声を事前に学習したAIが、入力されたせりふや楽譜データを基に本人らしい声質や歌い方を自動でシミュレーションして人間らしい話し声や歌声を合成する。
テクノスピーチと歌声合成向け音源の開発ベンダー各社は、CeVIO AIで使える話し声合成用音源「ONE」「IA」や、歌声合成用音源「結月ゆかり」「v flower」といった製品を21年春までをめどに順次発売する予定。価格はいずれも未定。
AI技術を活用した歌声合成は2020年に入ってから、研究領域だけでなく一般のクリエイターでも使えるソフトとして登場している。2月には無料の歌声合成ソフト「NEUTRINO」が登場し、ニコニコ動画などで注目を浴びた。
中国では7月以降、米Microsoftが中国語のAI歌声合成ソフト「StudioVoICE」の正式公開を控えている。
テクノスピーチはこれまで、統計的手法の一種であるHMM(隠れマルコフモデル)を活用した音声合成ソフト「CeVIO」を販売してきた。18年12月にはDNNなどを活用して合成した歌声を公開。その後も合成速度の高速化などを続けてきた。現在は製品の発売に向けて開発や関係各社との調整を行っているという。
同社は引き続き専用音源などの開発を行うベンダー企業を募集しており、今後も製品化に向けた開発が活発化するとみられる。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR