東芝デジタルソリューションズは8月16日、人が喋った音声の抑揚やテンポをAIで分析し、音声合成に自動で反映するPCソフト「Voice Track Maker」を発売した。従来の音声合成ツールの感情表現機能では再現が難しかった演技表現ができるという。Window 10向けで、価格は3万3000円(税込、以下同)から。一部機能の制限がある体験版は無料。
音声合成に喋らせたい文章をテキストで入力し、それを人が読み上げると、AIが抑揚やテンポを分析してまねする「韻律射影機能」を搭載。ソフトの使用者が手本になる演技を教えられるため、イメージした表現を直感的に再現できるという。
ゲームや映像などのクリエイターの利用を想定。性別・年齢が異なる声辞書(ボイスデータ)の充実度別に「Pro Light」「Pro」の2バージョンを展開する。有料版では別途ライセンス契約すれば商用利用もできる。
同社によると、“使ってみた動画”など動画サイトへの投稿を歓迎するという。「まだ粗削りな技術だが、皆さまの好奇心の力で新しい音声表現を創作してみてほしい」
「あなたに似た声」、なんのために?
無調整でもほぼ人間 AI歌声合成ソフト「CeVIO AI」の実力
高い、使いにくい、読みにくい──音声合成研究者を悩ませるハードルを解決する“台本”、明治大学らが発表
19歳の学生社長が音声合成サービス開発、3日でユーザー5万人 AIの勉強はWeb授業とインターンで
商用OK、無料のAI音声合成「CoeFont Studio」 ゲーム実況・プレゼンなどの利用見込むCopyright © ITmedia, Inc. All Rights Reserved.
Special
PR