ヤマー そういえば、今回の2つのプロダクトは技術的に何か新しい要素ってあるんですか?
マツ 技術的にはどちらもAIを使っています。そのために非常に人間に近い、リアルな表現が可能になっています。
ヤマー 声を聴いたらリアルすぎてたまげました。
マツ 特に、イントネーションの自然さは格段に上がった感じがありますね。
ヤマー これまでAIはあまり使われていなかったんですか?
マツ CeVIOの最初のバージョンは隠れマルコフ(HMM)という、確率モデルを使って推定する技術を使っていたんですが、それを2020年の「CeVIO AI」からCNNやRNNという機械学習技術に置き換えていった。
ヤマー ベースごと作り替えたんですね。
マツ VOICEPEAKとSynthesizer Vは最初からAI技術を使っていた、新しい世代のものですが、技術的にはどちらが優れている、ということはもう言えないレベルではないかなと。
ヤマー なるほど。VOICEPEAKの出来を見ると、本当にナレーターの仕事減るんじゃないかと思いまして。1万6000円で商用利用可能、しかも7つの声があるじゃないですか。
マツ それで十分という場合にはもう、それでいいですよね。まあ、そこがこれまでの大きな課題だったんです。音声合成の中の人だったり、技術の権利を守るために、これまでは商用利用が禁じられていたり、高額なライセンス料金が別途必要だったり、使えてもあえて音質を下げたりしていたんです。
ヤマー あくまで個人ユースに限るってことですかね。
マツ そうですね。それが、今回はその制限が取り払われた。VOICEPEAKは、1万6000円で購入しさえすれば、その音源に限っては無制限。
ヤマー 制限撤廃、ユーザーとしてはありがたいですが、本職の声優・ナレーター側からの反応が気になるところですね。それこそ、制限されていたわけですし。
マツ その問題は、最初のVOICEROIDが出た2009年の時点で指摘されてましたが、その後は自分たちの声が売り物になるということで、徐々に広まってきました。だからといって、世の中の全ての声がこの7人で全てまかなえるわけではなく、サードパーティーで、VOICEPEAKに提供すると明言しているところもあるので、そこは有償で販売するのではないでしょうか。その場合には商用ライセンスについては別契約になる可能性もあるかもですね。ちなみにこの7人は、全員が声優事務所のぷろだくしょんバオバブに所属しているんですね。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR