藤子・F・不二雄さんの漫画「パーマン」に「コピーロボット」というアイテムがあったのを覚えているだろうか。鼻のボタンを押すと、自分そっくりの姿に変化して、自分の身代わりになってくれる人形だ。
あのアイテムに近いようなことが歌声合成業界では可能になっている。自分の歌い方をそっくりに再現して人間のように歌う“AIシンガー”がかなり普及してきているのだ。
最近では、バーチャルYouTuberの「花譜」さんが「CeVIO AI」というブランドのAIシンガーになり、ヒット曲もたくさんリリースされている。8月8日にはVTuberのキズナアイさんの歌声を再現したAI「#kzn」が先行販売された。
そして、CeVIO AIの音声合成エンジンを開発しているテクノスピーチが、9月1日に新たな試みを始める。AIシンガーのサブスクリプションサービス提供だ。
今回は同社の大浦圭一郎代表とエンタメ事業部の塚田恵佑さん、音声合成研究の権威である徳田恵一教授(名古屋工業大学)に、AIシンガーのビジネスモデルについて聞いた。
これはAIの歌声で“印税”を得る仕組みともいえそうだ。
テクノスピーチは2013年から、ソニー・ミュージックエンタテインメントなど4社と共同で「CeVIOプロジェクト」を進めている会社だ。これまで「CeVIO」ブランドで、機械学習の技術を活用し人間の歌声を再現するソフトウェアの開発・販売に携わってきた。
同社は22年6月、新ブランド「VoiSona」を発表した。CeVIOブランドとは異なる同社単独のプロジェクトで、使っている要素技術はほぼ同じだが、別のビジネスモデルを採用している。それがサブスクリプションだ。
VoiSonaは楽譜を入力すると、AIが人間らしい歌声を自動生成するソフトウェア。歌声を加工する編集ソフト(エディター)は無償で提供し、人間の歌声を学習したAIモデルを月額880円、年額6600円で提供する。
これまでのCeVIOシリーズは、エディターが5000〜8000円程度、音源が4000円から1万円程度だった。サブスクリプション形式の採用で、ユーザーから見れば導入しやすくなったといえる。
しかし、サブスクリプション形式を採用したのは学習元となる歌手や声優といった演者への収益の還元のためだという。
「今まで音声合成技術を研究する中で、アナウンサーや声優の仕事を奪うんじゃないか、詐欺に悪用されるんじゃないかといったネガティブな話も伺ってきました。演者さんと共存するにはどうすればいいのかというのは大学時代からの課題でした」(大浦代表)
AIを活用した音声合成技術は品質向上を続け、特に話し声の再現では人間と聞き分けられないレベルのものも登場している。そうなると、ユーザーからすれば一度だけ1万円前後でソフトウェアを買ってしまえば、声優に仕事を頼まなくて済むような状況になってしまう。
「そうすると、いつか本当にAIが演者さんの敵になってしまう。そこで、新しいビジネスモデルとして、サブスクリプションによって定常的に収益を上げ、それを演者さんに還元する仕組みを作りました」(大浦代表)
音源の提供で得た収益の一部を演者(の所属事務所など)にフィードバックする。利用されればされるほど演者に収入が入る印税のような仕組みだ。
実際は、CeVIOブランドで採用している買い切り型でも、契約次第では演者への還元もできる。しかし、ソフトウェアの性能が頭打ちになった場合や、ユーザーに普及しきった場合に収益が出せなくなる恐れもあるという。サブスクリプション形式の採用で定常的な収益を生み出せる。
演者にとっては、自分が歌わなくても副収入としてAIシンガーという“コピーロボット”が働いた分の収益を得られる仕組みといえる。
「メインの収益にならなくても副業的な収入になるようなプラットフォームにしたいですね」(大浦代表)
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR