AI音声合成サービス「DMMボイス」盛況 公開4日で700万文字の音声を生成 アプリやAPIの提供も計画
1日にβ版を公開したAI音声生成サービス「DMMボイス」が、公開から4日間で概算700万文字の音声を生成するなどクリエイターの注目を集めている。
今月1日にβ版を公開したAI音声生成サービス「DMMボイス」が、公開から4日間で概算700万文字の音声を生成するなどクリエイターの注目を集めている。DMMグループでAI関連サービスを開発するAlgomatic GlobalカンパニーCEOの原田祐二さん「一度に70文字までしか生成できない制限を入れているのに驚異的な数字」と自身のnoteで紹介した。
β版では、20人のキャラクターから1人を選び、70文字までのテキストを入力すると音声を合成できる。自然な話し方になるのが特長で、再生スピードの調整も可能。現在は登録不要、無料で提供している。
原田さんは、DMMボイスを使った作品を公開しているX上の投稿を紹介しながら「実際DMMボイスを触っているとわかるのですが、すごく楽しいんですよね。声がリアル過ぎて本格的な動画を簡単に作れるので、作り始めると止まらない癖になるサービスです」という。
今後の計画についても触れた。現在20種類の声(キャラクター)は、年内に少なくとも100種類まで増やす予定で、「順次新キャラクターもどんどん投下」するという。ASMRや関西弁に対応するキャラクターも用意する。
また「感情パラメーター設定」の実装や、簡易ではあるもののネイティブアプリの提供も年内を予定している。アプリは文字数の制限を外した有償プランを基本としながら、フリーのプランも残す考え。「それぞれのプランの上限文字数の範囲でAPIも使えるようにする」という。
一方、ユーザーが登録した声で音声モデルを作成する仕組みも用意する考え。ただし作成にはコストが掛かるため審査制とし、音声モデルになったユーザーには生成された文字量に応じて収益を還元するという。原田さんは、具体的な金額は公表しないものの、「初期フェーズは大きく還元していきたい」としている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
かなり自然! DMM、AI音声合成サービスβ公開 「ドラマチックなアフレコからナレーションまで」
さまざまなキャラクターの声でテキストを音声合成できるAI音声合成サービスがDMMグループから。
JOYSOUNDの“配信者向け”カラオケ、Steamでリリース 配信活動が「趣味」か「仕事」かで料金変化 無料でも「ソーラン節」歌える
通信カラオケ「JOYSOUND」を提供するエクシングは、配信者向けSteamアプリ「カラオケJOYSOUND for STREAMER」の提供を始めた。
ゴジラを倒した「オキシジェン・デストロイヤー」、実寸大の“ぬいぐるみ”に
BANDAI SPIRITSは3日、映画「ゴジラ」に架空の兵器として登場する「オキシジェン・デストロイヤー」のぬいぐるみを発表した。
「面白いんだけど……」 βテストが大盛況「モンハンワイルズ」を遊んだマンガ家が感じた魅力と“とっつきにくさ”
25年2月発売予定の新作ゲーム「モンスターハンターワイルズ」が11月4日までオープンβテストを実施しています。グラフィックがきれいで「こんがり肉」も美味しそう。ただハードルの高さも感じてしまいました。
キヤノン「EOS R1」詳細レビュー プロ向けフラグシップ機は“さすがの性能”だった
キヤノンのフラッグシップ機「EOS R1」。待望のプロ向けカメラである。発売前の機材をいち早く使わせてもらったのでここでレビューしたい。

