日本語の“アニメ声”に強い? 中国から新たな動画生成AIモデル「Vidu Q3」登場
中国のAIスタートアップShengShu Technologyは2月2日までに、動画生成AIの新モデル「Vidu Q3」を発表した。APIに加え、Webサービスとしても提供しており、テキストや画像を基に日本語・英語・中国語の音声付き動画を最大16秒まで生成可能。発話者の口の動きを音声と合わせるリップシンク機能も備える。すでに日本のXユーザー間ではアニメーションの出力や日本語読み上げのクオリティーが話題だ。
Webサービスから利用する場合、出力できる動画の解像度は1080p。アスペクト比は16:9、9:16、1:1、4:3、3:4から選べる。ShengShu Technologyによれば、リップシンクに加えてパン、チルト、ドリーといったカメラワークやカットの切り替えといった指定にも追従しやすい点も特徴という。Vidu Q3によるものかは不明だが、一度生成した動画の解像度を2Kもしくは4Kに上げるアップスケール機能も備える。
API経由の場合は540pや720pなど解像度を抑えての出力も可能。料金は解像度や混雑状況によって異なり、1080pの場合は1秒の生成ごとに0.16ドル。混雑していない場合は半額となる。
実際にWebサービス上から何度か利用してみたところ、確かに日本語読み上げの精度は高く、特に“アニメ声”のクオリティーは高い。リップシンクも違和感が少なく、カメラワークやカット変更も米OpenAIの「Sora 2」などに比べればプロンプトに追従する印象を受けた。ただし生成には時間がかかり、8~10秒程度の動画でも出力に数分~10分かかることもあった。
経営×IT×事業のコラボで導くデジタル基点のビジネス変革
経営層とIT部門、そして現場業務を担う事業部門の視点を合わせ、デジタル戦略の解像度を高めるためにはどうすればいいのでしょうか。本イベントでは、ビジネストレンドを整理しながら、今知りたい経営×IT×事業のコラボレーションで全社の変革を進めるためのヒントをお届けします。
- イベント「ITmedia デジタル戦略EXPO 2026 冬」
- 2026年1月27日(火)から2月25日(水)まで
- こちらから視聴登録できます
- 主催:ITmedia ビジネスオンライン、ITmedia NEWS
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
Google、“動画版Nano Banana”こと「Gemini Omni」公開 会話で映像を生成・編集
-
2
Appleが5年がかりで開発したセキュリティ対策を5日で突破 「Mythos」が見せつけた脆弱性攻撃の威力
-
3
日立、Anthropicと提携 グループ29万人に「Claude」などAI導入 社会インフラ分野にも展開へ
-
4
生成AIで3Dモデルを自動作成 専門スキル不要でテキストや画像から3D化
-
5
GoogleのAIサブスク、最上位プランを値下げ 月額1万4500円の新プランも
-
6
人間 vs. 人型ロボ、より多く作業をこなせるのは? 生配信で対決した結果…… 米企業
-
7
「最新のAI創薬ラボ」なのに会議室みたい!? 製薬大手がラブコール送る“異色のAI企業”による新拠点とは
-
8
【やさしいデータ分析】ベイズ統計入門 ~ 古典的な統計との違いと使い分け
-
9
「ポンコツ」と呼ばれたM365 Copilotの逆転劇、GPT-5が転換点 活用の秘訣は“脱・プロンプト職人”
-
10
Google「Gemini」に個人向けAIエージェント 質問に答えるだけでなく「作業を代替」 まずは米国で
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR