Google I/O 2025
ついに「音声付き動画」の生成が可能に Google、動画生成AIの最新モデル「Veo 3」発表
米Googleは5月20日(現地時間)、同社の年次カンファレンス「Google I/O 2025」にて、動画生成AI「Veo 3」と画像生成AI「Imagen 4」を発表した。
Veo 3では、新たに音声付き動画の生成が可能になった。街中の交通音や公園の鳥のさえずりなどの効果音の他、キャラクター同士の対話などを生成できる。また、前モデル「Veo 2」よりも動画の品質が向上し、現実世界の物理法則や正確なリップシンクなどをより優れた形で出力できるようになった。
まずは、月額249.99ドルのサブスクリプションサービス「Google AI Ultra」の米国ユーザーと、 「Vertex AI」のエンタープライズ向けユーザーに提供する。
またVeo 2にも、動画内のオブジェクトを追加/削除できる機能や、アウトペインティングによる画像拡張機能などを実装。映画生成AIツール「Flow」を通せば「参照画像による動画生成」「カメラコントロール」も利用できるようにする。これらの機能は、今後数週間宙に「Vertex AI API」で提供する予定だ。
Imagen 4は最大2K解像度の画像を生成可能に
Imagen 4は、画像生成のスピードと精度が向上。さまざまなアスペクト比で最大2K解像度の画像を生成できる。また、文字表現やタイポグラフィの生成能力も大幅に上がっており、グリーティングカードやポスター、漫画なども簡単作れるとしている。
また近日中に、前モデル「Imagen 3」と比べて、最大10倍の処理速度を実現する「Imagen 4の高速版」も公開する予定。
Imagen 4は、AIアプリ「Gemini」や画像生成AI「Whisk」、Vertex AIなどの他、WorkspaceのGoogleスライドやVids、ドキュメントなどで同日から利用可能だ。
Copyright © ITmedia, Inc. All Rights Reserved.
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
「ChatGPTのコネクタでつながるし、M365 Copilotいらなくない?」→有識者3人に聞いてみた 知らないと損するコンテキスト管理「Work IQ」の仕組み
-
2
中国が人型ロボット開発競争をリードする「納得の理由」 日本に残された逆転シナリオは?
-
3
生成AI台頭、経営コンサルの倒産・廃業が過去最多ペース “補助金頼み”限界に
-
4
JASRAC、「AI作曲・人間作詞」の曲は管理します――「人間の創作的寄与の有無」で線引き
-
5
Anthropic、最上位「ミュトス」級モデルを一般提供 悪用防ぐ保護機能を備えた「Claude Fable 5」
-
6
Google、拡散型テキスト生成モデル「DiffusionGemma」公開 ローカルGPUで毎秒1000トークン超
-
7
AnthropicとNEC、金融8社とAI活用で連携 三井住友FG、大和証券など
-
8
「ポンコツ」と呼ばれたM365 Copilotの逆転劇、GPT-5が転換点 活用の秘訣は“脱・プロンプト職人”
-
9
AnthropicのアモデイCEO、フロンティアAIに「航空機並みの安全審査」求めるエッセイと政策提言を公開
-
10
公式がワンコーラス公開→AIで無断フルコーラス化、拡散 大原ゆい子氏「無職転生III」OPが被害
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR