米Googleは5月20日(現地時間)、同社の年次カンファレンス「Google I/O 2025」にて、動画生成AI「Veo 3」と画像生成AI「Imagen 4」を発表した。
Veo 3では、新たに音声付き動画の生成が可能になった。街中の交通音や公園の鳥のさえずりなどの効果音の他、キャラクター同士の対話などを生成できる。また、前モデル「Veo 2」よりも動画の品質が向上し、現実世界の物理法則や正確なリップシンクなどをより優れた形で出力できるようになった。
まずは、月額249.99ドルのサブスクリプションサービス「Google AI Ultra」の米国ユーザーと、 「Vertex AI」のエンタープライズ向けユーザーに提供する。
またVeo 2にも、動画内のオブジェクトを追加/削除できる機能や、アウトペインティングによる画像拡張機能などを実装。映画生成AIツール「Flow」を通せば「参照画像による動画生成」「カメラコントロール」も利用できるようにする。これらの機能は、今後数週間宙に「Vertex AI API」で提供する予定だ。
Imagen 4は、画像生成のスピードと精度が向上。さまざまなアスペクト比で最大2K解像度の画像を生成できる。また、文字表現やタイポグラフィの生成能力も大幅に上がっており、グリーティングカードやポスター、漫画なども簡単作れるとしている。
また近日中に、前モデル「Imagen 3」と比べて、最大10倍の処理速度を実現する「Imagen 4の高速版」も公開する予定。
Imagen 4は、AIアプリ「Gemini」や画像生成AI「Whisk」、Vertex AIなどの他、WorkspaceのGoogleスライドやVids、ドキュメントなどで同日から利用可能だ。
Googleが“月額249.99ドル”の高額サブスク発表 「Gemini」「NotebookLM」など使い放題 まずは米国のみで
Google検索に「AIモード」 質問を解釈してAIが回答、高度なレポートも作成 「エージェント機能」でチケット予約も
「NotebookLM」に動画生成機能 実装時期は「かなり近いうちに」 まずは英語のみ対応
Googleが軽量AIモデル「Gemma 3n」を発表 スマホ上で高性能マルチモーダルAI Claude 3.7 Sonnetに肉薄
「Gemini 2.5 Pro」のさらに高度な思考モード「Deep Think」 性能は「o3」「o4-mini」超えCopyright © ITmedia, Inc. All Rights Reserved.