メディア
ITmedia AI+ >

Google、Gemini 2.5やVeo 2の正式版、Live APIプレビューなど、開発者向け新機能多数

» 2025年04月10日 11時10分 公開
[ITmedia]

 米Googleは4月9日(現地時間)、米ネバダ州ラスベガスで開催の年次イベント「Google Cloud Next 2025」で、開発者向けの複数のGoogle AIのアップデートと機能を発表した。「Gemini 2.5」の最新モデル、リアルタイムインタラクションを可能にする「Live API」の進化、動画生成ツール「Veo 2」の正式リリースなどだ。

 gemini

より強力になった思考モデル「Gemini 2.5」のProとFlash

 思考するAIモデルの「Gemini 2.5 Pro」は、既に一般ユーザー向けに「Experimental」として提供しているが、そのパブリックプレビューをGemini API(Google AI Studio内)およびVertex AIで利用可能にした。

 また、低遅延とコスト効率を維持しつつ思考能力を取り入れている「Gemini 2.5 Flash」を、Vertex AIおよびGoogle AI Studioで近日公開予定だ。Gemini 2.5 Flashは、シンプルなリクエストに対しては処理時間を自動調整する「thinking budget」機能や、速度、精度、コストのバランスを調整できる柔軟な制御機能も備えており、顧客サービスやリアルタイム情報処理のような大量かつコスト重視のシナリオに最適という。

 Vertex AIでは、Geminiの利用を最適化するための新機能として、「supervised tuning」(独自のデータによる特化)と「context caching」(効率的な長文脈処理)が近日中に提供予定。さらに、品質とコストのバランスに基づいて最適な応答を自動生成する「Vertex AI Model Optimizer」が実験的に導入され、特定のリージョンでの処理を必要としないワークロード向けには、複数のリージョンにわたるキャパシティ対応ルーティングを提供する「Vertex AI Global Endpoint」も利用可能になる見込みだ。

動画生成ツール「Veo 2」の正式リリース

 高品質な動画生成AIモデル「Veo 2」がGemini APIで正式に利用可能になった。Veo 2は、簡単な指示から複雑な指示まで理解し、現実世界の物理現象を幅広いビジュアルスタイルでシミュレートするAIモデル。テキストから動画を生成する「Text-to-Video」(t2v)と、画像とテキストによるガイドから動画を生成する「Image-to-Video」(i2v)の両方に対応しており、アプリ内で直接高品質な動画を生成できる。

 veo Veo 2の補完機能で、2つのフレーム間の画像の間の動きを生成

 解像度720pで24フレーム/秒の動画を、最長8秒まで生成できる。利用価格は、動画1秒当たり35セント。

リアルタイムインタラクションを加速する「Live API for Gemini Models」

 昨年」12月にテスト版として発表された、動的でリアルタイムなインタラクションを実現するモデル「Live API for Gemini」がプレビュー段階となった。Live APIは、ストリーミングオーディオ、動画、テキストを低遅延で処理するアプリケーションやエージェントの構築を可能にし、人間のような自然な会話、ライブミーティングへの参加、リアルタイムな状況の監視などに最適という。

 プレビュー版での機能強化により、Live APIはGemini 2.5 Proなどの高性能モデルを高度なインタラクティブアプリケーションで活用するための基盤を強固なものにするとしている。

Copyright © ITmedia, Inc. All Rights Reserved.