米Googleは12月11日(現地時間)、次世代AIモデル「Gemini 2.0」を発表した。画像や音声の出力、ツールのネイティブ使用などが可能だ。
まずは、開発者や試験的に使う人に向け、「Gemini 2.0 Flash」として提供する。ベンチマークでは、応答速度は「Gemini 1.5 Flash」と同等でありながら、「Gemini 1.5 Pro」を超えるパフォーマンスを記録した。
テキストを含む生成画像や、操作可能なテキスト読み上げ(TTS)による多言語音声などをサポートし、Google 検索、コード実行、サードパーティのユーザー定義関数などをネイティブに呼び出せる。
Geminiユーザーはこれらが可能になったGemini 2.0 Flashを利用できる。
加えて、高度な推論と長文脈や前後関係を理解する能力を持ち、複雑なトピックを探索してユーザーの代わりにレポートを作成する「Deep Research」という新機能も提供する。対象はサブスクプランサービス「Gemini Advanced」ユーザーだ。
Google「メッセージ」アプリでGeminiと日本語で会話可能に
Googleが「Gemini 1.5 Pro」をアップデート、軽量版「Gemini 1.5 Flash」もリリース
さよなら「Googleアシスタント」──Pixel 9では「Gemini」がデフォルトに
Google フォト、Geminiを活用した「Ask Photos」機能 質問して写真を検索
iOS版「Geminiアプリ」リリース iPhoneでも日本語での音声会話が可能にCopyright © ITmedia, Inc. All Rights Reserved.