速報

Google、AIモデル「Gemini 3」を全ユーザーに提供開始

Googleは、AIモデル「Gemini 3」をGeminiアプリの全ユーザーに提供開始した。有料プランではより高度なGemini 3 Proが利用可能。最先端の推論とネイティブマルチモーダルを特徴とし、質問内容に応じて表示を工夫する新機能「生成インターフェース」の実験提供も順次開始する。

 米Googleは11月18日(現地時間)、「Gemini 3」のリリースを発表した。同日より、Geminiアプリの全ユーザーに「Gemini 3」を提供する。無料でも使えるが、有料プラン(Google AI Plus、Pro、Ultra)で「より高いレベルを目指せる」としている。また、Google AI ProおよびUltraプランユーザーは、Google検索の「AIモード」もGemini 3ベースになる。


 GoogleはGemini 3を「最先端の推論を適用した史上最高のバイブコーディングモデル」と紹介。また、「ネイティブマルチモーダル」で、テキスト、画像、音声、動画にわたる推論能力も、これまで以上に高度になっているという。

 例えばモバイルアプリでは、スポーツのプレイ中の動画を撮影してアップロードし、フォーム改善のアドバイスをもらったり、欠席した講義の文字起こしをスムーズにできるとしている。

advertisement

 GeminiアプリでGemini 3 Proを試すには、「モデルを選択」で「思考モード」を選択する(本稿執筆時点で筆者のGeminiアプリにはまだ「思考モード」が表示されない)。


Google AI ProプランのWebアプリでは選択可能になっている

 アプリには、作成した画像やレポートを見つけるための「作成したもの」フォルダが追加される。また、日本での提供は未定だが、米国ではアプリ内で500億点以上の商品情報を直接表示できるようになった。

 新機能「生成インターフェース」は、ユーザーの質問の内容に合わせて、単なるテキストでの答えだけでなく、答え方を工夫するというものだ。まずは「ビジュアルレイアウト」と「動的ビュー」の実験の提供を「順次開始」する。

 「ビジュアルレイアウト」は、回答をテキストだけでなく、画像や操作ボタンを組み合わせたWebサイトのようなレイアウトで表示する。例えば旅行の計画を立てるよう頼むと、観光地の写真、スケジュールのタイムライン、地図、予約ボタンなどが配置された画面が表示され、その上で情報の追加や削除が直感的に行える。

 「動的ビュー」は、AIがその場でコードを書いて、専用アプリのような画面を構築する。「○○の歴史について教えて」と尋ねると、テキストの説明ではなく、タップしたりスクロールして時代をさかのぼったり詳細を表示できる図鑑アプリのような画面が生成される。


「ゴッホの各作品の背景を添えたギャラリーを作成して」の回答(画像:Googleの動画より)

Copyright © ITmedia, Inc. All Rights Reserved.