Googleがついに最新AIモデル「Gemini 3」を発表した。推論能力や長期タスクの計画能力が向上したという。アプリの新機能も併せて発表された。われわれの日常業務はどう変わるのだろうか。
この記事は会員限定です。会員登録すると全てご覧いただけます。
Googleは2025年11月18日(現地時間)、最新のAIモデル「Gemini 3」の提供開始を発表した。発表時点から「Gemini」アプリや「Google AI Studio」「Vertex AI」などで利用可能になっている。
Gemini 3は「推論能力において最先端のモデル」とされ、ユーザーのプロンプトの細かなニュアンスを読み取ることが可能だという。Googleはその性能を「驚異的」とうたう。
Gemini 3ファミリーの第1弾として「Gemini 3 Pro」がプレビュー公開されている。同モデルの主要なベンチマークテストの結果は以下の通りだ。
Gemini 3 Proの応答は「簡潔かつ直接的」とされ、「決まり文句やお世辞ではなく、真の洞察を提供する」という。
併せて推論能力とマルチモーダル性能を向上させた「Gemini 3 Deep Think」モードも発表された。これは個人向けの最上位プラン「Google AI Ultra」加入者への展開が予定されており、まずセーフティーテスターへの提供から開始する。
Gemini 3 Proは長期的なタスクの実行能力も向上した。長期の計画に沿ってタスクを実行する能力を自動販売機ビジネスのシミュレーションを通して測るベンチマークテスト「Vending-Bench 2」では「Claude Sonnet 4.5」や「GPT-5.1」を抑えて1位となった。
Gemini 3の発表に併せて、Geminiアプリの新機能も発表された。
Geminiアプリは新たに「生成インターフェース」機能を搭載する。この内「ビジュアルレイアウト」機能を使うと、Geminiの応答に画像やユーザーの操作を促すボタンが配置される。「動的ビュー」機能を利用すれば、プロンプトでインタフェースをカスタマイズできる。
Geminiが「Gmail」や「Google カレンダー」を直接操作する「Gemini Agent」機能も発表された(現時点では米国のみの提供。日本での提供は未定)。エージェントがユーザーの指示に基づいて受信トレイの整理やフライトの予約をこなす機能だという。
今回のGemini 3の発表はユーザーにどのような影響をもたらすのか。
まず、日常の業務における利便性の向上が期待できる。Gemini 3 Proはユーザーのプロンプトから「ニュアンス」を読み取る性能が強化され、画面の内容の認識などマルチモーダルの性能も向上している。実際の使用感は今後検証する必要があるが、現時点の公開情報で分かる限りでは、資料作成や計画立案、開発などの多くの業務がこれまで以上に効率化されることが期待できそうだ。既に日本でもGeminiアプリなどで利用でき、ユーザーはすぐに性能向上の恩恵を受けられる。
今後普及が期待されるAIエージェントの性能向上にもつながりそうだ。AIが人間と同じように働けるようになるためには、長期のタスクの実行能力が不可欠だ。Gemini 3は長期にわたるタスクの計画や、ツールの使用における能力が向上している。「Gemini Enterprise」やVertex AIで開発したAIエージェントの頭脳として利用すれば、より高度なタスクを効率化できるかもしれない。
「GPT-5」発表当初、応答がドライだったため「GPT-4o」ロスが広がったのは記憶に新しい。Gemini 3は「簡潔かつ直接的」をアピールしており、あえて業務利用に特化した印象だ。このモデルが“AI従業員”として企業で受け入れられるか、注目したい。
Microsoft 365 Copilot、ついに“エージェント化” ExcelやWordで複雑なタスクを段階的に処理する新機能
“AIエージェントの次”のトレンドは何か Gartnerが描く未来志向型インフラのハイプ・サイクル
生成AI、進化の鍵を握る「長期思考」 Sakana AIが挑む“人間のように試行錯誤するAI”への道筋Copyright © ITmedia, Inc. All Rights Reserved.