Google、思考するAI「Gemini 2.5」発表──推論能力とコーディング能力が大幅向上
Googleは、AI推論モデル「Gemini 2.5」を発表した。最初のリリースの「Gemini 2.5 Pro Experimental」はマルチモーダルな推論モデルで、Gemini Advancedなどで利用可能だ。
米Google傘下のGoogle DeepMindは3月25日(現地時間)、同社の“最もインテリジェントなAIモデル”である「Gemini 2.5」を発表した。
最初のリリースとなる「Gemini 2.5 Pro Experimental」は、特に高度な推論能力とコーディング能力を発揮するとしている。ベンチマーク「LMArena」のリーダーボードでは第1位を獲得した。
Googleは、今後リリースするすべてのAIモデルに推論機能を組み込むとしている。
利用プランと提供時期
Gemini 2.5 Pro Experimentalは、「Google AI Studio」で既に開発者向けに公開されている。また、「Gemini Advanced」のユーザーは、デスクトップおよびモバイルアプリのモデル選択ドロップダウンから利用できる。
「Vertex AI」でも近日中に利用可能になる予定。スケーリングされた本番環境での利用に向けた料金体系は、数週間以内に発表される見込みだ。
Gemini 2.5の主な特徴
Gemini 2.5は、応答する前に思考プロセスを経て推論する能力を持ち、これによりパフォーマンスと精度が向上している。
Gemini 2.5 Proは、「GPQA」や「AIME 2025」などの数学・科学分野のベンチマークで優れた成績を収めている。また、人間の知識と推論の最前線を捉えるように設計されたデータセットである「Humanity’s Last Exam」でも、ツールを使用しないモデルの中で18.8%という高いスコアを記録している。
Gemini 2.5はコーディング性能に重点を置いており、Gemini 2.0から大きく改善された。視覚的に魅力的なWebアプリや、エージェント型のコードアプリケーションの作成、コードの変換や編集に優れているという。Webサイトでは、単一のプロンプトから実行可能なコードを生成してゲームを作成する例も紹介されている。
先代のGemini 2.0のネイティブなマルチモーダルを引き継いでおり、テキスト、オーディオ、画像、動画、コードリポジトリ全体など、多様な情報源からの複雑な問題を理解し、処理することができる。
コンテキストウィンドウは100万トークン(近日中に200万トークンに拡張予定)で、膨大なデータセットを理解し、複雑な問題に対応できる。
Geminiの最初の推論モデルは「Gemini 2.0 Flash Thinking」だったが、Gemini 2.5では、大幅に強化された基盤モデルと改善されたポストトレーニングを組み合わせることで、新たなレベルの性能を実現しているという。特に、コーディング性能が2.0から大きく向上しており、思考能力がすべてのモデルに直接組み込まれることで、より複雑な問題や、より高性能で文脈を意識したエージェントをサポートできるようになるとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Google、「Gemini」アップデート パーソナライズ機能など多数
Googleは、AIチャットbot「Gemini」の大幅アップデートを発表した。検索履歴と接続する「Personalization」などの新機能や、無料ユーザーが利用できる機能の拡大などを含む。
Google、「Gemini Code Assist」を無料公開 コード補完は月当たり18万回
Googleは、コーディング支援AIサービス「Gemini Code Assist」の無料版を公開した。コード補完は月当たり18万回まで可能で、競合するMicrosoftの無料版「GitHub Copilot」の90倍だ。
Google、Geminiアプリで推論AI「Gemini 2.0 Flash」の提供開始
Googleは、GeminiアプリのAIモデルとして「Gemini 2.0 Flash」の提供を開始した。無料版でも利用可能なこのモデルは、推論能力を含む多様な機能を持つLLMだ。
Google、AIモデル「Gemini 2.0」発表 Advancedで利用可能に
Googleは、次世代AIモデル「Gemini 2.0」と、それに関連する多数の取り組みを発表した。一部の機能は有料プランで既に体験可能だ。マルチモーダルエージェントProject Astraの進捗も紹介している。


