Google、思考するAI「Gemini 2.5」発表──推論能力とコーディング能力が大幅向上

公開 2025年03月26日 07時04分

[ITmedia]

印刷する

　米Google傘下のGoogle DeepMindは3月25日（現地時間）、同社の“最もインテリジェントなAIモデル”である「Gemini 2.5」を発表した。

　最初のリリースとなる「Gemini 2.5 Pro Experimental」は、特に高度な推論能力とコーディング能力を発揮するとしている。ベンチマーク「LMArena」のリーダーボードでは第1位を獲得した。

Googleは、今後リリースするすべてのAIモデルに推論機能を組み込むとしている。

利用プランと提供時期

　Gemini 2.5 Pro Experimentalは、「Google AI Studio」で既に開発者向けに公開されている。また、「Gemini Advanced」のユーザーは、デスクトップおよびモバイルアプリのモデル選択ドロップダウンから利用できる。

Gemini Advancedで利用可能

　「Vertex AI」でも近日中に利用可能になる予定。スケーリングされた本番環境での利用に向けた料金体系は、数週間以内に発表される見込みだ。

Gemini 2.5の主な特徴

　Gemini 2.5は、応答する前に思考プロセスを経て推論する能力を持ち、これによりパフォーマンスと精度が向上している。

　Gemini 2.5 Proは、「GPQA」や「AIME 2025」などの数学・科学分野のベンチマークで優れた成績を収めている。また、人間の知識と推論の最前線を捉えるように設計されたデータセットである「Humanity’s Last Exam」でも、ツールを使用しないモデルの中で18.8％という高いスコアを記録している。

ベンチマーク比較（画像：Google DeepMind）

　Gemini 2.5はコーディング性能に重点を置いており、Gemini 2.0から大きく改善された。視覚的に魅力的なWebアプリや、エージェント型のコードアプリケーションの作成、コードの変換や編集に優れているという。Webサイトでは、単一のプロンプトから実行可能なコードを生成してゲームを作成する例も紹介されている。

　先代のGemini 2.0のネイティブなマルチモーダルを引き継いでおり、テキスト、オーディオ、画像、動画、コードリポジトリ全体など、多様な情報源からの複雑な問題を理解し、処理することができる。

　コンテキストウィンドウは100万トークン（近日中に200万トークンに拡張予定）で、膨大なデータセットを理解し、複雑な問題に対応できる。

　Geminiの最初の推論モデルは「Gemini 2.0 Flash Thinking」だったが、Gemini 2.5では、大幅に強化された基盤モデルと改善されたポストトレーニングを組み合わせることで、新たなレベルの性能を実現しているという。特に、コーディング性能が2.0から大きく向上しており、思考能力がすべてのモデルに直接組み込まれることで、より複雑な問題や、より高性能で文脈を意識したエージェントをサポートできるようになるとしている。

印刷する