米Google傘下のGoogle DeepMindは3月25日(現地時間)、同社の“最もインテリジェントなAIモデル”である「Gemini 2.5」を発表した。
最初のリリースとなる「Gemini 2.5 Pro Experimental」は、特に高度な推論能力とコーディング能力を発揮するとしている。ベンチマーク「LMArena」のリーダーボードでは第1位を獲得した。
Googleは、今後リリースするすべてのAIモデルに推論機能を組み込むとしている。
Gemini 2.5 Pro Experimentalは、「Google AI Studio」で既に開発者向けに公開されている。また、「Gemini Advanced」のユーザーは、デスクトップおよびモバイルアプリのモデル選択ドロップダウンから利用できる。
「Vertex AI」でも近日中に利用可能になる予定。スケーリングされた本番環境での利用に向けた料金体系は、数週間以内に発表される見込みだ。
Gemini 2.5は、応答する前に思考プロセスを経て推論する能力を持ち、これによりパフォーマンスと精度が向上している。
Gemini 2.5 Proは、「GPQA」や「AIME 2025」などの数学・科学分野のベンチマークで優れた成績を収めている。また、人間の知識と推論の最前線を捉えるように設計されたデータセットである「Humanity’s Last Exam」でも、ツールを使用しないモデルの中で18.8%という高いスコアを記録している。
Gemini 2.5はコーディング性能に重点を置いており、Gemini 2.0から大きく改善された。視覚的に魅力的なWebアプリや、エージェント型のコードアプリケーションの作成、コードの変換や編集に優れているという。Webサイトでは、単一のプロンプトから実行可能なコードを生成してゲームを作成する例も紹介されている。
先代のGemini 2.0のネイティブなマルチモーダルを引き継いでおり、テキスト、オーディオ、画像、動画、コードリポジトリ全体など、多様な情報源からの複雑な問題を理解し、処理することができる。
コンテキストウィンドウは100万トークン(近日中に200万トークンに拡張予定)で、膨大なデータセットを理解し、複雑な問題に対応できる。
Geminiの最初の推論モデルは「Gemini 2.0 Flash Thinking」だったが、Gemini 2.5では、大幅に強化された基盤モデルと改善されたポストトレーニングを組み合わせることで、新たなレベルの性能を実現しているという。特に、コーディング性能が2.0から大きく向上しており、思考能力がすべてのモデルに直接組み込まれることで、より複雑な問題や、より高性能で文脈を意識したエージェントをサポートできるようになるとしている。
Google、「Gemini」アップデート パーソナライズ機能など多数
Google、「Gemini Code Assist」を無料公開 コード補完は月当たり18万回
Google、Geminiアプリで推論AI「Gemini 2.0 Flash」の提供開始
Google、AIモデル「Gemini 2.0」発表 Advancedで利用可能にCopyright © ITmedia, Inc. All Rights Reserved.