Google、思考するAI「Gemini 2.5」発表──推論能力とコーディング能力が大幅向上
米Google傘下のGoogle DeepMindは3月25日(現地時間)、同社の“最もインテリジェントなAIモデル”である「Gemini 2.5」を発表した。
最初のリリースとなる「Gemini 2.5 Pro Experimental」は、特に高度な推論能力とコーディング能力を発揮するとしている。ベンチマーク「LMArena」のリーダーボードでは第1位を獲得した。
Googleは、今後リリースするすべてのAIモデルに推論機能を組み込むとしている。
利用プランと提供時期
Gemini 2.5 Pro Experimentalは、「Google AI Studio」で既に開発者向けに公開されている。また、「Gemini Advanced」のユーザーは、デスクトップおよびモバイルアプリのモデル選択ドロップダウンから利用できる。
「Vertex AI」でも近日中に利用可能になる予定。スケーリングされた本番環境での利用に向けた料金体系は、数週間以内に発表される見込みだ。
Gemini 2.5の主な特徴
Gemini 2.5は、応答する前に思考プロセスを経て推論する能力を持ち、これによりパフォーマンスと精度が向上している。
Gemini 2.5 Proは、「GPQA」や「AIME 2025」などの数学・科学分野のベンチマークで優れた成績を収めている。また、人間の知識と推論の最前線を捉えるように設計されたデータセットである「Humanity’s Last Exam」でも、ツールを使用しないモデルの中で18.8%という高いスコアを記録している。
Gemini 2.5はコーディング性能に重点を置いており、Gemini 2.0から大きく改善された。視覚的に魅力的なWebアプリや、エージェント型のコードアプリケーションの作成、コードの変換や編集に優れているという。Webサイトでは、単一のプロンプトから実行可能なコードを生成してゲームを作成する例も紹介されている。
先代のGemini 2.0のネイティブなマルチモーダルを引き継いでおり、テキスト、オーディオ、画像、動画、コードリポジトリ全体など、多様な情報源からの複雑な問題を理解し、処理することができる。
コンテキストウィンドウは100万トークン(近日中に200万トークンに拡張予定)で、膨大なデータセットを理解し、複雑な問題に対応できる。
Geminiの最初の推論モデルは「Gemini 2.0 Flash Thinking」だったが、Gemini 2.5では、大幅に強化された基盤モデルと改善されたポストトレーニングを組み合わせることで、新たなレベルの性能を実現しているという。特に、コーディング性能が2.0から大きく向上しており、思考能力がすべてのモデルに直接組み込まれることで、より複雑な問題や、より高性能で文脈を意識したエージェントをサポートできるようになるとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
農水省の“クソダサ”ポスター話題 「AIよりよっぽど良い」の声も 担当者に狙いを聞いた
-
2
え、21日で37テラも? 高性能SSDを食いつぶす「あのAIツール」にご用心:886th Lap
-
3
AIに「相手に電気ショックを与えろ」と命じ続けたらボタンを押すのか? 11のLLMで“ミルグラム実験” 抵抗できたのは……
-
4
ソフトウェアエンジニアの仕事は「ループを書くこと」になる 内側ループと外側ループ(ハーネス)入門
-
5
Anthropicの営業はAIエージェントをこう使う! 日本法人メンバーが明かす手の内
-
6
復活した「Fable 5」 米政府からのオーダーに対して、Anthropicはどう対策したのか
-
7
「Claude Fable 5」をサブスクの標準機能に――AnthropicのエンジニアがXに投稿 7月8日以降の「早期復活目指す」
-
8
AIで“ゲームキャラの出産二次創作”を何千回と生成する人も……ChatGPTの会話57万件から見えたヘビーな利用実態
-
9
3万円で「Yahoo!ニュース」にPR掲載 プレスリリースをAIで「ニュース風記事」に
-
10
光接続の標準規格「OCI」対応シリコン、GFが27年に投入
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR