検索
速報

最もコスト効率の高い思考モデル「Gemini 2.5 Flash」提供開始(無料版でも)

Googleは、思考するAIの軽量版「Gemini 2.5 Flash」を無料ユーザーを含むすべてのGeminiユーザーへの提供を開始した。Google AI StudioとVertex AIのGemini APIでも利用可能だ。

Share
Tweet
LINE
Hatena

米Googleは4月17日(現地時間)、9日に発表した思考するAIモデル「Gemini 2.5 Flash」を、Experimentalとして公開したと発表した。Google AI Studio、Vertex AIのGemini API、Geminiアプリで利用可能だ。Geminiアプリでは、無料ユーザーも使える。

 flash 1
無料版Geminiのプルダウンメニュー

 「Gemini 2.0 Flash」を基盤とするGemini 2.5 Flashは、速度とコストを優先しつつ、推論能力が大幅に向上したという。また、このモデルの最大の特徴として、Google初の完全にハイブリッドな推論モデルである点を挙げた。これにより、開発者はモデルの「思考」をオン/オフしたり、思考に費やすトークン量を設定することで、品質、コスト、レイテンシのバランスを細かく調整できるという。

 “思考するAIモデル”であるGemini 2.5は、応答を生成する前に思考することで、プロンプトの理解、複雑なタスクの分解、応答の計画などをより適切に行えるとGoogleは説明する。数学の問題解決や調査分析など、複数の推論ステップを要する複雑なタスクで、正確で包括的な回答を出せるとしている。

 Gemini 2.5 Flashは、ベンチマークとして使われるLMArenaのHard Promptsで、Gemini 2.5 Proに次ぐ成績だった。

 Googleは複数のベンチマークで、他の主要なモデルと比較して、低コスト、小サイズで同等のメトリックを達成していると示した。価格性能比でも優位性を示しているとしている。

 benchmarks
各種ベンチマーク比較(画像:Google)

 Geminiアプリでは、ドキュメントやコードを改良するためのインタラクティブなスペースである「Canavas」も、Gemini 2.5 Flashで利用可能だ。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る