Google、推論の深さを制御する「thinking levels」搭載の「Gemini 3.1 Flash-Lite」リリース
米Googleは3月3日(現地時間)、「Gemini 3」シリーズ中で最も高速かつコストパフォーマンスに優れたAIモデルとして「Gemini 3.1 Flash-Lite」をリリースした。現在、プレビュー版として提供が開始されており、開発者は「Google AI Studio」の「Gemini API」を通じて、企業ユーザーは「Vertex AI」を通じてアクセス可能だ。
利用料金は入力100万トークン当たり0.25ドル、出力100万トークン当たり1.50ドルと、「Gemini 2.5 Flash-Lite」からは上がっているものの比較的安価に設定されており、大規模で高頻度な処理が求められる開発者のワークロード向けに構築されている。
性能面では、前世代からスピードアップし、品質の向上も図られている。昨年4月リリースの「Gemini 2.5 Flash」との比較では、最初の回答トークンが出力されるまでの時間が2.5倍高速化し、全体の出力速度も45%向上したという。同クラスの競合モデルと比較したベンチマークテストでも、推論とマルチモーダル理解能力で高い結果を示しており、「Arena.ai Leaderboard」で1432のEloスコアを獲得したほか、「GPQA Diamond」で86.9%、「MMMU Pro」で76.8%を記録し、旧世代のより大規模なモデルであるGemini 2.5 Flashを上回る性能を発揮している。
AI StudioおよびVertex AIでの利用時には、タスクに応じてモデルの推論の深さを制御できる「thinking levels」機能が標準で提供される。この低遅延と柔軟な制御能力により、大量の翻訳や画像等のコンテンツモデレーションのようなコスト重視のタスクから、動的なリアルタイムダッシュボードの生成、多様なステップをこなすSaaSエージェントの構築などの高度な推論が求められる複雑なタスクまで、スケールに合わせて幅広く対応できるとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
「ChatGPTのコネクタでつながるし、M365 Copilotいらなくない?」→有識者3人に聞いてみた 知らないと損するコンテキスト管理「Work IQ」の仕組み
-
2
データセンター建設に足りないのは「発電」ではなく「送電」 AI需要で電力消費26%増、Gartner予想
-
3
“AIが電力使いすぎ問題” 「電力不足」懸念で、発電能力より深いボトルネックとは
-
4
中国が人型ロボット開発競争をリードする「納得の理由」 日本に残された逆転シナリオは?
-
5
JASRAC、「AI作曲・人間作詞」の曲は管理します――「人間の創作的寄与の有無」で線引き
-
6
「もはや宗教」のClaudeに焦るOpenAI 流出メモが暴いた覇権交代のリアル
-
7
「日本がいないと成り立たない」世界へ、フィジカルAIが導く独自の交渉力
-
8
「今、Codexのレート制限を解除したい」を解決? “付与したリセット権の貯蓄”可能に 有料ユーザー向け
-
9
公式がワンコーラス公開→AIで無断フルコーラス化、拡散 大原ゆい子氏「無職転生III」OPが被害
-
10
ローカルLLMは本当に手元で動くのか? ハードウェアとモデルの現実的な選び方【2026年春】
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR