Googleから「Gemini 3」登場/xAIが新型AIモデル「Grok 4.1」を公開週末の「気になるニュース」一気読み!(1/3 ページ)

» 2025年11月23日 06時00分 公開
[山本竜也ITmedia]

 うっかり見逃していたけれど、ちょっと気になる――そんなニュースを週末に“一気読み”する連載。今回は、11月16日週を中心に公開された主なニュースを一気にチェックしましょう!

Googleが「Gemini 3」を公開

 Googleは11月18日、同社のAIモデル「Gemini」シリーズの最新版となる「Gemini 3」を発表した。Google 検索のAIモード、Geminiアプリ、開発者向けプラットフォームのそれぞれで、順次提供を開始する。

photo Googleが最新AIモデル「Gemini 3」を発表した

 Gemini 3はマルチモーダルにおいて最も高性能なモデルであり、最先端の推論能力を基盤としている。強力なエージェント機能とバイブコーディングモデルを搭載し、より豊かな視覚表現と深い双方向性を実現したという。

 主要なAIベンチマークではGemini 2.5 Proを大幅に上回る性能を示した。LLMの性能を比較/評価するためのオープンなベンチマークプラットフォーム「LMArena」では、「1501 Elo」というスコアでトップに立ち、博士号レベルの推論能力を必要とするHumanity's Last ExamやGPQA Diamondで、最高スコアを達成したとのこと。

 短いプロンプトでも文脈と意図を的確に把握でき、応答は簡潔かつ直接的で、真の洞察を提供する「思考パートナー」として機能するという。

 この他、強化された推論モード「Gemini 3 Deep Think」も導入される。より複雑な問題解決が可能で、ARC-AGIでは45.1%という高いスコアをを記録している。こちらは、今後数週間以内にGoogle AI Ultraのサブスクリプションユーザーに提供予定となっている。

xAIが新型AIモデル「Grok 4.1」を公開

 xAIは11月17日、AIモデル「Grok」の最新版となる「Grok 4.1」を発表した。Web版Grok、X、iOS/Androidアプリで、全ユーザーに提供を開始している。

photo xAIが最新AIモデル「Grok 4.1」を発表した

 Grok 4.1は「創造的、感情的、協働的なやりとりにおいて例外的な能力」を発揮するよう設計されており、ニュアンスを含む意図の理解力と、人格の一貫性が向上しているという。この実現のため、xAIはGrok 4で使用した大規模強化学習インフラを活用し、スタイル/パーソナリティー/有用性/アライメントの最適化に注力したとしている。

 xAIによれば、本番環境での2週間のブラインドテストでは、以前のモデルに対して64.78%の確率でGrok 4.1が好まれた。

 LMArenaのText Arenaリーダーボードでは、推論モード「Grok 4.1 Thinking」が1483 Eloで一時、首位に立った(その後、GoogleのGemini 3が1501で首位を奪取)。非推論モードの「Grok 4.1」も1465 Eloで2位にランクインしており、他のモデルの完全推論構成を上回る性能を示した。

 また、ハルシネーションも従来モデルから低減しており、非推論モードでは、Grok 4 Fastの12.09%から4.22%へと約65%の削減を達成。FActScoreベンチマークでも9.89%から2.97%へと大幅に改善したという。

       1|2|3 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

最新トピックスPR

過去記事カレンダー

2026年