うっかり見逃していたけれど、ちょっと気になる――そんなニュースを週末に“一気読み”する連載。今回は、11月16日週を中心に公開された主なニュースを一気にチェックしましょう!
Googleは11月18日、同社のAIモデル「Gemini」シリーズの最新版となる「Gemini 3」を発表した。Google 検索のAIモード、Geminiアプリ、開発者向けプラットフォームのそれぞれで、順次提供を開始する。
Gemini 3はマルチモーダルにおいて最も高性能なモデルであり、最先端の推論能力を基盤としている。強力なエージェント機能とバイブコーディングモデルを搭載し、より豊かな視覚表現と深い双方向性を実現したという。
主要なAIベンチマークではGemini 2.5 Proを大幅に上回る性能を示した。LLMの性能を比較/評価するためのオープンなベンチマークプラットフォーム「LMArena」では、「1501 Elo」というスコアでトップに立ち、博士号レベルの推論能力を必要とするHumanity's Last ExamやGPQA Diamondで、最高スコアを達成したとのこと。
短いプロンプトでも文脈と意図を的確に把握でき、応答は簡潔かつ直接的で、真の洞察を提供する「思考パートナー」として機能するという。
この他、強化された推論モード「Gemini 3 Deep Think」も導入される。より複雑な問題解決が可能で、ARC-AGIでは45.1%という高いスコアをを記録している。こちらは、今後数週間以内にGoogle AI Ultraのサブスクリプションユーザーに提供予定となっている。
xAIは11月17日、AIモデル「Grok」の最新版となる「Grok 4.1」を発表した。Web版Grok、X、iOS/Androidアプリで、全ユーザーに提供を開始している。
Grok 4.1は「創造的、感情的、協働的なやりとりにおいて例外的な能力」を発揮するよう設計されており、ニュアンスを含む意図の理解力と、人格の一貫性が向上しているという。この実現のため、xAIはGrok 4で使用した大規模強化学習インフラを活用し、スタイル/パーソナリティー/有用性/アライメントの最適化に注力したとしている。
xAIによれば、本番環境での2週間のブラインドテストでは、以前のモデルに対して64.78%の確率でGrok 4.1が好まれた。
LMArenaのText Arenaリーダーボードでは、推論モード「Grok 4.1 Thinking」が1483 Eloで一時、首位に立った(その後、GoogleのGemini 3が1501で首位を奪取)。非推論モードの「Grok 4.1」も1465 Eloで2位にランクインしており、他のモデルの完全推論構成を上回る性能を示した。
また、ハルシネーションも従来モデルから低減しており、非推論モードでは、Grok 4 Fastの12.09%から4.22%へと約65%の削減を達成。FActScoreベンチマークでも9.89%から2.97%へと大幅に改善したという。
カラー電子ペーパーのアートフレーム「SwitchBot AIアートキャンバス」を試してみた AI生成絵画や好きな画像を転送してワンランク上の空間作り
マウスコンピューターの最新フルタワーゲーミングPC「NEXTGEAR HD-A7A7X(ホワイト)」を試す 高パフォーマンス+高コスパで高い満足感!
屋内向けネットワークカメラの新モデル「Google Nest Cam Indoor(第3世代)」は視野角が広くなり解像度もアップ! ライバル機や従来モデルと比べてみた
Core Ultraプロセッサ(シリーズ3)の「Xe3 GPU」の改良点をさらに深掘り 今後の取り組みもチェック!
1ドライブで大容量の30TB! 個人でも買えるNAS向けHDD「IronWolf Pro」を試すCopyright © ITmedia, Inc. All Rights Reserved.