主要なAIベンチマークではGemini 2.5 Proを大幅に上回る性能を示した。LLMの性能を比較／評価するためのオープンなベンチマークプラットフォーム「LMArena」では、「1501 Elo」というスコアでトップに立ち、博士号レベルの推論能力を必要とするHumanity's Last ExamやGPQA Diamondで、最高スコアを達成したとのこと。

　短いプロンプトでも文脈と意図を的確に把握でき、応答は簡潔かつ直接的で、真の洞察を提供する「思考パートナー」として機能するという。

　この他、強化された推論モード「Gemini 3 Deep Think」も導入される。より複雑な問題解決が可能で、ARC-AGIでは45.1％という高いスコアをを記録している。こちらは、今後数週間以内にGoogle AI Ultraのサブスクリプションユーザーに提供予定となっている。

xAIが新型AIモデル「Grok 4.1」を公開

　xAIは11月17日、AIモデル「Grok」の最新版となる「Grok 4.1」を発表した。Web版Grok、X、iOS／Androidアプリで、全ユーザーに提供を開始している。

xAIが最新AIモデル「Grok 4.1」を発表した

　Grok 4.1は「創造的、感情的、協働的なやりとりにおいて例外的な能力」を発揮するよう設計されており、ニュアンスを含む意図の理解力と、人格の一貫性が向上しているという。この実現のため、xAIはGrok 4で使用した大規模強化学習インフラを活用し、スタイル／パーソナリティー／有用性／アライメントの最適化に注力したとしている。

　xAIによれば、本番環境での2週間のブラインドテストでは、以前のモデルに対して64.78%の確率でGrok 4.1が好まれた。

　LMArenaのText Arenaリーダーボードでは、推論モード「Grok 4.1 Thinking」が1483 Eloで一時、首位に立った（その後、GoogleのGemini 3が1501で首位を奪取）。非推論モードの「Grok 4.1」も1465 Eloで2位にランクインしており、他のモデルの完全推論構成を上回る性能を示した。

　また、ハルシネーションも従来モデルから低減しており、非推論モードでは、Grok 4 Fastの12.09%から4.22％へと約65％の削減を達成。FActScoreベンチマークでも9.89%から2.97%へと大幅に改善したという。

OpenAIが教育現場向けのAIモデル「ChatGPT for Teachers」を発表

カラー電子ペーパーのアートフレーム「SwitchBot AIアートキャンバス」を試してみた　AI生成絵画や好きな画像を転送してワンランク上の空間作り
企業や組織のIT部門を支援してきた石黒直樹氏が、実際に使っていて仕事に役立つと思ったものや、これから登場する新製品、新サービスをいち早く試してレビューする連載。
マウスコンピューターの最新フルタワーゲーミングPC「NEXTGEAR HD-A7A7X（ホワイト）」を試す　高パフォーマンス＋高コスパで高い満足感！
マウスコンピューターの最新フルタワーゲーミングPC「NEXTGEAR HD-A7A7X」は、ハイエンド構成ながらコストパフォーマンスの高いゲーミングデスクトップPCだ。今回は、Ryzen 7 9800X3D搭載のホワイトモデルの実力をチェックしていく。
屋内向けネットワークカメラの新モデル「Google Nest Cam Indoor（第3世代）」は視野角が広くなり解像度もアップ！　ライバル機や従来モデルと比べてみた
Googleから、屋内向けネットワークカメラの新モデル「Google Nest Cam Indoor（第3世代）」が発売された。従来モデルや競合モデルとの違いをチェックした。
Core Ultraプロセッサ（シリーズ3）の「Xe3 GPU」の改良点をさらに深掘り　今後の取り組みもチェック！
Intelが2025年末に一部を出荷する予定の「Core Ultraプロセッサ（シリーズ3）」（開発コード名：Panther Lake）は、「Xe3 GPU」なる新しいGPUコアを搭載する。この記事では演算エンジン回りを中心に、Xe3 GPUをもう少し深掘りしていく。
1ドライブで大容量の30TB！　個人でも買えるNAS向けHDD「IronWolf Pro」を試す
日本シーゲートのNAS向けHDD「IronWolf Pro」シリーズに属する「ST30000NT011」は、容量30TBの大容量モデルだ。NASだけでなくPCでの利用も想定してテストしてみた。

　　　　　　 1|2|3 次のページへ

SpecialPR

アクセストップ10

2026年02月10日更新

6500円でデスクに新風！　Thermalrightの小型液晶がヒット、背景にメモリ高騰？（2026年02月09日）
改めて考える単眼カメラとモノラルスピーカー　それでも「iPhone Air」を推したくなる理由（2026年02月09日）
32GBメモリが6万円切り、2TB SSDは3.3万円から　価格上昇が続くアキバで見つけた高コスパパーツ（2026年02月07日）
ソニーが「Blu-ray Discレコーダー」の出荷と開発を終了　代替の録画手段はある？（2026年02月09日）
ソニー、PCゲーマー向けの「DualSense」を3月5日に発売　USBケーブル付属（2026年02月09日）
新ARグラス「XREAL 1S」を試す　解像度と輝度が向上、BOSEサウンドで没入感アップ　“3D変換”も大きな魅力（2026年02月10日）
カプセルトイ「手のひらネットワーク機器」に第4弾モデル（2026年02月09日）
アドビが「Animateの販売終了」を撤回／メモリ高騰を受けRaspberry Piの一部モデルが再値上げ（2026年02月08日）
スパコン「富岳」×モーションキャプチャで見えた金メダルへの「空気のつかみ方」（2026年02月08日）
ソニーとTCLの合弁が意味する「新しいソニー」の完成形――ソニーが“家電企業”の殻を脱いだ日（2026年02月06日）

ランキングトップ30

最新トピックスPR

過去記事カレンダー

2026年

2月
1月

2025年

2024年

2023年

2022年

2021年

2020年

2019年

2018年

2017年

2016年

2015年

2014年

2013年

2012年

2011年

2010年

2009年

2008年

2007年

2006年

2005年

2004年

2003年

Feed Back

利用規約

ITmediaはアイティメディア株式会社の登録商標です。

Googleから「Gemini 3」登場／xAIが新型AIモデル「Grok 4.1」を公開：週末の「気になるニュース」一気読み！（1/3 ページ）

Googleが「Gemini 3」を公開