「Grok 4.1」リリース 感情表現や対話能力を強化、ユーザー選好度も向上
米xAIは11月17日(現地時間)、AIモデル「Grok」の新バージョン「Grok 4.1」を発表した。grok.com、iOSおよびAndroid向けアプリで利用可能になっている。
自動モードで順次展開されているほか、モデル選択で明示的に「Grok 4.1」を指定することもできる。
xAIは、スタイルや人格、ユーザー支援、アライメントなどの側面を最適化するようGrok 4.1をチューニングしたと説明している。こうした側面は検証可能な正解がないタイプの報酬信号を扱うため、高度な「エージェント的推論モデル」を報酬モデルとして用い、自律的に応答を評価・反復する新たな手法を開発したという。これにより、従来モデルの知性や信頼性を維持しつつ、創造的・感情的・協調的な対話能力を強化したとしている。
11月1日から14日にかけて、grok.comやX、モバイルアプリ上でGrok 4.1のビルドを段階的に投入する「サイレントロールアウト」を実施し、従来モデルとの比較検証を行った。その結果、Grok 4.1は直前の本番モデルと比べて64.78%の割合でユーザーに選好されたという。
LMArenaの「Text Arena」ベンチマークでは、推論付きモード「Grok 4.1 Thinking」がElo 1483で総合1位を獲得した。推論を行わない通常モードも思考トークンなしで即時応答しつつ、Elo 1465で2位となった。従来のGrok 4の総合順位は33位だった。
また、悲嘆に暮れるユーザーに寄り添う応答の従来版との比較を紹介し、感情表現や語りの深みが増したとアピールしている。
事実性の向上も重点項目としており、情報検索系プロンプトでの幻覚(ハルシネーション)を減らすポストトレーニングを実施したという。ベンチマーク「FActScore」でGrok 4 FastとGrok 4.1を比較した結果、Grok 4.1では幻覚率の有意な低下が見られたとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
NTT、独自のAIモデル「tsuzumi 2」発表 “国産AI開発競争”に「負けられない」と島田社長
-
2
ローカルLLMは本当に手元で動くのか? ハードウェアとモデルの現実的な選び方【2026年春】
-
3
「Google AI Pro」ユーザーはYouTube広告ほぼ非表示 「Premium Lite」無料付与
-
4
フジクラ社長「データセンター市場、10年は堅調に伸びる」 生産拡大で「3000億円投資」に踏み切ったワケ
-
5
孫正義は「知能の石油」を独占するか? ソフトバンクグループが挑む日米データセンター構想
-
6
「Gemini」「Claude Code」「Codex」 全社展開・本番実装に役立つ5つのポイント
-
7
OpenAIの内部モデルが数学の未解決問題を証明──OpenAIは「重要な転換点」、フィールズ賞受賞数学者は「画期的な成果」と評価
-
8
「家庭教師のトライ」が学力診断にAI活用 20問解くだけで弱点を推定 生徒と講師の負担減らす
-
9
「私も2次元しか愛せない人間」 小野田大臣がAIへの恋愛感情に見解示す 依存には懸念
-
10
「Google Antigravity」利用上限緩和 ただし2.0アップデート手順に要注意
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR