「Grok 4.1」リリース 感情表現や対話能力を強化、ユーザー選好度も向上
xAIは「Grok 4.1」を発表した。新たな手法で創造的・感情的な対話能力を強化したという。LMArenaベンチマークでは推論モードが1位を獲得し、従来モデルよりユーザー選好度が64.78%向上した。幻覚(ハルシネーション)も低減させたとしている。
米xAIは11月17日(現地時間)、AIモデル「Grok」の新バージョン「Grok 4.1」を発表した。grok.com、iOSおよびAndroid向けアプリで利用可能になっている。
自動モードで順次展開されているほか、モデル選択で明示的に「Grok 4.1」を指定することもできる。
xAIは、スタイルや人格、ユーザー支援、アライメントなどの側面を最適化するようGrok 4.1をチューニングしたと説明している。こうした側面は検証可能な正解がないタイプの報酬信号を扱うため、高度な「エージェント的推論モデル」を報酬モデルとして用い、自律的に応答を評価・反復する新たな手法を開発したという。これにより、従来モデルの知性や信頼性を維持しつつ、創造的・感情的・協調的な対話能力を強化したとしている。
11月1日から14日にかけて、grok.comやX、モバイルアプリ上でGrok 4.1のビルドを段階的に投入する「サイレントロールアウト」を実施し、従来モデルとの比較検証を行った。その結果、Grok 4.1は直前の本番モデルと比べて64.78%の割合でユーザーに選好されたという。
LMArenaの「Text Arena」ベンチマークでは、推論付きモード「Grok 4.1 Thinking」がElo 1483で総合1位を獲得した。推論を行わない通常モードも思考トークンなしで即時応答しつつ、Elo 1465で2位となった。従来のGrok 4の総合順位は33位だった。
また、悲嘆に暮れるユーザーに寄り添う応答の従来版との比較を紹介し、感情表現や語りの深みが増したとアピールしている。
事実性の向上も重点項目としており、情報検索系プロンプトでの幻覚(ハルシネーション)を減らすポストトレーニングを実施したという。ベンチマーク「FActScore」でGrok 4 FastとGrok 4.1を比較した結果、Grok 4.1では幻覚率の有意な低下が見られたとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
xAI、高速コーディングAI「Grok Code Fast 1」を発表 GitHub Copilotでお試し可能
xAIは、高速で経済的な新AIモデル「Grok Code Fast 1」を発表した。AIが自律的にコーディングタスクを実行する「エージェンティックコーディング」に優れ、特にTypeScriptやPythonなどでの開発で能力を発揮するとしている。GitHub Copilotでプレビュー版が期間限定無料で利用可能だ。
イーロン・マスク「Grokが世界をつなぐ」──X、他言語ポストをGrokが翻訳→自動で英訳表示 米国で提供開始
米Xは8月13日(日本時間)までに、他言語ポストを自動的に英語に翻訳して表示する機能の提供を始めた。翻訳はxAIの生成AI「Grok」によるもので、米国の全ユーザーが対象となる。
xAI、「Grok 4」を無料ユーザーに制限付きで解放 画像→映像機能は米国のみ
xAIは、最新AIモデル「Grok 4」を無料ユーザーにも限定的に公開したと発表。複雑な質問で自動的に使われるほか、手動での選択も可能。また、AI動画生成ツール「Grok Imagine」も米国の無料ユーザーに期間限定で提供する。
xAI、Grokの“恐ろしい行動”について謝罪し、原因と対策を説明
xAIは、AIチャットボット「Grok」がヒトラーを称賛するなど不適切な投稿を繰り返した件で謝罪した。原因は「Xユーザーを密接に模倣しすぎた」ことだと説明。問題のコードを削除しシステムを再構築したと報告した。



