「Grok 4.1」リリース 感情表現や対話能力を強化、ユーザー選好度も向上

 米xAIは11月17日(現地時間)、AIモデル「Grok」の新バージョン「Grok 4.1」を発表した。grok.com、iOSおよびAndroid向けアプリで利用可能になっている。

 grok 1 (画像:xAI)

 自動モードで順次展開されているほか、モデル選択で明示的に「Grok 4.1」を指定することもできる。

 grok 2 モデル選択メニューの「Grok 4.1」

 xAIは、スタイルや人格、ユーザー支援、アライメントなどの側面を最適化するようGrok 4.1をチューニングしたと説明している。こうした側面は検証可能な正解がないタイプの報酬信号を扱うため、高度な「エージェント的推論モデル」を報酬モデルとして用い、自律的に応答を評価・反復する新たな手法を開発したという。これにより、従来モデルの知性や信頼性を維持しつつ、創造的・感情的・協調的な対話能力を強化したとしている。

 11月1日から14日にかけて、grok.comやX、モバイルアプリ上でGrok 4.1のビルドを段階的に投入する「サイレントロールアウト」を実施し、従来モデルとの比較検証を行った。その結果、Grok 4.1は直前の本番モデルと比べて64.78%の割合でユーザーに選好されたという。

 LMArenaの「Text Arena」ベンチマークでは、推論付きモード「Grok 4.1 Thinking」がElo 1483で総合1位を獲得した。推論を行わない通常モードも思考トークンなしで即時応答しつつ、Elo 1465で2位となった。従来のGrok 4の総合順位は33位だった。

 grok 4 ベンチマーク結果(画像:xAI)

 また、悲嘆に暮れるユーザーに寄り添う応答の従来版との比較を紹介し、感情表現や語りの深みが増したとアピールしている。

 grok 3 「猫がいなくてとてもつらい」に対する回答比較(画像:xAI)

 事実性の向上も重点項目としており、情報検索系プロンプトでの幻覚(ハルシネーション)を減らすポストトレーニングを実施したという。ベンチマーク「FActScore」でGrok 4 FastとGrok 4.1を比較した結果、Grok 4.1では幻覚率の有意な低下が見られたとしている。

印刷する
SNSでシェア

関連記事

こんなメディアも見られています

ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。

メールマガジンを配信中
メールマガジンを配信中

国内外の業界動向、AIやクラウドなどの最新技術、キャリア情報など今知りたい情報をまとめてお届けします。

いますぐご登録

よく見られているカテゴリー

アクセスランキング

  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  6. 6
  7. 7
  8. 8
  9. 9
  10. 10

SpecialPR

ITmedia AI+ SNS

X @itm_aiplusをフォロー

インフォメーション

ITmedia AI+をフォロー

あなたにおすすめの記事PR