イーロン・マスク氏が率いる米xAIは7月10日(日本時間)、新たなAIモデル「Grok 4」を発表した。同社が2月に発表した「Grok 3」の後継に当たるモデル。複数のベンチマークで、米Googleや米OpenAIの最新モデルを超える性能を示したとアピールしている。
Grok 4は、思考のプロセスを明示的に扱ってタスクを解くリーズニングモデルで、1度に処理できるテキスト量を示すコンテキストウィンドウは25万6000トークン。より性能の高いバージョン「Grok 4 heavy」も用意しており、1つのタスクに対し、複数の処理を独立して同時に実行。それぞれの解決策を比較・検討して回答する仕組みを採用している。
複数のベンチマークで、Grok 4とGrok 4 heavyは、GoogleのAIモデル「Gemini 2.5 Pro」や、OpenAIの「o3」より高いスコアを獲得した。特に、幅広い学術分野の最先端の知見を問う高難度ベンチマーク「Humanity's Last Exam 」(HLE)では、高い性能を示したと説明。HLEを解いたスコアを比べると、o3が24.9%、Gemini 2.5 Proが26.9%だったのに対し、Grok 4が38.6%、Grok 4 heavyが44.4%に達したという。
イーロン・マスク氏は、Grok 4について「世界で最も賢いAI」と自信を見せる。HLEで人間が獲得できるスコアについて「楽観的に言って5%くらい」とする一方で「Grok 4は全ての科目で大学の博士号レベルより優れている。例外はない」とGrok 4の性能に言及した。
Grok 4は10日から、Xの有料会員「プレミアムプラス」と、Grokの有料会員「SuperGrok」に提供する。APIでも利用でき、100万トークンにつき、入力で0.75ドル(1ドル145円換算で約108.75円、以下同)、出力で15ドル(約2175円)。Grok 4 Heavyは、同日に開始したGrokの有料会員「SuperGrok Heavy」(月300ドル、約4万3500円)向けに展開する。
xAIは10日、Grokに関してコーディング特化型のAIモデルも開発中と明かした。今後数週間以内の提供を目指す。また9月ごろにはマルチモーダルのAIエージェントを、10月ごろには動画生成モデルを公開する方針を示した。
「もっと…特別なリラックスがいい?」――Grokの“成人向け”音声チャット、日本でも使えるように
Microsoft、AIモデル「Grok」導入か イーロン・マスク氏率いるxAIと協議 米報道
「Grok」に新機能 生成コンテンツを別ウィンドウで同時編集可能に Google ドライブとも連携
Xの投稿を「なんJ民口調」に変換、Grok活用の公式機能が突如リリース 「港区女子」「大阪のおばちゃん」にも
Xの最新AI「Grok 3」無料開放 推論モデルや「DeepSearch」も使える(制限あり)Copyright © ITmedia, Inc. All Rights Reserved.