イーロン・マスク氏率いる米AI企業xAIは11月4日(現地時間)、同社初のAIモデル「Grok」を発表した。マスク氏はそれに先立ち、GrokをXのハイエンドサブスクプランユーザーに提供する計画だとポスト済みだ。
xAIは企業サイトのトップページで「Grokは、『銀河ヒッチハイク・ガイド』をモデルにしたAIで、ほぼすべてのことに答えることを目的としており、質問すべきことを提案することさえできる」「ウィットに富んだ質問に答えるよう設計されており、反抗的な性格でもあるので、ユーモアが嫌いであれば使わないように」と説明している。
xAIは、全人類に利益をもたらすAIツールを構築するためにフィードバックを集め、あらゆる背景や政治的見解を持つ人々にとって役立つAIツールを設計し、規則に準拠して使えるようにすることを目指しているという。Grokを強力な研究アシスタントとして機能させ、人々が必要な情報に迅速にアクセスし、データを処理し、新たなアイデアを思いつくのを支援するとしている。
マスク氏は、いずれXで提供するとポストしたが、xAIはGrokがまだトレーニングを始めたばかりの「非常に初期のβ版」と説明した。
Grokのベースとなるのは、「Grok-1」と呼ばれるAIモデル。xAIはまず、Grok-0という初期のプロトタイプLLMを330億パラメータでトレーニングした。このプロトタイプは標準ベンチマークで米Metaの「LLaMA」(700億パラメータ)に迫る能力だったという。その後2カ月間でGrok-1の推論とコーディング能力を強化し、複数のベンチマークで米OpenAIの「ChatGPT-3.5」や米Inflection AIの「Inflection-1」などのモデルを上回る「強力な結果を示し」、Grok-1を超えるのは、「GPT-4」のような、大量のトレーニングデータとリソースを使ってトレーニングされたモデルのみだと主張する。
Grok-1は、Kubernetes、Rust、JAXに基づくカスタムトレーニングおよび推論スタックを使用してトレーニングされている。Grokはインターネットにアクセスして最新情報にリアルタイムでアクセスできるため、「誤った情報や矛盾した情報が生成される可能性がある」とxAIは説明する。
将来のモデルはそうした問題を軽減するために、以下の領域の研究を進めるとしている。
xAIはGrokのモデルカードも公開している。モデルカードは機械学習モデルを理解、共有、改善するためのドキュメント。Grokのモデルカードには肝心のパラメータ数などの詳細が明記されていない。トレーニングデータについては、「2023年第3四半期までのインターネットとAIチューターによって提供されたデータの両方から取得したもの」となっている。
マスク氏はGrokはXの公開データでトレーニングされており、Xのデータにリアルタイムでアクセスすると説明した。例として「ジョー・ローガンによる直近のイーロンのインタビューはいつ?」という質問に、10月31日と正しく答えた画像を添付した(比較対象としてPhindのLLM「Phind」に「ジョー・ローガンは最近のインタビューで何を着ていた?」と質問しているが、これでは公平な比較にはならないだろう)。
Grokはまず、米国内のユーザーに限定β版をリリースする。米国在住でXのアカウントを持っていれば、ウェイティングリストに登録できる。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR