NVIDIA、エージェント型AI開発向けオープンモデル「Nemotron 3」発表
米NVIDIAは12月15日(現地時間)、エージェント型AIの構築に最適化されたオープンな基盤モデルファミリー「Nemotron 3」を発表した。
計算資源とユースケースに応じて選択可能な「Nano」「Super」「Ultra」の3モデル構成。モデルの重みだけでなく、データセット、トレーニングレシピ、開発ツールチェーンを含めたフルスタックのオープンソースとして提供される。
Nemotron 3は、アーキテクチャにハイブリッドなMixture-of-Experts(MoE:混合エキスパート)を採用している。8月に発表した「Nemotron Nano 2」の設計思想を継承しつつ、大規模なエージェントワークフロー向けに改良を加えたものだ。推論時にアクティブになるパラメータを動的にルーティングすることで、高スループットを維持しながら、複雑な推論タスクにおける回答精度を向上させたとしている。
最大100万トークンにおよぶロングコンテキストへの対応も特徴だ。これにより、RAG(検索拡張生成)における大量ドキュメントの参照や、長期記憶を必要とするマルチターン対話、複数のサブエージェントが連携してコード実行やAPIコールを行う「マルチステップ推論」で、コンテキスト落ちを防ぎながら安定した挙動を実現する。
まず提供が開始された「Nemotron 3 Nano」は、ファミリーの中で最も軽量なモデルで、エッジデバイスやローカル環境での高効率な推論をターゲットとしている。
Hugging Faceでの技術解説によると、Nanoモデルは品質と推論効率のトレードオフを極限まで最適化しており、商用利用やリサーチ用途に耐えうる「実用的な小規模モデル」として設計されている。開発者は、自身のタスクに合わせてSFT(教師ありファインチューニング)やRLHF(人間からのフィードバックによる強化学習)を追加で行い、独自の派生モデルを作成・配布することが可能だ。
NVIDIAはNemotron 3を、単なるLLMではなく「次世代エージェントシステムの基盤」と位置付けている。事前学習から指示追従(Instruction Tuning)、アライメントまでのプロセスを透明化し、学習レシピを公開することで、開発者はモデルの挙動を深く理解し、再現性を担保できるとしている。
また、このモデル群はNVIDIAのH100やBlackwellアーキテクチャ上のTensorRT-LLMで最大化されるよう最適化されてはいるが、オープンモデルとして提供されるため、幅広い環境での検証が可能だ。NVIDIAはこれにより、エンタープライズレベルの複雑なエージェントワークフローを、ブラックボックス化させずに構築できるエコシステムの確立を狙う。
上位モデルである「Super」および「Ultra」も、今後順次リリースされる予定だ。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
農水省の“クソダサ”ポスター話題 「AIよりよっぽど良い」の声も 担当者に狙いを聞いた
-
2
AIに「相手に電気ショックを与えろ」と命じ続けたらボタンを押すのか? 11のLLMで“ミルグラム実験” 抵抗できたのは……
-
3
Anthropicの営業はAIエージェントをこう使う! 日本法人メンバーが明かす手の内
-
4
AIで“ゲームキャラの出産二次創作”を何千回と生成する人も……ChatGPTの会話57万件から見えたヘビーな利用実態
-
5
「ウソだろ」アスクル社長がうなったAI活用 商談準備を2週間→3時間に “担当者のカオス”脱却へ
-
6
「Claude Fable 5」が帰ってくる 「Mythos 5」含む輸出規制解除へ Anthropic発表
-
7
生成AIの請求書、人件費と並べる時代へ 国内5社のAI責任者が語る「トークンマネジメント」の現在地
-
8
謎の「“日の丸AI”開発企業」正体明らかに ソフトバンク、NECら大手がそろって出資するワケ
-
9
「ねこ」検索で「手押し一輪車」表示――モノタロウが守った、生成AIに“譲れない”購買体験
-
10
日産「AIで再び世界トップの開発力へ」、独自の統合型次世代AIDV基盤描く
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR