ITmedia NEWS > 製品動向 >
ITmedia AI+ AI活用のいまが分かる

NVIDIA、次世代AIプラットフォーム「Rubin」量産開始 推論コストを10分の1へCES 2026

» 2026年01月06日 10時35分 公開
[ITmedia]

 米NVIDIAは1月5日(現地時間)、ラスベガスで6日から開催のCES 2026に合わせて現地で開催したプレスイベントで、次世代AI向けプラットフォーム「NVIDIA Rubin」(以下「Rubin」)の量産開始と、2026年後半の提供開始に向けた製品エコシステムの詳細を発表した。

 huang 登壇したジェンスン・フアンCEO(画像:NVIDIAの動画より)

 Rubinは、Vera CPU、Rubin GPU、NVLink 6 Switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 Ethernet Switchの6つの新チップで構成される。これらをハードウェアとソフトウェアの境界を超えたextreme codesign(極限の共同設計)によって一体化し、1台のAIスーパーコンピュータとして機能させる。Rubin GPUには次世代メモリ「HBM4」が初採用され、データ転送のボトルネックを解消したとしている。

 rubin 1 NVIDIA Rubinの6つの新チップ(画像:NVIDIA)

 Rubinの狙いは、学習と推論の双方で増大し続ける計算需要に対し、コストと時間を大幅に削減することだ。先代の「Blackwell」世代と比較して、推論のトークン生成コストを最大10分の1に、Mixture-of-Experts(MoE)モデルの学習に必要なGPU数を4分の1に抑えられる。また、Spectrum-X Ethernet Photonicsの採用により、電力効率と稼働率を5倍改善すると説明した。

 rubin 2 Blackwellとの比較(画像:NVIDIA)

 ジェンスン・フアンCEOは「学習と推論の需要が急増する“まさに今”にRubinが来る」とした上で、毎年新世代のAIスーパーコンピュータを投入する年次サイクルと、6チップを貫く共同設計により「次のフロンティアへ大きく飛躍する」と強調した。

 Rubinという名称は天文学者Vera Rubin(ヴェラ・ルービン)にちなんでおり、ラックスケールの「Vera Rubin NVL72」や「HGX Rubin NVL8」システムとして展開していく。NVL72はラック全体が1つの巨大なGPUとして機能する設計だ。

 nvl Vera Rubin NVL72(画像:NVIDIA)

 Rubinは既にフル生産に入っており、搭載製品はパートナー各社が2026年後半に提供を開始する。NVIDIAはRubin採用が見込まれる企業として、Amazon Web Services(AWS)、Anthropic、Black Forest Labs、Cisco、Cohere、CoreWeave、Cursor、Dell Technologies、Google、Harvey、HPE、Lambda、Lenovo、Meta、Microsoft、Mistral AI、Nebius、Nscale、OpenAI、OpenEvidence、Oracle Cloud Infrastructure、Perplexity、Runway、Supermicro、Thinking Machines Lab、xAIを挙げた。

 OpenAIのサム・アルトマンCEOはNVIDIAの発表文に「NVIDIA Rubinプラットフォームは、進歩を継続的に拡大し、高度なインテリジェンスがすべての人に恩恵をもたらすよう支援する」というコメントを寄せた。xAIのイーロン・マスクCEOは「NVIDIA RubinはAIのロケットエンジンになるだろう。最先端モデルを大規模にトレーニングし展開したいなら、まさにこのインフラが不可欠だ」と語った。


Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ

あなたにおすすめの記事PR