ニュース

新GPU「NVIDIA Rubin」が量産体制に 2026年後半からプラットフォーム製品に実装

NVIDIAの新アーキテクチャGPU「Rubin」が量産に入った。2026年後半に、プラットフォーム製品へと搭載される見通しだ。

 NVIDIAは1月5日(米国太平洋時間)、AIデータセンター向けの「NVIDIA Rubinプラットフォーム」を2026年後半からパートナー企業を通して提供することを発表した。


NVIDIA Rubinプラットフォームの1つ「NVIDIA DGX Vera Rubin NVL72」

NVIDIA Rubinプラットフォームの概要

 NVIDIA Rubinプラットフォームは、新アーキテクチャGPU「NVIDIA Rubin」とNVIDIAが設計したArmアーキテクチャCPU「NVIDIA Vera」を中核に据えたハードウェア/ソフトウェア協調型のプラットフォーム製品だ。

 現行のBlackwellアーキテクチャベースのプラットフォームと比べると、推論トークンの提供コストを最大で10分の1に、混合専門家(MoE)モデルの学習に必要なGPU数を4分の1に削減できるという。

advertisement

 プラットフォームには、Rubin/Vera以外に以下のハードウェアも含まれている。

  • NVIDIA NVLink 6 スイッチ:ラック内でスケールアップするためのスイッチ
  • NVIDIA ConnectX-9 SuperNIC:ラック同士で並列処理する際に使うNIC
  • NVIDIA BlueField-4 DPU:ネットワーク/ストレージの制御とセキュリティ処理を担うプロセッサ
  • NVIDIA Spectrum-6 イーサネット スイッチ:AI並列処理に最適化されたスイッチ

 処理効率や消費電力の改善は、6つのハードウェア(チップ)の協調動作が大きく貢献しているとのことだ。

プラットフォームのラインアップ

 Rubinプラットフォームは、ニーズに合わせて以下の3種類が用意されている。

  • NVIDIA Vera Rubin NVL72(ラックマウントサーバ)
    • Vera Rubin Superchip(※1)×36基にNVLink 6/ConnectX-9/BlueField-4を組み合わせ
    • グラフィックスメモリは合計20.7TB
    • CPUメモリは合計54TB(LPDDR5X規格)
    • FP4演算のピーク性能は3600PFLOPS(推論)/2520PFLOPS(学習)
    • 統合度が高く、安全性も高い
  • NVIDIA DGX Vera Rubin NVL72(DGXサーバ)
    • Vera Rubin NVL72を「NVIDIA DGXサーバ」として提供
    • 基本スペックはVera Rubin NVL72と同様
  • NVIDIA HGX Rubin NVL8(ラックマウントサーバ)
    • x86 CPUベースのAIプラットフォームを高速化するためのサーバ
    • Rubun×8基をNVLinkを介して接続
    • CPUは「Xeon 6776P」×2
    • グラフィックスメモリは合計2.3TB
    • FP4演算のピーク性能は400PFLOPS(推論)/280PFLOPS(学習)

(※1)2基のRubinと1基のVeraをひとまとめにしたSoC

 これらに加えて、 DGX Vera Rubin NVL72を8ユニットまとめた「DGX SuperPOD With DGX Vera Rubin NVL72」も用意されている。


NVIDIA Vera Rubin NVL72(左)とNVIDIA HGX Rubin NVL8(右)

Copyright © ITmedia, Inc. All Rights Reserved.