ニュース
新GPU「NVIDIA Rubin」が量産体制に 2026年後半からプラットフォーム製品に実装
NVIDIAの新アーキテクチャGPU「Rubin」が量産に入った。2026年後半に、プラットフォーム製品へと搭載される見通しだ。
NVIDIAは1月5日(米国太平洋時間)、AIデータセンター向けの「NVIDIA Rubinプラットフォーム」を2026年後半からパートナー企業を通して提供することを発表した。
NVIDIA Rubinプラットフォームの概要
NVIDIA Rubinプラットフォームは、新アーキテクチャGPU「NVIDIA Rubin」とNVIDIAが設計したArmアーキテクチャCPU「NVIDIA Vera」を中核に据えたハードウェア/ソフトウェア協調型のプラットフォーム製品だ。
現行のBlackwellアーキテクチャベースのプラットフォームと比べると、推論トークンの提供コストを最大で10分の1に、混合専門家(MoE)モデルの学習に必要なGPU数を4分の1に削減できるという。
advertisement
プラットフォームには、Rubin/Vera以外に以下のハードウェアも含まれている。
- NVIDIA NVLink 6 スイッチ:ラック内でスケールアップするためのスイッチ
- NVIDIA ConnectX-9 SuperNIC:ラック同士で並列処理する際に使うNIC
- NVIDIA BlueField-4 DPU:ネットワーク/ストレージの制御とセキュリティ処理を担うプロセッサ
- NVIDIA Spectrum-6 イーサネット スイッチ:AI並列処理に最適化されたスイッチ
処理効率や消費電力の改善は、6つのハードウェア(チップ)の協調動作が大きく貢献しているとのことだ。
プラットフォームのラインアップ
Rubinプラットフォームは、ニーズに合わせて以下の3種類が用意されている。
- NVIDIA Vera Rubin NVL72(ラックマウントサーバ)
- Vera Rubin Superchip(※1)×36基にNVLink 6/ConnectX-9/BlueField-4を組み合わせ
- グラフィックスメモリは合計20.7TB
- CPUメモリは合計54TB(LPDDR5X規格)
- FP4演算のピーク性能は3600PFLOPS(推論)/2520PFLOPS(学習)
- 統合度が高く、安全性も高い
- NVIDIA DGX Vera Rubin NVL72(DGXサーバ)
- Vera Rubin NVL72を「NVIDIA DGXサーバ」として提供
- 基本スペックはVera Rubin NVL72と同様
- NVIDIA HGX Rubin NVL8(ラックマウントサーバ)
- x86 CPUベースのAIプラットフォームを高速化するためのサーバ
- Rubun×8基をNVLinkを介して接続
- CPUは「Xeon 6776P」×2
- グラフィックスメモリは合計2.3TB
- FP4演算のピーク性能は400PFLOPS(推論)/280PFLOPS(学習)
(※1)2基のRubinと1基のVeraをひとまとめにしたSoC
これらに加えて、 DGX Vera Rubin NVL72を8ユニットまとめた「DGX SuperPOD With DGX Vera Rubin NVL72」も用意されている。
関連記事
NVIDIAが新型GPU「Rubin CPX」を発表 大規模コンテキスト処理に最適化し「動画生成」「大規模コーディング」で活躍
NVIDIAが、データセンター向けラックマウントシステムに“付加”するためのGPUを開発した。AIでよく使われる推論演算のうち、長コンテキストの処理を請け負うことでシステム全体のパフォーマンスを向上することが狙いだという。「Blackwell」の次は「Rubin」へ フアンCEOが次世代GPUアーキテクチャのロードマップを紹介
COMPUTEX TAIPEI 2024にあわせて米NVIDIAが基調講演を実施した。次世代GPUアーキテクチャ「Blackwell」の大規模版「Blackwell Ultra」や、さらに次世代となる「Rubin」「Rubin Ultra」を含む将来のロードマップについて明らかにした。富士通とNVIDIAが「AIで駆動する社会」を目指した協業を拡大 富士通製CPU「MONAKA」とNVIDIA製GPUを密結合
富士通とNVIDIAが、HPC/データセンター分野における協業を強化する。富士通のArmアーキテクチャベースのCPU「FUJITSU-MONAKA」とNVIDIA製GPUをNVLink Fusionで密結合することで高性能かつ低消費電力のAI基盤の構築を目指す。NVIDIAとIntelが複数世代に渡る「NVLink」を活用した製品開発で合意 「RTX GPU搭載のx86 CPU」「NVIDIA向けx86 CPU」などが登場する見通し
NVIDIAとIntelが複数世代に渡る「NVLink」を活用した製品開発で合意したことを発表した。「RTX GPU搭載のx86 CPU」「NVIDIA向けx86 CPU」などが登場する見通しだという。これに伴い、NVIDIAはIntelの普通株式を50億ドル(約7370億円)で購入するという。GeForce RTX 50だけではない! 社会がAIを基礎にしたものに置き換わる? 「CES 2025」で聴衆を圧倒したNVIDIAの最新構想
NVIDIAのジェンスン・ファンCEOが「CES 2025」の基調講演に登壇した。新アーキテクチャのGPU「GeForce RTX 50シリーズ」に注目が集まりがちだが、注目すべきポイントはそこだけではない。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.