NVIDIAは9月9日(米国太平洋夏時間)、データセンターにおける推論演算に特化したGPU「NVIDIA Rubin CPX」を発表した。Rubin CPXを搭載する製品は、2026年末に製品化(発売)される予定だ。
Rubin CPXは、2026年後半に発売予定のラックマウントシステム「NVIDIA Vera Rubin NVL144 CPX」に搭載されたArmアーキテクチャCPU「NVIDIA Vero」やメインGPU「NVIDIA Rubin」と連携動作することを前提とした“付加GPU”で、長コンテキストの処理パフォーマンスを向上することに特化した設計となっている。
GPUアーキテクチャはメインGPUと同じ「Rubin」で、NVFP4フォーマット時のピーク演算性能は30PFLOPSとなっている。グラフィックスメモリは128GB(GDDDR7規格)で、ハードウェアベースの動画デコーダー/エンコーダーも備えている。
NVIDIAでは推論を「コンテキスト処理」と「生成」で分散して行うことでより効率的な処理を行えるとしている。Rubin CPXは、前者の処理に専念する付加GPUとしてVera Rubin NVL144 CPXに追加できるようになっている36基のVero/144基のRubin/144基のRubin CPXという構成のVera Rubin NVL144 CPXの場合、システム全体におけるNVFP4フォーマット時のピーク性能は8exaFLOPsに達する。これは、既存のラックシステム「NVIDIA GB300 NVL72」比で最大7.5倍だ。
「Blackwell」の次は「Rubin」へ フアンCEOが次世代GPUアーキテクチャのロードマップを紹介
GeForce RTX 50だけではない! 社会がAIを基礎にしたものに置き換わる? 「CES 2025」で聴衆を圧倒したNVIDIAの最新構想
NVIDIAがプロ向けグラボ「RTX PRO 2000 Blackwell」「RTX PRO 4000 Blackwell SFF」を発表 2025年後半に発売予定
まるで“ファンミーティング”な熱気 NVIDIA基調講演でフアンCEOは何を語ったのか?
NVIDIAのAI特化型ミニPC「DGX Spark」、台湾の主要PCメーカーからも7月に発売Copyright © ITmedia, Inc. All Rights Reserved.