ニュース
NVIDIAが新型GPU「Rubin CPX」を発表 大規模コンテキスト処理に最適化し「動画生成」「大規模コーディング」で活躍:2026年後半に発売予定
NVIDIAが、データセンター向けラックマウントシステムに“付加”するためのGPUを開発した。AIでよく使われる推論演算のうち、長コンテキストの処理を請け負うことでシステム全体のパフォーマンスを向上することが狙いだという。
NVIDIAは9月9日(米国太平洋夏時間)、データセンターにおける推論演算に特化したGPU「NVIDIA Rubin CPX」を発表した。Rubin CPXを搭載する製品は、2026年末に製品化(発売)される予定だ。
NVIDIA Rubin CPXの概要
Rubin CPXは、2026年後半に発売予定のラックマウントシステム「NVIDIA Vera Rubin NVL144 CPX」に搭載されたArmアーキテクチャCPU「NVIDIA Vero」やメインGPU「NVIDIA Rubin」と連携動作することを前提とした“付加GPU”で、長コンテキストの処理パフォーマンスを向上することに特化した設計となっている。
GPUアーキテクチャはメインGPUと同じ「Rubin」で、NVFP4フォーマット時のピーク演算性能は30PFLOPSとなっている。グラフィックスメモリは128GB(GDDDR7規格)で、ハードウェアベースの動画デコーダー/エンコーダーも備えている。
advertisement
NVIDIAでは推論を「コンテキスト処理」と「生成」で分散して行うことでより効率的な処理を行えるとしている。Rubin CPXは、前者の処理に専念する付加GPUとしてVera Rubin NVL144 CPXに追加できるようになっている
36基のVero/144基のRubin/144基のRubin CPXという構成のVera Rubin NVL144 CPXの場合、システム全体におけるNVFP4フォーマット時のピーク性能は8exaFLOPsに達する。これは、既存のラックシステム「NVIDIA GB300 NVL72」比で最大7.5倍だ。
関連記事
「Blackwell」の次は「Rubin」へ フアンCEOが次世代GPUアーキテクチャのロードマップを紹介
COMPUTEX TAIPEI 2024にあわせて米NVIDIAが基調講演を実施した。次世代GPUアーキテクチャ「Blackwell」の大規模版「Blackwell Ultra」や、さらに次世代となる「Rubin」「Rubin Ultra」を含む将来のロードマップについて明らかにした。GeForce RTX 50だけではない! 社会がAIを基礎にしたものに置き換わる? 「CES 2025」で聴衆を圧倒したNVIDIAの最新構想
NVIDIAのジェンスン・ファンCEOが「CES 2025」の基調講演に登壇した。新アーキテクチャのGPU「GeForce RTX 50シリーズ」に注目が集まりがちだが、注目すべきポイントはそこだけではない。NVIDIAがプロ向けグラボ「RTX PRO 2000 Blackwell」「RTX PRO 4000 Blackwell SFF」を発表 2025年後半に発売予定
NVIDIAが、SFF(スモールフォームファクター)PCへの組み込みを想定したプロフェッショナル向けグラフィックスカードの最新世代を発売する。併せて、サーバ/データセンター向けのラックマウントシステムについて、2U構成も追加する。まるで“ファンミーティング”な熱気 NVIDIA基調講演でフアンCEOは何を語ったのか?
COMPUTEX TAIPEI 2025開幕の前日、NVIDIAのジェンスン・フアンCEOが基調講演を開催した。会場周辺は熱気に包まれ、さながら「ファンミーティング」のような様相だった講演の模様をお伝えする。NVIDIAのAI特化型ミニPC「DGX Spark」、台湾の主要PCメーカーからも7月に発売
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.