NVIDIAは1月5日(米国太平洋時間)、AIデータセンター向けの「NVIDIA Rubinプラットフォーム」を2026年後半からパートナー企業を通して提供することを発表した。
NVIDIA Rubinプラットフォームは、新アーキテクチャGPU「NVIDIA Rubin」とNVIDIAが設計したArmアーキテクチャCPU「NVIDIA Vera」を中核に据えたハードウェア/ソフトウェア協調型のプラットフォーム製品だ。
現行のBlackwellアーキテクチャベースのプラットフォームと比べると、推論トークンの提供コストを最大で10分の1に、混合専門家(MoE)モデルの学習に必要なGPU数を4分の1に削減できるという。
プラットフォームには、Rubin/Vera以外に以下のハードウェアも含まれている。
処理効率や消費電力の改善は、6つのハードウェア(チップ)の協調動作が大きく貢献しているとのことだ。
Rubinプラットフォームは、ニーズに合わせて以下の3種類が用意されている。
(※1)2基のRubinと1基のVeraをひとまとめにしたSoC
これらに加えて、 DGX Vera Rubin NVL72を8ユニットまとめた「DGX SuperPOD With DGX Vera Rubin NVL72」も用意されている。
NVIDIAが新型GPU「Rubin CPX」を発表 大規模コンテキスト処理に最適化し「動画生成」「大規模コーディング」で活躍
「Blackwell」の次は「Rubin」へ フアンCEOが次世代GPUアーキテクチャのロードマップを紹介
富士通とNVIDIAが「AIで駆動する社会」を目指した協業を拡大 富士通製CPU「MONAKA」とNVIDIA製GPUを密結合
NVIDIAとIntelが複数世代に渡る「NVLink」を活用した製品開発で合意 「RTX GPU搭載のx86 CPU」「NVIDIA向けx86 CPU」などが登場する見通し
GeForce RTX 50だけではない! 社会がAIを基礎にしたものに置き換わる? 「CES 2025」で聴衆を圧倒したNVIDIAの最新構想Copyright © ITmedia, Inc. All Rights Reserved.