GeForce RTX 50シリーズを搭載する製品は、米国において1月30日から順次発売される。まずデスクトップのハイエンド製品「GeForce RTX 5080」「GeForce RTX 5090」が登場し、2月にはミドルレンジ製品「GeForce RTX 5070」「GeForce RTX 5070 Ti」が登場する。これらはいずれも従来世代(GeForce RTX 40シリーズ)に比べて2〜8倍もの性能向上を実現するシーンもあるとファンCEOは語る。
主なスペックは別記事を参照していただきたいが、例えば「GeForce RTX 5090」の場合、行列演算プロセッサ「Tensorコア」が4bit精度の演算にも対応したことで、生成AIの処理性能が「GeForceRTX 4090」の最大2倍に達する。
他のデスクトップ向けGPUでも「前世代の(同等製品に対して)最大2倍の性能」は変わりなく、これは最新世代のNVIDIA GPUに共通する特徴と言ってよいだろう。
またこのアーキテクチャは、モバイル向けの「GeForce RTX 50 Laptop GPUシリーズ」として、3月下旬からさまざまなPCメーカーから搭載製品がリリースされる。性能向上はもちろんだが、彼らが訴求しているのは省電力性能だ。省電力技術「Max-Q」を進化させたことで、前世代(GeForce RTX 40 Laptop GPUシリーズ)に比べ、最大40%ものバッテリー駆動時間延長効果が得られるという。
例えば新要素である「Advanced Power Gating」は、使われていないGPUを迅速にシャットダウンし、「Low Latency Sleep」はGPU使用時でもアイドル時間を検知し、こまめにスリープする。かなり細かい積み重ねで、省電力性を向上させている。
他にもさまざまな省電力機能を盛り込み、OSに組み込まれている小規模LLM(小規模言語モデル)の推論をバッテリー駆動でこなす場合でも、バッテリー駆動時間へのインパクトは最小限に抑えられる。
この基調講演でもう1つ注目を集めたのが「Project DIGITS」と呼ばれるコンパクトなAIコンピュータだ。本製品は20基の高効率コア(Cortex-X295×10基+Cortex-A725×10基)を備えるGrace CPUに、Blackwell GPUを接続したSoC「GB10 Grace Blackwell Superchip(GB10)」を備えている。FP4精度でのピーク演算性能は1PFLOPS(1000TFLOPS)だ。メモリは128GB(LPDDR5X規格)を備えているが、CPU/GPU共用の「ユニファイドメモリ」とすることで、CPUとGPUのデータ共有をしやすくしている。
この構成は「Apple Silicon(Apple Mプロセッサ)」と似ており、ある意味でのカウンターともいえる。Apple Siliconと異なるのは、Apple以外のコンピュータメーカーでも採用できる点に他ならない。
データセンター向けに提供するNVIDIA GB200 NVL72は、CPU1基+GPU2基を36セット搭載することでピーク演算性能は20PFLOPS(スパース利用時は40PFLOPS)というモンスター級の性能を備えるが、その分サイズはとても大きい。
その点、GB10は「20コアCPU+Blackwell GPUを備えるSoC」1つが最小単位なので、個人や小規模研究所でも導入しやすいというメリットがある。ファン氏の言葉を借りれば、「Project DIGITSを利用すれば、誰でも容易にAIの開発を始められる」。
それでいて、Project DIGITSはGB200を含むNVIDIAの大規模スーパーコンピュータ環境とソフトウェア的に互換性が保たれている。これも強みだ。
NVIDIAが新型GPU「GeForce RTX 50シリーズ」を発表 新アーキテクチャ「Blackwell」でパフォーマンスを約2倍向上 モバイル向けも
NVIDIA、2つのGPUダイを採用した新GPUアーキテクチャ「Blackwell」発表 電力効率25倍、AI性能は30倍に
「Blackwell」の次は「Rubin」へ フアンCEOが次世代GPUアーキテクチャのロードマップを紹介
GPUの「レイトレーシング処理」改良の歴史をひもとく【GeForce RTX 40シリーズ編】
ノートPC向け「GeForce RTX 40 Laptop」登場 搭載製品は2月8日から順次登場Copyright © ITmedia, Inc. All Rights Reserved.