DGX Sparkが搭載している「NVIDIA GB10(Grace Blackwell Superchip)」は、複数のダイをインターコネクトしたマルチダイ構成のSoC(System on a Chip)で、台湾TSMCの3nmプロセスで生産される。BlackwellアーキテクチャのGPUダイはNVIDIAの自社設計である一方、ArmアーキテクチャのCPUダイは台湾MediaTekで設計したものだ。
自社ブランドのSoCにおいて、NVIDIAが大切な役割を果たす部分を“外部”に委ねたのは異例といえる。
CPUコアは、パフォーマンスコア(Pコア)に相当する「Cortex-X925」と、高効率コア(Eコア)に相当する「Cortex-A725」を10基ずつ搭載する。
GPUコアは「GeForce RTX 50」シリーズと同じBlackwellアーキテクチャで、ストリーミングマルチプロセッサ(SM)は48基、CUDAコアは6144基を備え、Tensorコア(第5世代)はNVFP4フォーマットにネイティブ対応する。FP4演算時のピーク性能である1PFLOPSは、GeForce RTX 50シリーズに当てはめると、デスクトップ向けの「GeForce RTX 5070」と「GeForce RTX 5070 Ti」の中間にある。
ここまでを聞くと「スーパーコンピュータと言うほどのスペックではないのでは?」と思うかもしれないが、DGX Sparkの重要なポイントはCPUコアとGPUコアが同じメモリを“共有”していることと、背面のConnectX-7ポート×2でDGX Spark同士を“直結”して演算能力を高められることにある。
特にユニファイドメモリであることの効果はてきめんで、70B(700億)パラメーターのLLM(大規模言語モデル)はもちろん、120BパラメーターのMoEも、ロード直後からGPUで演算できる。QSFP112 DACケーブルで2台つなげば、合計256GBの広大なメモリ空間によって「Llama 3.1 405B(NVFP4)」も“オンデバイス”で動いてしまう。
データセンターの「Tensor Parallel」と「Pipeline Parallel」の作法が、そのまま机の上で走る――「Mac Studio」にPCベースのRTXワークステーションにもない設計だ。
NVIDIAのAI特化型ミニPC「DGX Spark」、台湾の主要PCメーカーからも7月に発売
GeForce RTX 50だけではない! 社会がAIを基礎にしたものに置き換わる? 「CES 2025」で聴衆を圧倒したNVIDIAの最新構想
最大20PFLOPSで爆速AI処理! MSI版「DGX Station」(プロトタイプ)をチェック!
NVIDIAのフアンCEOの一問一答 「AIネイティブにとってのパーソナルコンピューターが生まれる」の真意
フルスペックの新型「Mac Studio」に触れて考える、Appleが提案するM3 Ultraチップの真価Copyright © ITmedia, Inc. All Rights Reserved.