検索
連載

所有しているのに、手元にないように感じる不思議さ ミニスパコン「NVIDIA DGX Spark」と過ごした1カ月本田雅一のクロスオーバーデジタル(2/5 ページ)

NVIDIAからミニスパコン「NVIDIA DGX Spark Founders Edition」を借りて約1カ月ほど使ってみた。すると、使ってみないと分からないことがいろいろあることに気が付いた。この記事でまとめてみたい。

Share
Tweet
LINE
Hatena

MediaTekとNVIDIAが作り上げた「NVIDIA GB10」を搭載

 DGX Sparkが搭載している「NVIDIA GB10(Grace Blackwell Superchip)」は、複数のダイをインターコネクトしたマルチダイ構成のSoC(System on a Chip)で、台湾TSMCの3nmプロセスで生産される。BlackwellアーキテクチャのGPUダイはNVIDIAの自社設計である一方、ArmアーキテクチャのCPUダイは台湾MediaTekで設計したものだ。

 自社ブランドのSoCにおいて、NVIDIAが大切な役割を果たす部分を“外部”に委ねたのは異例といえる。

NVIDIA GB10
NVIDIA GB10は、NVIDIAとMediaTekの共同開発によって生まれた

 CPUコアは、パフォーマンスコア(Pコア)に相当する「Cortex-X925」と、高効率コア(Eコア)に相当する「Cortex-A725」を10基ずつ搭載する。

 GPUコアは「GeForce RTX 50」シリーズと同じBlackwellアーキテクチャで、ストリーミングマルチプロセッサ(SM)は48基、CUDAコアは6144基を備え、Tensorコア(第5世代)はNVFP4フォーマットにネイティブ対応する。FP4演算時のピーク性能である1PFLOPSは、GeForce RTX 50シリーズに当てはめると、デスクトップ向けの「GeForce RTX 5070」と「GeForce RTX 5070 Ti」の中間にある。

 ここまでを聞くと「スーパーコンピュータと言うほどのスペックではないのでは?」と思うかもしれないが、DGX Sparkの重要なポイントはCPUコアとGPUコアが同じメモリを“共有”していることと、背面のConnectX-7ポート×2でDGX Spark同士を“直結”して演算能力を高められることにある。

 特にユニファイドメモリであることの効果はてきめんで、70B(700億)パラメーターのLLM(大規模言語モデル)はもちろん、120BパラメーターのMoEも、ロード直後からGPUで演算できる。QSFP112 DACケーブルで2台つなげば、合計256GBの広大なメモリ空間によって「Llama 3.1 405B(NVFP4)」も“オンデバイス”で動いてしまう。

 データセンターの「Tensor Parallel」と「Pipeline Parallel」の作法が、そのまま机の上で走る――「Mac Studio」にPCベースのRTXワークステーションにもない設計だ。

ConnectX-7ポート
DGX Sparkの本体には、ConnectX-7ポートを2基搭載している。これを使って本機を2台“直結”すると、演算能力だけでなくメモリ空間も2倍に広がる

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る