所有しているのに、手元にないように感じる不思議さ ミニスパコン「NVIDIA DGX Spark」と過ごした1カ月:本田雅一のクロスオーバーデジタル(2/5 ページ)
NVIDIAからミニスパコン「NVIDIA DGX Spark Founders Edition」を借りて約1カ月ほど使ってみた。すると、使ってみないと分からないことがいろいろあることに気が付いた。この記事でまとめてみたい。
MediaTekとNVIDIAが作り上げた「NVIDIA GB10」を搭載
DGX Sparkが搭載している「NVIDIA GB10(Grace Blackwell Superchip)」は、複数のダイをインターコネクトしたマルチダイ構成のSoC(System on a Chip)で、台湾TSMCの3nmプロセスで生産される。BlackwellアーキテクチャのGPUダイはNVIDIAの自社設計である一方、ArmアーキテクチャのCPUダイは台湾MediaTekで設計したものだ。
自社ブランドのSoCにおいて、NVIDIAが大切な役割を果たす部分を“外部”に委ねたのは異例といえる。
CPUコアは、パフォーマンスコア(Pコア)に相当する「Cortex-X925」と、高効率コア(Eコア)に相当する「Cortex-A725」を10基ずつ搭載する。
GPUコアは「GeForce RTX 50」シリーズと同じBlackwellアーキテクチャで、ストリーミングマルチプロセッサ(SM)は48基、CUDAコアは6144基を備え、Tensorコア(第5世代)はNVFP4フォーマットにネイティブ対応する。FP4演算時のピーク性能である1PFLOPSは、GeForce RTX 50シリーズに当てはめると、デスクトップ向けの「GeForce RTX 5070」と「GeForce RTX 5070 Ti」の中間にある。
ここまでを聞くと「スーパーコンピュータと言うほどのスペックではないのでは?」と思うかもしれないが、DGX Sparkの重要なポイントはCPUコアとGPUコアが同じメモリを“共有”していることと、背面のConnectX-7ポート×2でDGX Spark同士を“直結”して演算能力を高められることにある。
特にユニファイドメモリであることの効果はてきめんで、70B(700億)パラメーターのLLM(大規模言語モデル)はもちろん、120BパラメーターのMoEも、ロード直後からGPUで演算できる。QSFP112 DACケーブルで2台つなげば、合計256GBの広大なメモリ空間によって「Llama 3.1 405B(NVFP4)」も“オンデバイス”で動いてしまう。
データセンターの「Tensor Parallel」と「Pipeline Parallel」の作法が、そのまま机の上で走る――「Mac Studio」にPCベースのRTXワークステーションにもない設計だ。
関連記事
NVIDIAのAI特化型ミニPC「DGX Spark」、台湾の主要PCメーカーからも7月に発売
GeForce RTX 50だけではない! 社会がAIを基礎にしたものに置き換わる? 「CES 2025」で聴衆を圧倒したNVIDIAの最新構想
NVIDIAのジェンスン・ファンCEOが「CES 2025」の基調講演に登壇した。新アーキテクチャのGPU「GeForce RTX 50シリーズ」に注目が集まりがちだが、注目すべきポイントはそこだけではない。最大20PFLOPSで爆速AI処理! MSI版「DGX Station」(プロトタイプ)をチェック!
スタンドアロンでスーパーコンピュータ並みのAI処理ができる――NVIDIAのデスクトップコンピュータ「DGX Station」の最新モデルは、主要なPCメーカーからも発売される。MSIのエンタープライズ製品ブースに行ってみたところ、同社版のプロトタイプが展示されていたので、サックリとチェックしてみよう。NVIDIAのフアンCEOの一問一答 「AIネイティブにとってのパーソナルコンピューターが生まれる」の真意
NVIDIAのジェンスン・フアンCEOが、報道関係者やアナリストからの質疑に応じた。その中で「新しいWindows ML」「ローカルAIデバイス」のメリットを語る場面があった。フルスペックの新型「Mac Studio」に触れて考える、Appleが提案するM3 Ultraチップの真価
M3 Ultraチップを搭載した「Mac Studio」が登場したが、気になるのはM4 Maxチップを搭載した製品との用途の違いだ。
Copyright © ITmedia, Inc. All Rights Reserved.