所有しているのに、手元にないように感じる不思議さ ミニスパコン「NVIDIA DGX Spark」と過ごした1カ月本田雅一のクロスオーバーデジタル(3/5 ページ)

» 2026年05月27日 16時00分 公開
[本田雅一ITmedia]

メモリ帯域の“狭さ”をカバーするのは「ソフトウェア」の最適化

 現状において、DGX Sparkの実質的なライバルはM3 Ultraチップ搭載のMac Studioということになる。

 理論的な性能を比べると、行列演算のスループットはNVIDIA GB10に軍配が上がる。一方で、ユニファイドメモリの帯域はM3 Ultraチップの方が広い。

 実測値を淡々と並べると、DGX Spark(NVIDIA GB10)では「gpt-oss(MXFP4)」で生成を行うと、20B(200億)パラメーターのモデルで毎秒49.7トークン、120B(1200億)パラメーターのモデルで毎秒38.5トークンとなる。

 「Llama 3.3 70B(Q4_K_M)」(700億パラメーター)だと毎秒4.4トークン、NVFP4+TensorRT-LLMに切り替えると毎秒5.4トークン。「Qwen3 235B」(2350億パラメーター)を2台分散で走らせると、毎秒11〜12トークンとなる。70Bクラスのモデルで毎秒5トークン程度となると、プロンプトを使った「会話」を成立させるには遅い。

 一方、M3 Ultraチップ搭載のMac Studio M3 UltraをApple独自の「MLX」フレームワークを使って演算させると、「DeepSeek-V3 685B」(6850億パラメーター)は毎秒20トークン以上、「R1 671B」(6710億パラメーター)だとを毎秒17〜18トークンで回す。

 この差が生まれる原因は、NVIDIA GB10の「毎秒273GB」というメモリ帯域の“狭さ”にある。M3チップ(毎秒819GB)の3分の1で、GeForce RTX 5090(毎秒1792GB)と比べるとわずか6分の1だ。

 トランスフォーマーモデルにおける「生成」のプロセスは帯域律速(※1)なので、メモリ帯域の差が、ほぼそのままスループットの差として出てしまうのだ。

(※1)律速:物事の進行や性能を左右するポイント

メモリ帯域幅 DGX Sparkが搭載するNVIDIA GB10のメモリ帯域幅は、毎秒273GBとなる。生成のプロセスを考えると、スループットに不足感がある

 加えて、エンジニアのジョン・カーマック氏は自身のhttps://x.com/ID_AA_Carmack/■□Xアカウント■で「DGX Sparkは公称240Wに対して、実負荷が100W止まりと、理論値の半分しか出ていない」という旨のポストをしている。

 本件に対して、Business Insiderによると、2026年1月に入手したNVIDIAの社内メールでファン氏自身が「すぐ出てきて『直す』と言え」と指示する記述があったという。

 加えて、DGX Sparkを購入した製薬大手のAstraZeneca(アストラゼネカ)の研究者や脳腫瘍研究を行う医師から受けた指摘に対して、数時間で修正パッチが出るということもあった。

 そして「CES 2026」のNVIDIAステージでは、ソフトウェアだけで最大2.6倍の性能向上を果たした旨が発表された。「vLLMのNVFP4対応」「Speculative Decoding/Eagle3/TensorRT-LLMのSM121カーネルへの最適化」の積み上げた結果だ。

 ハードのメモリ帯域は毎秒273GBで固定されているのに、同じ“箱”で発揮できる実効性能が“半年”で別物になったということになる。

高速化 AIモデルの最適化を進めることで、ハードウェアの仕様を変えずに平均35%のパフォーマンス改善を図った(参考記事

 実際にDGX Sparkを触っていて気付いたのだが、評価軸そのものがまだ定まっていないことが、このマシンに対する評価が大きく割れている原因だと思われる。

 カーマック氏もジェフ・ギアリング氏(※2)も、DGX Sparkを“ベンチマークスコア”を使って評価している。一方で、ServeTheHomeのパトリック・ケネディ氏や、Level1Techsのウェンデル氏はDGX Sparkを使って2週間で何を組み上げられたかで採点している。

 ベンチマークだけ見れば平凡に映るDGX Sparkだが、2週間を費やして何を作れたかで評価すると、別の側面が見えてくる――AIを稼働するハードウェアを測る物差しそのものが、まだ揺れていることを象徴する出来事といえる。

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2026年05月27日 更新
  1. おもちゃと侮るなかれ! レトロな画面&レバー搭載タイプライター風キーボード「EPOMAKER Glyph」は実用性抜群の“しごでき”モデルだった (2026年05月26日)
  2. 一部PCでWindows 11(バージョン 24H2/25H2)で5月のセキュリティ更新をインストールできない事象 今後の更新で解消予定(暫定回避策あり) (2026年05月26日)
  3. スマートウォッチとの“2台持ち”がはかどる! 約12gで画面レスの「Google Fitbit Air」とパーソナルAIコーチの実力を試す (2026年05月26日)
  4. 新開発の「ボールローラー支持」で滑らかさと静音性を実現! 全ボタン静音化&オンボードメモリを搭載したエレコムの新型トラックボール「IST PLUS」登場 (2026年05月26日)
  5. 付属PCが増加中! 「Microsoft 365 Personal(24か月版)/Office Home & Business 2024オプション付」って何? (2026年05月26日)
  6. サンコー、気化式冷却に対応した卓上タイプのUSB冷風扇 (2026年05月26日)
  7. 「実は社長を狙ってました(笑)」──元日本MS幹部が語るグーグル・クラウドへ移籍した理由と「伸び代しかない」日本のAI市場の今後 (2026年05月27日)
  8. 「ロジクール MX MASTER 3S Bluetooth Edition」がタイムセールで20%オフの1万2980円に (2026年05月25日)
  9. ハイエンドは「白」が選ばれる? 6万円台の高級キーボードや白いケーブルキットなど最新トレンドを追う (2026年05月25日)
  10. 「エルゴトロン LX モニターアーム」がセールで31%オフの1万6380円に (2026年05月25日)
最新トピックスPR

過去記事カレンダー

2026年