「Llama 3.3 70B（Q4_K_M）」（700億パラメーター）だと毎秒4.4トークン、NVFP4＋TensorRT-LLMに切り替えると毎秒5.4トークン。「Qwen3 235B」（2350億パラメーター）を2台分散で走らせると、毎秒11～12トークンとなる。70Bクラスのモデルで毎秒5トークン程度となると、プロンプトを使った「会話」を成立させるには遅い。

　一方、M3 Ultraチップ搭載のMac Studio M3 UltraをApple独自の「MLX」フレームワークを使って演算させると、「DeepSeek-V3 685B」（6850億パラメーター）は毎秒20トークン以上、「R1 671B」（6710億パラメーター）だとを毎秒17～18トークンで回す。

　この差が生まれる原因は、NVIDIA GB10の「毎秒273GB」というメモリ帯域の“狭さ”にある。M3チップ（毎秒819GB）の3分の1で、GeForce RTX 5090（毎秒1792GB）と比べるとわずか6分の1だ。

　トランスフォーマーモデルにおける「生成」のプロセスは帯域律速（※1）なので、メモリ帯域の差が、ほぼそのままスループットの差として出てしまうのだ。

（※1）律速：物事の進行や性能を左右するポイント

DGX Sparkが搭載するNVIDIA GB10のメモリ帯域幅は、毎秒273GBとなる。生成のプロセスを考えると、スループットに不足感がある

　加えて、エンジニアのジョン・カーマック氏は自身のhttps://x.com/ID_AA_Carmack/■□Xアカウント■で「DGX Sparkは公称240Wに対して、実負荷が100W止まりと、理論値の半分しか出ていない」という旨のポストをしている。

　本件に対して、Business Insiderによると、2026年1月に入手したNVIDIAの社内メールでファン氏自身が「すぐ出てきて『直す』と言え」と指示する記述があったという。

　加えて、DGX Sparkを購入した製薬大手のAstraZeneca（アストラゼネカ）の研究者や脳腫瘍研究を行う医師から受けた指摘に対して、数時間で修正パッチが出るということもあった。

→CEO Jensen Huang stepped in as criticism mounted over a key Nvidia product launch, internal emails show（Business Insider）

　そして「CES 2026」のNVIDIAステージでは、ソフトウェアだけで最大2.6倍の性能向上を果たした旨が発表された。「vLLMのNVFP4対応」「Speculative Decoding／Eagle3／TensorRT-LLMのSM121カーネルへの最適化」の積み上げた結果だ。

　ハードのメモリ帯域は毎秒273GBで固定されているのに、同じ“箱”で発揮できる実効性能が“半年”で別物になったということになる。

→CES 2026における発表内容の概要（日本語）

AIモデルの最適化を進めることで、ハードウェアの仕様を変えずに平均35％のパフォーマンス改善を図った（参考記事）

　実際にDGX Sparkを触っていて気付いたのだが、評価軸そのものがまだ定まっていないことが、このマシンに対する評価が大きく割れている原因だと思われる。

　カーマック氏もジェフ・ギアリング氏（※2）も、DGX Sparkを“ベンチマークスコア”を使って評価している。一方で、ServeTheHomeのパトリック・ケネディ氏や、Level1Techsのウェンデル氏はDGX Sparkを使って2週間で何を組み上げられたかで採点している。

　ベンチマークだけ見れば平凡に映るDGX Sparkだが、2週間を費やして何を作れたかで評価すると、別の側面が見えてくる――AIを稼働するハードウェアを測る物差しそのものが、まだ揺れていることを象徴する出来事といえる。

クラウドと同じAIスタックを机上で動かせる

NVIDIAのAI特化型ミニPC「DGX Spark」、台湾の主要PCメーカーからも7月に発売
GeForce RTX 50だけではない！　社会がAIを基礎にしたものに置き換わる？　「CES 2025」で聴衆を圧倒したNVIDIAの最新構想
NVIDIAのジェンスン・ファンCEOが「CES 2025」の基調講演に登壇した。新アーキテクチャのGPU「GeForce RTX 50シリーズ」に注目が集まりがちだが、注目すべきポイントはそこだけではない。
最大20PFLOPSで爆速AI処理！　MSI版「DGX Station」（プロトタイプ）をチェック！
スタンドアロンでスーパーコンピュータ並みのAI処理ができる――NVIDIAのデスクトップコンピュータ「DGX Station」の最新モデルは、主要なPCメーカーからも発売される。MSIのエンタープライズ製品ブースに行ってみたところ、同社版のプロトタイプが展示されていたので、サックリとチェックしてみよう。
NVIDIAのフアンCEOの一問一答　「AIネイティブにとってのパーソナルコンピューターが生まれる」の真意
NVIDIAのジェンスン・フアンCEOが、報道関係者やアナリストからの質疑に応じた。その中で「新しいWindows ML」「ローカルAIデバイス」のメリットを語る場面があった。
フルスペックの新型「Mac Studio」に触れて考える、Appleが提案するM3 Ultraチップの真価
M3 Ultraチップを搭載した「Mac Studio」が登場したが、気になるのはM4 Maxチップを搭載した製品との用途の違いだ。

前のページへ 1|2|3|4|5 次のページへ

SpecialPR

アクセストップ10

2026年07月12日更新

パーツ高騰で「低容量」と「旧世代」に熱視線――500GB SSDやRTX 3060 12GB版がアキバで目立つ理由（2026年07月11日）
白くて縦に3つ折りできる「Ewin 折りたたみ式ワイヤレスキーボード」がセールで15％オフの5080円に（2026年07月09日）
片手で使えるゲーミングキーボード「EPOMAKER HE30」が25％オフの6563円に（2026年07月09日）
14.6型の大型Androidタブレット「Samsung Galaxy Tab S11 Ultra」が24％オフの18万955円に（2026年07月09日）
あえてのカメラ非搭載による安心感、日常に溶け込む超軽量スマートグラス「Even G2」を試す　サードパーティーアプリの環境も魅力（2026年07月09日）
エイサー、Android搭載14型／16型タブレット「Acer Iconia」の新モデル3機種を発売（2026年07月10日）
PCデスクをサイバーパンク風に演出できる「Divoom Times Gate」がセールで26％オフの1万300円に（2026年07月10日）
リコーイメージング、ハイエンドコンデジ「RICOH GR IV」をベースにした30周年特別仕様モデルの一部情報を予告（2026年07月09日）
14.5型のサブディスプレイ「CORSAIR XENEON EDGE」がセールで21％オフの3万3980円に（2026年07月11日）
ユニークな形の「Ewin ワイヤレスミニキーボード」がセールで3978円に　USB Type-C変換アダプターも付属（2026年07月11日）

ランキングトップ30

最新トピックスPR

過去記事カレンダー

2026年

2025年

2024年

2023年

2022年

2021年

2020年

2019年

2018年

2017年

2016年

2015年

2014年

2013年

2012年

2011年

2010年

2009年

2008年

2007年

2006年

2005年

2004年

2003年

Feed Back

利用規約

ITmediaはアイティメディア株式会社の登録商標です。

所有しているのに、手元にないように感じる不思議さ ミニスパコン「NVIDIA DGX Spark」と過ごした1カ月：本田雅一のクロスオーバーデジタル（3/5 ページ）

メモリ帯域の“狭さ”をカバーするのは「ソフトウェア」の最適化

関連記事