Apple Siliconはなぜ「オンデバイスAI」に強いのか? NVIDIA「RTX Spark」との比較で読み解くシリコン設計の哲学:本田雅一のクロスオーバーデジタル(5/5 ページ)
WWDC 2026が迫る中、AppleでApple Silicon(自社設計半導体)担当のシニアプロダクトマネージャーを務めるダグ・ブルックス氏に話を聞く機会を得た。
NVIDIAのSoCとApple Siliconの違いを考察
ここからは、ブルックス氏の発言からいったん離れて、筆者自身の検証と見立てを交えながら、RTX Sparkとの違いをもう少し考えてみたい。
RTX Sparkは、Armアーキテクチャの20コアCPU「Grace」と、6144基のCUDAコアを擁するGPU「Blackwell」を統合したSoCで、そこに最大128GBの共有メモリを組み合わせて構成される。メモリ帯域幅はGB10と同じく毎秒273GBとなっており、M5 Maxチップの半分以下である。
ピーク時のAI処理性能は1PFLOPS(毎秒1000兆回)のAI性能を持ち、「CUDA」から「TensorRT」、FP4のネイティブ実行まで、NVIDIAのAIスタック全体を、Arm版Windows上で動かすことができる。
NVIDIAの強みは「演算性能」「バッチ処理」、そしてCUDAを中心に長年積み上げてきた「ソフトウェアスタック」にある。中でもFP4(4bit浮動小数点)に量子化されたAIモデルを高速に処理できることは、大量のサンプルを並列に扱う局面で威力を発揮する。
データセンターのように「多数のリクエストを束ねてGPUを使い切る」という使い方では、この演算能力が決定的に効く。ある意味で、RTX Sparkはデータセンターで培われたNVIDIAのAI技術をPCへと持ち込む試みだ。
しかし、エンドユーザーが自分のデバイスで“対話的に”AIを使う場面では、クラウド上のサービスほどに大きなバッチサイズを取りにくい。低レイテンシーで応答することが重視されるため、演算性能よりもメモリ帯域幅が全体の速度を左右し、行列演算性能のピークを使い切れないことも珍しくない。
FP4をネイティブ実行できることは、プロンプトや長大なコンテキストを一括処理するプリフィルの場面ではとりわけ大きな効果を発揮する。また、モデルが占有するメモリの容量や転送量を抑えられるため、デコードにとってもプラスの効果がある。
ただし、デコード中心の日常的な利用における体感性能は、FP4への対応だけで決まるわけではない。「メモリ帯域」「量子化形式」「ランタイム」「コンテキスト長」を含めた、システム全体のバランスが重要になる。
Apple Siliconでは、自身に最適化されたオープンソースの配列計算フレームワークである「MLX(Machine Learning Extensions)」を通して4bit量子化されたモデルを扱える。Apple自身も「GPT OSS 20B」をMXFP4精度で動かした評価結果を公開している。
ただし、同じ4bit量子化ではあるものの、NVIDIAの「NVFP4」とMXFP4は同一の形式ではない。また、Apple SiliconがFP4系演算をハードウェアとしてどのように処理しているのか、詳細は明らかになっていない。
それでも、いくつかのテスト結果を観察する限り、少なくとも筆者が想定するオンデバイスAIの用途において、FP4系のネイティブ演算の可否が支配的なボトルネックとなるようには見えない。
Apple Siliconは、異なるフォームファクターの製品を単一アーキテクチャでまとめ上げる方向で開発されてきた。これに対してRTX Sparkは、データセンターで培われてきたNVIDIAの技術資産を、PCというカテゴリーへ展開する製品である。
CUDAを中心に約20年かけて積み上げてきた開発資産は、NVIDIAの大きな武器ではある。手元のデバイスでも、「AIモデルの開発やカスタマイズ」という用途なら価値は生きる。しかし、一般ユーザーが対話型AIを快適に使う場面では、CUDA資産は決定的な評価軸になるわけではない。
WWDC 2026で期待される「+α」
インタビューの終盤、筆者はブルックス氏に2つの論点を投げかけた。
1つは、WWDCでM5チップファミリーのより強力な派生モデル、すなわち「M5 Ultraチップ」の登場が期待されていること。もう1つは、M5 Ultraチップ(仮)に求められるであろう「AIモデル開発環境」としてのMacでは、強化学習を含むモデルのトレーニングにおいて、NVIDIAがCUDAで蓄積してきた資産は大きな価値を持つことだ。
これらを伝えた上で、「Mac Studioの今後に期待を寄せるユーザーに向けて、何かメッセージはあるか?」と尋ねた。すると同氏は「未発表のハードウェアについて、今は語れない」としながら、こう応じた。
今回のWWDCキーノートにぜひ注目してほしい。毎回、何か新しいニュースがある。新しいMac Studioのロードマップについて、どのような期待があるのか――顧客からの声は非常に大きく、そしてはっきりと耳に届いている。
仮にM5 Ultraチップが登場すれば、M3 Ultraチップにおいて相対的なボトルネックとなっていた行列演算性能は、飛躍的に向上するに違いない。
では、NVIDIAのCUDA資産が大きな意味を持つ領域に対し、Appleはどのような解を示すのか。あるいは、コーディング支援のように、用途を絞り込んだソリューションを提示するのか――M5 Ultraチップ(仮)搭載のMac Studioとともに、どのようなユースケースや開発環境が提案されるのか。今から基調講演が楽しみだ。
関連記事
NVIDIAが新型プロセッサ「RTX Spark」でWindows PCに“再挑戦” 搭載PCは2026年秋に登場
NVIDIAがWindows PCへの搭載を想定したプロセッサ(SoC)を、約13年ぶりにリリースする。AI全盛の時代において、AIを含むあらゆる処理が高速に行えることを前提にした設計としたことが特徴だ。なぜAppleは「半導体」と「製品」のトップを統合したのか クック退任より重要な「CHO新設」と究極の垂直統合
Appleが15年ぶりにCEOを交代する――このニュースは新旧CEOにばかり目が行ってしまいがちだが、新体制で新設される「CHO(最高ハードウェア責任者)」という役職にも注目すべきだ。突然の「スーパーコア」誕生と消えたEコア――Apple M5 Pro/Maxが断行した「CPU大再編」を読み解く
Appleが「M5 Proチップ」「M5 Maxチップ」を発表した。初めてM5チップのバリエーションモデルが出てきた格好だが、実はCPUコアの呼称が遡及的に変わっている。その背景を解説する。M5 Max搭載「14インチMacBook Pro」がワークステーションを過去にする 80万円超の“最強”モバイル AI PCを試す
AppleがM5 Pro/Maxチップ搭載の「MacBook Pro」をリリースした。今回は、SSDの容量以外は最上位構成の「14インチMacBook Pro」で、LLMをゴリゴリ動かしてみた。コンパクトボディーにスパコン並みのAI性能! 「NVIDIA RTX Spark」搭載ミニデスクトップPCを見てきた
NVIDIAがWindows PC向けのSoC「RTX Spark」を発表したのだが、注目を集めるのはノートPC製品ばかり。そこでこの記事では、あえてデスクトップPCに注目してみたい。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.