検索
連載

Apple Siliconはなぜ「オンデバイスAI」に強いのか? NVIDIA「RTX Spark」との比較で読み解くシリコン設計の哲学本田雅一のクロスオーバーデジタル(5/5 ページ)

WWDC 2026が迫る中、AppleでApple Silicon(自社設計半導体)担当のシニアプロダクトマネージャーを務めるダグ・ブルックス氏に話を聞く機会を得た。

Share
Tweet
LINE
Hatena
前のページへ |       

NVIDIAのSoCとApple Siliconの違いを考察

 ここからは、ブルックス氏の発言からいったん離れて、筆者自身の検証と見立てを交えながら、RTX Sparkとの違いをもう少し考えてみたい。

 RTX Sparkは、Armアーキテクチャの20コアCPU「Grace」と、6144基のCUDAコアを擁するGPU「Blackwell」を統合したSoCで、そこに最大128GBの共有メモリを組み合わせて構成される。メモリ帯域幅はGB10と同じく毎秒273GBとなっており、M5 Maxチップの半分以下である。

 ピーク時のAI処理性能は1PFLOPS(毎秒1000兆回)のAI性能を持ち、「CUDA」から「TensorRT」、FP4のネイティブ実行まで、NVIDIAのAIスタック全体を、Arm版Windows上で動かすことができる

RTX Spark
RTX Sparkは、CPUコアとGPUコアを結合したSoCの周辺に共有メモリを配置する設計となっている

 NVIDIAの強みは「演算性能」「バッチ処理」、そしてCUDAを中心に長年積み上げてきた「ソフトウェアスタック」にある。中でもFP4(4bit浮動小数点)に量子化されたAIモデルを高速に処理できることは、大量のサンプルを並列に扱う局面で威力を発揮する。

 データセンターのように「多数のリクエストを束ねてGPUを使い切る」という使い方では、この演算能力が決定的に効く。ある意味で、RTX Sparkはデータセンターで培われたNVIDIAのAI技術をPCへと持ち込む試みだ。

 しかし、エンドユーザーが自分のデバイスで“対話的に”AIを使う場面では、クラウド上のサービスほどに大きなバッチサイズを取りにくい。低レイテンシーで応答することが重視されるため、演算性能よりもメモリ帯域幅が全体の速度を左右し、行列演算性能のピークを使い切れないことも珍しくない。

 FP4をネイティブ実行できることは、プロンプトや長大なコンテキストを一括処理するプリフィルの場面ではとりわけ大きな効果を発揮する。また、モデルが占有するメモリの容量や転送量を抑えられるため、デコードにとってもプラスの効果がある。

 ただし、デコード中心の日常的な利用における体感性能は、FP4への対応だけで決まるわけではない。「メモリ帯域」「量子化形式」「ランタイム」「コンテキスト長」を含めた、システム全体のバランスが重要になる。

 Apple Siliconでは、自身に最適化されたオープンソースの配列計算フレームワークである「MLX(Machine Learning Extensions)」を通して4bit量子化されたモデルを扱える。Apple自身も「GPT OSS 20B」をMXFP4精度で動かした評価結果を公開している。

 ただし、同じ4bit量子化ではあるものの、NVIDIAの「NVFP4」とMXFP4は同一の形式ではない。また、Apple SiliconがFP4系演算をハードウェアとしてどのように処理しているのか、詳細は明らかになっていない。

 それでも、いくつかのテスト結果を観察する限り、少なくとも筆者が想定するオンデバイスAIの用途において、FP4系のネイティブ演算の可否が支配的なボトルネックとなるようには見えない

MLX
MLXはGithubを通して情報が公開されている

 Apple Siliconは、異なるフォームファクターの製品を単一アーキテクチャでまとめ上げる方向で開発されてきた。これに対してRTX Sparkは、データセンターで培われてきたNVIDIAの技術資産を、PCというカテゴリーへ展開する製品である。

 CUDAを中心に約20年かけて積み上げてきた開発資産は、NVIDIAの大きな武器ではある。手元のデバイスでも、「AIモデルの開発やカスタマイズ」という用途なら価値は生きる。しかし、一般ユーザーが対話型AIを快適に使う場面では、CUDA資産は決定的な評価軸になるわけではない

WWDC 2026で期待される「+α」

 インタビューの終盤、筆者はブルックス氏に2つの論点を投げかけた。

1つは、WWDCでM5チップファミリーのより強力な派生モデル、すなわち「M5 Ultraチップ」の登場が期待されていること。もう1つは、M5 Ultraチップ(仮)に求められるであろう「AIモデル開発環境」としてのMacでは、強化学習を含むモデルのトレーニングにおいて、NVIDIAがCUDAで蓄積してきた資産は大きな価値を持つことだ。

 これらを伝えた上で、「Mac Studioの今後に期待を寄せるユーザーに向けて、何かメッセージはあるか?」と尋ねた。すると同氏は「未発表のハードウェアについて、今は語れない」としながら、こう応じた。

 今回のWWDCキーノートにぜひ注目してほしい。毎回、何か新しいニュースがある。新しいMac Studioのロードマップについて、どのような期待があるのか――顧客からの声は非常に大きく、そしてはっきりと耳に届いている

 仮にM5 Ultraチップが登場すれば、M3 Ultraチップにおいて相対的なボトルネックとなっていた行列演算性能は、飛躍的に向上するに違いない。

 では、NVIDIAのCUDA資産が大きな意味を持つ領域に対し、Appleはどのような解を示すのか。あるいは、コーディング支援のように、用途を絞り込んだソリューションを提示するのか――M5 Ultraチップ(仮)搭載のMac Studioとともに、どのようなユースケースや開発環境が提案されるのか。今から基調講演が楽しみだ。

WWDC
WWDC 2026は日本時間の6月9日午前2時から開催される

Copyright © ITmedia, Inc. All Rights Reserved.

前のページへ |       
ページトップに戻る