検索
ニュース

「Snapdragon X2 Elite」がNPU性能「80TOPS」をアピールする理由鈴木淳也の「Windows」フロントライン(3/3 ページ)

Qualcommが11月に開催したイベント「Snapdragon Architecture Deep Dive 2025」で語られた、最新PC向けSoC「Snapdragon X2 Elite」について細かく見ていこう。

Share
Tweet
LINE
Hatena
前のページへ |       

Agentic AI時代はNPU「80TOPS」も通過点

 最後はAIトレンドの話題だ。

 以前のレポートでも触れたが、X2 EliteのNPUでサポートされたINT2を始め、INT4やINT8、FP8にBF16など、AI処理の世界では比較的低精度のデータ型が利用される傾向が強くなっているのは、大きなパラメーターを持つAIモデルであっても、少ないメモリ容量で高速動作するフットプリントの小さいモデルが好まれることが理由にある。

 当然、そのぶん推論の精度が落ちるわけだが、学習時の工夫である程度までカバーできるため、いかに少ない“bit”数でモデルを動作させるかが鍵となる。

 これは、例えばスマートフォンのような小型デバイスで巨大なモデルを動作させる場合に重要となるが、同時に世間は高い精度を要求する画像生成AIのようなモデルの実行であったり、Agentic AIに代表される「複数のAIモデルが互いに連携して“1つの”タスクを完了させる」といった仕組みを取り入れる方向にあり、NPUの負荷が必然的に高くなる。

 つまり、軽くできる処理はなるべく軽くして、可能な限り“余白”を作っていくことが将来的に必要となる。


AI処理のトレンドの変化

 下は参考図だが、例えばAgentic AIが複数動作する状況を想定し、30億パラメーター(3B)/70億パラメーター(7B)/140億パラメーター(14B)をそれぞれ持つLLMとLVMを協調動作させた場合、どれだけのTOPSがNPUに要求されるのかを図示したものになる。

 X2 Eliteに搭載されるNPUのTOPSは80だが、140億パラメーターのモデルの場合、2つのエージェントを組み合わせただけでほぼ処理が限界だ。今後もしAgentic AIが主流となり、ほとんど全ての処理においてAgentic AIが介入するようになれば、現状で使い切れていない80TOPSの性能でさえ、割とすぐに限界に達することになる。

 Agentic AIの性質として、基本はバックグラウンド動作となるので、低消費電力が前提でありNPUの活用が基本となる。そのため、その動作にGPUの処理能力を借りるのは目指す趣旨から外れることになる。これが今回アピールされた「80TOPS」の性能にまつわる背景であり、今後も引き続き処理能力向上を目指す理由でもある。

 なお、AI動作のフレームワークとしてはWindows on Arm(Snapdragon)の場合、Microsoftの「Windows ML(ハードウェア非依存)」とQualcomm独自の「QNN/Direct」の2種類の選択肢があるが、当然独自仕様の後者の方がハードウェアの性能を最大限に引き出せると考えられる。

 だがQualcommによれば、「どちらを使用しても同等のパフォーマンスを実現可能」とのことで、そういった意味での差別化はないとのスタンスだ。


Agentic AIとしてLLMとLVMを動作させた場合の要求TOPSの推移

AIフレームワークとしてはMicrosoftのWindows MLとQualcommのQNNの2種類をサポートするが、どちらを選んでも性能的差異はないという

Copyright © ITmedia, Inc. All Rights Reserved.

前のページへ |       
ページトップに戻る