先の記事でも触れた通り、Xe-LPGアーキテクチャのGPUでは、Xe-HPGアーキテクチャのGPUには存在する推論アクセラレーター「Xe Matrix Engine(XMX)」が省かれている。両アーキテクチャにおけるXe-Coreのブロックダイヤグラムを見比べると、そのことが分かりやすい。
ここで心配となるのが、「Intel版DLSS(Deep Learning Super Sampling)」ともいわれる、超解像/アンチエイリアス技術「Xe Super Sampling(XeSS)」の処理方法だ。
XeSSでは、「低解像度画像」と「高解像度画像」の相関性を学習したデータを元にした推論エンジンをXMXで動かして、超解像処理やアンチエイリアス処理を行う――Intelはこう説明してきた。つまり、XMXがないXe-LPGベースのGPUでは、別の方法でXeSSを実装しなければならない。
Core UltraプロセッサではXeSSが使えないのか――そう心配するユーザーが出てくるのを見越してか、同社は「XMXが省かれていても、XeSSは問題なく使える」と説明する。
というのも、XeSSのAI処理系は、Micrsoftのシェーダー言語「HLSL(High-level Shader Language)」のうちの1つである「Shader Model 6.4(SM 6.4)」をベースとして作られている。そのため、XeSSはNVIDIAやAMDのSM 6.4対応GPUでも問題なく利用できてしまう。これは結構有名な話だ。
なぜ、XMXがなくてもXeSSが動作するのか――これは、XMXの有無で処理系を変えているからだ。XMXがあるGPU(≒Xe-HPGアーキテクチャのGPU)の場合、XeSSのシェーダーコードはXMXにおいて処理される。
それに対して、XMXがないGPUの場合、シェーダーユニットで普通のプログラマブルシェーダーコードとして実行される。これはXMXを備えないXe-LPGアーキテクチャのGPU(≒Meteor Lakeの内蔵GPU)でも同様で、XVEにおいて処理される。
XeSSにおける推論処理に用いられる根幹演算は、「符号付き8bit整数による4要素行列(ベクトル)積和算」だ。これは「DP4a(Signed Integer Dot-Product of 4 Elements and Accumulate)」と呼ばれる命令の過程で実行されるもので、IntelのCPU内蔵GPUではXe-LPアーキテクチャのGPU(≒Iris Xe Graphics)以降でサポートされている。
Intelのデイブ・アストル氏(Director of Game Engineering)によると、XeSSがXVE上でプログラマブルシェーダコードとして実行されたとしても、通常の3Dグラフィックスのレンダリングにおけるパフォーマンスへの影響はないという。
その根拠として、同氏はXe-LPGアーキテクチャではDP4aの演算/実行ユニットがXVE上に専用ロジックとして実装されていること、その動作クロックが大きく向上したこと、そしてグラフィックス描画に多用される「浮動小数点演算」と「DP4a命令」の処理が並列動作可能な仕様であることの3点を挙げている。
他にも、アプリにXeSS対応を組み込むためのSDK(ソフトウェア開発キット)にもバージョンアップが加えられている。
Copyright © ITmedia, Inc. All Rights Reserved.