次世代の「Core Ultraプロセッサ」に採用! リアルタイムレイトレに対応したIntel内蔵GPUの“秘密”に迫るIntel Innovation 2023(4/6 ページ)

» 2023年11月09日 12時00分 公開
[西川善司ITmedia]

省かれた「推論アクセラレーター」 超解像処理のパフォーマンスは?

 先の記事でも触れた通り、Xe-LPGアーキテクチャのGPUでは、Xe-HPGアーキテクチャのGPUには存在する推論アクセラレーター「Xe Matrix Engine(XMX)」が省かれている。両アーキテクチャにおけるXe-Coreのブロックダイヤグラムを見比べると、そのことが分かりやすい。

Xe-Coreの比較 Xe-Coreのブロックダイヤグラムを見比べる。左のXe-HPG向けXe-CoreにはあるXMXが、右のXe-LPG向けXe-Coreでは“ごっそりと”省かれている

 ここで心配となるのが、「Intel版DLSS(Deep Learning Super Sampling)」ともいわれる、超解像/アンチエイリアス技術「Xe Super Sampling(XeSS)」の処理方法だ。

 XeSSでは、「低解像度画像」と「高解像度画像」の相関性を学習したデータを元にした推論エンジンをXMXで動かして、超解像処理やアンチエイリアス処理を行う――Intelはこう説明してきた。つまり、XMXがないXe-LPGベースのGPUでは、別の方法でXeSSを実装しなければならない。

 Core UltraプロセッサではXeSSが使えないのか――そう心配するユーザーが出てくるのを見越してか、同社は「XMXが省かれていても、XeSSは問題なく使える」と説明する。

 というのも、XeSSのAI処理系は、Micrsoftのシェーダー言語「HLSL(High-level Shader Language)」のうちの1つである「Shader Model 6.4(SM 6.4)」をベースとして作られている。そのため、XeSSはNVIDIAやAMDのSM 6.4対応GPUでも問題なく利用できてしまう。これは結構有名な話だ。

XeSS ON/OFF 「GeForce RTX 4090」で動かしたPC版の「Marvel's Spider-Man Remastered」において、XeSSをオフ(上)/オン(下)にしたところ。ちなみに、XeSSは本作の他、「Death Stranding」や「Shadow of the TOMBRAIDER」など、かなりの数のタイトルにおいて他社製GPUで有効化できることが確認されている
アストル氏 XeSSの実装に関する説明は、デイブ・アストル氏(Director of Game Engineering)が担当した

 なぜ、XMXがなくてもXeSSが動作するのか――これは、XMXの有無で処理系を変えているからだ。XMXがあるGPU(≒Xe-HPGアーキテクチャのGPU)の場合、XeSSのシェーダーコードはXMXにおいて処理される。

 それに対して、XMXがないGPUの場合、シェーダーユニットで普通のプログラマブルシェーダーコードとして実行される。これはXMXを備えないXe-LPGアーキテクチャのGPU(≒Meteor Lakeの内蔵GPU)でも同様で、XVEにおいて処理される。

XeSS XeSSの実行過程の模式図。XMXがないGPUでも、SM 6.4に対応していれば超解像処理を行えるようになっている

 XeSSにおける推論処理に用いられる根幹演算は、「符号付き8bit整数による4要素行列(ベクトル)積和算」だ。これは「DP4a(Signed Integer Dot-Product of 4 Elements and Accumulate)」と呼ばれる命令の過程で実行されるもので、IntelのCPU内蔵GPUではXe-LPアーキテクチャのGPU(≒Iris Xe Graphics)以降でサポートされている。

 Intelのデイブ・アストル氏(Director of Game Engineering)によると、XeSSがXVE上でプログラマブルシェーダコードとして実行されたとしても、通常の3Dグラフィックスのレンダリングにおけるパフォーマンスへの影響はないという。

 その根拠として、同氏はXe-LPGアーキテクチャではDP4aの演算/実行ユニットがXVE上に専用ロジックとして実装されていること、その動作クロックが大きく向上したこと、そしてグラフィックス描画に多用される「浮動小数点演算」と「DP4a命令」の処理が並列動作可能な仕様であることの3点を挙げている。

DP4a Xe-LPGアーキテクチャのGPUでは、DP4a命令の処理はXVE上で行われる。DPaA命令の中身は「整数のSIMD命令」なので、同アーキテクチャのGPUでは浮動小数点演算を伴う命令と同時に実行可能だ。ゆえに、XeSSの処理でDP4a命令が多く実行されたとしても、3Dグラフィックス描画で必要な「ジオメトリ演算」などのスループット(実効速度)に大きくは影響しないという

 他にも、アプリにXeSS対応を組み込むためのSDK(ソフトウェア開発キット)にもバージョンアップが加えられている。

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2024年05月09日 更新
最新トピックスPR

過去記事カレンダー