次世代の「Core Ultraプロセッサ」に採用! リアルタイムレイトレに対応したIntel内蔵GPUの“秘密”に迫るIntel Innovation 2023(4/6 ページ)

» 2023年11月09日 12時00分 公開
[西川善司ITmedia]

省かれた「推論アクセラレーター」 超解像処理のパフォーマンスは?

 先の記事でも触れた通り、Xe-LPGアーキテクチャのGPUでは、Xe-HPGアーキテクチャのGPUには存在する推論アクセラレーター「Xe Matrix Engine(XMX)」が省かれている。両アーキテクチャにおけるXe-Coreのブロックダイヤグラムを見比べると、そのことが分かりやすい。

Xe-Coreの比較 Xe-Coreのブロックダイヤグラムを見比べる。左のXe-HPG向けXe-CoreにはあるXMXが、右のXe-LPG向けXe-Coreでは“ごっそりと”省かれている

 ここで心配となるのが、「Intel版DLSS(Deep Learning Super Sampling)」ともいわれる、超解像/アンチエイリアス技術「Xe Super Sampling(XeSS)」の処理方法だ。

 XeSSでは、「低解像度画像」と「高解像度画像」の相関性を学習したデータを元にした推論エンジンをXMXで動かして、超解像処理やアンチエイリアス処理を行う――Intelはこう説明してきた。つまり、XMXがないXe-LPGベースのGPUでは、別の方法でXeSSを実装しなければならない。

 Core UltraプロセッサではXeSSが使えないのか――そう心配するユーザーが出てくるのを見越してか、同社は「XMXが省かれていても、XeSSは問題なく使える」と説明する。

 というのも、XeSSのAI処理系は、Micrsoftのシェーダー言語「HLSL(High-level Shader Language)」のうちの1つである「Shader Model 6.4(SM 6.4)」をベースとして作られている。そのため、XeSSはNVIDIAやAMDのSM 6.4対応GPUでも問題なく利用できてしまう。これは結構有名な話だ。

XeSS ON/OFF 「GeForce RTX 4090」で動かしたPC版の「Marvel's Spider-Man Remastered」において、XeSSをオフ(上)/オン(下)にしたところ。ちなみに、XeSSは本作の他、「Death Stranding」や「Shadow of the TOMBRAIDER」など、かなりの数のタイトルにおいて他社製GPUで有効化できることが確認されている
アストル氏 XeSSの実装に関する説明は、デイブ・アストル氏(Director of Game Engineering)が担当した

 なぜ、XMXがなくてもXeSSが動作するのか――これは、XMXの有無で処理系を変えているからだ。XMXがあるGPU(≒Xe-HPGアーキテクチャのGPU)の場合、XeSSのシェーダーコードはXMXにおいて処理される。

 それに対して、XMXがないGPUの場合、シェーダーユニットで普通のプログラマブルシェーダーコードとして実行される。これはXMXを備えないXe-LPGアーキテクチャのGPU(≒Meteor Lakeの内蔵GPU)でも同様で、XVEにおいて処理される。

XeSS XeSSの実行過程の模式図。XMXがないGPUでも、SM 6.4に対応していれば超解像処理を行えるようになっている

 XeSSにおける推論処理に用いられる根幹演算は、「符号付き8bit整数による4要素行列(ベクトル)積和算」だ。これは「DP4a(Signed Integer Dot-Product of 4 Elements and Accumulate)」と呼ばれる命令の過程で実行されるもので、IntelのCPU内蔵GPUではXe-LPアーキテクチャのGPU(≒Iris Xe Graphics)以降でサポートされている。

 Intelのデイブ・アストル氏(Director of Game Engineering)によると、XeSSがXVE上でプログラマブルシェーダコードとして実行されたとしても、通常の3Dグラフィックスのレンダリングにおけるパフォーマンスへの影響はないという。

 その根拠として、同氏はXe-LPGアーキテクチャではDP4aの演算/実行ユニットがXVE上に専用ロジックとして実装されていること、その動作クロックが大きく向上したこと、そしてグラフィックス描画に多用される「浮動小数点演算」と「DP4a命令」の処理が並列動作可能な仕様であることの3点を挙げている。

DP4a Xe-LPGアーキテクチャのGPUでは、DP4a命令の処理はXVE上で行われる。DPaA命令の中身は「整数のSIMD命令」なので、同アーキテクチャのGPUでは浮動小数点演算を伴う命令と同時に実行可能だ。ゆえに、XeSSの処理でDP4a命令が多く実行されたとしても、3Dグラフィックス描画で必要な「ジオメトリ演算」などのスループット(実効速度)に大きくは影響しないという

 他にも、アプリにXeSS対応を組み込むためのSDK(ソフトウェア開発キット)にもバージョンアップが加えられている。

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2026年06月10日 更新
  1. 「次世代Apple Intelligence」をフル活用するにはどのような条件がある? 「Siri AI」は日本で使える? 知っておくべき対応モデルのハードル (2026年06月09日)
  2. 「macOS 27 Golden Gate」が2026年秋に登場 初のApple Silicon専用バージョンに (2026年06月09日)
  3. 実売1万円切りでパススルー給電にも対応! KTCの15.6型モバイルディスプレイ「H15F9」は“買い”か (2026年06月09日)
  4. 初のカラー対応「Kindle Scribe Colorsoft」の実力は? 通常モデルとの価格差1万7000円の価値を検証 (2026年06月10日)
  5. Apple Siliconはなぜ「オンデバイスAI」に強いのか? NVIDIA「RTX Spark」との比較で読み解くシリコン設計の哲学 (2026年06月08日)
  6. 「Geminiの技術は使うが、Geminiではない」 WWDC26で見えたApple流AIとプライバシー戦略の核心 (2026年06月10日)
  7. 高騰中のSSD、品薄のHDD──けれど“最終処分”のニーズは変わらず (2026年06月06日)
  8. 新GPU「RX 9070 GRE」搭載カード発売! 既存上位モデル「RX 9070 XT」との価格差に悩む声も (2026年06月08日)
  9. ミニPCに強みの「MINISFORUM」 ミニワークステーションの新モデルから「謎の拡張カード」まで多彩な製品を披露 (2026年06月10日)
  10. コンパクトボディーにスパコン並みのAI性能! 「NVIDIA RTX Spark」搭載ミニデスクトップPCを見てきた (2026年06月04日)
最新トピックスPR

過去記事カレンダー