下の図は、Xe3 GPUの機能強化部分がXe2アーキテクチャと比べてどのくらいパフォーマンスを向上したのかを示したものだ(Xe2を「1」とした場合の相対スコア)。
レイトレのパフォーマンスはXe2比で「2.0倍」となっている……のだが、Xe3 GPUのレイトレーシングユニットの数はXe2 GPU比で1.5倍でしかない。「0.5倍」の上乗せは、恐らくDynamic Ray Managementの恩恵だろう。
メッシュレンダリング(Mesh Rendering)のパフォーマンスは「2.4倍」、高レジスタープレッシャーシェーダー(High Register Pressure Shader)のパフォーマンスに至っては「3.1倍」にまで向上している。これはVariable Register Allocationから導出された実行スレッド数の25%増加と、URBの改善による効果だ。
16x Anisotropic Filtering sRGBのパフォーマンスが「2.0倍」となったことと、Depth Writesが「最大7.4倍」となっているのは、「Up to 2X Anisotropic Filtering」「Upto 2x Stencil Test rate」のチューニングの恩恵だろう。
ちなみに「Xe3 GPUの“総合”パフォーマンスはどうなんだ?」という点について、Intelは非常にざっくりとしたグラフしか示していない。一応、Core Ultra 200Hプロセッサに搭載された「Xe GPU」やCore Ultra 200Vプロセッサに搭載された「Xe2 GPU」から順当な性能向上を果たしているよということは分かる。
実際の人気ゲームにおけるパフォーマンスは、市販製品が出てきてから各メディアが実測して示してくれるはず。その時が来るまで、最終評価はお預けだ。
下図は、とあるゲーム実行時のXe2 GPUとXe3 GPUのパフォーマンスの違いを見せたグラフになる。少し分かりにくいのだが、このグラフの横軸は時間ではなく、APIコールの通算数を表す。縦軸も難解で、こちらはAPIの実施に掛かった累積時間になる。
つまり、このグラフは必ず右肩上がりとなり、高さが低い方が優秀ということになる。グラフの右端に書かれた時間(ミリ秒単位)は、1フレームの描画に掛かった総時間を表している。
グラフの各所に囲まれたポイントが数カ所あるが、これらにはここまで筆者が解説してきた、Xe3 GPUのさまざまな機能改善点が大きく表れている。
左端は、Variable Register Allocationによって実行スレッド数が最大10になったことによる処理時間の短縮分を表している。ここから右に順番に見ていくと、次はL2キャッシュが16MBに増量された効果だ。
ここに記載されている「Render Pre Pass」とは、具体的にはDeferred Rendering(遅延レンダリング)における「G-Bufferレンダリング」を指している。G-Buffer(Geometry Buffer:ジオメトリバッファー)は、後段に行うライティングに必要なパラメーター群(法線/深度/鏡面反射/ベースカラーなど)を収めたものだ。平常は「Multi-Render Target(MRT)」で最大8枚を同時出力するため、それなりに負荷は高い。
後段3つのポイントも、Variable Register Allocationの恩恵を表している。Compute ShaderやPixel Shaderの処理がXe2 GPUよりもだいぶ速くなっているということが分かる。
Xeコアの最大数が1.5倍になったXe3 GPUだが、フレーム処理の時間は2倍近くも違うので、ここは素直にXe3 GPUの改良点が着実な効果を見せていると見て良いだろう。
Core Ultraプロセッサ(シリーズ3)の「Xe3 GPU」の全体像を解説 完全な新世代ではないものの用途に合わせた最適化がポイント
Intelの新型CPU「Core Ultraプロセッサ(シリーズ3)」は何が変わった? Lunar Lakeからの進化をチェック!
2025年末出荷開始予定の「Core Ultraプロセッサ(シリーズ3)」のCPUコア構造を“深掘り”
Intelの「Core Ultraプロセッサ(シリーズ3)」は2025年末に一部出荷 2026年1月にはラインアップを拡充
Intelが次世代CPU「Panther Lake」を“チラ見せ” 製品は2026年初頭に発売予定Copyright © ITmedia, Inc. All Rights Reserved.