コラム

Core Ultraプロセッサ(シリーズ3)の「Xe3 GPU」の改良点をさらに深掘り 今後の取り組みもチェック!(3/5 ページ)

Intelが2025年末に一部を出荷する予定の「Core Ultraプロセッサ(シリーズ3)」(開発コード名:Panther Lake)は、「Xe3 GPU」なる新しいGPUコアを搭載する。この記事では演算エンジン回りを中心に、Xe3 GPUをもう少し深掘りしていく。

Xe3 GPUのパフォーマンスはどこまで上がった?

 下の図は、Xe3 GPUの機能強化部分がXe2アーキテクチャと比べてどのくらいパフォーマンスを向上したのかを示したものだ(Xe2を「1」とした場合の相対スコア)。


Xe3 GPUの機能単位ベンチマークの結果(Xe2アーキテクチャを「1」とした場合を相対値)

 レイトレのパフォーマンスはXe2比で「2.0倍」となっている……のだが、Xe3 GPUのレイトレーシングユニットの数はXe2 GPU比で1.5倍でしかない。「0.5倍」の上乗せは、恐らくDynamic Ray Managementの恩恵だろう。

 メッシュレンダリング(Mesh Rendering)のパフォーマンスは「2.4倍」、高レジスタープレッシャーシェーダー(High Register Pressure Shader)のパフォーマンスに至っては「3.1倍」にまで向上している。これはVariable Register Allocationから導出された実行スレッド数の25%増加と、URBの改善による効果だ。

advertisement

 16x Anisotropic Filtering sRGBのパフォーマンスが「2.0倍」となったことと、Depth Writesが「最大7.4倍」となっているのは、「Up to 2X Anisotropic Filtering」「Upto 2x Stencil Test rate」のチューニングの恩恵だろう。

 ちなみに「Xe3 GPUの“総合”パフォーマンスはどうなんだ?」という点について、Intelは非常にざっくりとしたグラフしか示していない。一応、Core Ultra 200Hプロセッサに搭載された「Xe GPU」やCore Ultra 200Vプロセッサに搭載された「Xe2 GPU」から順当な性能向上を果たしているよということは分かる。


GPUの全体パフォーマンスはざっくりとした表で示されている。同じ消費電力なら、順当にパフォーマンスを改善できているということを言いたいのだと思われる

 実際の人気ゲームにおけるパフォーマンスは、市販製品が出てきてから各メディアが実測して示してくれるはず。その時が来るまで、最終評価はお預けだ。


イベント会場では、Core Ultraプロセッサ(シリーズ3)を搭載するPCの実機で「Painkiller」のリメイク版が動作していた

メニュー画面を見てみると、「Xe Super Sampling(XeSS)」のマルチフレーム生成(XeSS MFG)には対応していないものの、XeSS 2相当の機能は実装できていた

 下図は、とあるゲーム実行時のXe2 GPUとXe3 GPUのパフォーマンスの違いを見せたグラフになる。少し分かりにくいのだが、このグラフの横軸は時間ではなく、APIコールの通算数を表す。縦軸も難解で、こちらはAPIの実施に掛かった累積時間になる。

 つまり、このグラフは必ず右肩上がりとなり、高さが低い方が優秀ということになる。グラフの右端に書かれた時間(ミリ秒単位)は、1フレームの描画に掛かった総時間を表している。


Xe2 GPU(8コア)とXe3 GPU(12コア)で描画させた、とあるゲームにおけるフレームの累積時間グラフ

 グラフの各所に囲まれたポイントが数カ所あるが、これらにはここまで筆者が解説してきた、Xe3 GPUのさまざまな機能改善点が大きく表れている

 左端は、Variable Register Allocationによって実行スレッド数が最大10になったことによる処理時間の短縮分を表している。ここから右に順番に見ていくと、次はL2キャッシュが16MBに増量された効果だ。

 ここに記載されている「Render Pre Pass」とは、具体的にはDeferred Rendering(遅延レンダリング)における「G-Bufferレンダリング」を指している。G-Buffer(Geometry Buffer:ジオメトリバッファー)は、後段に行うライティングに必要なパラメーター群(法線/深度/鏡面反射/ベースカラーなど)を収めたものだ。平常は「Multi-Render Target(MRT)」で最大8枚を同時出力するため、それなりに負荷は高い。

 後段3つのポイントも、Variable Register Allocationの恩恵を表している。Compute ShaderやPixel Shaderの処理がXe2 GPUよりもだいぶ速くなっているということが分かる。

 Xeコアの最大数が1.5倍になったXe3 GPUだが、フレーム処理の時間は2倍近くも違うので、ここは素直にXe3 GPUの改良点が着実な効果を見せていると見て良いだろう。

Copyright © ITmedia, Inc. All Rights Reserved.