Meteor Lakeでは、Graphics Tile(内蔵GPU)の性能が大幅に強化されたこともホットなトピックの1つだ。GPUとしての名前も「Intel Iris Xe Graphics」から「Intel Arc Graphics」に改められている。
GPUのアーキテクチャは、新登場となる「Xe-LPG」を採用する。新登場とはいうものの、既存のIntel Arc Graphicsで使われている、ゲーミング向けの「Xe-HPG」をベースに開発されたものだ。LPGは「Low Power Graphics(低電力グラフィックス)」の略で、省電力性にも配慮がなされているという。
Xe-LPGアーキテクチャは、独立GPUで使われているXe-HPGアーキテクチャをベースに開発された。このスライドによると、現行の「Xe-LPアーキテクチャ(Intel Iris Xe Graphics)」比で最大2倍のパフォーマンスを備えているようだ
Graphics Tileについて説明するトム・ピーターセン氏(Intelアーキテクチャ、グラフィックス、ソフトウェア担当フェロー兼先進グラフィックス体験エンジニアリングソリューション担当ディレクター)Xe-LPGアーキテクチャのブロックダイヤグラム(設計模式図)は、ベースとなったXe-HPGと似ている。
GPUとしての処理性能は「レンダースライス」と呼ばれるGPUクラスターの数で調整している。今回登場したMeteor Lakeでは、これを2基搭載している。1基のレンダースライスには、演算ユニットに相当する「Xeコア」が4基搭載されている。つまり、Meteor Lakeの内蔵GPUにはXeコアが合計8基存在する。
この構成は、モバイル向けのエントリーGPU「Intel Arc 370M Graphics」と同一だ。
Xeコアを子細に見てみると、1つ当たり16基の「Xe Vector Engine(XVE)」を備えている(GPUコア全体では16×8=128基)。その名の通り、XVEはベクトル演算エンジン、もう少し詳しくいえば256bitの「SIMD浮動小数点ベクトル積和算演算器」だ。
XVEでFP32(32bit浮動小数点数)演算を行う場合、256÷32=8、つまり1つの命令で8つの計算を並行して行える。GPUコアの稼働クロックを仮に「2GHz」とした場合、Meteor Lakeの内蔵GPUにおけるFP32演算の理論性能は、以下の通りとなる。
8(同時計算数)×16(XVEの数)×8(Xeコアの数)×2FLOPS(積和算)×20億Hz(稼働クロック)=4兆960億(FLOPS)
まあ、ざっくりいえば約4TFLOPSの演算性能があるということだ。動作クロックが半分の「1GHz」だとしても、約2TFLOPSの演算パフォーマンスは確保できる。
いずれにせよ、CPUに内蔵されたGPUとしては高性能であることは間違いないだろう。
Xe-LPGアーキテクチャは、Xeコアと対になる形で「レイトレーシング(RT)ユニット」を備える。
つまり、1つのレンダースライスで8基、Meteor Lakeの内蔵GPUの場合は2×8=16基のRTユニットを備えている。ようやくIntelのCPU内蔵GPUもRT対応を果たしたことには、ある種の感慨を覚える。
ここまでを見ていると、Meteor Lakeの内蔵GPUは、外部GPUとしてのIntel Arc Graphicsと全く同じ構成に見えるが、実際には大きく異なる部分も見受けられる。
まず、Xe-HPGアーキテクチャでは搭載されていた推論プロセッサ「Xe Matrix Engine(XMX)」が省かれている。先述の通り、Meteor LakeのSoC TileにはNPUが搭載されているので、「Graphics Tileには不要だ」と判断されたのかもしれない。また、XMXは1024bit幅の行列積和算演算器で、搭載するとそれなりの面積が必要なので、省スペース化の観点から省くことにした可能性もある。どちらも理解はできる。
ただ、単純にXMXを省くと困ったことが起こる。「Intel版DLSS」とも言われる超解像/アンチエイリアス技術「Xe Super Sampling(XeSS)」が利用できなくなってしまうのだ。これは、XeSSがXMXの演算能力に依存した機能だからである。
しかし、Intelは「XMXが省かれていても、XeSSは問題なく利用できる」という。どういうことなのだろうか?
実は、XeSSのAI処理系は「プログラマブルシェーダモデル6.4(SM6.4)」ベースのシェーダコードで書かれている。XMXがあるGPU(≒Xe-HPGアーキテクチャGPU)の場合、このコードはXMXにおいて処理されるが、XMXがないXe-LPGアーキテクチャのGPU(≒Metero Lakeの内蔵GPU)では、普通のプログラマブルシェーダコードとしてXVEを使って実行されるのだ。
こうして、XeSSはXe-HPGでもXe-LPGでも保たれることは保たれた……のだが、Xe-LPGで動かした場合はグラフィックス描画に動員されるべきXVEが、XeSSの処理に回されてしまう可能性がある。つまり、XeSSを使う場合はGPUのパフォーマンスを3Dグラフィックス描画へと“全振り”できない状況になる。
まあ、このあたりもIntelとしては「CPU内蔵GPUだから、これくらいは別にいいでしょ」という判断なのだろう。
Xe-LPGアーキテクチャにおける新機能として「Out of Order Sampling」というものがアピールされたのだが、詳しい説明はなかった。本件については、米国で9月19日と20日に行われたイベント「Intel Innovation 2023」において詳説があったので、後日別の記事で紹介したい。最後に、Meteor Lakeの入出力バス回りを見てみよう
「Meteor Lake」はCPUコアが3種類!? Intelが次世代CPUの詳細を発表(前編)
Intelが「第5世代Xeonスケーラブルプロセッサ(Emerald Rapids)」を12月14日に発表 先の新製品のスケジュールも順調
モバイル向けGPU「Intel Arc Aシリーズ」が発進 スペック別に3シリーズを順次投入
IntelがゲーミングGPU「Intel Arc」におけるフレームレート改善を報告 計測ツール「PresentMon」のβ版も一般公開
イスラエルのIntelハイファラボで見た“ちょっと未来”のPC像Copyright © ITmedia, Inc. All Rights Reserved.