Core Ultraプロセッサ（シリーズ3）の「Xe3 GPU」の全体像を解説　完全な新世代ではないものの用途に合わせた最適化がポイント（2/3 ページ）

Intelが2025年末に一部を出荷する予定の「Core Ultraプロセッサ（シリーズ3）」（開発コード名：Panther Lake）は、「Xe3 GPU」なる新しいGPUコアを搭載する。この記事では、Xe3 GPUの概要をお伝えする。

[西川善司，ITmedia]

X^e3で構造が変わった「レンダースライス」　一体なぜ？

　近年のIntel GPUは、一番大きな塊として「レンダースライス（Render Slice）」があり、この中に演算器などを内包する「X^eコア」を複数基搭載するという階層構造になっている。X^eコアの中には、単位ベクトル演算器として「X^e Vector Engine（XVE）」が複数配列されている。

　これらの用語を、NVIDIAのGPUに置き換えて説明すると以下の通りとなる。

レンダースライス≒GPC（Graphics Processing Cluster）
X^eコア≒SM（Streaming Mulitiprocessor）
XVE≒CUDA（Compute Unified Device Architecture）コア

　ここで、Meteor LakeにおけるX^e GPU（Alchemistベース）と、Lunar LakeのX^e2 GPU（Battlemageベース）、そしてPanther LakeのX^e3 GPUのレンダースライスを比較してみようと思う。ここではX^e3 GPUについては12コア仕様で説明するが、4コア仕様では少し話が異なるポイントがあるので、後ほどフォローする。

　レンダースライスは、ミニGPUを複数内包した「GPUクラスター」ともいえる塊だ。NVIDIAのGPUならGPC、AMDのGPUでは「シェーダーエンジン（Shader Engine）」または「シェーダーアレイ（Shader Array）」に相当する。

　Intelにおいて、このような「ミニGPUのクラスター」的な考え方を採用したのはX^eアーキテクチャが初めてだ。それ以前にも「サブスライス（Subslice）」という概念はあったものの、X^eコアに相当するものだ。強いて説明するなら、サブスライスは「レンダースライス1基」ということになる。

Meteor Lakeに搭載されているX^e GPUのレンダースライス

Lunar Lakeに搭載されているX^e2 GPUのレンダースライス

　X^eとX^e 2のレンダースライスを比較すると、1基当たり4基のX^eコアを内蔵していることに注目すると、変化が少ないように思える。しかし、変化が全くないわけではない。搭載するXVEの数が16基から8基に削減されている……のだが、これは能力の劣化を意味しない。

　実は、XVEにおけるSIMD（Single Instruction／Multiple Data：並列処理を行う手法の1つ）の実行レーン数が、X^e GPUの8レーン（SIMD8）から16レーン（SIMD16）に倍増しているのだ。そのため、以下の通り論理的な演算能力は変わりない。

X^e GPUのX^eコア1基当たりの演算器：SIMD8×16XVE＝128基
X^e2 GPUのX^eコア1基当たりの演算器：SIMD16×8XVE＝128基

　筆者は、この方針転換を「処理できるスレッド数を半分にする代わりに、一度にこなせる演算密度を増やした」と解釈している。

　もう少し具体的に、実際の3Dグラフィックス描画における違いで説明すると、X^e GPUは「たくさんのシェーダープログラムを動かす」ことに重きを置いたのに対して、X^e2 GPUは「複雑なシェーダープログラムを短時間で終える」ことを重視したともいえる。あるいは、「4K（3840×2160ピクセル）といった高解像度ゲーミングは最初から想定せずに割り切った」と捉えることもできる。

　ここでX^e3 GPU（12コア仕様）のブロックダイアグラムを見てみると、X^e／X^e2 GPUと比べて分かりやすい違いがある。それはレンダースライス1基当たりのX^eコアの数が4基から6基に増えたことだ。

Panther Lakeに搭載されているX^e3 GPU（12コア仕様）のレンダースライスは、X^eコア（とレトレーシングコア）が4基から6基に増えている

　これを踏まえて下に掲載したX^e3 GPU（12コア仕様）の全体図を見てみよう。レンダースライスは2基あるので、X^eコアは6基×2＝12基構成となる。

　しかし、ここで疑問が湧く人もいるはずだ。X^eコアを12基にするなら、レンダースライスのX^eコアを4基に据え置いて「Xeコア4基×レンダースライス3基＝Xeコア12基」という構成にしても良かったのではないだろうか。

　確かに、レンダースライスは2基構成よりも3基構成にした方が、処理の並列度は上がる。しかし、独立GPUと比べると内蔵GPUはメモリ帯域が狭いため、並列度を高めて複数のレンダースライスでピクセル色を演算できても、それをメモリへ書き出す部分、いわゆる「ROP（Rendering Output Pipeline）」がボトルネックになって効率的に出力できない（IntelではROPを「PiX^el Backends」と呼んでいる）。

　では逆に、なぜX^e3 GPU（12コア仕様）ではレンダースライスを2基構成にしたのだろうか。答えはシンプルで、16MBのL2キャッシュでボトルネックを解消（というか低減）できるからだ。

　となると、今度は「L2キャッシュをもう少し大きくすれば、レンダースライスを3基構成にもできたのではないか？」という疑問も浮上する。それは確かにその通りなのだが、「できるけどあえてそうしなかった」のだと推測している。

　SRAMによる大容量キャッシュは、どうしてもチップ上で大きな面積を専用する（SRAMはプロセス微細化の恩恵を受けづらい）上に、電力消費と発熱も大きくなりがちだ（アイドル時にもリーク電流が大きいため）。要するに、現状の「レンダースライス×2基＋L2キャッシュ16MB」という仕様がベストバランスだと判断したのだろう。

X^e3 GPU（12コア仕様）のブロックダイアグラム

　実は、AMDもAPUに内蔵するGPUにおいてIntelと似た判断をしており、せいぜい毎秒100GBクラスのメモリ帯域を想定して多くのモデルでGPUクラスタを1～2基にとどめている。最大パフォーマンスを引き出すため、内蔵GPUの設計者は「メモリ帯域」と「キャッシュ容量」のバランスに頭を悩ませているのだ。

　余談はさておき、この「1基のレンダースライスにX^eコアが6基」という仕様は、過去のAlchemistはもちろん、Battlemageでも見られなかった。筆者は、この構成が次期アーキテクチャであるCelestialで採用されるのではないかと見ている。ゆえに、X^e3 GPUはCelestial Lightなのではないかと考えた次第である。

12コア仕様で「Xbox One X」より強く、4コア仕様でも「PS4」より強い

前のページへ | 次のページへ

Intelの新型CPU「Core Ultraプロセッサ（シリーズ3）」は何が変わった？　Lunar Lakeからの進化をチェック！
Intelが2025年末に出荷を開始する予定のPanther Lakeこと「Core Ultraプロセッサ（シリーズ3）」。その技術的特徴を数回に分けて解説する。今回は、全体的な概要を紹介する。
2025年末出荷開始予定の「Core Ultraプロセッサ（シリーズ3）」のCPUコア構造を“深掘り”
Intelが2025年末に一部モデルを出荷する予定の「Core Ultraプロセッサ（シリーズ3）」（開発コード名：Panther Lake）だが、CPUコアを改良しているという。どう改良されているのか、解説しよう。
Intelの「Core Ultraプロセッサ（シリーズ3）」は2025年末に一部出荷　2026年1月にはラインアップを拡充
Intelが、「Panther Lake」という開発コード名で開発を進めていたCPUを新しいCore Ultraプロセッサとして発売することになった。2025年内に大量生産を開始し、同年末に一部製品の出荷を開始する見通しだ。2026年1月には、より広範な製品を集荷するという。
Intelが次世代CPU「Panther Lake」を“チラ見せ”　製品は2026年初頭に発売予定
Intelが「Core Ultraプロセッサ（シリーズ2）」の次に投入する予定のCPU「Panter Lake」のデモンストレーションを行った。量産は2025年後半から始まる予定で、搭載製品は2025年初頭に発売される見通しだ。
インテルが国内でPanther Lakeの概要を改めて発表　Intel 18Aプロセスの量産開始をアピール
インテルが、国内の報道陣向けに次世代プロセッサ「Panther Lake」（開発コード名）の概要や、AI PCに関する発表会を開催した。

Core Ultraプロセッサ（シリーズ3）の「Xe3 GPU」の全体像を解説　完全な新世代ではないものの用途に合わせた最適化がポイント（2/3 ページ）

X^e3で構造が変わった「レンダースライス」　一体なぜ？

関連記事

記事ランキング

Core Ultraプロセッサ（シリーズ3）の「Xe3 GPU」の全体像を解説 完全な新世代ではないものの用途に合わせた最適化がポイント（2/3 ページ）

Xe3で構造が変わった「レンダースライス」 一体なぜ？

関連記事

記事ランキング

Core Ultraプロセッサ（シリーズ3）の「Xe3 GPU」の全体像を解説　完全な新世代ではないものの用途に合わせた最適化がポイント（2/3 ページ）

X^e3で構造が変わった「レンダースライス」　一体なぜ？