次世代の「Core Ultraプロセッサ」に採用! リアルタイムレイトレに対応したIntel内蔵GPUの“秘密”に迫るIntel Innovation 2023(2/6 ページ)

» 2023年11月09日 12時00分 公開
[西川善司ITmedia]

Core Ultraプロセッサの内蔵GPUを深掘り!

 Core Ultraプロセッサは、Xe-LPGアーキテクチャを採用するGPUを搭載する“初号機”ということになる。そのブロックダイアグラム(構造図)を見てみると、「Render Slice」と呼ばれるGPUクラスターが2基あり、それぞれのRender Sliceには「Xe-Core」が4基内包されている。1基のXe-Coreには、合計16基(2基×8)の「XVE(Xe Vector Engine)」と呼ばれるベクトル演算エンジンが搭載されている。

 各部位の名称を、NVIDIA製GPUと同等の呼び方に言い換えると以下の通りとなる。

  • Render Slice≒GPC(Graphics Processing Cluster)
  • Xe-Core≒SM(Streaming Mulitiprocessor)
  • XVE≒CUDA(Compute Unified Device Architecture)コア

 Render Sliceが2基構成という点は、ノートPC向けのエントリー独立GPU「Intel Arc A370M Graphics」と近い。恐らくは、実際の性能もArc A370Mが目安となるだろう。

ブロックダイヤグラム Core Ultraプロセッサの内蔵GPUのブロックダイヤグラム

ベクトル演算エンジンに改良

 XVEの実態は、256bitの「SIMD浮動小数点ベクトル積和算演算器」だ。なので、XVE1基でFP32(32bit浮動小数点数)演算を行う場合、1命令で最大8つの演算を並行して行える。いわゆる「SIMD8」だ。

 その見かけ上の仕様は、Xe-HPGアーキテクチャにおけるXVEと変わりない。しかし、Intel Graphics Product Teamのダミエン・トリオレット氏によると、He-LPGのXVEは2つの点でXe-HPGのそれを上回る仕様となっているという。

Xe-Core Xe-Coreのブロックダイヤグラム。合計16基(2基×8セット)のXVEが搭載されている

 強化点の1つが、FP64(64bit倍精度浮動小数点)演算に対応したことだ。ただし、XVE全体で1クロック当たり1つの演算しかできないという制限がある。

 もう1つが、「FP16(半精度浮動小数点数)またはFP32のSIMD演算」と「整数のSIMD演算または超越関数のスカラ演算」を同時実行できるようになったことだ。これにより、シェーダープログラムの実行効率が若干上がる。

 後述する「DP4a命令」は、整数のSIMD演算に相当するので、FP16/FP32の浮動小数点演算と同時並列実行が可能となっている。

XVE Xe-LPGアーキテクチャにおけるXVEのブロックダイヤグラム。基本的にはXe-HPGアーキテクチャのXVEと同一だが、大きく2つのポイントで改良が加わった

 従来のXe-HPGアーキテクチャにはなかった「Out of Order Sampling」や、IntelのCPU内蔵GPUとしては初めて搭載される「リアルタイムレイトレーシング機能」についても見ていこう。

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2024年05月09日 更新
最新トピックスPR

過去記事カレンダー