GPUの「レイトレーシング処理」改良の歴史をひもとく【GeForce RTX 40シリーズ編】レイトレーシングが変えるゲームグラフィックス(第6回)(2/5 ページ)

» 2024年07月18日 19時30分 公開
[西川善司ITmedia]
※本記事はアフィリエイトプログラムによる収益を得ています

大容量「LLC」がレイトレ時代のGPUの“鍵”?

 負荷の大きいトラバース処理とインターセクション処理をもう少し具体的に説明すると、描画対象の3Dシーンの構成が記述されている「BVH(Bounding Volume Hierarchy)」と呼ばれる構造体に対して、レイが衝突しているかどうか探査する処理に相当する。実務的には「グラフィックスメモリへのアクセス」と「多少の幾何学計算」が行われることになる。

 2つの処理のうち、グラフィックスメモリへのアクセスにおける負荷を軽減するとしたら、どのような改善を施すのがベターなのか――最も直接的な解答は、グラフィックスメモリへのアクセスをキャッシュメモリへのアクセスに置き換えて隠蔽することだ。

 事実、GeForce RTX 40シリーズ(Ada Lovelaceアーキテクチャ)では先代の「GeForce RTX 30シリーズ」(Ampereアーキテクチャ)と比べるとL2キャッシュの容量を大幅に増量している。以下に、GeForce RTX 40シリーズの上位モデルにおけるL2キャッシュの容量を示す。

  • GeForce RTX 4090:72MB
  • GeForce RTX 4080:64MB
  • GeForce RTX 4070 Ti(※1):48MB

(※1)発表当初は「GeForce RTX 4080」のバリエーションモデルとされていた(参考記事その1その2

 GeForce RTX 40シリーズでは、L2キャッシュは「ラストレベルキャッシュ(LLC)」に相当する。実はGPUにおけるLLCの大容量化は、ここ最近(2020年以降)の技術的トレンドの1つとなっている。

 例えばAMD初のリアルタイムレイトレーシング対応GPUとして2020年登場した「Radeon RX 6000シリーズ(RDNA 2アーキテクチャ)」は、まさにその典型例だ。同シリーズの最上位モデル「Radeon RX 6900 XT」には、「Infinty Cache」という名称のL3キャッシュ(LLC)を128MBも搭載していた。

 こうした大容量LLCは、一般的なグラフィックス処理系の高速化に貢献するのはもちろん、レイトレーシング処理にも大きなパフォーマンス向上をもたらす。実際、NVIDIA自身もGeForce RTX 40シリーズの発表時に大容量LLCの効果の一例として、このことを挙げていた。

GeForce RTX 4090 GeForce RTX 40シリーズでは、L2キャッシュの容量を増やしている(写真はNVIDIA設計の「GeForce RTX 4090 Founders Edition」)
Radeon RX 6900 XT Radeon RX 6900 XTは、L3キャッシュを128MB搭載していた(写真はAMD設計デザインのグラフィックスカード)

 GeForce RTX 40シリーズでは、RTコア自身にも幾つかの改良を施されている。

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

最新トピックスPR

過去記事カレンダー