負荷の大きいトラバース処理とインターセクション処理をもう少し具体的に説明すると、描画対象の3Dシーンの構成が記述されている「BVH(Bounding Volume Hierarchy)」と呼ばれる構造体に対して、レイが衝突しているかどうか探査する処理に相当する。実務的には「グラフィックスメモリへのアクセス」と「多少の幾何学計算」が行われることになる。
2つの処理のうち、グラフィックスメモリへのアクセスにおける負荷を軽減するとしたら、どのような改善を施すのがベターなのか――最も直接的な解答は、グラフィックスメモリへのアクセスをキャッシュメモリへのアクセスに置き換えて隠蔽することだ。
事実、GeForce RTX 40シリーズ(Ada Lovelaceアーキテクチャ)では先代の「GeForce RTX 30シリーズ」(Ampereアーキテクチャ)と比べるとL2キャッシュの容量を大幅に増量している。以下に、GeForce RTX 40シリーズの上位モデルにおけるL2キャッシュの容量を示す。
(※1)発表当初は「GeForce RTX 4080」のバリエーションモデルとされていた(参考記事その1/その2)
GeForce RTX 40シリーズでは、L2キャッシュは「ラストレベルキャッシュ(LLC)」に相当する。実はGPUにおけるLLCの大容量化は、ここ最近(2020年以降)の技術的トレンドの1つとなっている。
例えばAMD初のリアルタイムレイトレーシング対応GPUとして2020年登場した「Radeon RX 6000シリーズ(RDNA 2アーキテクチャ)」は、まさにその典型例だ。同シリーズの最上位モデル「Radeon RX 6900 XT」には、「Infinty Cache」という名称のL3キャッシュ(LLC)を128MBも搭載していた。
こうした大容量LLCは、一般的なグラフィックス処理系の高速化に貢献するのはもちろん、レイトレーシング処理にも大きなパフォーマンス向上をもたらす。実際、NVIDIA自身もGeForce RTX 40シリーズの発表時に大容量LLCの効果の一例として、このことを挙げていた。
GeForce RTX 40シリーズでは、RTコア自身にも幾つかの改良を施されている。
GPUの「レイトレーシング処理」改良の歴史をひもとく【GeForce RTX 30シリーズ編】
2035年、ゲームグラフィックスは「オール・パストレーシング時代」へ――レイトレーシング技術の“先”を見つめる
「レイトレーシング」の最大の“敵”とは何か? やっつける方法はあるのか?
ゲームの中で「レイトレーシング」はどう使われる? 実例を見てみよう
最近よく聞く「レイトレーシング」 一体ナニモノ?Copyright © ITmedia, Inc. All Rights Reserved.