RADEON X1800のマイクロアーキテクチャは次のようになっている。
RADEON X1800は、8ユニットの演算器を備えたバーテックスシェーダユニット、16ユニットを備えるピクセルシェーダユニット、同じく16ユニットのROPから構成されている。8つのエンジンから構成されているバーテックスシェーダエンジンは、各ユニットにそれぞれ128ビットのベクトル演算器と、32ビットのスカラー演算器を備える。それぞれのユニットは、1クロックに2つのシェーダ命令を実行可能で、1秒間に100億もの命令を処理できる。すでに述べたように、シェーダモデル3.0に対応しており、そこで規定されている1024の命令を実行できるほか、動的なフローコントロール(分岐やループの実行)も可能になっている。
ピクセルシェーダエンジンは、4つのシェーダプロセッサが1つのシェーダコアとしてまとめられている。RADEON X1800では、このシェーダコアが4つ搭載されているので、合計16シェーダプロセッサが実装されていることになる。従来の言いかたをするのであれば「16パイプ構成になっている」と言い換えてもよい。それぞれのシェーダプロセッサには、2つのベクトル演算器と2つのスカラー演算器がそれぞれ実装されている。もちろん、ピクセルシェーダエンジンも、シェーダモデル3.0に対応しており、シェーダモデル3.0でサポートされる128ビットの浮動小数点演算や動的なフローコントロールにも対応している。
RADEON X1000シリーズがユニークなのは、実行単位(スレッド)を細分化してからシェーダエンジンに処理することで、命令実行の効率を上げる仕組みを採用していることだ。ATIが「Ultra-Threading」と呼ぶこの方式は、要するにGPUの実行効率向上を目的とした仕掛けとも言える。従来のGPUでは、1つの大きなスレッドに多くのピクセルを詰め込んで処理していたが、これだと、分岐予測に時間がかかるなどの問題があり、実行効率はあまりよくなかった。そこで、RADEON X1000シリーズでは、このスレッドを分割して1つのスレッドに格納するピクセル数を減らし、依存関係を減少させることで、分岐予測にかかる時間を減らす。これにより、実行効率は大幅に上昇することになる。
Copyright © ITmedia, Inc. All Rights Reserved.