ニュース
» 2008年06月26日 11時30分 UPDATE

Radeon HD 4800シリーズが「新世代」な理由(前編) (1/2)

1TFLOPSを超える性能を有しながら、ライバルより小さなダイサイズを実現し、アンチエイリアス性能などの改善で3D性能も向上した。なぜ、それが可能になったのか。

[笠原一輝,ITmedia]

1年前の製品に比べて4倍のワット性能やコストパフォーマンスを実現

 AMD グラフィックス製品事業部 Radeon HD 4800シリーズ設計責任者のスコット・ハートグ氏は、Radeon HD 4800シリーズの特徴を「設計にあたって目指したのは高効率なデザインだ。Radeon HD 4800シリーズは、1年前にリリースされたRadeon HD 2900シリーズと比較して、消費電力あたりの浮動小数点演算性能で4倍、1ドルあたりの浮動小数点演算性能でも4倍を実現している」と説明する。ここで言われているように、Radeon HD 4800シリーズは、消費電力やダイサイズの増加以上に演算性能を向上させることを目指して開発されている。

 ハートグ氏によれば、Radeon HD 4800シリーズのマイクロアーキテクチャの特徴は以下のようになる。

  • 800個のストリームプロセッサを搭載
  • 新しいSIMDコアデザイン
  • 改良されたテクスチャユニット
  • GDDR5をサポートしたメモリアーキテクチャ
  • レンダーバックエンジンの効率化でアンチエイリアスの性能を改善
  • ジオメトリシェーダとテッセレータ性能の改善

 このようなマイクロアーキテクチャの改善により、ダイサイズを肥大化させることなく、演算性能や3D描画性能を上げていくことが可能であったのだという。

kn_r48dtl_01.jpg AMD グラフィックス製品事業部 Radeon HD 4800シリーズ設計責任者 スコット・ハートグ氏
kn_r48dtl_02.jpg AMDが示すRadeon HD 4800シリーズのハイライト

高効率の秘密はストリームプロセッサとテクスチャユニットのデザインにあり

 Radeon HD 4800シリーズの基本的なアーキテクチャは800ものスカラーストリームプロセッサからなる演算器で構成される。80個単位で1つのSIMDコアを構成しており、これが10個用意されている。それぞれのSIMDコアは、「5個×2」で1つのまとまりとして動くストリームプロセッサユニットで構成されており、SIMDコア内にはそのようなユニットが16個存在する。

 各SIMDコアにはスレッドを管理するThread Sequencerが用意され、そこでスレッドが生成され、各ストリームプロセッサに処理が渡される。また、SIMDコアには16Kバイトのメモリも組み込まれ、一般的な処理を行う場合にはローカルメモリとして利用されるほか、同じく搭載された4つの専用テクスチャユニットではテクスチャの処理が行われる。

 AMDでは各SIMDコアを構成するストリームプロセッサユニットとテクスチャユニットの構成をRadeon HD 3800シリーズから大きく見直し、デザイン効率を見直すことでダイサイズの有効利用を実現している。ハートグ氏は「前世代となるRadeon HD 3800シリーズに比べてRadeon HD 4800シリーズは、それぞれのストリームプロセッサユニットのサイズが40%も効率を改善している。同じようにテクスチャユニットに関しても70%の改善を実現している」と説明している。GPUを構成するユニットの面積を減らすことができたため、ダイサイズの増加以上に各ユニットの数を増やせて、そのことが性能の改善に貢献したというわけだ。

kn_r48dtl_03.jpg Radeon HD 4800シリーズのダイレイアウト
kn_r48dtl_04.jpg Radeon HD 4800シリーズのSIMDコア、1つのSIMDコアは80個のストリームプロセッサから構成されている

kn_r48dtl_05.jpg SIMDコアの設計にあたり、細かな設計を見直すことで、コアあたりのサイズを節約できた
kn_r48dtl_06.jpg テクスチャユニットの設計も見直し、サイズあたりの性能を70%改善している

       1|2 次のページへ

Copyright© 2016 ITmedia, Inc. All Rights Reserved.