AMDは、12月22日（現地時間）に同社が“Graphics Core Next”と呼ぶ次世代グラフィックスアーキテクチャを採用したグラフィックスカード「AMD Radeon HD 7970」を発表した。同製品は、開発コード名“Southern Islands”シリーズとして開発を進めてきた「AMD Radeon HD 7000シリーズ」で、シングルGPU構成フラグシップモデルだ。

　AMD Radeon HD 7970は、TSMCの28ナノメートルプロセスルールで43億1000万トランジスタを集積し、同社のFusion APUで“Radeon Core”と呼ぶStream Processorを2048基搭載する。さらに、グラフィックスメモリインタフェースを384ビットに拡張し、ピーク演算性能は3.79TFLOPSと、従来の同社シングルGPU最上位モデルとなるRadeon HD 6970に比べて、約1.4倍の性能向上を実現した。

　また、AMDは同製品を、グラフィックスカードとしては世界で初めて「第3世代PCI Express」とWindows 8で採用を予定する「DirectX 11.1」のそれぞれに対応することもアピールする。

AMD Radeon HD 7970の主な仕様（写真＝左）。AMDは米テキサス州オースチンにある同社Lone StarキャンパスでRadeon HD 7970で導入した技術の説明会を行っている（写真＝右）

進化したグラフィックスアーキテクチャ

　Radeon HD 7000シリーズで採用する“Graphics Core Next”（GCN）とAMDが呼ぶ新しいグラフィックスアーキテクチャは、同社が推進するCPUとGPUを融合した“Fusion”でも大きな役割を果たす存在だ。

　Radeon HDシリーズは、これまで依存関係のない複数の命令を1つの命令としてまとめて実行できる「VLIW」（Very Long Instruction Word）方式を採用してきた。この方式は、グラフィックス用途ではGPUのコアを効率よく利用できるが、汎用コンピューティング用途などでは、実行する複数の命令に依存関係があると、その処理が終わるまでGPUコアの一部を待機させる欠点もあった。また、複数の命令をまとめるためにGPU内部でコンパイルしなおすのに一定の時間を必要とすることも、パフォーマンスに影響を与える結果となった。

　そこで、GCNでは（AMDグラフィックス部門の前身である）ATI TechnologiesがRadeon HDシリーズ以前に採用していた、一般的なSIMD方式に立ち返るとともに、複雑な命令処理にも対応できる機能拡張を行なうことで、グラフィックス処理と汎用コンピューティング処理の両方でスループット性能の向上を図った。

Radeon HD 7970を公開するグラフィックスアーキテクチャ開発を統括するエリック・デメル最高技術責任者。ATI TechnologiesからAMDにいたるまでのグラフィックスアーキテクチャの変遷。Radeon HDシリーズで採用したVLIW以前には、ATI Technologies時代にSIMDアーキテクチャを採用している。その意味でGCNは原点回帰といえる

GCNの構成を知る

　GCNでは、16基のベクタ演算ユニット（Stream Processor。SP）をひとまとめにした16wayベクタSIMDユニットの4基（合計で64SP）と、1基のスカラプロセッサ、4基のテクスチャフィルタリングユニット、16Kバイトのリード／ライト対応1次キャッシュメモリを統合した「Compute Unit」（以下、CU）を最小単位とする。Radeon HD 7970では、CUを32基搭載し、2048SPを統合する。

　CUは、それぞれ命令発効ユニットやロード／ストアユニットを搭載し、CU 4基で16Kバイトの命令キャッシュと32Kバイトのデータキャッシュ共有することで、個々のCNで独立したカーネル処理ができるようにしている。CUに搭載されたスカラユニットは、フル機能の整数演算機能を備えており、複雑な演算処理の補助に使ったりCU内部の制御に利用する小さなCPUの役割を果たしたりすることで、CUのスカラSIMDユニットを効率よく機能できるようにする。

　2次キャッシュメモリは32基のCUで768Kバイトを共有し、CUに内蔵された1次キャッシュと同様にデータ読み込みだけでなく書き込みにも対応する。1次キャッシュメモリと2次キャッシュメモリで書き込みにも対応したのは、汎用コンピューティング処理で各CU間のデータ共有を容易にするためでもあり、CPUとGPUの連係を高める上でも大きな役割を果たす。

　GCNでは、ジオメトリ性能も向上している。Radeon HD 7970に統合された32基のCUは16基ごとに分けられ、それぞれにジオメトリエンジンを搭載する。このジオメトリエンジンに統合されたテッセレーションユニットは、AMDとしては第9世代に当たり、頂点データの再利用率を引き上げるなどして、Radeon HD 6900シリーズに比べて最大4倍の性能を実現するとAMDは説明する。

Radeon HD 7970のブロックダイヤグラム。32基のGCN構成で2048基のStream Processorを統合。16基のGCNを1組として、それぞれにジオメトリエンジンなどを搭載するほか、384ビット幅のグラフィックスメモリインタフェースを採用する（写真＝左）。GCNの核をなすCompute Unit（CU）の構成。16基のStream ProcessorをまとめたベクタSIMDユニット4基と1基のスカラ演算ユニット、4基のテクスチャフィルタリングユニットなどを統合する（写真＝中央）。GCNのクアッドSIMD方式と従来のVLIW4方式を比べる。GCNでは命令発効のスケジューリングが容易になり、性能が安定する（写真＝右）

GNCで搭載するキャッシュメモリの構成。CUは16Kバイトの1次キャッシュメモリを搭載するほか、1組として16Kバイトの命令キャッシュと32Kバイトのデータキャッシュを4基のCUで共有する。また、32基のCUで768Kバイトの2次キャッシュメモリを共有する（写真＝左）。Radeon HD 7900シリーズは、2基のジオメトリエンジンを搭載する。テッセレーションユニットは第9世代に進化した（写真＝中央）。テッセレーション機能は大幅に向上し、特に分割が多いテッセレーション処理ではRadeon HD 6970に比べて約4倍のパフォーマンスを示す（写真＝右）

アクセストップ10

2024年04月26日更新

ワコムが有機ELペンタブレットをついに投入！　「Wacom Movink 13」は約420gの軽量モデルだ（2024年04月24日）
わずか237gとスマホ並みに軽いモバイルディスプレイ！　ユニークの10.5型「UQ-PM10FHDNT-GL」を試す（2024年04月25日）
「社長室と役員室はなくしました」　価値共創領域に挑戦する日本IBM　山口社長のこだわり（2024年04月24日）
QualcommがPC向けSoC「Snapdragon X Plus」を発表　CPUコアを削減しつつも圧倒的なAI処理性能は維持　搭載PCは2024年中盤に登場予定（2024年04月25日）
「Surface Go」が“タフブック”みたいになる耐衝撃ケース　サンワサプライから登場（2024年04月24日）
16.3型の折りたたみノートPC「Thinkpad X1 Fold」は“大画面タブレット”として大きな価値あり（2024年04月24日）
AI PC時代の製品選び　展示会「第33回 Japan IT Week 春」で目にしたもの　AI活用やDX化を推進したい企業は要注目！（2024年04月25日）
あなたのPCのWindows 10／11の「ライセンス」はどうなっている？　調べる方法をチェック！（2023年10月20日）
アドバンテック、第14世代Coreプロセッサを採用した産業向けシングルボードPC （2024年04月24日）
エレコム、10GbEポートを備えたWi-Fi 7対応無線LANルーター（2024年04月25日）

ランキングトップ30

最新トピックスPR

過去記事カレンダー

2024年

2023年

2022年

2021年

2020年

2019年

2018年

2017年

2016年

2015年

2014年

2013年

2012年

2011年

2010年

2009年

2008年

2007年

2006年

2005年

2004年

2003年

Feed Back

利用規約

ITmediaはアイティメディア株式会社の登録商標です。

大解説！ 28ナノプロセスルール採用の新世代GPU「Radeon HD 7970」：まさか、このタイミングででてくるとは（1/4 ページ）

「Graphics Core Next」とはなんぞ