ニュース
» 2014年02月18日 23時00分 UPDATE

Keplerと何が違う?:NVIDIAの最新アーキテクチャ“Maxwell”を徹底解説 (1/3)

Maxwell世代初のGPU「GeForce GTX 750 Ti」が登場した。Keplerと何が違うのか。徹底解説。

[本間文,ITmedia]

メインストリームで新アーキテクチャを投入

 ついに、NVIDIAが新アーキテクチャ“Maxwell”ベースのGPUを市場投入する。ただし、これまでの同社の戦略と大きく異なるのは、メインストリーム市場向け製品で最初に新しいアーキテクチャを採用したことだ。

 同社でGeForce製品を担当するジャスティン・ウォーカー氏(Justin Walker、GeForce Senior Product Manager)は、「“第1世代”のMaxwellは、Keplerが実現した消費電力あたりのパフォーマンスをさらに向上させたアーキテクチャ」と位置づける。

 そのカギとなるのが、CUDAコアクラスタとなるSM(Streaming Multiprocessor)の構成を見直し、CUDAコアの利用効率を高めることで、大幅なパフォーマンスアップと省電力性の維持を実現した点だ。

og_maxwell_001.jpgog_maxwell_002.jpg メディア向け説明会が開催されたNVIDIA台湾本社ビル(写真=左)。GeForce GTX 750Tiに採用したGM107チップを披露するジャスティン・ウォーカー氏(写真=右)

 Maxwellアーキテクチャでは、Keplerが192基のCUDAコアでSMXを構成していたのに対し、128基のCUDAコアをプロセシングブロック(PB)と呼ぶ32コアごと、4つのパーティションに分け、それぞれのプロセシングブロックにコントロールロジックとなるWarpスケジューラと2つの命令発行ユニット(ディスパッチユニット)、64Kバイト(16384×32ビット)のレジスタファイルを持ち、命令発行の効率化を図るとともに、プロセシングブロックごとにクロック制御をすることで、低負荷時の省電力化を図りやすくする。

og_maxwell_003.jpg “第1世代”のMaxwellアーキテクチャでは、SM内にプロセシングブロックを設けることで、命令発行の効率化や省電力制御の容易性を高めているという

og_maxwell_004.jpgog_maxwell_005.jpg MaxwellアーキテクチャのSMM構成。128基のCUDAコアを4つのプロセシングブロックに分けている(写真=左)。KeplerアーキテクチャのSMX構成。192基のCUDAコアを1つのクラスタにまとめている(写真=右)

 この32 CUDAコアという構成は、“数”だけを見れば、GeForce GTX 280で採用した“Fermi”フェルミアーキテクチャと同じだ。しかし、SMのクロック制御はKeplerと同じ単一クロック動作をベースとしており、スケジューリングに関してもKepler同様ソフトウェア制御を多用するもので、Fermi世代とは大きく構成が異なる。

 特に超越関数演算に用いるスペシャルファンクションユニット(Special Function Unit:SFU)や、ロード・ストアユニット(Load/Store Unit:LD/ST)の割合は、Kepler世代よりも増えていることが、下の表からも見て取れるだろう。

 L1キャッシュはテクスチャキャッシュと共用する一方、4つのプロセシングブロックが共用するユニファイドメモリを搭載するデザインに変更されており、Fermiや同社初のCUDA GPUとなったG80世代に採用した手法に立ち返った部分もある。

og_maxwell_006.jpgog_maxwell_007.jpg Keplerアーキテクチャの発表時には、32 CUDAコア構成のSMを192コア構成のSMXに変更したことで、消費電力あたりのパフォーマンス(パフォーマンス/ワット)を2倍に高めたとアピールしていた

SMM/SMX構成比較
アーキテクチャ Maxwell Gen.1 Kepler
プロセス技術 TSMC 28nm TSMC 28nm
CUDAコア 128 192
プロセシング・ブロック(パーティション) 32コア×4
Warpスケジューラ 4 (1×4) 4
命令発行ユニット(ディスパッチユニット) 8 (2×4) 8
スペシャルファンクションユニット(SFU) 32基(8×4) 32基
ロード・ストアユニット 32基(8×4) 32基
レジスタファイル 256KB (64KB:16,384×32bit×4) 256KB (65,536×32bit)
テクスチャユニット 8 16
PolyMorph Engine 1 1

 ウォーカー氏によれば、Maxwellに採用したCUDAコアや、SFUなどは、基本的にKepler世代と同じものであり、テッセレータなどを統合するジオメトリ処理用の固定ファンクションユニットのPolyMorph Engineも手は加えられていないという。

 その意味では、“第1世代”のMaxwellアーキテクチャは、同社のモバイルSoC「Tegra K1」への実装も果たしたKeplerアーキテクチャの省電力性能を、さらに突き詰めた改良版アーキテクチャという色が濃いようにも感じる。

 実際、ウォーカー氏は「“第1世代”のMaxwellコアとなるGK107では、消費電力あたりのパフォーマンスを追究することを最優先に開発が進められた」としており、パフォーマンスを最大限に引き出すことよりも、エネルギー効率を高めることを優先したことが分かる。

og_maxwell_008.jpg 4年間で4倍のエネルギー効率向上を果たしたとアピール

og_maxwell_009.jpgog_maxwell_010.jpg パフォーマンスでは、Fermiアーキテクチャを採用したGeForce GTX 550 Tiの2倍の性能向上を果たしつつ、消費電力は550 Tiの116Wに比べて約半分の60ワットに抑えられている

       1|2|3 次のページへ

Copyright© 2016 ITmedia, Inc. All Rights Reserved.