NVIDIAの最新アーキテクチャ“Maxwell”を徹底解説：Keplerと何が違う？（1/3 ページ）

» 2014年02月18日 23時00分公開

[本間文，ITmedia]

メインストリームで新アーキテクチャを投入

　ついに、NVIDIAが新アーキテクチャ“Maxwell”ベースのGPUを市場投入する。ただし、これまでの同社の戦略と大きく異なるのは、メインストリーム市場向け製品で最初に新しいアーキテクチャを採用したことだ。

　同社でGeForce製品を担当するジャスティン・ウォーカー氏（Justin Walker、GeForce Senior Product Manager）は、「“第1世代”のMaxwellは、Keplerが実現した消費電力あたりのパフォーマンスをさらに向上させたアーキテクチャ」と位置づける。

　そのカギとなるのが、CUDAコアクラスタとなるSM（Streaming Multiprocessor）の構成を見直し、CUDAコアの利用効率を高めることで、大幅なパフォーマンスアップと省電力性の維持を実現した点だ。

メディア向け説明会が開催されたNVIDIA台湾本社ビル（写真＝左）。GeForce GTX 750Tiに採用したGM107チップを披露するジャスティン・ウォーカー氏（写真＝右）

　Maxwellアーキテクチャでは、Keplerが192基のCUDAコアでSMXを構成していたのに対し、128基のCUDAコアをプロセシングブロック（PB）と呼ぶ32コアごと、4つのパーティションに分け、それぞれのプロセシングブロックにコントロールロジックとなるWarpスケジューラと2つの命令発行ユニット（ディスパッチユニット）、64Kバイト（16384×32ビット）のレジスタファイルを持ち、命令発行の効率化を図るとともに、プロセシングブロックごとにクロック制御をすることで、低負荷時の省電力化を図りやすくする。

“第1世代”のMaxwellアーキテクチャでは、SM内にプロセシングブロックを設けることで、命令発行の効率化や省電力制御の容易性を高めているという

MaxwellアーキテクチャのSMM構成。128基のCUDAコアを4つのプロセシングブロックに分けている（写真＝左）。KeplerアーキテクチャのSMX構成。192基のCUDAコアを1つのクラスタにまとめている（写真＝右）

　この32 CUDAコアという構成は、“数”だけを見れば、GeForce GTX 280で採用した“Fermi”フェルミアーキテクチャと同じだ。しかし、SMのクロック制御はKeplerと同じ単一クロック動作をベースとしており、スケジューリングに関してもKepler同様ソフトウェア制御を多用するもので、Fermi世代とは大きく構成が異なる。

　特に超越関数演算に用いるスペシャルファンクションユニット（Special Function Unit：SFU）や、ロード・ストアユニット（Load／Store Unit：LD／ST）の割合は、Kepler世代よりも増えていることが、下の表からも見て取れるだろう。

　L1キャッシュはテクスチャキャッシュと共用する一方、4つのプロセシングブロックが共用するユニファイドメモリを搭載するデザインに変更されており、Fermiや同社初のCUDA GPUとなったG80世代に採用した手法に立ち返った部分もある。

Keplerアーキテクチャの発表時には、32 CUDAコア構成のSMを192コア構成のSMXに変更したことで、消費電力あたりのパフォーマンス（パフォーマンス/ワット）を2倍に高めたとアピールしていた


SMM／SMX構成比較
アーキテクチャ	Maxwell Gen.1	Kepler
プロセス技術	TSMC 28nm	TSMC 28nm
CUDAコア	128	192
プロセシング・ブロック（パーティション）	32コア×4	ー
Warpスケジューラ	4 (1×4)	4
命令発行ユニット（ディスパッチユニット）	8 (2×4）	8
スペシャルファンクションユニット（SFU）	32基（8×４）	32基
ロード・ストアユニット	32基（8×4）	32基
レジスタファイル	256KB (64KB：16,384×32bit×4)	256KB (65,536×32bit)
テクスチャユニット	8	16
PolyMorph Engine	1	1