GM206が低消費電力動作を実現した背景には、Maxwellが、もともとTegraへの実装を想定して省電力性能を追究した設計になっていることが大きい。特に、Maxwellアーキテクチャで採用した、SM内のPBごとに動作クロックを制御できる仕組みによって、低負荷時にはあまり使われていないPBの動作クロックを抑えることが可能にあったのが、大幅な省電力化に寄与している。
SM内の動作クロックの制御をきめ細やかにできるようになったことで、よりアグレッシブなオーバークロック動作も可能になった。グラフィックスカードの熱設計や電源設計に余裕を持たせた製品であれば、GPUコアクロックやメモリクロックを大幅に引き上げることもできる。
一方、GeForce GTX 960では、トランジスタ数やダイサイズを抑えるために、メモリコントローラは128ビット幅にしている。この点だけをみれば、GeForce GTX 660(GK106コア)やGeForce GTX 760(GK204コア)より少ない。しかし、ウォーカー氏は「GM206では、GM204でも採用したカラー圧縮技術などをサポートした最新メモリコントローラを採用するほか、より高速なGDDR5メモリを載せているため、128ビット幅メモリインタフェースでもパフォーマンスへの影響はほとんどない」と語る。
GeForce GTX 960では、GeForce GTX 980で対応した1080pディスプレイなどでも4K描画を利用できるスケーリング技術「DSR」(Dynamic Super Resolution)や、複数のフレームを参照してアンチエイリアシング処理を行なうことで、より低負荷で高品質な描画を実現する「Multi Frame sampled Anti-Aliasing」、VRヘッドマウント使用時の描画遅延を最小限に抑えることを可能にする「VR DIRECT」などの機能もフルサポートする。
GM206の機能拡張として、4K時代の動画圧縮技術として期待されているH.265(HEVC:High Efficiency Video Coding)にフル対応した。NVIDIAは、すでにGeForce GTX 980で採用したGM204コアで、H.265のハードウェアエンコード機能を実装したが、「H.265のハードウェアデコード機能は、GM206が最初」(ウォーカー氏)で、そのビデオエンジンは、先に2015 International CESで発表した、NVIDIAの最新モバイルSoCである「Tegra X1」と同じものになる。
さらに、GM204と同様に、HDMI 2.0をサポートするだけでなく、「GM206では、HDCP 2.2へのネイティブ対応も追加」(ウォーカー氏)して、4Kビデオコンテンツの再生環境としても優れているとウォーカー氏は訴求する。なお、HDCP 2.2対応は、グラフィックスカード上にHDCP対応ICを搭載することも可能だが、実装はベンダーごとに異なるという。
4K出力では、より多くのピクセル出力を必要とするため、ROP(Rendering Output Pipeline)の負荷が高くなる。そこで、第2世代のMaxwellアーキテクチャでは、メモリコントローラとセットになるROPの数をKepler世代の倍にすることで、GeForce GTX 960では128ビットメモリインタフェースながら32基のROPを実装しており、4Kのマルチディスプレイ出力もサポートできるレンダリング出力性能を実現している。
GPU名称 | GeForce GTX 960 | GeForce GTX 660 | GeForce GTX 760 | GeForce GTX 980 |
---|---|---|---|---|
GPUコア | GM206 | GK106 | GK204 | GM204 |
GPUアーキテクチャ | 第2世代Maxwell | 第1世代Kepler | 第2世代Kepler | 第2世代Maxwell |
半導体プロセス | 28nm | 28nm | 28nm | 28nm |
トランジスタ数 | 29億4000万 | 25億4000万 | 35億4000万 | 52億 |
GPC(Graphics Processing Clusters) | 2 | 3 | 3 または 4 | 4 |
SM(Streaming Multiprocessors) | 8 | 5 | 6 | 16 |
CUDAコア | 1024 | 960 | 1152 | 2048 |
テクスチャユニット | 64 | 80 | 96 | 128 |
ROPユニット | 32 | 24 | 32 | 64 |
ベースクロック | 1126MHz | 980MHz | 980MHz | 1126MHz |
Boostクロック | 1178MHz | 1033MHz | 1033MHz | 1216MHz |
メモリインタフェース | 128bit | 192bit | 256bit | 256bit |
メモリタイプ | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
メモリクロック(データ転送レート) | 7010MHz | 6008MHz | 6008MHz | 7010MHz |
メモリ帯域 | 112.16GB/sec | 144.2GB/sec | 192.2GB/sec | 224GB/sec |
L2キャッシュ | 1024KB | 384KB | 512KB | 2048KB |
DirectX | 12 | 11.1 | 11.1 | 12 |
OpenGL | 4.4 | 4.3 | 4.3 | 4.4 |
ディスプレイ出力(最大) | 4 | 4 | 4 | 4 |
Display Port | 1.2 | 1.2 | 1.2 | 1.2 |
HDMI | 2.0 | 1.4 | 1.4a | 2.0 |
HDCP 2.2 ネイティブ対応 | ○ | ー | ー | ー |
H.264デコード | ○ | ○ | ○ | ○ |
H.264エンコード | ○ | ○ | ○ | ○ |
H.265(HEVC)デコード | ○ | × | × | × |
H.265(HEVC)エンコード | ○ | × | × | ○ |
TDP | 120W | 140W | 170W | 165W |
ウォーカー氏は、GeForce GTX 960のユーザー層は、コストパフォーマンスを優先したシステムを組む傾向にあるとした上で、「H.265の4KビデオコンテンツをCPUでデコードすると、かなりの負荷がかかり、非力なCPUでは描画品質にも影響が出るが、GM206であれば、省電力で、かつ、スムーズな再生が可能になる」と説明する。
GeForce GTX 960が、ゲームユーザーだけでなく、一般のPCユーザーにとってもメリットが多い製品に仕上がっているとNVIDIAはアピールしている。いわば、GM206コアは、最先端モバイルSoCのTegra X1と、最強GPUであるGeForce GTX 980の長所を兼ね備え、4K時代のフルサポートしたGPUに仕上がっているといえるだろう。
Copyright © ITmedia, Inc. All Rights Reserved.