GeForce GTX 680は従来の“Fermi”世代から大きく進化した。まず、Fermi世代のGPUが40ナノメートルプロセスルールを採用していたが、これが、より微細な28ナノメートルプロセスルールになった。さらに、Fermi世代以前のGPUが、PCI Express 2.0までの対応だったのが、PCI Express 3.0に対応した。そして、新しいアーキテクチャ「Kepler」を採用して、その性能が従来比2倍と大幅に向上した。
従来の“Fermi”アーキテクチャでは、32基のCUDAコアによってSM(Streaming Multiprocessor)を構成していた。これに対し、“Kepler”ではSMが“SMX”に発展し、構成するCUDAコアの数も192基に増えた。GPU全体でみたCUDAコアの総数でも、GeForce GTX 580の512基に対して、GeForce GTX 680は1536基と3倍に達している。CUDAコアの構造も変わっているので単純な数の比較はできないが、仕様におけるアーキテクチャの違いを明確に示すポイントだ。
FermiとKeplerでGPUコア部に関して異なる点は、テクスチャユニットとROPユニット、そして動作クロックだ。Radeon HD 7870やRadeon HD 7770で、GPUのコアクロックが1GHzに達したが、NVIDIAのGPUもGeForce GTX 680でようやく1GHzに到達した。最上位モデルで1GHz台になったという点では、NVIDIAのアドバンテージといえるかもしれないが、Radeon HD 7970(リファレンスデザインのコアクロックは925MHz)もすでにコアクロック1GHz超えのOCモデルが登場している状況では、それほど大きな評価ポイントとはいえない。なお、これまでのGeForceシリーズであれば、コアクロックの倍速で動作するシェーダクロックがCUDAコアで用いられていたが、GeForce GTX 680からはこれが廃止された。
GeForce GTX 680のリファレンスデザインで「1006MHz」というのは「ベースクロック」を示している。わざわざ“ベース”クロックと称しているのは、GeForce GTX 680からはもう1つの動作クロック指標として「ブーストクロック」が用いられるからだ。これは、新機能「GPU Boost」の性能を示す値で、CPUにTurbo Boost TechnologyやTurbo CORE Technologyといった自動オーバークロックを導入しているが、そのGPU版というべき機能になる。
ブーストクロックは、GPU Boostによって発揮できる可能性があるコアクロックの“期待値”であって、GPU Boostの上限クロックではない。NVIDIAによれば、ブーストクロックは、ベースクロック+5パーセント程度で設定する。リファレンスデザインに設定しているGeForce GTX 680であれば1200MHzあたりがGPU Boostの上限クロックになる。ただし、上限のクロックまで引き上げられる機会はそれほど多くないため、「良心的な値」を表記することになるという。
GPU Boostのクロック変更では、グラフィックスカードに搭載した温度センサや駆動電圧、そのほか各種ハードウェアの情報を活用し、極めて短時間で、そして、細かいステップで制御する。NVIDIAのスタッフも「こうしたGPUの柔軟なクロック調整が可能なのはNVIDIAの技術だけだ」と語っている。
テクスチャユニットは、GeForce GTX 580の2倍になる128基となった一方で、ROPユニットは48基から32基に減少している。テクスチャのボリュームが増える一方で、出力側は32基でも十分処理できるスペックが得られたということだろうか。
Copyright © ITmedia, Inc. All Rights Reserved.