ニュース
» 2012年03月22日 22時00分 公開

KeplerでGPUが動く時代に:大解説! 新世代GPU“Kepler”が性能2倍で省電力の理由 (2/4)

[本間文,ITmedia]

なぜ、性能2倍で消費電力を下げられたのか

 Keplerアーキテクチャが省電力性能を高められた理由は、CUDAコアの集積度を上げただけではない。NVIDIAでGeForceビジネスを統括するドリュー・ヘンリー氏は、「命令の依存関係を判断したり、スレッドのスケジューリングや管理を行なうコントロール回路を大幅に簡素化したことで、より多くのCUDAコアを搭載できるようにするとともに、省電力化を実現した」と説明する。また、Keplerアーキテクチャでは、これまでCUDAコアをほかの回路の倍速で動作させていた“プロセッサクロック”をなくし、GPU全体を単一の動作クロックにするとともに、動作クロックそのものを低く抑えることで、さらなる省電力化を実現している。

 なお、SMXを構成するCUDAコアや複雑な演算を処理するスペシャルファンクションユニットは、「GeForce GTX 580などのFermiアーキテクチャ世代と同じ」と、NVIDIAでGPUアーキテクチャの開発などを統括するヨナ・アルベン上級副社長は語っている。「Keplerアーキテクチャでは、シングルクロック化によって従来製品に比べて周辺回路の動作クロックが上がっている上に、2次キャッシュメモリやテクスチャキャッシュメモリなどとのインタフェース帯域も倍になっているため、高負荷時もパフォーマンスが低下しにくい」とアルベン氏が述べているように、アーキテクチャの最適化によって、トランジスタ数を大幅に増やした大きなGPUチップを作らなくても、最上位モデルのGPUにふさわしいパフォーマンスを実現している。

Keplerアーキテクチャを解説するNVIDIAのドリュー・ヘンリー氏(写真=左)と、GeForce GTX 680の優位点を説明するNVIDIA上級副社長のヨナ・アルベン氏

32基のCUDAコアで構成していたGeForce GTX 580世代のSMに比べ、GeForce GTX 680で採用したSMXは、コントロールロジックを大幅に簡素化し、限られたトランジスタ数でより多くのCUDAコアを搭載できるようにし、電力あたりのパフォーマンス性能を2倍に高めたとNVIDIAは説明する(写真=左、中央)。GeForce GTX 680が採用するKeplerアーキテクチャでは、CUDAコアもほかの回路と同じクロックで動作するシングルクロック化を図ったことで、回路エリアは1.8倍に増えても、消費電力は大幅に低減した(写真=右)

命令発効のスケジューリングや依存性のチェックにCPUを利用することで、より効率的かつ複雑なCUDAコアのコントロールを可能にした(写真=左)。GeForce GTX 680とGeForce GTX 580で比較した電力あたりのパフォーマンス。NVIDIAが公開した資料で純粋なパフォーマンス比較ではないことは理解しておく必要がある(写真=中央)。NVIDIAが公開したGeForce GTX 680とRadeon HD 7970のパフォーマンス比較。ほとんどのゲームで“想定競合”のRadeon HD 7970を上回る(写真=右)

余力をパワーに振り分ける「GPU Boost」

 GeForce GTX 680は、GPUの性能をフルに引き出すための機能をもう1つ追加している。NVIDIAが「GPU Boost」と呼ぶその機能は、インテルのTurbo Boost Technologyと同様に、GPUの消費電力が低いときは、その余力をオーバークロック動作に振り分けることで、さらなるパフォーマンスを引き出そうとする。この機能は、GPU内部とグラフィックスカード上の各種ハードウェアモニタの数値を取得し、ターゲット電力(GeForce GTX 680においてデフォルトでは170ワット)まで余裕がある場合は、GPUやグラフィックスメモリの駆動電圧と動作クロックを動的に制御して、パフォーマンスを最大限に引き出す。このため、NVIDIAはGeForce GTX 680において、通常の動作クロックにあたるベースクロックの1006MHzに加えて、GPU boost有効時にオーバークロック動作を確実に保証できる値として“Boost Clock”の1058MHzをスペックに併記している。さらに、WebブラウザやOfficeアプリなど、GPUへの負荷が低いアプリケーションでは、ベースクロックよりも低い動作クロックで動作する。

 なお、このターゲット電力や、GPU Boost有効時のターゲット動作クロックなどは、グラフィックスカードベンダーが用意するパフォーマンスツールなどで調整できるが、GPU Boost機能そのものは、NVIDIAコントロールパネルを使っても、ユーザーは無効にできない。ただ、GPU Boost機能とパフォーマンスチューニングツールを利用して、1.2GHz以上のオーバークロック動作を実現することも可能だという

GPU Boostでは、ターゲット電力に対する余裕分をオーバークロック動作に割り当てることで、電力を消費しないゲームタイトルなどでさらなるパフォーマンスアップが可能になる

NVIDIAが公開したGPU Boostのアルゴリズム。GPU、およびグラフィックスカード上のハードウェアモニタから得た各種データを利用して、GPUやグラフィックスメモリの動作クロックと駆動電圧を動的に制御する(写真=左)。GPUの冷却効率を高めれば、GPU Boostを利用して1.2GHzを超えるオーバークロック動作も可能だという(写真=右)

Copyright © ITmedia, Inc. All Rights Reserved.

この記事が気に入ったら
ITmedia PC USER に「いいね!」しよう