大解説! 新世代GPU“Kepler”が性能2倍で省電力の理由KeplerでGPUが動く時代に(2/4 ページ)

» 2012年03月22日 22時00分 公開
[本間文,ITmedia]

なぜ、性能2倍で消費電力を下げられたのか

 Keplerアーキテクチャが省電力性能を高められた理由は、CUDAコアの集積度を上げただけではない。NVIDIAでGeForceビジネスを統括するドリュー・ヘンリー氏は、「命令の依存関係を判断したり、スレッドのスケジューリングや管理を行なうコントロール回路を大幅に簡素化したことで、より多くのCUDAコアを搭載できるようにするとともに、省電力化を実現した」と説明する。また、Keplerアーキテクチャでは、これまでCUDAコアをほかの回路の倍速で動作させていた“プロセッサクロック”をなくし、GPU全体を単一の動作クロックにするとともに、動作クロックそのものを低く抑えることで、さらなる省電力化を実現している。

 なお、SMXを構成するCUDAコアや複雑な演算を処理するスペシャルファンクションユニットは、「GeForce GTX 580などのFermiアーキテクチャ世代と同じ」と、NVIDIAでGPUアーキテクチャの開発などを統括するヨナ・アルベン上級副社長は語っている。「Keplerアーキテクチャでは、シングルクロック化によって従来製品に比べて周辺回路の動作クロックが上がっている上に、2次キャッシュメモリやテクスチャキャッシュメモリなどとのインタフェース帯域も倍になっているため、高負荷時もパフォーマンスが低下しにくい」とアルベン氏が述べているように、アーキテクチャの最適化によって、トランジスタ数を大幅に増やした大きなGPUチップを作らなくても、最上位モデルのGPUにふさわしいパフォーマンスを実現している。

Keplerアーキテクチャを解説するNVIDIAのドリュー・ヘンリー氏(写真=左)と、GeForce GTX 680の優位点を説明するNVIDIA上級副社長のヨナ・アルベン氏

32基のCUDAコアで構成していたGeForce GTX 580世代のSMに比べ、GeForce GTX 680で採用したSMXは、コントロールロジックを大幅に簡素化し、限られたトランジスタ数でより多くのCUDAコアを搭載できるようにし、電力あたりのパフォーマンス性能を2倍に高めたとNVIDIAは説明する(写真=左、中央)。GeForce GTX 680が採用するKeplerアーキテクチャでは、CUDAコアもほかの回路と同じクロックで動作するシングルクロック化を図ったことで、回路エリアは1.8倍に増えても、消費電力は大幅に低減した(写真=右)

命令発効のスケジューリングや依存性のチェックにCPUを利用することで、より効率的かつ複雑なCUDAコアのコントロールを可能にした(写真=左)。GeForce GTX 680とGeForce GTX 580で比較した電力あたりのパフォーマンス。NVIDIAが公開した資料で純粋なパフォーマンス比較ではないことは理解しておく必要がある(写真=中央)。NVIDIAが公開したGeForce GTX 680とRadeon HD 7970のパフォーマンス比較。ほとんどのゲームで“想定競合”のRadeon HD 7970を上回る(写真=右)

余力をパワーに振り分ける「GPU Boost」

 GeForce GTX 680は、GPUの性能をフルに引き出すための機能をもう1つ追加している。NVIDIAが「GPU Boost」と呼ぶその機能は、インテルのTurbo Boost Technologyと同様に、GPUの消費電力が低いときは、その余力をオーバークロック動作に振り分けることで、さらなるパフォーマンスを引き出そうとする。この機能は、GPU内部とグラフィックスカード上の各種ハードウェアモニタの数値を取得し、ターゲット電力(GeForce GTX 680においてデフォルトでは170ワット)まで余裕がある場合は、GPUやグラフィックスメモリの駆動電圧と動作クロックを動的に制御して、パフォーマンスを最大限に引き出す。このため、NVIDIAはGeForce GTX 680において、通常の動作クロックにあたるベースクロックの1006MHzに加えて、GPU boost有効時にオーバークロック動作を確実に保証できる値として“Boost Clock”の1058MHzをスペックに併記している。さらに、WebブラウザやOfficeアプリなど、GPUへの負荷が低いアプリケーションでは、ベースクロックよりも低い動作クロックで動作する。

 なお、このターゲット電力や、GPU Boost有効時のターゲット動作クロックなどは、グラフィックスカードベンダーが用意するパフォーマンスツールなどで調整できるが、GPU Boost機能そのものは、NVIDIAコントロールパネルを使っても、ユーザーは無効にできない。ただ、GPU Boost機能とパフォーマンスチューニングツールを利用して、1.2GHz以上のオーバークロック動作を実現することも可能だという

GPU Boostでは、ターゲット電力に対する余裕分をオーバークロック動作に割り当てることで、電力を消費しないゲームタイトルなどでさらなるパフォーマンスアップが可能になる

NVIDIAが公開したGPU Boostのアルゴリズム。GPU、およびグラフィックスカード上のハードウェアモニタから得た各種データを利用して、GPUやグラフィックスメモリの動作クロックと駆動電圧を動的に制御する(写真=左)。GPUの冷却効率を高めれば、GPU Boostを利用して1.2GHzを超えるオーバークロック動作も可能だという(写真=右)

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2024年03月28日 更新
  1. Synology「BeeStation」は、“NASに興味があるけど未導入”な人に勧めたい 買い切り型で自分だけの4TBクラウドストレージを簡単に構築できる (2024年03月27日)
  2. 「ThinkPad」2024年モデルは何が変わった? 見どころをチェック! (2024年03月26日)
  3. ダイソーで330円の「手になじむワイヤレスマウス」を試す 名前通りの持ちやすさは“お値段以上”だが難点も (2024年03月27日)
  4. ダイソーで550円で売っている「充電式ワイヤレスマウス」が意外と優秀 平たいボディーは携帯性抜群! (2024年03月25日)
  5. ミリ波レーダーで高度な検知を実現する「スマート人感センサーFP2」を試す 室内の転倒検出や睡眠モニターも実現 (2024年03月28日)
  6. 次期永続ライセンス版の「Microsoft Office 2024」が2024年後半提供開始/macOS Sonoma 14.4のアップグレードでJavaがクラッシュ (2024年03月24日)
  7. 2025年までに「AI PC」を1億台普及させる――Intelが普及に向けた開発者支援をアップデート ASUS NUC 14 Proベースの「開発者キット」を用意 (2024年03月27日)
  8. いろいろ使えるFireタブレットが最大7000円オフ! Echo Budsは半額以下で買える! (2024年03月26日)
  9. 15.5万円の有機ELディスプレイ「MPG 271QRX QD-OLED」に指名買い続出 (2024年03月25日)
  10. サンワ、Windows Helloに対応したUSB Type-C指紋認証センサー (2024年03月27日)
最新トピックスPR

過去記事カレンダー