NVIDIAの最新アーキテクチャ“Maxwell”を徹底解説Keplerと何が違う?(1/3 ページ)

» 2014年02月18日 23時00分 公開
[本間文,ITmedia]

メインストリームで新アーキテクチャを投入

 ついに、NVIDIAが新アーキテクチャ“Maxwell”ベースのGPUを市場投入する。ただし、これまでの同社の戦略と大きく異なるのは、メインストリーム市場向け製品で最初に新しいアーキテクチャを採用したことだ。

 同社でGeForce製品を担当するジャスティン・ウォーカー氏(Justin Walker、GeForce Senior Product Manager)は、「“第1世代”のMaxwellは、Keplerが実現した消費電力あたりのパフォーマンスをさらに向上させたアーキテクチャ」と位置づける。

 そのカギとなるのが、CUDAコアクラスタとなるSM(Streaming Multiprocessor)の構成を見直し、CUDAコアの利用効率を高めることで、大幅なパフォーマンスアップと省電力性の維持を実現した点だ。

メディア向け説明会が開催されたNVIDIA台湾本社ビル(写真=左)。GeForce GTX 750Tiに採用したGM107チップを披露するジャスティン・ウォーカー氏(写真=右)

 Maxwellアーキテクチャでは、Keplerが192基のCUDAコアでSMXを構成していたのに対し、128基のCUDAコアをプロセシングブロック(PB)と呼ぶ32コアごと、4つのパーティションに分け、それぞれのプロセシングブロックにコントロールロジックとなるWarpスケジューラと2つの命令発行ユニット(ディスパッチユニット)、64Kバイト(16384×32ビット)のレジスタファイルを持ち、命令発行の効率化を図るとともに、プロセシングブロックごとにクロック制御をすることで、低負荷時の省電力化を図りやすくする。

“第1世代”のMaxwellアーキテクチャでは、SM内にプロセシングブロックを設けることで、命令発行の効率化や省電力制御の容易性を高めているという

MaxwellアーキテクチャのSMM構成。128基のCUDAコアを4つのプロセシングブロックに分けている(写真=左)。KeplerアーキテクチャのSMX構成。192基のCUDAコアを1つのクラスタにまとめている(写真=右)

 この32 CUDAコアという構成は、“数”だけを見れば、GeForce GTX 280で採用した“Fermi”フェルミアーキテクチャと同じだ。しかし、SMのクロック制御はKeplerと同じ単一クロック動作をベースとしており、スケジューリングに関してもKepler同様ソフトウェア制御を多用するもので、Fermi世代とは大きく構成が異なる。

 特に超越関数演算に用いるスペシャルファンクションユニット(Special Function Unit:SFU)や、ロード・ストアユニット(Load/Store Unit:LD/ST)の割合は、Kepler世代よりも増えていることが、下の表からも見て取れるだろう。

 L1キャッシュはテクスチャキャッシュと共用する一方、4つのプロセシングブロックが共用するユニファイドメモリを搭載するデザインに変更されており、Fermiや同社初のCUDA GPUとなったG80世代に採用した手法に立ち返った部分もある。

Keplerアーキテクチャの発表時には、32 CUDAコア構成のSMを192コア構成のSMXに変更したことで、消費電力あたりのパフォーマンス(パフォーマンス/ワット)を2倍に高めたとアピールしていた

SMM/SMX構成比較
アーキテクチャ Maxwell Gen.1 Kepler
プロセス技術 TSMC 28nm TSMC 28nm
CUDAコア 128 192
プロセシング・ブロック(パーティション) 32コア×4
Warpスケジューラ 4 (1×4) 4
命令発行ユニット(ディスパッチユニット) 8 (2×4) 8
スペシャルファンクションユニット(SFU) 32基(8×4) 32基
ロード・ストアユニット 32基(8×4) 32基
レジスタファイル 256KB (64KB:16,384×32bit×4) 256KB (65,536×32bit)
テクスチャユニット 8 16
PolyMorph Engine 1 1

 ウォーカー氏によれば、Maxwellに採用したCUDAコアや、SFUなどは、基本的にKepler世代と同じものであり、テッセレータなどを統合するジオメトリ処理用の固定ファンクションユニットのPolyMorph Engineも手は加えられていないという。

 その意味では、“第1世代”のMaxwellアーキテクチャは、同社のモバイルSoC「Tegra K1」への実装も果たしたKeplerアーキテクチャの省電力性能を、さらに突き詰めた改良版アーキテクチャという色が濃いようにも感じる。

 実際、ウォーカー氏は「“第1世代”のMaxwellコアとなるGK107では、消費電力あたりのパフォーマンスを追究することを最優先に開発が進められた」としており、パフォーマンスを最大限に引き出すことよりも、エネルギー効率を高めることを優先したことが分かる。

4年間で4倍のエネルギー効率向上を果たしたとアピール

パフォーマンスでは、Fermiアーキテクチャを採用したGeForce GTX 550 Tiの2倍の性能向上を果たしつつ、消費電力は550 Tiの116Wに比べて約半分の60ワットに抑えられている

       1|2|3 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2026年03月12日 更新
  1. 10万円切りMacが17年ぶりに復活! 実機を試して分かったAppleが仕掛ける「MacBook Neo」の実力 (2026年03月10日)
  2. 「MacBook Neo」を試して分かった10万円切りの衝撃! ただの“安いMac”ではなく絶妙な引き算で生まれた1台 (2026年03月10日)
  3. 新型「MacBook Air」はM5搭載で何が変わった? 同じM5の「14インチMacBook Pro」と比べて分かったこと (2026年03月10日)
  4. リュック1つで展示会セミナーの音響セット構築レポ 現場で得た“2.4GHz帯混信地獄”を生き抜く教訓 (2026年03月11日)
  5. セールで買った日本HPの約990gノートPC「Pavilion Aero 13-bg」が想像以上に良かったので紹介したい (2026年03月11日)
  6. 最新Core Ultra X7 358Hの破壊力! 16型OLED搭載で内蔵GPUがディスクリート超え!? Copilot+ PC「Acer Swift 16 AI」レビュー (2026年03月10日)
  7. 「iPhone 17e」実機レビュー! 9万9800円で256GB&MagSafe対応 ベーシックモデルの魅力と割り切り (2026年03月09日)
  8. 「GeForce NOW」がサービスをアップデート Apple Vision ProやMeta Questで最大90fpsのゲーミングが可能に (2026年03月11日)
  9. 出張や通勤で荷物が増えても安心な「ミレー ビジネスリュック EXP NX 20+」が27%オフの1万3865円に (2026年03月10日)
  10. 自作PCを売却して「Mac Studio」へ ローカルLLMサーバ移行で得られた驚きの“ワッパ”と安心感 (2026年03月09日)
最新トピックスPR

過去記事カレンダー

2026年