“共有するシェーダ”でGPUの新しい時代を──G80の革新性に迫る（3/3 ページ）

開発コード名「G80」と呼ばれてきたNVIDIAの最新GPUが発表された。Direct X 10に対応した「ユニファイドシェーダアーキテクチャ」を採用する最新GPUの特徴を解説していく。

[笠原一輝，ITmedia] PC用表示関連情報

LINE

Hatena

前のページへ | 　　　　　　

シェーダの並列実行性能を生かして一般的な用途にもGPUを

　こうしたユニファイドシェーダのアーキテクチャを採用し、マルチコア的なハードウェアとなることで、NVIDIAはGPUを新たな分野に利用することを検討し始めている。

　それが「GPGPU」（General Purpose GPU）と呼ばれる取り組みで、従来は3Dグラフィックス用に用途を限定されてきたGPUを、3Dグラフィックス以外にも使おうというものだ。この取り組み自体は以前から提唱されてきたが、NVIDIAは今回のGeForce 8800シリーズで、GPGPUに取り組んでいくことを具体的に明らかにした。

　GeForce 8800の特徴は、なんといっても並列実行が可能になったことにあるといってもよいが、並行実行処理をうまく活用すれば、科学技術演算のような従来はスーパーコンピュータを利用して行われていた計算でGPUを利用することも不可能ではない。また、動画のエンコードのような並列実行に適した処理であれば、GPGPUを利用することで既存のCPUに比べて高い処理能力を発揮できる可能性がある。

　ただし、この場合、現在の3D処理で行われているようにDirect XやOpen GLなどを利用してハードウェアを仮想化することはできないので、GPUそれぞれに対するネイティブな命令をソフトウェアが直接発行する必要がある。このためソフトウェア開発者は、NVIDIAの命令セットに対応したソフトウェアをコーディングしなければならない。

　この問題に対応するために、NVIDIAは「CUDA」（Compute Unified Device Architecture）という構想を明らかにしている。これは、ソフトウェア開発者に対してGPU用のCコンパイラを提供し、それを利用してプログラムと実行ファイルを生産してもらうことで、手軽にGPGPUのソフトウェアをつくってもらうものだ。

　問題は、CUDAを利用してソフトウェアを開発することが有益であるとソフトウェア開発者に理解してもらうことが重要であって、NVIDIAもCUDAの存在がすぐにGPGPUの普及を促すと考えている訳ではない。「とりあえずソフトウェア開発者にCUDAを理解してもらう必要があり、それが最初のステップだ」（トニー・タマシ氏、NVIDIA テクニカルマーケティングディレクター）との言葉の通り、これから時間をかけて徐々に普及させていきたいという考えであるようだ。

汎用的な開発環境の提供とともに、GeForce8800シリーズではシェーダユニットに組み込まれた共有L1キャッシュを利用して性能を向上させる「CUDA Thread Computing」も考えられている

CUDA Thread Computingで動くGeForce 8800シリーズと動作クロック2.66GHzのConroeで比較した相対性能。CUDA Thread ComputingはCPUを超越する性能を発揮するとNVIDIAでは考えている

HD-Videoの再生処理が強化されたPure Video

　GeForce 8800ではビデオ再生機能も強化されている。具体的にはHD解像度でのVC-1とH.264の逆テレシネ、および時空間インタレース除去、ノイズリダクション、エッジ拡張などの機能が追加された（なお、これらの機能はソフトウェアのアップグレードで実現できるので、従来のGeForce 7シリーズでも対応できるものがある）。

　NVIDIA マルチメディア部門プロダクトマーケティングマネージャのパトリック・ベリュー氏は「基本的なビデオプロセッサのアーキテクチャはGeForce 7シリーズと大きな違いはない。ただし、演算ユニットの性能が上がっているので処理性能も上がっている」と説明する。ビデオプロセッサのアーキテクチャは従来と同じだが、ビデオプロセッサが演算ユニットとして利用しているシェーダの性能が向上しているので、PureVideoでビデオを処理する性能が向上し、HD画質でも高画質化処理ができるようになったというのが正しいだろう。なお、GeForce 8800シリーズは標準でHDCPにも対応しており、再生ソフトウェアと組み合わせることで、BDやHD DVDのHD-Videoを再生できる。

　ディスプレイ出力のDACはRGBの各出力が10ビットに対応している。一般的なディスプレイは8ビット出力が標準で、10ビットの場合に比べて表現力がやや劣る。10ビットにすることでより高精細で広い色表現が可能になる。ただし、これはディスプレイ側入力も10ビットに対応する必要があるのだが、現状では10ビットに対応したコンシューマ向けディスプレイはない。今のところはあまり意味はないが、将来安価な10ビット入力に対応したディスプレイが登場すれば、こちらも充実した色表現が可能になる。

GTX、GTSという2つのラインアップが用意されているGeForce 8800シリーズ

GeForce 8800 GTXとGeForce 8800 GTSの主要スペックの比較。スペックは異なるものの、使用しているチップは同じものであるとNVIDIAは説明している

　GeForce 8800シリーズには、発表時点で2つのモデルが用意されている。それが「GeForce 8800 GTX」と「GeForce 8800 GTS」だ。2つの製品の違いは、ストリームプロセッサの数と動作クロック（コアクロックにメモリクロック）、対応できるビデオメモリ容量などで、具体的には左の表のようになっている。

　ビデオ出力は、いずれもデュアルリンクに対応したDVI出力が2系統とHDTV出力が1系統となっている。今回登場したGeForce 8800シリーズは、TSMCの90ナノメートルプロセスルールで製造されており、6億8100万個のトランジスタで構成されている。ちなみに、Core2 Duoのトランジスタ数が2億9100万個だから、その2倍以上ということになる。このため、消費電力はものすごいことになっており、GTXのSKUでは平均で130ワットで、ワーストケースでは185ワットにも達するという。このため、リファレンスのグラフィックスカードには2つの6ピン電源入力が用意されており、仮にNVIDIA SLI構成で利用したい場合には、6ピンコネクタが4本ある構成で利用することになる。

　NVIDIA SLIのコネクタも1枚のボードに2つ用意されている。「これはデイジーチェーンで利用することを可能にするためのものだ。ただし、現時点ではドライバレベルでNVIDIA SLIは1組しかサポートされていない」（ジェス・デザイ氏、NVIDIA General Manager、Desktop GPUs）と述べるなど、将来的には2枚だけでなく接続できる枚数を増やすことができる可能性があることを示唆している。AMDは4x4と呼ばれるGPUを4枚差すことができるプラットフォームを年内にリリースすることをすでに明らかにしていることを考えると、これは期待できるのではないだろうか。

これからDX10対応GPUの時代が始まる、今後はメインストリーム版のリリースにも期待

　GeForce 8800シリーズの特徴はすでに述べてきたようにユニファイドシェーダの採用だ。ユニファイドシェーダのアーキテクチャは、もちろんDirect X 9世代のアプリケーションでも有効だが、本当の意味で性能を発揮させるにはDirect X 10とそれに対応したアプリケーションが必須であるのはいうまでもない。すでにベンチマークテストでは、前世代のGeForce 7900シリーズに比べて高い性能を発揮しているが、今後Windows VistaとDirect X 10対応アプリケーションが出そろえば、また検証してみたいところだ。

　なお、今後はATI部門からも「R6XX」の開発コード名で知られる次世代GPUが登場する予定になっており、こちらもユニファイドシェーダになる可能性が高い。そうした意味では、本当の競争はそれから始まるといってもいい。新しいDX10世代のGPU競争が始まるのは、AMDがDX10世代のリリース後ということになるだろう。

　また、今後はNVIDIAからよりローエンドの製品のリリースも予想される。今のところGeForce 8800シリーズはハイエンドのみだが、現行の7600や7300相当のユニファイドシェーダの製品も来年には登場すると見られている。そのときにはWindows Vistaがリリースされてから時間も経過しているだろうから、DX10対応のアプリケーションも姿を見せているのではないだろうか。メインストリームユーザーであれば、そちらを待つというのも1つだろうか。

“共有するシェーダ”でGPUの新しい時代を──G80の革新性に迫る（3/3 ページ）

シェーダの並列実行性能を生かして一般的な用途にもGPUを

HD-Videoの再生処理が強化されたPure Video

GTX、GTSという2つのラインアップが用意されているGeForce 8800シリーズ

これからDX10対応GPUの時代が始まる、今後はメインストリーム版のリリースにも期待

関連記事

関連リンク