GeForce6800 シリーズに秘められたNVIDIA の戦略とは?(中編)(1/2 ページ)

» 2004年06月09日 14時20分 公開
[トライゼット西川善司,ITmedia]
今回もお相手は前回に引き続き、NVIDIA Vice President&Technical Marketingを務めるTトニー・タマシ氏だ

演算精度は「FP24精度で十分?」「FP32精度が必要?」

 2003年世代に引き続き2004年世代のGPUでも、プログラマブルピクセルシェーダの演算精度がATIとNVIDIAでは異なっている。ATIのRADEON X800シリーズは先代RADEON 9800シリーズ同様24ビット浮動小数点実数(FP)精度で、対するGeForce 6800シリーズは先代これもGeForce FXシリーズ同様の32ビットFP精度を採用している。

 ATIは、「今のリアルタイム3Dグラフィックスでは、ピクセル陰影処理の演算精度に24ビットで必要十分」という見解を示している。この演算精度にまつわる、両社の考えの相違点についての意見を聞いてみた。

タマシ氏 前回同様のGPUデザイントレードオフにまつわる問題です。内部レジスタをFP24でデザインできれば内部レジスタ容量を小規模に出来るし、積和算器を初めとしたいろいろな演算器も小規模に出来ます。ただ、確実にいえることは、FP24精度はFP32精度よりも精度的に劣ると言うことです。

 RADEON X800においてもFP24精度を採択したのは、もちろんベースアーキテクチャがRADEON 9800系であることも大きいと思うが、それ以外にも、シェーダ 2.0仕様に留まったことで、FP32精度への移行の必要性が少なかったとも考えられる。

 シェーダ 3.0仕様では、頂点シェーダによるテクスチャへのアクセスが可能となっており、テクスチャデータとしてテーブルに記録されたベクトルデータを使って頂点を変位させる「ディスプレースメントマッピング」(D-MAP)が可能となっている(ただし、シェーダ 3.0仕様のD-MAPは、Matrox Parhelia系のそれとは異なり、頂点数の増減はないシンプルなもの)。

 頂点シェーダ自身は、このベクトルデータ・テクスチャからデータが読み出せるだけで、内容を書き換えたりする能力は持たない。よって、このテクスチャの内容を変化させて、動的、かつインタラクティヴなD-MAPを行うためにはピクセルシェーダの力を借りる必要がある。つまり、シェーダ 3.0仕様では「ピクセルシェーダでテクスチャを更新して、これを頂点シェーダで利用する」といったパイプラインが構成できるのだ。

このデモの主役は実は船ではなくて波。視点から遠い距離の波の凹凸はバンプマッピングで表現し、視点から近い波の凹凸についてはジオメトリレベルの凹凸を実際に作り出して表現する。このジオメトリレベルの凹凸生成には、プログラマブル頂点シェーダ 3.0の特徴的な機能である頂点テクスチャリングによるD-MAPを活用している

 頂点シェーダの演算精度はRADEON X800もGeForce 6800もFP32精度(FP32×4=FP128精度という書き方をする場合もある)だ。一方、ピクセルシェーダの演算精度は、前述したようにFP24(ATI)とFP32(NVIDIA)の違いがある。ピクセルシェーダ→頂点シェーダという処理系が起こりうるシェーダ3.0仕様では、演算精度が異なっていてはまずい。

 シェーダ 2.0仕様に留まったRADEON X800シリーズはこの問題に直面しないからこそ「リアルタイム3DグラフィックスにおいてはFP24精度で十分」と言い切れるのだろう。

ATIのRADEON X800シリーズのために作られたリアルタイムレンダリングによる短編映画風デモ「RUBY-THE DOUBLE CROSS」 この映像クオリティを見る限りではFP24精度の不利なところは感じられないが……

タマシ氏 この頂点シェーダとピクセルシェーダの演算精度の相違は、Direct X 9世代GPU、それこそシェーダ2.0仕様GPUでも問題になりうるのです。

──頂点バッファレンダリング(Render-to-Vertex Buffer)テクノロジですね。FPフォーマットのフレームバッファに頂点情報に相当する内容をレンダリングし、これを頂点シェーダに戻す処理系で、セミ頂点シェーダ3.0仕様みたいな感じですですよね。OpenGLでもARB Superbuffersテクノロジ(www.ati.com/developer/gdc/SuperBuffers.pdf)の一つとして定義されていると、去年のSIGGRAPHのセッションで聞いてきました。

タマシ氏 RADEON 9700/9800系でもこの機能が使えますが、これらATIのGPUでは、ピクセルシェーダがFP24精度で生成した頂点バッファを頂点シェーダがFP32精度で処理することになりますから、上記の演算精度の違いの問題が生じることになります。

 とにかく、いまのGPU世代でFP24精度の優位性を語るのは無理がある私は思います。

 頂点バッファレンダリングは、メインメモリとビデオメモリの区別がないXboxでは効果的に活用されている例もあるそうだが、PCでこれを効果的に活用した例はあまり多くない。よって、RADEON系のピクセルシェーダのFP24演算精度が、それほど大きな問題を引き起こすことはめったにないとは思うのだが、一つの可能性としては確かに「その通り」である。

頂点バッファレンダリングは、GPUで物理シミュレーションをやるときにも有用とされる。画面は頂点バッファレンダリング技術を使って布の挙動のシミュレーションを行ったデモ。詳細はNVIDIAの開発者ページ(http://developer.nvidia.com/object/demo_cloth_simulation.html)を参照されたし

ネイティヴ vs.ブリッジソリューション。NVIDIAは本当に不利なのか

 RADEON X800系とGeForce 6800系とでは、ある最新フィーチャーに対するスタンスが決定的に異なっている部分がある。

 それはPCI-EXPRESSへの対応スタンスだ。

 先行して発表されたRADEON X800系は、GPUコア内部にAGP 8Xインタフェースを内蔵したAGP 8X版だが、先日COMPUTEX TAIPEI 2004でGPUコア内部にPCI-Expressインタフェースを内蔵したPCI-Express版が発表された。

 これに対し、GeForce 6800系は内部バスをAGP 16Xとし、これをPCI-Expressインタフェースへの変換ブリッジチップを組み合わせてPCI-Expressに対応する予定になっている。

NVIDIAのGPUはPCI-Expressへの対応にはHSIブリッジチップを用いる
ネイティヴソリューションの場合は理論上、上り下りがそれぞれ4Gバイト/秒の帯域を持つと説明される。図中のCore Logicとはチップセットのこと

 というわけで、2004年世代は、いわゆるPCI-Expressへの「ネイティヴ対応」(ATI) vs.ブリッジ対応」(NVIDIA)という戦いが繰り広げられるのである。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2024年03月28日 更新
  1. Synology「BeeStation」は、“NASに興味があるけど未導入”な人に勧めたい 買い切り型で自分だけの4TBクラウドストレージを簡単に構築できる (2024年03月27日)
  2. 「ThinkPad」2024年モデルは何が変わった? 見どころをチェック! (2024年03月26日)
  3. ダイソーで330円の「手になじむワイヤレスマウス」を試す 名前通りの持ちやすさは“お値段以上”だが難点も (2024年03月27日)
  4. ミリ波レーダーで高度な検知を実現する「スマート人感センサーFP2」を試す 室内の転倒検出や睡眠モニターも実現 (2024年03月28日)
  5. ダイソーで550円で売っている「充電式ワイヤレスマウス」が意外と優秀 平たいボディーは携帯性抜群! (2024年03月25日)
  6. 次期永続ライセンス版の「Microsoft Office 2024」が2024年後半提供開始/macOS Sonoma 14.4のアップグレードでJavaがクラッシュ (2024年03月24日)
  7. 2025年までに「AI PC」を1億台普及させる――Intelが普及に向けた開発者支援をアップデート ASUS NUC 14 Proベースの「開発者キット」を用意 (2024年03月27日)
  8. いろいろ使えるFireタブレットが最大7000円オフ! Echo Budsは半額以下で買える! (2024年03月26日)
  9. 15.5万円の有機ELディスプレイ「MPG 271QRX QD-OLED」に指名買い続出 (2024年03月25日)
  10. サンワ、Windows Helloに対応したUSB Type-C指紋認証センサー (2024年03月27日)
最新トピックスPR

過去記事カレンダー