レビュー

「新世代GPU」の実力はあるのか?──GeForce GTX 280ベンチマークレビューイマドキのイタモノ(2/2 ページ)

GeForce 9800なんたらが出たばかりですよね。なに、またですか。もういいですよ、といいたくなるほど続いたNVIDIAの最新GPU。しかし、今度は「新世代」にふさわしい性能を発揮するらしい。

前のページへ |       

1GPUのGeForce GTX 280はデュアルGPUのグラフィックスカードを超えられるのか

 それではベンチマークテストを使ってGeForce GTX 280の性能を検証したい。今回比較対象として用意したのは、GeForce 9800 GX2、GeForce 9800 GTX、Radeon HD 3870 X2で、評価用システムの構成は以下のようになっている。

CPU Core 2 Extreme QX9650(クアッドコア、3GHz)
チップセット Intel X38 Express
マザーボード ASUS P5E3
メモリ DDR3-1333
メモリモジュール PC3-10666(7-7-7)
容量 2Gバイト
標準解像度 1280×1024ドット/32ビットカラー
HDD HGST HDT725050VLA
フォーマット NTFS
OS Windows Vista Ultimate SP1

 GeForce 9800 GX2/GTX、RADEON HD 3870 X2のディスプレイドライバに関しては、ベンチマーク時点で両社のWebサイトに公開されていた最新版を利用した。GeForce GTX 280に関しては、NVIDIAから評価用として配布されたForceWare 177.34β版を適用している。なお、このβ版はGeForce GTX 200シリーズ専用で、G92世代のGPUには利用できなかった。

advertisement
3DMark Vantage(3DMARK SCORE)
3DMark Vantage(GPU)
3DMark06 3DMark Score
3DMark06 SM2.0 Score
3DMark06 HDR/SM3.0 Score
LOST PLANET EXTREME CONDITION<Snow>
F.E.A.R.
Company of Heroes 2.103.0
Crysis 1.1 Benchmark_GPU
Unreal Tornament 3 (vCTF-Suspense FlyThrough-PC)
Unreal Tornament 3 (DM-ShangriLa-FPS-PC)

 基本的な傾向としては、3DMark Vantage、Unreal Tournament 3、F.E.A.R.などのベンチマークテストで1GPU構成のGeForce GTX 280は、2GPU構成のGeForce 9800 GX2をおおむね上回っている。ただ、詳しく見ていくと、GPUへの負荷があまり高くない条件、アンチエリアシングや異方性フィルタリングなどが無効で低解像度における測定では、240個という膨大な統合型シェーダユニットを実装するGeForce GTX 280の特徴があまり生かされない。

 しかし、解像度を1920×1200ドットに上げてアンチエリアシングや異方性フィルタリングを有効にするとGeForce GTX 280は比較対象のGPUより良好な結果を示すようになる。1GPU構成という意味で、GeForce 9800 GTXと比較するならば、これはもう完全に段違いの性能を示しているといっていいだろう。

CUDAに対応したソフトウェアで爆速トランスコード

 この記事の冒頭で少し触れたように、GeForce GTX 280は、GPUとしてだけでなく、動画や写真編集といった一般用途にもGPUを利用できる。CUDAと呼ばれるソフトウェアプラットフォームがそれで、CUDAに対応したソフトウェアであれば、GPUのエンジンを利用していろいろな目的のための演算が可能になる。

 CUDAとGeForce GTX 200シリーズの関係は後日掲載する別記事で詳しく紹介するが、ここではElemental Technologiesが試作した、CUDA用のトランスコードソフトウェア「BadaBOOM Media Converter」でその性能の一端を紹介しておきたい。

 BadaBOOM Media ConverterはMPEG-2などの動画ファイルを、iPodやPSPといった携帯機器向けのMPEG-4 AVCにトランスコードできる機能を備えている。今回はこのソフトウェアとCUDAに対応していないTMPGenc 4 Xpressとで、MPEG-4 AVCにトランスコードする速度を測ってみた。なお、比較しやすいように、まず、TMPGenc 4 Xpressのバッチを利用してWMVへトランスコードするプロセスをバックグランドで2つ走らせてCPUの利用率をほぼ100%の状態にしたうえで、フォアグランドでTMPGenc4 XpressによるCPUを使ったトランスコード処理と、BadaBOOM Media Converterを利用したGPUによるトランスコード処理を実行し、それぞれにかかった時間を計測した。

 計測に利用したのは1万2624フレーム、ビットレート8MbpsのMPEG-2ファイルで、それをMPEG-4 AVCにトランスコードした。なお、BadaBOOM Media Converterは、ビットレートなどを細かく設定できないので、TMPGenc側のビットレートは、BadaBOOM Media Converterでトランスコードした結果から推測して同じ程度のビットレートに設定している。

BadaBOOM Media Converter(GPU利用) TMPGenc 4 Xpress(CPU利用)
MPEG-4 AVC 29.66秒 520秒

 CPUでトランスコードした場合には、(バックグランドでWMVのトランスコードプロセスが走っていることもあり)520秒もかかったが、GPUで行った場合にはわずか30秒だった。BadaBOOM Media Converter+GPUを利用した処理速度が圧倒的に速い。

 もっとも、細かい設定ができないBadaBOOM Media Converterに比べ、TMPGenc4 Xpressは多彩な設定が可能だ。ソフトウェアの機能も考慮した総合的な実用度を考えると、ただ単に速いからといってすぐにBadaBOOM Media ConverterとGPU処理の組み合わせに乗り換えるというのはあまりにも稚拙な考えだろう。トランスコード時に細かく調整することで生成物のクオリティはかなり変わることを考えると、現時点ではTMPGenc4 XpressとCPUによる処理に分があるといえる。

 しかし、TMPGenc4 XpressがCUDAに対応してGPUを利用できるようになったとしたらどうだろうか。CUDAソフトウェアのラインアップが充実してくれば、GPUでトランスコードする意味もでてくるのではないだろうか。

GeForce GTX 200シリーズのミドルレンジモデルにも期待

 ベンチマークテストの結果から、GeForce GTX 280は、現時点で存在するGPUとしては最高の性能を発揮すると評価していいだろう。また、BadaBOOM Media Converterがその潜在する能力をかいま見せたように、CUDAに対応したソフトウェアを使えば、3D以外におけるGPUの存在意義がより重要になってくる可能性も秘めている。

 現時点におけるGeForce GTX 200シリーズの問題点はその価格にある。GeForce GTX 280が699ドル、GeForce GTX 260が399ドルと、軽い気持ちと予算ではなかなか購入に踏み切れない価格だからだ。ヘビーゲーマーであれば、3D描画性能が対戦結果を左右することもあり得るので、それだけの価値を見出すこともできるだろうが、一般的なPCユーザーであれば、もう少し低価格のミドルレンジクラスを望むだろう。今後登場すると思われるGeForce GTX200シリーズのアーキテクチャを採用したミドルレンジやローエンドモデルにも大いに期待したい。

前のページへ |       

Copyright © ITmedia, Inc. All Rights Reserved.