ニュース
» 2008年06月19日 11時30分 公開

ゲームを超えるミッションとは──NVIDIAが「GT200」にこめたGPUの可能性 (2/3)

[笠原一輝,ITmedia]

GeForce 8800 GTXの倍近い演算性能を実現するGeForce GTX 280

 NVIDIAのテクニカルマーケティング担当副社長 トニー・タマシ氏によれば、GeForce GTX 200シリーズは、こうしたCUDAを利用して作成されたアプリケーションを利用するプラットフォームとしても意識した設計になっているという。「GeForce GTX 200シリーズはゲーム用途の利用だけを意識した従来のGPUとは異なる設計思想を持っている。具体的にはコンピューティングプラットフォームとしての側面を意識した設計になっている」とタマシ氏は述べ、それを実現するためにGeForce GTX 200シリーズのマイクロアーキテクチャの設計は行われていると説明した。

 GeForce GTX 200は「Thread Processor」と呼ばれるプロセッサコアを240個内蔵する。それぞれのThread Processorは整数演算器と倍精度(64ビット)の浮動小数点演算器を備え、8個のThread Processorで「Thread Processor Array」という単位を構成する。それぞれのThread Processor Arrayは16Kバイトのローカルメモリを備えている。さらに、3つのThread Processor Array(=24個のThread Procesor)で「Thread Processing Cluster」という単位が構成され、それぞれが1次キャッシュメモリを備えている。

 こうした構造をとることで、GeForce GTX 200シリーズでは3万を超えるスレッドをGPU全体で処理できるようになっている(前世代のGeForce 8/GeForce 9シリーズでは1万前後)。こうした演算器の増加や効率の向上などにより、GeForce 8800 GTXが533G FLOPS(FLOPSとは1秒間に実行できる浮動小数点演算の数)だったのに対して、GeForce GTX 200シリーズの上位モデルとなるGeForce GTX 280では933G FLOPSと倍近い性能を実現している。

 もちろん、GeForce GTX 200シリーズではグラフィックス処理における性能向上も図られている。NVIDIAによると、倍精度の浮動小数点演算をサポートしたため、テクスチャ処理の性能が向上しているほか、ジオメトリシェーダの処理能力が向上しているという。このほかにもレジスタファイルが倍になり、シェーダプログラムを実行する効率が向上するなどの特徴を備えている。

NVIDIA テクニカルマーケティング担当副社長 トニー・タマシ氏
GeForce GTX 200シリーズのダイ写真

GeForce GTX 200シリーズの内部構成。それぞれ整数演算器と浮動小数点演算器を持つ240個のプロセッサコア(Thread Processor)を備えている
Thread Processor Arrayの構造。8個のThread Processorから構成され、16Kバイトのローカルメモリを備えている

3つのThread Processor ArrayはThread Processing Clusterを構成し、10個のThread Processoing Clusterで1つのダイを構成している
GeForce GTX 280とGeForce 8800 GTXの比較

エンコードをGPUに任せて全体の性能をアップする

 NVIDIAは、GeForce GTX 200シリーズの発表にあわせてCUDA対応アプリケーションをいくつか紹介している。1つはAdobeのPhotoshop CS3を利用したデモで、デジタルカメラで撮影したRAW画像を展開してそれを加工する処理をGPUで行っている。通常、RAW画像を読みこんで加工する場合、CPUを利用して演算を行うとそれなりに時間がかかり、加工後の状況をライブビューで確認するのも難しい。しかし、GPUを利用して描画と加工を行うことで瞬時に読み込みを完了させ、ズームなどの加工作業を軽々と行うことができるようになる。

 さらに、米国のElemental Technologiesが作成した、GPUを利用したエンコードソフトウェアのデモも紹介された。「BadaBOOM Media Converter」と呼ばれるそのソフトウェアは、CUDAの導入によって利用可能となったGPUを利用してメディアファイルのトランスコードやエンコードを行う。NVIDIAが行ったベンチマークテストによれば、動作クロック1.8GHzのデュアルコアCPUに比べて、MPEG-2からMPEG-4 AVCへのトランスコードを18倍も高速に行うことができたという。

GPUを利用してPhotoshop CS3でRAWの写真を処理しているところ、非常に高速な処理ができていた

GPUを利用してエンコードを行っている。バックグランドではiTunesがCPUを利用してMPEG-4 AVCへのトランスコードを行っている
CPUに比べて18倍も高速に処理が可能であるとNVIDIAは説明している

Copyright © ITmedia, Inc. All Rights Reserved.

この記事が気に入ったら
ITmedia PC USER に「いいね!」しよう