NVIDIAのテクニカルマーケティング担当副社長トニー・タマシ氏によれば、GeForce GTX 200シリーズは、こうしたCUDAを利用して作成されたアプリケーションを利用するプラットフォームとしても意識した設計になっているという。「GeForce GTX 200シリーズはゲーム用途の利用だけを意識した従来のGPUとは異なる設計思想を持っている。具体的にはコンピューティングプラットフォームとしての側面を意識した設計になっている」とタマシ氏は述べ、それを実現するためにGeForce GTX 200シリーズのマイクロアーキテクチャの設計は行われていると説明した。

　GeForce GTX 200は「Thread Processor」と呼ばれるプロセッサコアを240個内蔵する。それぞれのThread Processorは整数演算器と倍精度（64ビット）の浮動小数点演算器を備え、8個のThread Processorで「Thread Processor Array」という単位を構成する。それぞれのThread Processor Arrayは16Kバイトのローカルメモリを備えている。さらに、3つのThread Processor Array（＝24個のThread Procesor）で「Thread Processing Cluster」という単位が構成され、それぞれが1次キャッシュメモリを備えている。

　こうした構造をとることで、GeForce GTX 200シリーズでは3万を超えるスレッドをGPU全体で処理できるようになっている（前世代のGeForce 8／GeForce 9シリーズでは1万前後）。こうした演算器の増加や効率の向上などにより、GeForce 8800 GTXが533G FLOPS（FLOPSとは1秒間に実行できる浮動小数点演算の数）だったのに対して、GeForce GTX 200シリーズの上位モデルとなるGeForce GTX 280では933G FLOPSと倍近い性能を実現している。

　もちろん、GeForce GTX 200シリーズではグラフィックス処理における性能向上も図られている。NVIDIAによると、倍精度の浮動小数点演算をサポートしたため、テクスチャ処理の性能が向上しているほか、ジオメトリシェーダの処理能力が向上しているという。このほかにもレジスタファイルが倍になり、シェーダプログラムを実行する効率が向上するなどの特徴を備えている。

NVIDIA テクニカルマーケティング担当副社長トニー・タマシ氏

GeForce GTX 200シリーズのダイ写真

GeForce GTX 200シリーズの内部構成。それぞれ整数演算器と浮動小数点演算器を持つ240個のプロセッサコア（Thread Processor）を備えている

Thread Processor Arrayの構造。8個のThread Processorから構成され、16Kバイトのローカルメモリを備えている

3つのThread Processor ArrayはThread Processing Clusterを構成し、10個のThread Processoing Clusterで1つのダイを構成している

GeForce GTX 280とGeForce 8800 GTXの比較

エンコードをGPUに任せて全体の性能をアップする

　NVIDIAは、GeForce GTX 200シリーズの発表にあわせてCUDA対応アプリケーションをいくつか紹介している。1つはAdobeのPhotoshop CS3を利用したデモで、デジタルカメラで撮影したRAW画像を展開してそれを加工する処理をGPUで行っている。通常、RAW画像を読みこんで加工する場合、CPUを利用して演算を行うとそれなりに時間がかかり、加工後の状況をライブビューで確認するのも難しい。しかし、GPUを利用して描画と加工を行うことで瞬時に読み込みを完了させ、ズームなどの加工作業を軽々と行うことができるようになる。

　さらに、米国のElemental Technologiesが作成した、GPUを利用したエンコードソフトウェアのデモも紹介された。「BadaBOOM Media Converter」と呼ばれるそのソフトウェアは、CUDAの導入によって利用可能となったGPUを利用してメディアファイルのトランスコードやエンコードを行う。NVIDIAが行ったベンチマークテストによれば、動作クロック1.8GHzのデュアルコアCPUに比べて、MPEG-2からMPEG-4 AVCへのトランスコードを18倍も高速に行うことができたという。

GPUを利用してPhotoshop CS3でRAWの写真を処理しているところ、非常に高速な処理ができていた

GPUを利用してエンコードを行っている。バックグランドではiTunesがCPUを利用してMPEG-4 AVCへのトランスコードを行っている

CPUに比べて18倍も高速に処理が可能であるとNVIDIAは説明している

アクセストップ10

2026年01月05日更新

ランキングトップ30

最新トピックスPR

過去記事カレンダー

2026年

1月

2025年

2024年

2023年

2022年

2021年

2020年

2019年

2018年

2017年

2016年

2015年

2014年

2013年

2012年

2011年

2010年

2009年

2008年

2007年

2006年

2005年

2004年

2003年

Feed Back

利用規約

ITmediaはアイティメディア株式会社の登録商標です。

ゲームを超えるミッションとは──NVIDIAが「GT200」にこめたGPUの可能性（2/3 ページ）

GeForce 8800 GTXの倍近い演算性能を実現するGeForce GTX 280