ゲームを超えるミッションとは──NVIDIAが「GT200」にこめたGPUの可能性(2/3 ページ)

» 2008年06月19日 11時30分 公開
[笠原一輝,ITmedia]

GeForce 8800 GTXの倍近い演算性能を実現するGeForce GTX 280

 NVIDIAのテクニカルマーケティング担当副社長 トニー・タマシ氏によれば、GeForce GTX 200シリーズは、こうしたCUDAを利用して作成されたアプリケーションを利用するプラットフォームとしても意識した設計になっているという。「GeForce GTX 200シリーズはゲーム用途の利用だけを意識した従来のGPUとは異なる設計思想を持っている。具体的にはコンピューティングプラットフォームとしての側面を意識した設計になっている」とタマシ氏は述べ、それを実現するためにGeForce GTX 200シリーズのマイクロアーキテクチャの設計は行われていると説明した。

 GeForce GTX 200は「Thread Processor」と呼ばれるプロセッサコアを240個内蔵する。それぞれのThread Processorは整数演算器と倍精度(64ビット)の浮動小数点演算器を備え、8個のThread Processorで「Thread Processor Array」という単位を構成する。それぞれのThread Processor Arrayは16Kバイトのローカルメモリを備えている。さらに、3つのThread Processor Array(=24個のThread Procesor)で「Thread Processing Cluster」という単位が構成され、それぞれが1次キャッシュメモリを備えている。

 こうした構造をとることで、GeForce GTX 200シリーズでは3万を超えるスレッドをGPU全体で処理できるようになっている(前世代のGeForce 8/GeForce 9シリーズでは1万前後)。こうした演算器の増加や効率の向上などにより、GeForce 8800 GTXが533G FLOPS(FLOPSとは1秒間に実行できる浮動小数点演算の数)だったのに対して、GeForce GTX 200シリーズの上位モデルとなるGeForce GTX 280では933G FLOPSと倍近い性能を実現している。

 もちろん、GeForce GTX 200シリーズではグラフィックス処理における性能向上も図られている。NVIDIAによると、倍精度の浮動小数点演算をサポートしたため、テクスチャ処理の性能が向上しているほか、ジオメトリシェーダの処理能力が向上しているという。このほかにもレジスタファイルが倍になり、シェーダプログラムを実行する効率が向上するなどの特徴を備えている。

NVIDIA テクニカルマーケティング担当副社長 トニー・タマシ氏
GeForce GTX 200シリーズのダイ写真

GeForce GTX 200シリーズの内部構成。それぞれ整数演算器と浮動小数点演算器を持つ240個のプロセッサコア(Thread Processor)を備えている
Thread Processor Arrayの構造。8個のThread Processorから構成され、16Kバイトのローカルメモリを備えている

3つのThread Processor ArrayはThread Processing Clusterを構成し、10個のThread Processoing Clusterで1つのダイを構成している
GeForce GTX 280とGeForce 8800 GTXの比較

エンコードをGPUに任せて全体の性能をアップする

 NVIDIAは、GeForce GTX 200シリーズの発表にあわせてCUDA対応アプリケーションをいくつか紹介している。1つはAdobeのPhotoshop CS3を利用したデモで、デジタルカメラで撮影したRAW画像を展開してそれを加工する処理をGPUで行っている。通常、RAW画像を読みこんで加工する場合、CPUを利用して演算を行うとそれなりに時間がかかり、加工後の状況をライブビューで確認するのも難しい。しかし、GPUを利用して描画と加工を行うことで瞬時に読み込みを完了させ、ズームなどの加工作業を軽々と行うことができるようになる。

 さらに、米国のElemental Technologiesが作成した、GPUを利用したエンコードソフトウェアのデモも紹介された。「BadaBOOM Media Converter」と呼ばれるそのソフトウェアは、CUDAの導入によって利用可能となったGPUを利用してメディアファイルのトランスコードやエンコードを行う。NVIDIAが行ったベンチマークテストによれば、動作クロック1.8GHzのデュアルコアCPUに比べて、MPEG-2からMPEG-4 AVCへのトランスコードを18倍も高速に行うことができたという。

GPUを利用してPhotoshop CS3でRAWの写真を処理しているところ、非常に高速な処理ができていた

GPUを利用してエンコードを行っている。バックグランドではiTunesがCPUを利用してMPEG-4 AVCへのトランスコードを行っている
CPUに比べて18倍も高速に処理が可能であるとNVIDIAは説明している

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2024年04月18日 更新
  1. ついに8K対応した「Insta360 X4」の画質をX3と1インチ360度版で比較 今買うべき全天球カメラだと確信した (2024年04月16日)
  2. バッファロー製Wi-Fiルーターに脆弱性 対象機種は今すぐファームウェア更新を (2024年04月17日)
  3. 「JBL GO 4」でBluetoothスピーカーデビュー! 累計出荷台数5700万台を突破した人気製品の最新モデルを試す (2024年04月17日)
  4. AI対応でCore Ultraよりも高いパフォーマンスをアピール! 企業PC向け「Ryzen PRO 8000シリーズ」登場 (2024年04月16日)
  5. Synology「BeeStation」はNASより便利な一面も 家族の“秘密”も守れるストレージ、共有リンクや写真管理もある (2024年04月16日)
  6. SwitchBotのミニプラグに不具合 「断続的にオン/オフを繰り返す、異音」などで該当製品の交換を呼びかけ (2024年04月17日)
  7. 「ASUS ZenScreen MB16QHG」は従来モデルの弱点を解消した高評価の16型モバイルディスプレイだ (2024年04月16日)
  8. あなたのPCのWindows 10/11の「ライセンス」はどうなっている? 調べる方法をチェック! (2023年10月20日)
  9. 無線LANルーター「Aterm」シリーズの一部に複数の脆弱性 設定変更や買い替えをアナウンス (2024年04月11日)
  10. NVIDIA、Ampereアーキテクチャを採用したシングルスロット設計のデスクトップ向けGPU「NVIDIA RTX A400/A1000」を発表 (2024年04月17日)
最新トピックスPR

過去記事カレンダー