これは壮大なコンピューティング革命の始まりに過ぎない:NVIDIA GPU Technology Conference(2/3 ページ)
NVIDIAは米国時間の9月30日から10月2日にかけて、同社の技術を紹介する技術イベントを開いた。そこで注目を集めたのが、新しいGPUアーキテクチャ「Fermi」だ。
革命的な並列コンピューティング
並列コンピューティングについてファン氏は、「NVIDIAは2006年にCUDAを発表したが、これはいい判断だった。現在では、ほぼ100%のPCベンダーがCUDA対応のPCを出荷している」と、市場には多数のCUDA対応PCが存在していると主張した。ファン氏は、多くの大学でCUDAを使ったプログラミングの授業があり、CUDAの開発環境を利用したアプリケーションが増えている現状を紹介し、「今後GPUによる並列コンピューティングは必須になる」(ファン氏)と、CUDAのようなGPUコンピューティングが一部の専門家のものではなく、一般のユーザーも利用する普通の存在になるという考えを述べた。
ファン氏は、CPUとGPUが共存するコンピューティング環境を示し、CPUとGPUの両方を効率よく利用することで、より高速にデータの処理を行えるとアピールした。「CPUはシリアル(順送り)な処理を、GPUはパラレル(並列)な処理を得意とする。CPUにパラレルなコードを走らせると遅くなるし、その逆にGPUにシリアルなコードを走らせると遅くなる、そこで、シリアルな処理とパラレルな処理が混在している場合には、それぞれCPUとGPUに分けて実行すると効率がよい」と、いわゆる「ヘテロジニアスコンピューティング」こそが正しい方向性だと述べた。その根拠として、CPUでは24日かかっていた並列処理が、GPUなら4時間で行える例が紹介された。
「例えば、サンフランシスコからニューヨークまで3分で行けるようになったらどうだろう? まさに革命的だと思うが、いま起きている並列コンピューティングの動きはまさにそういうものだ」とファン氏は、今後イメージ処理、エンコードといった多くの用途で並列コンピューティングが使われるようになれば世界が変わると主張した。
次世代アーキテクチャ「Fermi」は512個のプロセッサコアを持つ
GPUコンピューティングをサポートする新しいアーキテクチャとして、ファン氏は、「Fermi」(ファーミ、開発コード名)の概要を公開した。
Fermiは30億個のトランジスタを備え、プロセッサコアはGT200シリーズの倍以上となる512個を内蔵する。さらに、倍精度浮動小数点演算の性能が8倍に向上するほか、メモリはECCに対応する予定だ。ファン氏は「Fermiは、ゼロから作った完全に新しいアーキテクチャだ。最初からGPUコンピューティングを意識して作っている」と、FermiがGPUコンピューティングを普及させるための武器であることを強調した。Fermiの“第1号”シリコンを実際に動作させたデモでは、現状のTelsaが3~4fpsしか出ない処理で、Fermiは20fps近いフレームレートを発揮していた。
さらに、ファン氏はNexus(ネクサス)と呼ばれる開発ツールを提供することも明らかにした。Nexusはマイクロソフトの開発ツールであるVisual Studioの拡張ツールとして提供され、プログラマはこれを利用して、スレッドをどのようにCPUとGPUに割り振るのかをチューニングできるという。
なお、現時点で、Fermiはアーキテクチャの開発コード名であり、具体的な製品計画などについて、ファン氏は明らかにしなかった。しかし、「我々は、GeForceのようなトラディショナルなグラフィックスパイプラインを備えた製品も重要だと考えている。Fermiは、スケーラブルでモジュラー化されたデザインになっており、FermiをベースにしたGeForceも今後登場することになるだろう」と、将来FermiがGeForceのようなコンシューマ向けの製品にも採用される予定であることを示唆した。
Copyright © ITmedia, Inc. All Rights Reserved.