GTC 2012で注目したいもう1つの話題は、Keplerアーキテクチャを採用したフラグシップGPU「GK110」の概要だ。ファン氏は、GK110が、28ナノメートルプロセスルールで71億トランジスタを集積し、384ビットメモリインタフェースを採用することを明らかにするとともに、このGPUを採用したGPUコンピューティング向け製品「Tesla K20」を2012年の末に市場へ投入する意向を示した。
“Kepler II”という呼び名でも知られるGK110は、GPUコンピューティングのパフォーマンスを大幅に引き上げるべく、倍精度浮動小数点演算性能を高め、Fermiアーキテクチャを採用する「Tesla M2090」に比べて、最大3倍の演算性能を実現するとNVIDIAは主張している。
また、このGK110では「Hyper-Q」「Dynamic Parallelism」という2つの機能を追加する。Hyper-Qは、CPUコアがGPUに対して最大32のMPI(Message Passing Interface)処理を同時実行できる機能だ。従来のFermi世代では、MPI処理は1つずつしか行なえなかったため、GPUリソースを有効に使えなかったばかりか、複数のMPI処理が生じた場合は、CPUがGPU側の処理を待つムダな時間が生じることもあった。しかし、GK110では、Hyper-QによってMPIタスクを並列に処理できるため、GPUをより効率的に利用できるばかりか、CPU待ち時間の削減にも役立つ。
もう1つの強化ポイントとなるDynamic Parallelismは、CPUを介すことなくGPU内部で新しいスレッドを動的に生成する機能で、CPUとGPUのデータ転送に要するレイテンシを大幅に低減するとともに、CPUのリソースをより有効に活用できるようにする。
Copyright © ITmedia, Inc. All Rights Reserved.