Intel、AMDなどとGPUコンピューティングの覇権を賭けて戦うNVIDIA。自社でCPUの設計も手がけるのではないかとうわさされるNVIDIAだが、新たにチーフサイエンティストに就任したビル・ダリー氏に話を聞いた。
2009年1月、NVIDIAでチーフサイエンティストを務めていたデイビッド・カーク氏(現在はNVIDIAフェローに就任)の後を引き継ぐ形でNVIDIAに参画したビル・ダリー氏。スタンフォード大学のコンピュータ工学部部長も務めたダリー氏は、並列コンピューティング研究の第一人者として知られる。
GPUベンダーとしてのNVIDIAをもり立てたのが“Geforceの父”カーク氏だとすれば、ダリー氏はGPUコンピューティングベンダーとしてのNVIDIAを担う存在になっていくことは想像に難くない。Tesla製品ラインやCUDAに見られるよう、GPUの並列アーキテクチャを推進してきたNVIDIAだが、競合するIntelはLarrabeeで、AMDはFusionプロセッサでこの業界の覇権を握ろうとしている。
CPUからの発展を考えるIntelやAMDとは異なり、自社でCPUを持たないNVIDIAがGPU、あるいはGPUコンピューティングをどのようにとらえ、また、並列コンピューティングをどのようなプラットフォームで構成していくつもりなのかについては業界から多くの注目が集まっている。ビル・ダリー氏はチーフサイエンティスト兼NVIDIA Research副社長としてどういった方向を見据えているのか。同氏に聞いた。
―― NVIDIAのチーフサイエンティストとして参画した動機はどこにあるか。
ダリー コンピューティング技術は今、その方向性を決めていく上で大きな岐路に立っていると考えている。レイテンシを最適化したCPUとスループットを最適化したGPU、後者は今非常にエキサイティングなポジションにある。わたしが大学で取り組んでいた並列コンピューティングが現実の市場に落ちてきていることも魅力を感じた要因だ。
―― IntelのLarrabee、AMDはFusion化とそれぞれ並列コンピューティングへの布石を打っているが、これらをどのように見ているのか。
ダリー まだ世に登場していないLarrabeeについて詳細に言及できないが、これまで公開されている情報から話すと、ペンティアムの設計を引き継ぐ形で並列化したものだと考えている。Larrabeeの固定機能ユニットであるテクスチャフィルタリングユニットは特徴的だが、演算のサイクルなどを考えると、グラフィック性能を多少犠牲にしている部分があると見ている。また、GPUに比べるとスレッドの数も少なく、レイテンシを隠ぺいするのが難しい設計だと思う。
AMDについては、ここまでのところを振り返ってみると、現時点では優れたスコアを発揮している。しかし、わたしたちは、現在ではなくあくまで将来のGPUコンピューティングのようなアプリケーションに対応するための特徴を付加していくことに重きを置いている。グラフィックを実現しながらGPUコンピューティングのために追加機能を搭載するという姿勢なのだ。
―― 並列コンピューティングを考えるに当たって、最大の問題はCPUとGPUをいかに効率的に結びつけるかにある。単純にダイ上にCPUとGPUを配置するだけなら、命令レベルの統合は必要とされないし、ダイは別でも命令セット的には統合された形態もあり得る。NVIDIAはどちらを志向するのか。
ダリー レイテンシに対して最適化しているCPUのパフォーマンスはすでに頭打ちの状態にあるといってよいだろう。一方GPUは今後も年間50%を超えるパフォーマンスの向上が期待される。現在、ハイエンドのGPUで240個のシェーダプロセッサを備えているが、2015年にはこれが5000個程度の規模で搭載される可能性が高い。さらに、GPUの汎用性がさらに高まり、アプリケーションの負荷がGPUの方にシフトしていくことは間違いない。
ただ、CPUとGPUを1つのダイ上にまとめるのかどうかという議論はあまり意味がない。経済性こそ決定要因となると見ている。ハイエンドのシステムであれば別々のチップの方が経済的といえるし、NVIDIA Tegraのようなローエンドなものであれば、1つのダイに集積する方が得策であるといえる。個人的には、CPUとGPUが別であることは柔軟性が出ると考えている。どう最適化を図るかという点で選択肢が生まれるからだ。
結局のところ、これからもCPUとGPUが異種混在するヘテロな環境が続くと考える。並列化を必要とせず、シングルスレッドでのパフォーマンスを求める部分は残るだろう。CPUが消えるわけではない。レイテンシが性能のボトルネックになる処理はCPUが、並列処理やスループットが性能のボトルネックになる処理はGPUで処理されるようになるだろう。
―― x86命令セットとは異なる命令セットで並列データ実行に最適化するという姿勢で臨むのか。その場合、CPUとGPUの連携はどのようにあるべきか?
ダリー 先ほどアプリケーションの負荷がGPUの方にシフトしてくると話したが、現在のコードをそのままGPUに載せ替えるというわけではない。CUDAを用いてx86命令セットをエミュレートするような手法を考えているわけでもない。
―― ARMベースのNVIDIA Tegraはどのように位置づけているのか?
ダリー レイテンシに最適化したCPUという観点で考えると、x86よりARMの方が効率がよいアーキテクチャであると考えている。x86環境が必須ではなければ、有効な選択肢だろう。
―― NVIDIAとしてCPUの設計や製造に興味は?
ダリー そうした発表は特にしていないし、そのプランもない。
知らないだけで恥ずかしい。IT業界の最新動向は「Trend Insight」でチェック。
Copyright © ITmedia, Inc. All Rights Reserved.