「このままではエクサスケール実現にフーバーダムが必要」──NVIDIAが語る“GPUの必然性”GTC Asia 2011(3/4 ページ)

» 2011年12月16日 17時51分 公開
[鈴木淳也(Junya Suzuki),ITmedia]

消費電力が阻むエクサスケールへの道

 近年のスーパーコンピュータは、GPUの存在がパフォーマンスの成長カーブに大きく寄与している。例えば、2ペタFLOPSを実現する「Tsubame 2.0」の場合、そのパフォーマンスの9割以上はGPUの処理能力に因るもので、GPUが処理能力の向上に寄与したといっていい。もちろん、現在TOP 500ランキングトップにある「京」のように、GPU技術を用いないスーパーコンピュータも多数存在するが、CPUのみを利用したスーパーコンピュータでは、さまざまな制限から、性能の成長が止まる可能性が高いとファン氏はいう。

 現在、スーパーコンピュータの世界では過去10年間の目標だった「ペタFLOPS」を突破し、「京」は2011年11月に10ペタFLOPSの壁を突破している。「1エクサFLOPS」というエクサスケールまで「あと100倍」のところまでやってきた。だが、ファン氏によれば、こうしたエクサスケール実現には、多くの困難があるという。従来の手法のままでは「パワー」(電力)が壁となって立ちふさがることになると主張する。身近な例でいえば、かつて、インテルは発熱問題でPentiumの高クロック化に断念し、最近では、増え続けるバッテリー消費量がモバイルデバイスの高速化を阻んでいる。NVIDIAのTegra 3や、ARMのbig.LITTLEコンピューティングなどで導入する技術も、こうした消費電力問題を解決するための“トリック”といえる。

Gordon Bell賞を受賞した長崎大学のGPU搭載スーパーコンピュータ。750個の並列接続されたGPUで158TFLOPSを達成しており、トータル演算性能は地球シミュレータを上回る。このスーパーコンピュータの冷却は前後から扇風機を当てるシンプルなものだ(写真=左)。GPUスーパーコンピュータでTOP 500ランキングのトップを獲得した中国の国防科学技術大学(National University of Defense Technology:NUDT)の「天河一号」(てんがいちごう、Tianhe-1)。現在の天河は、建造当時のAMDベースからGPUをNVIDIAに変更しており、「Tianhe-1A」と名前も変えている(写真=右)

CUDAはHPC向けGPGPUとしてほぼ100パーセント近いシェアがある(写真=左)。天河一号の成果の1つに、世界で初めてH1N1ウイルスの全体シミュレーションを実現したことが挙げられる(写真=中央)。GPUスーパーコンピュータでランキング5位の東京工業大学の「Tsubame 2.0」は、ピーク性能が2TFLOPSに達する。Tsubame 2.0で行った細胞の樹状突起の構造解析シミュレーションが紹介された(写真=右)

中国のゲノム解析研究で著名なBGI(Beijing Genomics Institute)は、GPUスーパーコンピュータの利用で従来計算に4日かかっていたタスクを6時間で完了するようになると期待する(写真=左)。さらに、従来のHPCと比較してアプリケーション次第で期待できる高速化効果を説明した(写真=中央)。CPU+GPUのヘテロジニアス環境で並列プログラミングを行う標準モデルが「OpenACC」だ。クレイ、CAPS、NVIDIA、PGI(Portland Group)の4社によって11月中旬に発表された(写真=右)

 CPUに限らず、コンピューティングの世界はすべて消費電力の問題が成長の壁となっているとファン氏はいう。米オークリッジ国立研究所(ORNL)に導入されているクレイの「Jaguar」は、20万基のCPUコアを持ち、7メガワットの消費電力で2ペタFLOPSのトータルパフォーマンスを実現している。もし、エクサスケールに拡張するのであれば、この500倍のシステムが必要というわけだ。

 これを分かりやすく例えると、システムの設置スペースだけで北京のオリンピック公園にある「鳥の巣」の面積が必要であり、電力については、米ネバダ州にあるフーバーダムの2ギガワットを上回る発電設備が必要になる。それだけの計算をする設備であれば、鳥の巣程度の施設を郊外に建てれば問題ないだろう。だが、建設当時世界最大級だったフーバーダムと同等の発電設備をこうした施設の横に設置するのは現実的ではない。これだけでも、消費電力がいかに深刻な問題にあることが分かる。

エクサスケール・コンピューティングの実現は厳しい。その最大の理由は電力にあるという。米オークリッジ国立研究所(ORNL)にあるクレイ製の「Jaguar」は、20万基のCPUコアを内蔵して7メガワットの電力を消費し、2ペタFLOPSのコンピューティングパワーを持つ(写真=左)。そのままエクサスケールに拡張すると、中国の国家スタジアム「鳥の巣」に相当するスペースに(写真=中央)、米国ネバダ州ラスベガスにあるフーバーダムが生み出す2ギガワット以上の発電容量を持つ設備を設置する必要がある(写真=右)。マシンの設置スペースはともかく、電力設備的には実現不可能だ

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2024年04月25日 更新
最新トピックスPR

過去記事カレンダー