米NVIDIAのCEOが絶賛する“日本のCUDA”「Echelon」はFermiの100倍(2/2 ページ)

» 2010年12月02日 00時00分 公開
[長浜和也,ITmedia]
前のページへ 1|2       

CUDA環境の導入で電力比性能問題を解決したTSUBAME 2.0

 ファン氏は、2010年10月28日に発表されたスーパーコンピュータランキング「TOP500」で第1位となった中国の「Tianhe-1A」を取り上げ、このマシンが7168基のTesla M2050を搭載することで短期間でシステムの構築が可能となり、そのGPUコンピューティング性能でTOP500のトップとなっただけでなく、同じ性能をCPUだけでは実現不可能だと語った。

 同時に、ファン氏はGPUコンピューティングの性能だけでなく、電力効率の高さも訴求している。TOP500のベスト5のうち、「Tianhe-1A」「Nebullae」「TSUBAME」の3台がNVIDIAのGPUを採用しているが、その消費電力は、第2位の「Jaguar」、第5位の「Hopper II」を下回ることを示して、「重要なのはエネルギー効率」であると強調する。

 東京工業大学のTSUBAMEは、ワットあたりの性能という指標でTOP500のトップになっているが、基調講演では同大学の松岡聡氏が登場して、TSUBAME 1.0から最新のTSUBAME 2.0までの開発を振り返った。2006年に登場したTSUBAME 1.0は、主要な企業や同大学など2000名のユーザーに利用されて「みんなのスパコン」と評価されるなど一定の成功を収めたが、その一方で、運用するためのエネルギーコストの高さが問題になった。電気代はピーク時で年間1億円にも達したという。

 2007年のTSUBAME 1.1を経て2008年に登場したTSUBAME 1.2でTesla S1070を170基搭載し、TSUBAME 2.0では2.4P(ペタ)FlopsというTSUBAME 1.0の30倍という性能向上を実現しながら、消費電力は1億5000万円に収まっていると、松岡氏は説明している。

スーパーコンピュータTOP500のトップ5の性能と「ワットあたりの性能」(赤いグラフ)で比較する。NVIDIAのGPUを導入したシステム(緑のグラフ)では、CPUだけで構成されるシステム(青いグラフ)よりワットあたりの性能で高い値を示す(写真=左)。ワットあたりの性能で比較するとGPUコンピューティングを導入したシステムが上位に並ぶ(写真=右)

“ネット越しのGPUコンピューティング”はAmazon EC2のインスタンスタイプで実用段階に

 続いて、ファン氏はCUDA環境普及のために、ソフトウェア開発者を積極的に支援していることをアピールした。NVIDIAは、多くの開発者がCUDAを体験できるようにほとんどのNVIDIA製GPUでCUDAに対応する一方、開発者を支援するテクニカルイベントとしてGTC 2010を行っている。

 GTC 2010では、各カテゴリーの有力アプリケーションがCUDAに対応したことが紹介されたが、今回の基調講演では日本で開発されたCUDA環境対応アプリケーションが紹介された。

 その1つとなるリンクスの「HALCON」最新版が同社Machine Vision Solutionマネージャーの島輝行氏から紹介された。HALCONは画像解析技術を利用して回路パターンの不具合や液晶パネルのカラー欠陥などを検出するアプリケーションで、第10世代液晶パネルの基板検査では画素幅5ミクロン、5120×3840配列の画像情報を短時間で処理しなければならず、CUDA対応によって演算性能が23倍に向上したことで可能になったとしている。

 また、先日Amazon Elastic Compute Cloud(Amazon EC2)でインスタンスタイプの運用が発表されるなど、商用サービスも始まったネットワークを経由するCUDA環境の利用や、「CUDA-x86」によるx86系CPUを搭載したシステムにおけるCUDA環境への対応など、CUDA対応GPUを持たない既存のシステムでもCUDAに対応するソフトウェア的な解決策が示された。

HALCONは、スキャンした回路パターン画像を画像処理することで欠陥部分を検出するアプリケーションだ。GPUコンピューティングの高い演算能力によって第10世代の液晶パネルのような膨大な画像処理を必要とする検査もできるようになった(写真=左)。ネットワーク経由のGPUコンピューティングもAmason EC2のサービス提供で本格化する(写真=右)

 ファン氏は、GTC 2010でも紹介した、NVIDIAのGPUアーキテクチャロードマップを示し、2011年に登場する予定の「Kepler」では性能をFermiの4倍に、2013年に登場する予定の「Maxwell」で10倍にするとした上で、「これでも始まりに過ぎない」と述べ、11月のSC10において米NVIDIAのビル・ダリー氏が2018年に登場すると紹介した「Echelon」では、Fermiの100倍の性能を実現するとアピールした。

9月のGTC 2010でも示されたNVIDIAの次世代GPUアーキテクチャのロードマップ(写真=左)。そして、2018年に登場するEchelonでFermiの100倍という性能を実現するという(写真=右)

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.

最新トピックスPR

過去記事カレンダー