日本SGIが明かすスパコンの本音(1/2 ページ)

SGIがNASAに納入したProject ColumbiaシステムがスパコンTOP500の2位にランクインしたことは記憶に新しい。しかし、SGIはそれを喜ぶそぶりも見せない。それどころか、TOP500の意義すら疑っているようだ。

» 2005年02月01日 03時28分 公開
[西尾泰三,ITmedia]

 2004年にスーパーコンピュータ(スパコン)関係のニュースで一番のインパクトを残したのは、長らく1位の座を譲ることのなかった地球シミュレータがその座を明け渡したことだろう。2002年、海洋科学技術センター向けに5年の歳月と500億円をかけて構築されたこのスパコンの性能は、それまでこの分野の開発技術で世界一を自負していたアメリカに脅威を感じさせるに十分なもので、アメリカにとっては、すぐにその座を奪還することが至上命題となった。NECはひところ、454%の関税をかけられ、米国市場から実質的に締め出されていたというから、いかに脅威であったかがうかがえる。

 その命題は国家レベルで後押しされた。HPC関連のプロジェクトに多大な投資が行われ、さまざまなスパコン開発計画が前倒しで進められた。例えば、ホワイトハウス科学技術政策局は、国家科学技術会議技術委員会の支援により、ハイエンド計算の連邦機関専門家から構成されたタスクフォース「ハイエンド計算活性化タスクフォース」(HECRTF)を設置するなどし、省庁横断型にスパコンの開発を支援してきた。

 このHECRTFにおける「Leadership-class」として構築されたのが、Space Exploation Simulatorとして米航空宇宙局(NASA)に納入されたProject Columbiaシステムである。1万240個のItanium 2を搭載したSGI Altixクラスタシステムは、51870GFLOPS(約52テラFLOPS)の性能を叩きだし、NASAが行うさまざまな研究開発の強化――例えば従来は2日前から可能だったハリケーンの進路予測を5日前から行えるようになった――にも貢献している。もし、こういった研究開発の一端を覗いてみたければ、NASAのサイトにあるこちらの動画(注:169Mバイト)を見てみるのもよいだろう。

Project Columbiaシステム Project Columbiaシステム(NASA - Goddard Space Flight Center Scientific Visualization Studio.)

「TOP500にそんなに意味があるとは思えない」

 約52テラFLOPSの処理性能を持ち、今回のTOP500の第2位にランクインしたProject Columbiaシステムだが、日本SGIのCTO(最高技術責任者)である戸室隆彦氏は「今後はBlueGeneが上位を占めるんじゃないでしょうか。スケールが違うだけのものをいくらでも作れるのだから」と、ランクインしたことにまったく興味がない様子だ。

「TOP500の上位をIBMが独占することになるでしょうね。SGIはそこに意義をあまり感じていない」と忙しい間を縫って取材に応じてくれた戸室氏

 TOP500 SUPERCOMPUTER SITESで用いられるLINPACKには「Rmax」(実効性能値)と「Rpeak」(理論ピーク値)という2つの値がある。先のColumbiaシステムであれば、Rmaxが51870GFlops、Rpeakが60960GFlopsとなる。また、Rmax/Rpeakが並列化効率と呼ばれるもので、この値が高いほど効率がよいシステムといえる。Columbiaシステムの並列化効率は0.852となり、Blue Gene/Lの0.771を上回る*。なお、日本SGIが日本原子力研究所(JAERI)に納入し(関連記事参照)、3月から稼働予定の「SGI Altix3000シリーズ」を中心としたシステムでは、この値が0.916となっている。「512CPU構成なら0.936も実現している」(戸室氏)

 また、LINPACKの測定結果が、必ずしも実稼働の性能を反映するものではないことはこれまでにも何度も指摘されている(関連記事参照)

 LINPACKは、浮動小数点演算はテストできるが、整数演算はテストできない。加えて、メモリやストレージなどとのデータ転送スピードは、このテストでは計測不可能だ。ColumbiaではInfiniBandを使用して高い帯域幅と短いレイテンシを実現しているが、TOP500だけを見ていると、このあたりが見えづらく、本当に本来の用途に即したパフォーマンスを計測できているか分からないという事態になる。実際に使われるアプリケーション、例えば地球シミュレータであれば、流体コード系シミュレーションが高速に動作するかどうかが問題であり、戸室氏の言葉は、科学技術計算における効率差を考える必要性を感じさせる。

 「SGIが志向しているのはLINPACKで出力されるピーク性能ではない。どれだけ実用性のあるアプリケーションがあり、それが高速で動作し、かつその性能を長時間発揮できるかが重要」と戸室氏は話しているが、それに呼応するように、NASAのサイトでも、Columbiaのステータスが公開されている。スパコンというと頻繁に再起動を繰り返すイメージを持っていたが、uptimeなどを見ると20日近く稼働し続けているマシンもあるようだ。

ますます深刻になる3つの問題

 スパコンはその処理能力が大きくなるにつれ、ある問題に直面している。それは、消費電力と発熱の問題、あえてもう1つ挙げるなら設置スペースの問題である。このうち、発熱に関して、Columbiaでは空調だけでは不十分と判断、筐体背面に水冷ユニットを搭載している。

 スパコンはとにかく電気と場所を食う。地球シミュレータは50×64メートル(約3000平方メートル)の部屋に置かれ、その消費電力は6000キロワットにも及ぶ。Columbiaはさらにその上をゆく。

 これに対して、8ラックのBlueGeneは大きさわずか30平方メートル、消費電力は216キロワットと言われている。年間の消費電力がスパコン自体の価格の5分の1近くを占めるとも言われる中、この消費電力の少なさは驚異的である。

 「確かに省電力化と冷却方法はどのユーザーも気にすることろで、SGIにとっても最重要項目の1つ。この部分の改善に向けて全力で取り組んでいる」(戸室氏)

Blue Gene/Lの0.771という並列化効率について

今回1位のBlueGene/L beta-Systemは、同15位のBlueGene/L DD2 Prototypeのちょうど8倍のスケール(CPU数、Rpeak)だが、並列化効率はBlueGene/L DD2 Prototypeより高い値となっている。一般的にプロセッサの数が増えると並列化効率は落ちるはずだが、プロセッサの数を増やしながら並列化効率も高めている点は評価されるべきである。


       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ