合言葉は「みんスパ」――東工大のTSUBAMEが飛翔

東京工業大学は、LINPACKベンチマークで国内最速となる85TFLOPSのスーパーコンピューティンググリッドシステム「TSUBAME」の披露式を開催した。スパコンにおける次のブレークスルーは「人材」であるという。

» 2006年07月03日 19時28分 公開
[西尾泰三,ITmedia]

 東京工業大学は7月3日、国内最速となる85TFLOPSのスーパーコンピューティンググリッドシステム「TSUBAME」(Tokyo-tech Supercomputer and UBiquitously Accessible Mass-storage Environment)の披露式を開催した。同大学で4代目のスパコンに当たるTSUBAMEは、同大学が国立大学法人化して最初のスーパーコンピュータ調達事例というだけでなく、先日発表されたTop500のランキングで7位、アジアでは最速という記録を携えてのお披露目となった。

東工大が進化し続ける流れの中で、スパコンも4代目となった。TSUBAMEが国内だけでなく国際的にさらに進化を果たす一助になる」と学長の相澤益男氏

 同大学の学術国際情報センター内に構築されたTSUBAMEは、NECがシステム構築を担当、サン・マイクロシステムズ製のデュアルコアOpteron(モデル880/885)を搭載した「Sun Fire X460」を計算ノードとして655ノード、プロセッサコアは実に1万480個にも達する。東工大では過去にベクトル計算機としてNECのSX-5、超並列機としてSGIのOrigin 2000、スカラ計算機として旧コンパックのGS320などを所有していたが、今回、汎用のx86プロセッサを利用したPCグリッドを構築し、さらにそのプロセッサコア数も世界最多となるなど、大きなイノベーションを加えている。また、演算性能だけでなく、メモリ容量も21.4Tバイト、ディスク容量も1.1P(ペタ)バイトを搭載している。

 これによりPCグリッド部では50TFLOPSの理論演算性能を持つが、さらに、SIMDアクセラレータを組み合わせることで、35TFLOPSの上乗せを可能としており、併せて85TFLOPS近くの理論演算性能を実現した。この計算ノードとストレージ(Sun Thumper)をInfiniBandで相互接続する形で350平方メートルほどの設置面積内にシステムが構築されている。OSはSuSE Linux Enterprise Server 9。

TSUBAMEの構築に寄与しているベンダー。特にSunについては、ここ数年TOP500の上位に名前が挙がることがなかったため、面目躍如といったところか
TSUBAMEが置かれているセンターには76個のラックのほか、32の空調機ユニット(重さは12.2トン)などが備わっている。さらに屋上には巨大な室外機が存在している。これらを3週間で構築したという
サーバの裏側。意外とすっきりした配線。しかし温風はものすごい

 また、安全対策については、サーバのファンと電源はそれぞれ4重化されているという。また、システム全体の最大消費電力は1.2MW程度で、通常時が900kWであるという。同システムでは「安定化電源装置」(CVCF)という安全設備を備えているが、こちらで供給できるのは350kWであるため、ストレージ系、制御/認証系を対象としたトラブル対策を採っている。とはいえ、ハードウェアをのぞく運用コストは年間で1.2億円程度であるとし、従来からすると運用コストは下がったとしている。

 パフォーマンスについては、今回のTop500ではアクセラレータを動作させていなかったこともあり、現時点では理論演算性能(RPEAK)で約50TFLOPSの性能となっている。ただし、Top500で用いられるLINPACKベンチマークは、あくまで参考であり、そのまま実アプリの性能となるわけではない。実効的な並列性について学術国際情報センターでコンピュータ基盤を担当する松岡聡教授は、「並列化効率100に近いものもあれば、それなりに低いものもある」とした上で、すべて情報としてWebで公開していると述べた。

 昨年の55システムから今年は81システムがランクインするなど、このところTop500でも目立つようになったAMDのOpteronを搭載したシステムだが、Opteron採用の背景について、松岡氏は、「さまざまな検討の中で、NECからの提案と、AMDからの提案のちょうど中間に位置するものがいいのではと考えた。そのため、それをこちらから提案した結果」であると述べた。

 今後、SIMDアクセラレータによってまずは100TFLOPSに迫る性能を、その後2008年にはクアッドコアへのアップグレードにより、さらに処理性能を向上させる予定だが、「TSUBAMEの寿命は4年」と松岡氏はいう。同システムは4年間の契約となっていることもあるが、すでに次の目標として1PFLOPSの達成を目指しているからだ。

 そして、そのキーとなるのは、HPCソフトウェアであり、さらに突き詰めれば教育であると松岡氏は話す。

 「いきなり1PFLOPSもの性能を持つシステムをポンと渡されても、それだけのシステムを有効活用するには並大抵のソフトウェア技術ではかなわないだろう。それゆえ、人材の教育が必要」

 東工大が同システムを全学的なITインフラとして用いたり、「みんなのスパコン」として学生に解放しているのも、シミュレーションの普遍化によるブレイクスルーへの期待があるという。文部科学省が計画している10PFLOPSの世界最速コンピュータ「汎用京速計算機」の実現は、ハードウェアのイノベーションではなく、それを使うユーザーからのイノベーションによってのみ実現されるのかもしれない。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ