ITmedia NEWS >

“自作”スーパーコンピュータ製作秘話

» 2004年04月13日 14時24分 公開
[IDG Japan]
IDG

 昨今、スーパーコンピュータの構築は、思ったよりずっと簡単になっている。私でさえ先日、スーパーコンピュータの構築を手伝いにいったほどだ。

 膨大な処理能力を擁するスーパーコンピュータの構築を呼び掛けたのは、サンフランシスコ大学(USF)の院生グループだった。彼らの目的は私のようなコンピュータマニアを呼び集め、ノートPCやデスクトップPCをつなげて大規模コンピュータを構築し、世界のスーパーコンピュータ上位500リストにランクインすることだった(4月3日の記事参照)。このリストの第1位は、40テラFLOPS(1テラ=1000ギガ)の処理能力を誇る日本の地球シミュレータだ。

 私は自分の2.4GHz Pentium 4搭載のCompaq製ノートPCを抱えて、およそ300人の参加者とともに、「Flashmob1」というスーパーコンピュータの構築に向けてUSFの体育館を訪れた。

 スタッフや学生は、一晩がかりで体育館を巨大なデータセンターへと変貌させた。体育館中に設置されたテーブルの端をイーサネットケーブルで結び、これらのケーブルを体育館のあちこちに置かれたFoundry Networks製スイッチ4台につないだ。堂々たるプラットフォームが体育館の中央に鎮座し、ここで数人の学生がFlashmob1の中枢の監視にあたった。

 体育館の入口で持ち寄ったコンピュータのセキュリティ検査を受けた後、ボランティアはマシンの速度に応じてマシンを置くテーブルを指示された。私はセキュリティ検査に合格すると「Pentium 4ですか?」と尋ねられ、「部屋の後ろ側に行ってください」と告げられた。

 その場所にはFlashmob1のロゴ入りの黒いTシャツを着た責任者がいて、マシンの設定を手伝ってくれた。私が電源パックを持ってきたことを話すと、そのスタッフは「いいね、それは必要だよ。バッテリーでノートPCを動かすと、このベンチマークだと10分しか持たないからね」と話した。

 このスタッフは、この実験のためにマシンを走らせるのに必要なソフトがすべて収録されているCDを起動した。「スーパーコンピュータが1枚のディスクに入っている」とは、米ローレンスリバモア国立研究所のコンピュータ科学者にしてUSFで講師を務めるパット・ミラー氏の言葉だ。

 ミラー氏は、1400台のマシンが集まろうとしているのをのんびりと眺めているように見えた。多数のノードでつくるシステムは600ギガFLOPSを達成すると見込まれていた。4時間以内に上位500リストの候補に求められるベンチマーク結果を叩き出し、6月に発行される次回の上位500リストの下の方のランクにFlashmob1をランクインさせるのに十分な記録になるはずだった。

 Flashmobコンピューティングのアイデアが生まれたのは、ミラー氏の自作スーパーコンピューティングの講座からだった。見知らぬ人々を指定の場所に集めて、歌を歌うなどの突飛な行動をして終わったら解散していくという流行のイベント「flashmob」に触発され、学生たちはボランティアを募って彼らのマシンを1日譲り受けようとした。

 その作業はものすごく手間のかかるものだった。「ネックになるのは(ノードの)メモリ容量だ」とミラー氏。確か私のノートPCには512Mバイトのメモリが積まれていたと思う。「たくさんのマシンを持ち込んだ。不具合を抱えているマシンやネットワークケーブルの具合が悪いマシンもあるかもしれない。メモリを非常に高速で酷使しているし、プロセッサは常時稼動することになるだろう」。ベンチマーク中にコンピュータのうちの1台でもだめになれば、Flashmob1は崩壊するという。

 午前11時までに、責任者を除いて全員が体育館から退去させられた。Flashmob1のテストが始まろうとしていた。Hewlett-Packard(HP)から来た専門家は運営者に、弱点を排除するために、一度に少数のコンピュータのグループでベンチマークテストをするよう助言していた。HPの専門家が言うには、典型的な1000ノードのスーパーコンピュータでは、ノードのテストに1カ月半をかけ、受け入れテストでさらに3カ月を費やすという。Flashmobチームは、用意したベンチマーク2種類の最初の1つを、2時間後の午後1時には開始すると決めていた。スーパーコンピュータは午後6時には解体され、上位500リスト入りを目指してベストの記録が提出されることになっていた。

 Foundryから参加したエンジニアは前夜からバックボーンネットワークの設置とテストに当たっていた。同社は、FastIron 1500 Layer 2/3モジュラーネットワークスイッチ4台を土台に10Gビットイーサネットワークを構築。それぞれのスイッチは2ポートの10Gビットイーサネットモジュール1つと、48ポートの10/100モジュール6つを備え、これらがクライアントマシンを支えた。

 ボランティアは幾つかの窓からFlashmobチームの作業を眺めることができた。われわれは何人かのスタッフがプラットフォームのモニタにかじりついている光景を目にしたが、ほかの責任者は談笑しながら、栄養ドリンク「Red Bull」を飲んでいた。

 スーパーコンピュータに関する難解な議論に参加した後、私は午後4時に体育館に戻った。しかし、そこで聞いた知らせは芳しいものではなかった。一部のマシンに取り付けられたネットワークインタフェースカードに不具合があり、大きな問題が発生したというのだ。

 ミラー氏によると、「(コンピュータのネットワーク接続は)100 Base-Tと記されていたのだが、それほど高速でないものが一部あったようだ」。また、Flashmobソフトが一部コンピュータの内蔵無線LANカードを利用しようとした際にも問題が起きたという。

 ボランティアが持ち寄ったシステムの最終的な台数は700台だった。テストでネットワーク問題の特定を試みた後、Flashmobチームは午後4時15分から256台のコンピュータでベンチマークテストを開始した。70分後、計算の75%を達成したところで、スーパーコンピュータは1つのノードの不具合によって崩壊した。このテストで得られた性能は180ギガFLOPS。目標とした600ギガFLOPSには程遠いが、Flashmob自体は完全なシステム――プラズマモデリングなどに使える性能を備えたスーパーコンピュータ――だとUSFのコンピュータ科学専門のグレッグ・ベンソン助教授は語った。

 技術的な問題が起きたにもかかわらず、運営者は通常のコンピュータを使ってスーパーコンピュータを構築できることを示すという1つの目的を達成し、沸き立っていた。彼らは、地域社会で小型のFlashmobコンピュータを構築してアドホックな課題に取り組める日が実現することを夢見ている。Flashmobコンピュータは高校生のオゾンホール研究や、地域住民がガス漏れの影響を予測する上で役立つかもしれない。

 ミラー氏とベンソン氏は共に、科学コミュニティーでほかのFlashmob活動にも参加していく意向を示している。さらに、Flashmob2の構築に関心を示した世界各地の大学が、USFに連絡を取ってきているという。

 USFはメモリとCPUの問題を見つけ出すためにFlashmobソフトを開発したが、結局は予期していなかったクライアントのネットワーク問題が障害となった。

Copyright(C) IDG Japan, Inc. All Rights Reserved.