ニュース
2002/12/24 20:14 更新


PCクラスタの最速エンジンとしてOpteronを売り込むAMD

日本AMDがスパコン並みに演算処理を叩き出すPCクラスタのエンジンとして、Opteronを売り込む。Opteronの価格レンジはXeonクラスとなる見込みで、圧倒的なコストパフォーマンスと64ビットアーキテクチャによる恩恵を、エンタープライズやハイパフォーマンスコンピューティングのマーケットにもたらすことになる。

 日本AMDは去る12月10日、ハイパフォーマンスコンピュータの輸入・販売、システムサポート、ソフトウェア開発を行っているベストシステムズと共同で、大手顧客向けに「AMDクラスター・ソリューション・カンファレンス2002」を開催。その中で米AMD上級副社長のダーク・マイヤー氏はAMDのプロセッサロードマップを披露。さらに4プロセッサ構成のOpteron搭載システムのデモも行った。

 マイヤー氏によるとAMDは、2プロセッサ以下のローエンドクラス向けに「Sledgehammer DP」、4プロセッサのミドルレンジから8プロセッサ以上のハイエンド向けに「Sledgehammer MP」という2種類のOpteronを用意する。

 また、先のCOMDEX/Fallの基調講演で披露されたように、Opteronは低いクロック周波数でも高いパフォーマンスを発揮する設計となっていることを強調。SPECint 2000は2GHz動作時で1200以上、SPECfp2000は1800前後をマークするという。これは同クロックのインテルXeonプロセッサの2倍を遥かに超える値である。

 Opteronの価格レンジはXeonクラスとなる見込みで、圧倒的なコストパフォーマンスと64ビットアーキテクチャによる恩恵を、エンタープライズやハイパフォーマンスコンピューティングのマーケットにもたらすことになる。

 マイヤー氏は、既存のx86にはレジスタ不足と32ビットアドレッシングの2つの制限があるが、いずれもAMDのx86-64を用いることで、従来のソフトウェアとの互換性を犠牲にすることなく解決可能であると話した。x86-64ではXeonの2倍に相当する16本の同時に利用可能な64ビット汎用レジスタ(そのうち8本は従来の32ビットレジスタと兼用)が内蔵され、SSE命令で利用される128ビットXMMレジスタも2倍の16本に増加する。

 またシステム上のボトルネックとなりやすいメモリコントローラをプロセッサに内蔵。ほかのプロセッサやI/Oコントローラとは高速チップ間インターコネクト技術のHyperTransprtで接続するなど、システム全体の性能を上げるための工夫が施されている。

 現在のところ、リリース時期に大きな変更はなく、最初のOpteronが2003年前半に登場、直後にデスクトップ向けのAthlon 64、そのさらに少し後にはモバイルAthlon 64までが一気に投入される。これらはすべて独ドレスデンにあるFab30の0.13ミクロンSOIプロセスで製造される見込みだ。さらに2004年前半には、これら3つの分野すべてを0.09ミクロンSOIプロセスへと移行させる予定という。

 またマイヤー氏はハイパフォーマンスコンピューティング向けにOpteronを採用するベンダーとしてクレイを紹介した。クレイは1万個以上のOpteronプロセッサを用いるクラスタシステム「Red Storm」(予価およそ9000万ドル)を開発中で、浮動小数点演算能力は40TFLOPSを上回る(これまでの最高はNEC地球シュミレータの35.86TFLOPS)。新薬開発や流体解析などの分野への応用が期待されている。

 同セミナーで講演を行った東京大学大学院の石原孟氏は2000年からの10年を「1990年代に成長した流体解析技術が普及する時期」と予測。「さらに2010年以降には成熟期を迎えるだろう」と話す。その鍵となるのが、安価なPCを用いたクラスタコンピューティング技術だ。石原氏は安価なx86互換プロセッサで64ビットアーキテクチャを利用できるOpteronに大きな期待を寄せているという。

 また、東京工業大学学術国際情報センタの松岡聡教授が、Athlon MPを用いた大規模クラスタシステムを紹介。東工大ではベクトル計算機としてNECのSX-5(128GFLOPS)、超並列機としてシリコングラフィックスのOrigin 2000(204GFLOPS)、スカラ計算サーバとして旧コンパックのGS320(128GFLOPS)などを所有していたが、SX-5のプロセッサ利用率はほぼ100%でフル稼働状態。それ以外のシステムも80%以上稼働していることがほとんどという、過密スケジュールで、既に限界に達していたという。しかし、次回のシステムリプレースは2006年1月まで待たないといけない。

 そこで、松岡氏の研究室ではネットワーク上で仮想組織を作り、組織のコンピュータを接続する分散並列型の仮想コンピュータを動的に形成するインフラ構築に乗り出した。リソースが組織内のどこにあっても、システムの能力やネットワーク帯域を自動判断。またセキュリティやデータベース、ユーザーインタフェースなどを抽象化し、共通のアクセス手法で仮想コンピュータにアクセスできるようにする。

フィールド・オブ・ドリームズ作戦

「しかし、本当にそのような事がうまくいくのか? 関係者の理解は得られるのか?」という疑問が、当然のように出てくる。そこで松岡氏たちが考えたのが、「フィールド・オブ・ドリームズ」作戦だ。これは同名の映画になぞらえ、きちんとした球場(=使い物になるハイパフォーマンスの仮想コンピュータ)を整えれば、自ずとプレーヤーがそれを使ってくれるというもの。500ノードを超えるクラスタならば興味を持ってもらえるだろうし、1万ノード以上なら世界最高峰を目指せるかもしれない。

 ところがこの方法にも2つの問題がある。1つはハードウェアやソフトウェアの技術から開発せねばならない上、大学の一研究室が管理可能なものなのかということ。もう1つは可能だったとして、その成果(能力)をどのようにして世の中に知ってもらうかである。

 そこで松岡氏たちが挑戦したのが「The Top500 Supercomputing Sites」と呼ばれる、全世界の計算機ベンチマークをアーカイブするプロジェクトへの挑戦だ。

 Top500は年2回更新され、それぞれ上位3位までを表彰、500位までに賞状が送られることになっている。上位陣はメーカー、研究所、国の威信をかけた激しい戦いを繰り広げている。これまでのトップはNECの地球シュミレータである。以前からPCクラスタを研究していた松岡氏の研究室は、2000年11月にPentium IIIを用いた128ノード、256プロセッサのシステムで挑戦するが惨敗。500位以内に入ることができなかった。

 そこで得たものは、ノード数を幾ら増やしてもプロセッサ単体の浮動小数点演算能力をカバーするには限界があることだったという。x86システムは安価ではあるが、あまりに大規模になるとノード自身よりも、ネットワークや管理の面でのコストが過大になり、パフォーマンスが向上しないのである。

 x86プロセッサは8087命令との互換性を維持するため、命令発行が1つずつしか行えずパフォーマンスが伸びない。しかしAthlonはx86でありながら、浮動小数点演算の2命令同時発行が行える。

 そこで2001年6月の再挑戦では、Athlon/1.3GHzの78ノード、理論ピーク性能で208GFLOPSに達するPCクラスタを1カ月で完成させた。クラスタネットワークは前回の挑戦で使ったものと全く同じものを利用したという。結果は77.4GFLOPSを記録して439位にランクインした。

 2001年11月にはAthlon MPの登場に合わせ、各ノードをデュアルプロセッサ化し128ノード、256プロセッサ(Athlon MP/1.2GHz)、理論ピーク性能617GFLOPSのシステムを構築。ノード間ネットワークの強化やソフトウェアチューンにより、331.7GFLOPSで86位(PCクラスタ部門で4位)にまでランクが上昇。今年1月にはさらに256ノード、512プロセッサ(AthlonMP 1900+)にアップグレードし、716GFLOPSで47位、PCクラスタ部門では2位にまで性能を向上させることに成功した。

 これらのコンペを通じて、現在松岡研究室には6つのクラスタシステムが稼働し、890基のプロセッサが1.8TFLOPSのピーク性能と100Tバイト以上のストレージを提供するに至っているという。またフィールド・オブ・ドリームズ作戦も功を奏し、松岡研究室のクラスタシステムを用いたアプリケーションの共同開発プロジェクトに多数関わる事になり、またクラスタシステム構築やソフトウェア開発のノウハウを蓄積できたという。

 松岡氏は今後もAMDプラットフォームを用いたPCクラスタの研究開発を前進させる予定という。従来のx86プロセッサでは期待できなかったメモリ帯域、I/O帯域、そして64ビットアドレッシングとレジスタ数の倍増など、ハイパフォーマンスコンピューティングの分野で即効性のあるフィーチャーがOpteronには多数ある。松岡研究室では2005〜2006年にかけて、50〜100TFLOPS級のPCクラスタを構築する計画という。

 ハイパフォーマンスコンピューティングの世界は、われわれが速いと感じるムーアの法則に従った性能上昇を遙かに超えるペースで進化している。大学の研究室レベルでも、世界記録に挑戦できるPCクラスタが研究室を飛び出すことに成功すれば、そこには従来の計算機コストによる秩序を打ち破る新しい可能性が広がっているはずだ。

関連記事
▼米AMD、新ロードマップを公開、2004年前期に90nm/SOIの64bitプロセッサ3種類を投入
▼米サンディア国立研究所向けスーパーコンピュータにAMD Opteronが採用
▼HyperTransportを生かしたOpteronのプラットフォーム技術

関連リンク
▼AMDニュースレター
▼日本AMD

[本田雅一,ITmedia]

Copyright © ITmedia, Inc. All Rights Reserved.