普通のパソコンをスパコン並みに――ある高校生たちの挑戦(2/2 ページ)
広島国泰寺高校科学部物理班は、KNOPPIXを利用し、学校の情報教室のPCでMPI並列処理が可能なPCクラスタシステムを開発した。64台の並列で最高9476MFLOPSという高性能が求められた経緯などを追った。
そしてスパコン並みの性能に
このPCクラスタシステムの性能は、MPICHに付属する並列処理プログラム「cpi.c」と、非圧縮流体解析コードの性能評価のために理化学研究所の姫野龍太郎氏が作成した姫野ベンチマークテストで検証が行われた。表1から3がその結果である。
| PCの台数p | 1 | 2 | 4 | 8 | 16 | 32 | 64 |
|---|---|---|---|---|---|---|---|
| wall clock time(s) | 2.471 | 1.240 | 0.632 | 0.322 | 0.166 | 0.093 | 0.050 |
| 速度向上S(p) | 1.000 | 1.992 | 3.912 | 7.679 | 14.859 | 26.570 | 49.569 |
| 並列化効率E(p) | 1.000 | 0.996 | 0.978 | 0.960 | 0.929 | 0.830 | 0.775 |
| 表1 cpi.cの実行結果 | |||||||
| PC | 1 | 2 | 4 | 8 | 16 | 32 | 64 |
|---|---|---|---|---|---|---|---|
| S size | 399.3 | 711.9 | 1064.6 | 1523.3 | 780.1 | 648.0 | 559.6 |
| M size | 384.5 | 729.2 | 1228.1 | 1714.9 | 1857.5 | 1597.5 | 1201.5 |
| L size | 2178.4 | 3208.5 | 4009.9 | 4149.8 | |||
| XL size | 9475.7 | ||||||
| 表2 姫野ベンチ結果(単位MFLOPS) | |||||||
| PC | 1 | 2 | 4 | 8 | 16 | 32 | 64 |
|---|---|---|---|---|---|---|---|
| S size | 1.000 | 0.891 | 0.666 | 0.477 | 0.122 | 0.051 | 0.022 |
| M size | 0.963 | 0.913 | 0.769 | 0.537 | 0.291 | 0.125 | 0.047 |
| L size | 0.682 | 0.502 | 0.314 | 0.162 | |||
| XL size | 0.371 | ||||||
| 表3 姫野ベンチにおける並列化効率(S size1台のときを1とした) | |||||||
考察
表1から、PCの台数が倍になると計算時間がほぼ半分になっていることが分かる。また、表2に示すようにPCの台数が8台以下の場合は、実行速度が台数とともに増加している。
サイズがSの場合は、8台をピークに処理速度が減少する逆転現象が見られる。また、Mサイズの場合、処理速度のピークは16台にある。Lサイズでは64台で飽和している。そして、64台での処理速度はXLの計算サイズ(1024 x 512 x 512)のとき最高で9475.7MFLOPSであった。10GFLOPSにも達しようかというこの性能は、スパコンの実測性能に匹敵する性能である。
並列処理の速度向上に限界があることは、アムダールの法則として知られている。並列処理であってもすべての処理が並列化できるわけではなく、必ず逐次処理の部分が存在するからだ。アムダールの法則では、例えば並列部の比率が0.9のとき、PCの台数をどれだけ増やしても10倍以上の速度向上は得られない。
同校では、アムダールの法則からPCの台数が増えると処理速度は増加し、増加率は飽和すると予想していたが、実際には、台数が増えると処理速度が減る場合があることが分かった。これはサイズが小さい場合は計算回数が多く、データ量の小さい通信を送受信する回数が大きくなるので通信のオーバーヘッドが多くなり全体の処理速度が遅くなるためと考えられる。
また、図1に示したようにスパコンの場合はS、Mサイズでも速度向上が低下していない。すなわち並列化効率の低下が起きにくいことが分かる。これはスパコンの通信性能が優れているためと考えられるが、スパコンでもAlphaServerSCの場合には、Sサイズ64並列で速度向上の飽和が見られる。このことから、問題の大きさが小さい場合に並列台数を増加させると並列化効率が低下する現象はPCクラスタだけでなくスパコンでも起こりうるということを示唆している。
一般に並列処理が必要なプログラムは問題の大きさが非常に大きく、今回のベンチマークのように小さなサイズの問題を多くのPCで並列計算することは少ないので、並列処理による速度向上のメリットは十分にあると考えられる。しかし、今回のテストで速度向上のために問題の大きさに対して必要以上に並列台数を増やすことは逆効果であることが分かった。したがって、並列処理を実行するときには、個々の並列プログラムに適した並列台数で実行する必要があることなどの有益な情報が得られた。
同校の科学部物理班は、このテーマで高校生のための科学技術コンテストの全国大会「JSEC2004」にエントリー、1次審査を通過して11月6、7日に行われた最終発表に臨んだ。結果、同校は見事に優秀賞(3位に相当)を受賞し、2005年5月に米国で開催される国際学生科学フェア「ISEF」へ参加することになった。今回得られた成果を基に、同校がISEFで活躍するとともに、来年のSuperConに出場できることを願ってやまない。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- アテネの裏で行われた暗号解読をめぐる死闘――「SuperCon2004」開催
- 行列の“できない”スパコン――防災科研の新システムが本格稼働を開始
防災科学技術研究所の新システムが本格稼働を開始した。Altix 4700を中心に構築されたシステムから出力されるデータは、4Kプロジェクタ2台を用いた高機能表示装置によって可視化が図られている。 - NIED、Altixを中核とするスパコンの導入へ
防災科学技術研究所(NIED)は「SGI Altix 4700」を中核とするスーパーコンピュータシステムを7月をめどに稼働させる。理論計算性能は13.59TFLOPSで、高機能表示装置には4Kプロジェクタを採用している。 - NEC、JAXAに最新版スパコンを導入 新システムのサブとして
JAXAが新たに導入するスーパーコンピュータシステムに「SX-9」が採用されたと、NECが発表した。
ベクトル機の時代が終わる? GPGPUの夜明けと課題
「ベクトル型のスパコンと同じ処理性能をGPUコンピューティングであれば、3.5けたほど安い価格で実現できる」――日本SGIが発表したソリューションがベクトル機の存在価値を大きく変えるかもしれない。
「国内で2番目の速さに」――富士通がJAXAに新スパコンを導入
JAXAが富士通製のスーパーコンピュータシステムを採用した。理論ピーク性能は135TFLOPS。現行システムの約15倍にもなる。
京大がスパコンを刷新 理論ピーク性能が7倍に
富士通は、京都大学から現行システムの7倍の理論ピーク性能、3倍以上のメモリ容量、100倍のストレージ容量を持つスパコンを受注した。- 筑波大学、新スパコンの稼働は6月から SCSら3社が受注
住商情報システムら3社は、最大95TFLOPSのスパコンを筑波大学から受注した。 - マルチコア用自動並列コンパイラの開発を支えるデスクサイドスパコン
1980年代からソフトウェア協調型マルチプロセッサアーキテクチャの研究を進める早稲田大学。そのマルチコア用自動並列コンパイラの研究開発に取り組む笠原研究室では、机の下に日本SGIのスパコンが鎮座している。
東大が新たに日立のスパコンを採用――筑波大、京大も新システムを導入へ
昨年末に東京大学情報基盤センターへの導入が決定した日立製スパコンの詳細が明らかになった。
