筑波大学の「最新スパコン」 “国内最高位”になるまでの軌跡

» 2024年01月17日 10時00分 公開
[PR/ITmedia]
PR

 「筑波大学の最新スパコンが国内最高位に」「世界最高性能のGPUとCPU、さらに先進的不揮発性メモリと最高性能の接続ネットワークを結集」――筑波大学が2023年11月にリリースした報道発表には、“世界トップ”を表す単語が踊っていた。

 同大学のスパコン「Pegasus」(ペガサス)が、スパコンの省エネ性能を比較する世界ランキング「Green500」で国内1位に輝いたのだ。消費電力1W当たりの計算性能は41.12GFLOPS(ギガフロップス)を誇る。

 この栄光の裏には、Pegasusの性能を数%でも上げるべく奮闘する科学者の姿と、構築を担ったNECの並々ならぬ努力があった。

photo 左から筑波大学 計算科学研究センターの朴泰祐教授(センター長)と建部修見教授

研究者たちの協調設計が産んだ“天馬”

 Pegasusは、筑波大学の計算科学研究センターが22年12月に運用を始めた。その名は天翔る馬のような高速計算を意味し、大きな翼にビッグメモリを重ね合わせている。

 計算科学研究センターの目的は、大規模な計算を必要とするシミュレーションやデータ解析、AIを使った科学研究の推進だ。HPCの性能を突き詰めて、宇宙物理学や生命科学、地球科学などの進歩を後押ししている。

 HPCを開発する際、計算科学研究センターは「コ・デザイン」(協調設計)というコンセプトを重視している。各分野の研究者が要望を上げ、計算機科学者と議論してシステムに落とし込んできた。既存のスパコンを調達するのではなく、用途に応じて設計することで研究の成果につながる高性能なスパコンを構築できると同センター長の朴泰祐教授は話す。

 「独自の視点で、常に一番新しい技術を採用することで価格性能比を高めています。Pegasusを構成する技術は、どれも世界的に早い段階で導入できました。限られた予算で特徴的なマシンを作り、ここでしかできない計算に応えています」(朴教授)

photo 朴教授と建部教授

国内最高位の座 「数%」を極める調整の舞台裏

 Pegasusには最先端技術が詰め込まれている。120台の計算ノードに世界トップクラスの演算能力を持つ米NVIDIAのGPU「NVIDIA H100 Tensor コア GPU」と、米IntelのCPU「第4世代Xeon スケーラブル・プロセッサー」(Sapphire Rapids)を搭載。

 Intelが22年に発表した不揮発性メモリ「インテル Optaneパーシステント・メモリー300シリーズ」を採用し、メモリを拡張することで1ノード当たり2TBという大規模メモリを実現し、大抵の問題サイズなら複数の計算ノードをまたがずに実行できる。この3つの技術を1つのシステムに導入した世界初の事例だと朴教授は胸を張る。

 「Pegasusの調達は本当に大変でした。最先端のものをそろえたので、納期ギリギリまで各社と調整していました」と話すのは、計算科学研究センターの建部修見教授だ。

 調達後にIntelがOptane事業を終了し、Optaneを採用したスパコンは世界でPegasusだけになった。Pegasusの貴重な技術を最大限に生かすために使いやすい設計にしていると建部教授は説明する。

 完成したPegasusは、Green500で国内最高位の座を手にした。実は、事前調査では日本一に数%届いていなかった。「何とかしたい」という朴教授の要望を受けたNECは、周波数の設定に至るまでギリギリの調整を月1回のメンテナンスで続けて結果につなげた。

 Green500で頂点を狙うだけなら、それ専用のシステム構成にすればいい。しかし計算科学研究センターは研究者のニーズに応えることを第一にし、さらに省電力性能も追求して国内1位をつかみ取った。これはコ・デザインの姿勢とNECの努力のたまものだ。

photo Pegasus

世界初の事象にも対応 NECの知見を横展開する

 Pegasusが華麗に羽ばたけたのは、計算科学研究センターを支えるNECの存在が大きい。NECはPegasusの構築から運用まで一手に担っている。Green500に向けた調整はもちろん、NVIDIAなどのベンダーとの橋渡しやOptaneを巡るIntelとの交渉にも奔走した。

 「Pegasusは新しい技術を使っているので、世界初のトラブルもたまに発生します。それをNECにきちんと対応していただきました」と建部教授は評価する。

 「多くの要望に、NECは誠実に向き合ってくれました。19年に運用を始めたスパコン『Cygnus』もNECが手掛けていることは広く知れ渡っています。それはNECの真摯(しんし)な姿勢があるからです。現場を安心して任せられます」(朴教授)

 NECは、Pegasusで学んだ新技術の知見やノウハウを他の学術研究機関や一般企業のHPCに横展開したいと意気込む。同社のHPC事業コンセプト「LX-Neo」の下で、CPU/GPUスパコン「LXシリーズ」とベクトル型スパコン「SXシリーズ」を提供し、システムインテグレーションを含む構築・運用サービスをトータルソリューションとして展開して研究開発やビジネスの加速を後押しする構えだ。

Copyright © ITmedia, Inc. All Rights Reserved.


提供:日本電気株式会社
アイティメディア営業企画/制作:ITmedia NEWS編集部/掲載内容有効期限:2024年1月22日