大阪に“イカした”スーパーコンピュータ(スパコン)システムがある。日本、ひいては世界の学術研究をリードする大阪大学の「SQUID」(スクウィッド)だ。優雅に泳ぐイカが描かれた筐体の中にCPU、GPU、ベクトルエンジンという3種類のプロセッサを搭載し、高度な計算ニーズに対応できるスパコンとして稼働している。
大阪大学の取り組みが画期的なのは、単なるHPC(High Performance Computing)の構築、運用にとどまらなかった点だ。SQUIDと並行して「ONION」(オニオン)と名付けたデータ集約基盤の試験運用を開始。大阪大学の伊達進教授(D3センター 先進高性能計算基盤システム研究部門、博士(工学))は、一連のシステムの構想を練っていた当時を次のように振り返る。
「データは21世紀の石油といわれます。しかし、データの保管や移動に労力がかかる、データを分析、活用するスパコンが使いにくいなどの課題がありました。『データが集まるところにこそ高い計算能力が必要で、それは使いやすいものがいい』というコンセプトを検討しました」
SQUIDとONIONが誕生した背景には、学術研究や教育分野における研究者の課題をITシステムの面から解決しようとする強い思いが存在した。大阪大学のスパコンシステムを作り上げた伊達教授と構築を担ったNECのキーパーソンたちに、このプロジェクトの狙いを聞いた。
大阪大学のD3センターがSQUIDとONIONを管理している。情報をデータ化して活用しやすくする「Digital design」、高度かつ膨大なデータの解析や利用を容易にする「Datability」、さまざまな意思決定を支援する「Decision intelligence」という「3つのD」を通じて「データ駆動型大学」の実現に取り組むのが同センターのミッションだ。伊達教授は、D3センターでスパコンシステムのプランニングなどを担当。計算基盤やデータ基盤のあるべき姿を構想、設計する立場にある。
SQUIDは、大阪大学のフラグシップスパコン「SX-ACE」の後継として2021年に導入された。正式名称を「Supercomputer for Quest to Unsolved Interdisciplinary Datascience」といい、学際的な未解決のデータサイエンス問題を探求するシステムとして2018年ごろからシステム構成を考え始めていた。
「それまでのHPCはシミュレーションがメインでしたが、盛り上がり始めていたAIを意識してSQUIDを構築しようと考えました。研究者の既存のニーズを踏まえつつ『AI Ready』のHPCとして準備しました」(伊達教授)
利用率が高いCPUとAIを見据えたGPU演算にはNECのHPCソリューション「LXシリーズ」を採用。さらにNECのベクトル型コンピュータ「SX-Aurora TSUBASA」を取り入れることでHPCとしての性能を確保した。理論ピーク性能は16.5PFLOPS(ペタフロップス)を超える。多くの計算リソースが急に要求される場合に備えて、クラウドとも連携できるようにしたのもSQUIDの特徴だ。
SQUIDを調達するタイミングで、伊達教授はある挑戦をした。それがデータ集約基盤であるONION(Osaka university Next-generation Infrastructure for Open research and open innovatioN)の構築だ。同教授は「既存のHPCのニーズに応えられて、AIや高度なデータ分析(HPDA:High Performance Data Analysis)に寄与するシステムが必要だと考えました。HPDAの核となる『データを集約し管理する基盤』を構想したのです」と話す。こうして、21PB(ペタバイト)の高速並列ファイルシステムと500TB(テラバイト)のオブジェクトストレージから成るONIONが出来上がった。
データを集約する基盤というコンセプトを聞いたNECの片岡洋介氏(国交・文教システム開発統括部・プロフェッショナル)は、「他に類似するものがない特徴的なシステムだと感じました」と当時を振り返る。過去に培ったHPCの知見やソリューションだけでは実現できないので、次世代のスパコンに必要なものをゼロベースで議論したと片岡氏は語る。
なぜHPCにデータ集約基盤が必要なのか。伊達教授は、隣接する超高圧電子顕微鏡センターの先生に「スパコンを使ってもらうにはどうすればいいか」と聞いたことがONIONを構想したきっかけの一つだと話す。
「電子顕微鏡の機器で1回撮影すると、接続先のPCのストレージが満杯になってしまうのだそうです。計測データを外部メディアに移さないと次の撮影ができないので、余計な手間がかかってしまいます。『機器とデータ基盤をネットワークでつなげられたらよいですね』と話したことがあり、SQUIDの調達時にデータ集約基盤の構築を考えました」
ONIONの目的は、大阪大学が生成した大量の研究データを持続可能な形で保持しつつ、責任ある活用を可能にすることだ。それによって社会的価値の創出や産学共創、国際共同研究などを推進する狙いがある。言い換えると、データの保持と活用が求められる状況だったのだ。
「学内にある望遠鏡や医療機器、実験機器、IoTデバイスなどがデータを生み出し続けています。今や天文学者は望遠鏡ではなくストレージを見ている時代です。これまでは、機器のデータをUSBメモリなどに移して研究者のPCに集めてからHPCに送っていました。HPCの計算結果が出たら、膨大なデータを外部メディアに書き出して持ち帰るという作業が当たり前でした」(伊達教授)
研究者たちの貴重な時間を奪っているデータ管理の課題を解決する必要がある。NECの平陽介氏(文教・科学インテグレーション統括部 シニアプロフェッショナル)は、研究の公正性を確保する「研究インテグリティ」が国際的に求められるようになっていると指摘。不適切なデータ管理は研究不正の原因になりかねないので、研究成果の根拠や再現性を示すためにも大量のデータを正しく保管しなければならない。
「学内のデータが勝手に集まってくる仕組みをつくればいいのではないか」――これがONIONのコンセプトだ。HPCを利用する研究者は「データはHPCから生まれる」と考えがちだが、AIの研究者は「データがあって初めて計算できる」という認識だ。AI Readyのスパコンシステムを作るためにも、データ集約基盤が必要だった。
平氏は「スパコンの提案においてストレージ関係の課題が表面化し始めたタイミングでした」と説明する。膨大な研究データを極力動かさず、1カ所に集めたところにHPCも置きたいという要望はあったというが「それを調達の要件に入れた大阪大学は先見の明がありました」と平氏は述べる。
伊達教授は「従来のHPCは独立したシステムなので、利用時に『よっこらしょ』という感じがありました。ONIONで目指したのは、学内外の拠点やクラウドと有機的につながる姿です。スパコンを使わない人でも『便利だね』となるシステムを狙いました」と話す。
完成したONIONに対する研究者たちの評価は「思っていた以上に便利」というものだった。ONIONやSQUID、大学内外の研究拠点などをネットワークで接続。APIでデータアクセスをサポートする仕組みを構築した。使いやすさにこだわってGUIを採用した他、SQUIDの計算結果をスマートフォンでも閲覧できるように設計。HPCのアカウントを持たない研究者にもデータの閲覧権限を付与できるようにしたことで、海外機関との共同研究もしやすくなったと伊達教授は笑顔を見せる。
「SQUIDとONIONは、80%の安定と20%のチャレンジを目指してつくりました。リソースの約90%が常に使われている状態で、利用率が高いということは成果だと言えるでしょう」
SQUIDとONIONの実現は並大抵のことではなかった。片岡氏は「最新鋭のスパコンをつくるときはいろいろなトラブルが発生します」とした上で、NECが総力を結集して対応したと話す。講習会の内容を調整するなど、多くの利用者に使ってもらうための工夫も欠かさなかった。現在は両システムの運用支援、保守を手掛けている。
「このプロジェクトは『つなぐ』をコンセプトにしています。HPCとHPDAをつなぐ、計算機とデータをつなぐ、データとユーザーをつなぐ――裾野がどんどん広がっていく良いシステムができたと自負しています」(片岡氏)
ONIONを使った研究も始まっている。D3センターと大阪大学歯学部附属病院、NECの産学連携プロジェクト「S2DH」(Social Smart Dental Hospital)で、歯科医療にAIを取り入れる方法を模索中だ。匿名化したデータをONIONに集約し、SQUIDを使ってAIを開発している。
大阪大学のD3センターとNECは、ONIONをさらに高度化させてオープンサイエンスを加速する新たなデータ基盤「RED-ONION」(Research EnhanceD ONION)の開発に取り組んでいる。情報セキュリティやモニタリング、来歴管理の仕組みづくりなどにも注力する予定だ。大学図書館などとも連携して、大阪大学全体で研究データや研究プロセスの適切な蓄積や共有を支えて活用を促す構えでいる。
NECの平氏は「学術研究における公正性や再現性、セキュリティの確保が国内外で大きなテーマになっています」と強調する。NECは、大阪大学などの学術研究機関との取り組みで培ったHPCやデータマネジメント、同社の強みであるネットワーク、情報セキュリティなどの知見を総動員して包括的に提供するモデル「研究情報基盤」(RII:Research Information Infrastructure)を用意。同社の価値創造モデル「BluStellar」の枠組みで提供することで、研究力の向上を後押ししたいと平氏は意気込む。国内はもちろん、海外の研究機関のデータ管理、活用も積極的にサポートすると説明する。
「大学にむちゃ振りをしてもらえば、総合ベンダーであるNECの全力を尽くせます。それこそがシステムインテグレーターの腕の見せ所です」(片岡氏)
伊達教授は「日本を代表するNECが、大阪大学のニーズを理解した上で高度なシステムを構築して、安定的に運用してくれています。今後も高い技術力を見せてほしいですね。これからもむちゃ振りしますよ」と笑う。
大阪大学とNECの取り組みは、高度な研究を支えると同時に国内外の学術研究機関が抱えるデータの課題を解決する一歩になるだろう。RED-ONIONの成果やRIIの展開に期待しつつ、学術研究に携わる誰もが研究データの在り方を考えることで研究力を向上させられそうだ。
“地球シミュレータ”JAMSTECの新「四次元仮想地球」に見るHPCの進化形 多様なニーズとセキュリティをどう両立?
筑波大学のスパコン「省エネ性能で日本一」は何がすごいのか “最先端”に懸ける思い
HPCの雄、NECの次の一手 “当たり前”の裏に込められた決意Copyright © ITmedia, Inc. All Rights Reserved.
提供:日本電気株式会社
アイティメディア営業企画/制作:ITmedia NEWS編集部/掲載内容有効期限:2025年3月26日