ITmedia NEWS > 企業・業界動向 >
ニュース
» 2018年03月12日 08時00分 公開

スパコン初心者のヤフーが省エネ性能世界2位の「kukai」を作るまで (1/2)

2017年6月に発表されたヤフーのスーパーコンピュータ「kukai」。省エネ性能世界2位を誇り、より大規模なディープラーニング処理を従来より低コストで行える。しかしヤフーは、もともとスパコンを作るつもりではなかったという。

[村田朱梨,ITmedia]

 2017年6月に発表されたヤフーのスーパーコンピュータ「kukai」(クウカイ)は、同社初のスパコンであるにも関わらず、スパコンの省エネランキング「GREEN500」で世界2位を獲得するなど話題を呼んだ。しかし開発に携わった角田直行テクニカルディレクター(データ&サイエンスソリューション統括本部)によると、ヤフーは「もともとスパコンを作るつもりではなかった」という。なぜ、kukaiは生まれたのか。

photo ヤフーのスパコン「kukai」
photo

スパコン「kukai」とは?

 kukaiは17年6月にヤフーが開発を発表したスーパーコンピュータ。GPUを使った従来の社内環境と比べ、その演算処理性能(460.7 TFLOPS)は理論上約225倍で、角田ディレクターによると「GPUサーバ1台とkukaiの約半分のリソースを使って比較したところ、kukaiはだいたい140倍のスピードが出た」という。

 米NVIDIAの最新GPU「Tesla P100」を160基搭載し、冷却方法には高効率な「液浸」を採用。スパコンの消費電力あたりの処理性能をランキングにした「GREEN500」(2017年6月)では、東工大の「TSUBAME3.0」に続き、世界2位を獲得している。

 角田ディレクターは、kukaiの開発について「もともとスパコンを作るつもりではなく、AI(人工知能)を使ったディープラーニング(深層学習)に特化した環境を作ろうと、突き詰めていった結果だった」と説明する。

作ろうとしたのは「ディープラーニング」の環境

 ヤフーではディープラーニングが盛り上がり始めた2012、13年頃からその活用に目を付けていたものの、社内にディープラーニングのための環境はなく、技術者たちは手元の環境で検証を行っていたという。

photo 角田ディレクター

 自分たちが保持しているデータをフル活用するためにも、AIを使ったディープラーニングは必要だ。そう考えた角田ディレクターたちは、調査を進めていくうちにあることに気付いたという。――スパコンのスペックは、自分たちが必要だと考えている環境と「とても良く似ている」と。

 「それなら、『ディープラーニングに最適な環境を作りました』というより『スパコンを作りました!』の方が一般の人にも分かりやすいし、社外的なアピール度も高いですよね」(角田ディレクター)

 kukaiの開発が本格的に動き出したのは2015年末頃。角田ディレクターたちが「最適な環境作り」の必要性を進言したことはもちろん、経営陣にも「日本をインターネット技術で良くするため、全知全能的なAIを作りたい」という構想があったことが、開発を後押しした。

 ちなみにkukaiと名付けたのは同社の宮坂学社長。もし全知全能的なAIを作ったとして、どんな名前を付けるべきか――「日本のインターネットを良くするためだから、日本の歴史上の人物にしよう」「その中で頭の良い人といえば誰か?」という話が出た際、「それは空海だ、と宮坂さんが言い、『スパコンを作ろう。名前はkukaiだ!』となったんです」(角田ディレクター)

photo 「kukai」の名前は、真言宗の開祖・空海から

世界2位を実現したのは「タイミングの良さ」?

 しかし、スパコンの開発は同社にとって初めての挑戦。同社では自社でインフラを構築してサービスを提供することが多く、ハードウェアの知識を持った技術者も大勢いたものの、スパコンとサービス用のサーバでは構成が異なる部分も多く、一から作らなければならなかったという。

 それでも高性能なスパコンを作れたのは「いろいろなタイミングの良さがあったから」と角田ディレクターは言う。

 1つは高性能のGPUを採用できたこと。もともと画像処理のために開発されたGPU(Graphics Processing Unit)は汎用的なCPUに比べて価格性能比が高く、消費電力も小さい。kukaiの開発が始まった頃は、ちょうどAI、ディープラーニングの需要からGPUの性能が大きく伸びていた時期だった。一方スパコン業界でも「GPUを取り入れよう」という動きが広まってきていたという。

 「それまでスパコンは、CPUの性能を高めたり、処理を効率的にしたりすることが多かったが、『GPUも取り入れないと難しいよね』という考えがメジャーストリームになってきていた。私たちはディープラーニング向けの環境を作ろうと考えていたので、ちょうど伸びていた高性能なGPUを取り入れることができた」(角田ディレクター)

 GPUをスパコンに取り入れたのはヤフーだけではないが、さらに「液浸」――電気を通さない特殊な液体に直接ハードウェアを漬け込んで冷却する技術を採用することで一歩抜け出すことができたという。

 「どうやってスパコンを作ろうか考えて、東工大のTSUBAME(※編注:油を使った液浸を採用しているスパコン)を見学させてもらったり、スパコンのカンファレンスでExaScalerの液浸技術を見たりして、『これはすごい!』と思った」(角田ディレクター)

 しかし、スパコンでよく用いられるのは「空冷」や「水冷」で、液浸の採用事例は少ないという。メンテナンスの手間がかかるなどの課題もあるからだ。それでもヤフーは、液浸を採用することに決めた。

 「スパコンを普通に作るだけでは面白みがないし、チャレンジが足りない。液浸を使ったスパコンを作って、それでサービスの実運用までできたら、世界的にもすごいこと。せっかく初めてスパコンを作るなら、とことんチャレンジしようと思った」(角田ディレクター)

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.