バグかな?――スパコンで計算が38倍高速に 文献分析AIに活用 トヨタG企業に真相を聞く

» 2022年12月19日 10時00分 公開
[PR/ITmedia]
PR

 スーパーコンピュータ(スパコン)で計算を約38倍に高速化したトヨタグループの企業がある――こんな驚きの話を耳にした。スパコンの性能は重々承知だが、まさか一般企業が活用しているとは思わなかった。この結果は本当なのだろうか。

 ITmedia NEWSの駆け出し記者・サトウが調べると、スパコンも進化しているようだった。巨大なサーバ群といったイメージは過去のもので、片手で持てるデスクトップサイズで比較的価格が低いスパコンが登場している。なるほど、これなら一般企業でも扱えそうだ。

 そして38倍の高速化という仰天の成果は、AIを活用した文献分析の工程でスパコンを活用した結果らしい。なぜそのような結果が出たのか、業務にどう生かしているのかなど疑問は尽きない。

 その企業が使ったのはNECのベクトル型スパコン「SX-Aurora TSUBASA」だと分かった。そこでNECの担当者にも同席してもらい、詳細を聞いてきた。今回はその模様をお届けする。

「スパコンで演算処理を約38倍に」 それって本当?

 取材したのは、特許調査といったIP(知的財産)事業を手掛けるトヨタテクニカルディベロップメント(以下、TTDC)だ。幸いなことに、スパコン導入の中心人物であるTTDCの山本俊介氏に話を聞けた。

サトウ 本日はありがとうございます。早速ですが、単刀直入にお伺いします。スパコンで演算処理を約38倍に高速化したというのは本当なのでしょうか。あまりに驚きの数値で信じられず……。

photo トヨタテクニカルディベロップメントの山本俊介氏(プラットフォーム開発部 AI・データサイエンス技術室 プロフェッショナルエキスパート)

山本氏 そうですよね、私も最初はバグではないかと思ってソースコードを調べました(笑) 結果的に約38倍という数値は事実でした。処理の実行指示を出した後、スパコン導入前の感覚でコーヒーでも飲みに行こうと席を立ったら、既に終わっていたというくらいの違いでした。

サトウ ちなみに、TTDCさんの使い方がものすごく特別だったというわけでもないですよね。

山本氏 はい、普通の業務です。弊社では論文や特許情報を分析して、内容が似ているもの同士をまとめてマッピングする「ランドスケープマップ」の制作の一部にSX-Aurora TSUBASAを活用しています。論文などのテキストデータを基に研究開発や新たなサービス開発を支援するものです。

サトウ なるほど、例えばこの図(下図)の場合はスマートシティーに関する特許の内容を分析して、半導体関連やエンタメ関連といった種類ごとにグループ化して表示しているわけですね。

photo ランドスケープマップのイメージ(山本氏の説明資料より)

山本氏 その通りです。ランドスケープマップを使えば、時系列での変化やそのときのトレンドを誰でも直感的に把握できるので、大量のテキストデータを分析するのに役立ちます。しかし人が作業すると手間と時間がかかるため、複数の自然言語処理を取り入れております。その中でも文献のトピック分類処理にSX-Aurora TSUBASAを使いました。

スパコンにも得意不得意 活用の鍵は「適材適所」

サトウ 文献の傾向を分析する過程にスパコンを活用されていますが、スパコンを選んだきっかけは何ですか。

山本氏 SX-Aurora TSUBASAの導入を決めたのは2018年ごろです。当時はAIブームの真っ只中で、演算処理をするGPUに注目が集まっていました。しかし私はGPU以外の選択肢も検討すべきだと考えており、NECさんからSX-Aurora TSUBASAの説明を聞いて導入に至りました。

サトウ 今回、SX-Aurora TSUBASAを担当するNECの永浜公太郎さんにもご同席いただいています。当時NECさんは、TTDCさんにどのような説明をしたのですか。

photo NECの永浜公太郎氏(プラットフォーム販売部門 SW・サービス販売推進統括部 Aurora・量子コンピューティング販売推進グループ プロフェッショナル)

永浜氏 はい。GPUにはGPUの強みがあり、ベクトル型スパコンのSX-Aurora TSUBASAにも独自の強みがあります。それぞれの得意分野を適材適所に組み合わせるヘテロジニアス(異機種混合)環境にすることで、業務の効率化や処理の高速化を実現できるとお伝えしました。

 例えば、GPUは深層学習を使う自然言語処理や画像認識処理といったコア数が重要になる領域が得意です。一方でSX-Aurora TSUBASAはシミュレーションや、ロジスティック回帰分析といった統計的機械学習などが得意です。言い換えるとメモリバンド幅(プロセッサコアへのデータ供給能力)の広さが求められる処理に向いています。TTDCさんの用途を踏まえ、両者を使い分けるメリットを説明しました。

photo AIにおけるGPUやベクトルプロセッサ(SX-Aurora TSUBASA)それぞれの得意分野(永浜氏の説明資料より)

サトウ 「スパコンに全てお任せ!」で済むと思っていましたが、真価を発揮するにはスパコンの特性に合った使い方をすることがポイントですね。で、その結果が約38倍の高速化という成果につながると。

山本氏 SX-Aurora TSUBASAを使ったところ、従来は10万件の文献で約841秒かかっていた文献分類の処理を、約21秒にまで短縮できました。結果を信じきれず、NECさんに「こんなに速くなったけど本当?」と聞いて、理論的に正しいか確認をしてから納得しました(笑)

永浜氏 今回の38倍というのはベクトルエンジンに合わせてプログラムをチューニングするといった山本さんの努力のたまものです。とはいえSX-Aurora TSUBASAの得意領域が用途にうまくはまれば、従来比で数十倍高速化するといった性能を引き出せるでしょう。

「SX-Aurora TSUBASAがめちゃくちゃ速い」 その理由は?

サトウ SX-Aurora TSUBASAを使えば数倍速くなるということですが、GPUが遅すぎるのか、SX-Aurora TSUBASAがすごいのか、どちらなのでしょうか。

山本氏 SX-Aurora TSUBASAがめちゃくちゃ速いです。

永浜氏 トピック分類をGPUで処理するとデータの出し入れがボトルネックになります。SX-Aurora TSUBASAは多量のデータを同時に演算できるベクトル処理が可能なので、今回のように大量のデータを処理する用途と相性が良く、きれいに結果が出たのでしょう。

山本氏 実際、弊社でもGPUがボトルネックになっていると認識していたものの、スパコンは使いこなすのが大変という先入観がありました。しかしSX-Aurora TSUBASAは慣れ親しんだPythonを使えるので、抵抗感なく作業できました。その他に、手順書を見ながら私自身で各種設定やソフトウェアのインストールを完結できるなど、導入しやすさも印象的です。

永浜氏 全員がいきなり山本さんのようにサクサク進むわけではないし、ベクトルエンジンをうまく活用できるか不安に思う方もいるでしょう。そこはNECがプログラミングについてアドバイスしたり、有償にはなりますがお客様のプログラムを分析し、高速化や並列化を行うチューニングサービスをご提供したりするなどの技術支援を行っています。

山本氏 高速化に関するNECさんの取り組みポイントは他にもあります。NECさんはGitHubで機械学習の高速化ミドルウェア「Frovedis」を公開しており、サンプルコードも充実しています。既にあるソースコードを少し変更すればSX-Aurora TSUBASAで高速化できると分かるので、検証を進められると思います。

永浜氏 大量のデータを高速に分散処理できるソフトウェア「Apache Spark」をSpark/Python Fremewaork「Frovedis」に変えてSX-Aurora TSUBASA上で実行するだけで、100倍以上の高速化を実現できる可能性もあります。また既存ソフトウェアの動作検証をして結果を公開している他、「このソースコードを変えればいい」といった調整を推奨するコンパイラも用意しています。

サトウ 単にスパコンだから速いというわけではなく、検証を進めるにはいろいろな工夫をしたわけですね。

山本氏 そうですね。何でもSX-Aurora TSUBASAで動かせば高速化できると思うのは避けたいです。実際、あるソースコードを実行しても大きな高速化につながらなかったことがあります。やはり得意な領域への適用こそが効果的です。

量子コンピューティング技術の導入も視野に 待っているのは「新しい出会い」

サトウ ここまでSX-Aurora TSUBASAの性能についてお伺いしました。少し話を戻しますが、永浜さんからヘテロジニアス環境を薦められていましたね。TTDCさんのシステム構成を教えてください。

山本氏 はい、いままでCPUで処理していた内容をSX-Aurora TSUBASAに置き換えつつ、GPUを使う高負荷処理はそのままGPUに任せています。SX-Aurora TSUBASAをコントローラーにして、苦手な処理をGPUに割り振る構成です。

永浜氏 とても効率的な使い方だと思います。TTDCさんのように適材適所でアクセラレータとして使うことがトレンドになると見込んでいます。例えばGPUは深層学習でSX-Aurora TSUBASAは統計的機械学習といった具合です。

サトウ 山本さんは今後のトレンドに先立って、SX-Aurora TSUBASAを取り入れたわけですが、実際に使ってみていかがでしたか。

山本氏 そうですね、計算時間を短縮できる選択肢が増えたことで、困ったときの手札が増えました。計算時間を短縮すればCPUの占有率が下がるので、別の作業にCPUを活用できます。実際に業務で使ってみると、効率的に時間を使えていると気付けるでしょう。

サトウ いまの環境はSX-Aurora TSUBASAとGPUを掛け合わせた構成ですが、将来的にアップデートする予定はありますか。

山本氏 SX-Aurora TSUBASAは、スパコンありきではなく手段を探す中で見つけたものです。今後はクラウドや量子コンピューティングなどと接続するのも面白いと考えています。量子コンピューティングの可能性はまだまだ発展途上なので、いまやらない手はないです。きっと処理を最適化するブレークスルーが起きるでしょう。

サトウ 量子コンピューティングまで見据えているとは! このあたりはNECさんが知見をお持ちですよね。

永浜氏 量子コンピューティングは2種類あり、いわゆる“夢の次世代コンピュータ”といわれる「量子ゲート方式」の実現はまだ先の話です。一方、「組合せ最適化問題」に特化して量子コンピューティング技術を活用するのが「量子アニーリング方式」です。

 実際の量子コンピュータを使った量子アニーリング方式の実用化は現在NECで開発中ですが、量子コンピュータと同じ振る舞いをSX-Aurora TSUBASA上で実現するシミュレーテッドアニーリング技術を「NEC Vector Annealing サービス」として提供しています。グループ会社のNECフィールディングでは、荷物の配送ルート計画の立案業務に量子アニーリング技術を活用して、2時間かかっていた立案業務を約12分に短縮する成果を上げました。

サトウ 量子コンピューティング技術も実用化段階にあり、そこでもSX-Aurora TSUBASAが活躍するのですね。最後に、こうした新しい技術を企業がうまく活用する秘訣(ひけつ)を教えてください。

永浜氏 スパコンはこれまで大学や研究機関で使うイメージでしたが、アイデアや工夫次第では一般企業でも活用場面がたくさんあります。ぜひ活用して、ビジネスの成長につなげていただければと思います。その際にNECにお声掛けいただければチャレンジをしっかりサポートします。

山本氏 実際にスパコンを使うと分かるのですが、新しい技術や人との出会いがたくさんありますよね。加えて自身や自社の新しい方向性も見えてきます。ひいては部門や企業のミッションにもビジョンにもつながるでしょうから、そこに期待していただきたいです。

サトウ 「38倍高速化」という話からかなり広がりました。スパコンはもちろん技術的な強みはありますが、それだけではない価値があるのですね。SX-Aurora TSUBASAをはじめスパコンに手が届くようになり、実際にビジネスにインパクトを与えている姿を取材できてとても興味深い機会でした。スパコンを活用してみたいという人はNECさんにお声掛けするのが良さそうです。本日はどうもありがとうございました。



Copyright © ITmedia, Inc. All Rights Reserved.


提供:日本電気株式会社
アイティメディア営業企画/制作:ITmedia NEWS編集部/掲載内容有効期限:2023年2月9日