国内外の企業がこぞってAI(人工知能)活用に取り組んでいる。特に注目されているのが、現在の“第3次AIブーム”のきっかけになった「ディープラーニング」(DL)技術だ。DLは膨大な学習データを何度も演算処理する必要があり、学習するための環境構築やシステム選びが非常に重要になってくる。
DLのシステムを使う上では、学習を高速化するだけでなく、いかに効率的に運用するかが重要である。実際、エンジニアがゼロからDLの学習環境を構築しようとすると、ソフトウェアのインストールやバージョン管理などに膨大な手間と時間が掛かってしまう。システム選定についても、大規模投資のリスクや運用管理の手間、障害発生時のトラブル対応など、経営者や情報システム部を悩ます課題は多い。
多くの企業にとって、DLはハードルが高い――こうした課題を解決すべく、富士通が提供しているのが「FUJITSU AI Zinraiディープラーニング システム」だ。
Zinraiディープラーニング システムは、同社のAIソリューション群「FUJITSU Human Centric AI Zinrai」の1つであるDL基盤。ハードウェアと汎用的なフレームワークやOSSなどの使い慣れたソフトウェア、さらに富士通独自の管理機能を垂直統合で提供することによって使いやすいDL環境を提供。動作検証済みのフレームワークを採用することで、余計なセットアップの手間なくすぐにDL開発に取り組めるのが特長だ。また日本全国にサポート拠点を構え、障害発生時には迅速に対応してくれる。
今回、このZinraiディープラーニング システムを、株式会社デコムのデータサイエンティストであり、ITmedia NEWSでAIの現状を伝える人気連載を持つ松本健太郎さん(R&D部門マネージャー)に体験してもらった。
TensorFlowやKerasといった機械学習ライブラリを触った経験がある松本さんは「DL開発のハードルが下がるのはうれしいですね」とZinraiディープラーニング システムに期待を寄せる。今回は、GPU割り当てなどの運用管理機能に加え、初心者向け「バッチ型学習」、経験者向け「対話型学習」の2種類の学習方法を体験してもらった。
Zinraiディープラーニング システムは、DLの学習と推論を行うためのシステム基盤。システム管理者向けの運用管理機能を備え、エンジニア向けには2種類の学習環境を用意している。
まずは、情シスに優しい「運用管理機能」を体験。システム管理者が各ユーザーに環境を割り当てることで、ユーザー間でのデータ共有や閲覧はできないようになっている。セキュアな環境が保たれるので、顧客データを使って学習する際も安心だ。
また、DLの学習に欠かせないGPUカードの割り当てもここで行う。GPUは最新の「NVIDIA Tesla V100」を採用。最大8枚導入でき、管理者が各ユーザーに割り当てることで、ユーザー同士でのリソースの奪い合いを防ぎ、効率的な運用を助ける。松本さんは「基本的にGPUリソースは奪い合いだと思っていたので、管理者が割り当ててくれるなら安心です」と笑顔を見せる。
これらの設定は、基本的にプルダウンメニューから選択する形で、難しい操作は必要ない。
「操作がシンプルで簡単なのが良いですね。また、データ分析ではデータをいただく顧客から常にセキュリティの心配をされます。これなら情シスの負担も軽くなって助かるでしょう」(松本さん)
GPUは1枚から選択可能で、システム導入後は利用者や学習量の増加に合わせて段階的な拡張が可能だ。大規模なシステム導入では過剰投資のリスクがつきものだが、これならプロジェクト開始時点などでもスモールスタートで取り組める。
従来、DL学習環境の構築には、OSやプログラミング言語、フレームワーク(DLに必要な機能を組み合わせたソフトウェア群)など、各種ソフトウェアのインストールに加え、これらのソフトのバージョン合わせの作業が必要だった。
Zinraiディープラーニング システムは、動作検証済みの学習環境を提供することで、これらに掛かっていた時間や手間を大幅に削減。開発者たちが、本来時間を割くべき学習や推論に集中するのを助けてくれる。
松本さんは「企業でDLをやろうとするときは、大抵システム導入の入り口でつまずいてしまいます。環境構築をエンジニアが手作業でするのはすごく面倒で、企業によっては数日〜1週間掛かる場合もあるでしょう。それがこんなに簡単にできるんだと驚いています」と感心する。
では実際に学習に取り組んでみよう。まずは、全データをまとめて学習する手法であるバッチ型学習から。誰でも簡単に操作できるGUI(グラフィカルユーザーインタフェース)を採用し、コードを書けない初心者でも各種操作を行えるのが特長だ。DLのフレームワークには、今回は画像処理で使われる「Caffe」を使用した。
初心者に優しい使い勝手を実現しつつ、より高い精度を求めたい人向けに、ユーザー自身がコードを記述できる機能も用意。学習結果を「ワーキングセット」という単位で一元管理し、タスク管理を容易にしているのも魅力の1つだ。
Caffeで、手書き文字認識の学習を体験した松本さんは、次のように語る。
「認識結果の画像が一覧できて、単純に便利ですよね。アウトプットを出した後は手を止めて考える時間も多いのですが、結果の画面が見やすいのはうれしい」
使い慣れたフレームワークが、富士通独自の管理ソフトによってさらに使いやすくなっていることにも注目したい。
また、DLでは精度の高いモデルを構築するため、学習率や重み、バッチ数、ネットワーク層のニューロン数などの「ハイパーパラメータ」の調整が欠かせない。これらはエンジニアの経験に基づく試行錯誤を伴ってきたが、バッチ型学習ではネットワークモデル各層のニューロン数を自動調整する富士通独自の「ニューラルネットワーク最適化技術」を実装。経験の少ないユーザーでも効率的に最適値を求められるようサポートする。
「これらの作業を1つ1つ行うのは大変なので、それを省けるのはいいですね。一方でボタン1つで最適化されてしまうのもそれはそれで不便なので、分析してからどれを選ぶかリストで確認できるのはありがたい」(松本さん)
利用者が必要なソフトウェアを自由にセットアップできる対話型学習は、CLI(コマンドラインインタフェース)を採用。GPUを割り当てたDockerコンテナ(システム仮想化技術の1つ)上でPythonを書き込むツールである「Jupyter Notebooks」を起動し、学習や推論を行う。カスタマイズの幅が広く、GPUを専有することで効率的な運用を見込める。
また、これまでのDL研究では難しいとされてきた「時系列データ」も取り扱える。ここでは、データの「形」に着目する「トポロジカルデータ解析」とDLを組み合わせる独自の手法を採用している。
松本さんは「時系列データの分析は難しいですよね。論文などを読んでも自分の環境でそれを再現できるのかと疑問に思っていましたが、こうした精度の高い学習環境が標準実装されているのはありがたい。自分がいかに煩雑な作業をしていたのか気付かされました」と驚きを見せる。
さらに「時系列データを扱うDLの手法はほとんど選択肢がなかったので、単純にその幅が広がることがうれしい。従来難しいと思われていたものが簡単にできるのなら、積極的に使いたいと思う人も多いでしょう」と続けた。
松本さんは、Zinraiディープラーニング システムが初心者でも使いやすい点に注目。コーディングが不要なGUIの採用で、エンジニア以外のユーザーにも活用シーンが広がるのではないかと期待を寄せる。
「例えば、営業や経理など現場の人にとりあえず1回触ってみてもらったら、新しいデータの利用アイデアが生まれるかもしれません。現場の知識がある人が触れることによって、アプリケーションやサービス開発に生かされる可能性にも期待しています」(松本さん)
そして、Zinraiディープラーニング システムによって煩わしい作業から解放され、分析に集中する時間が確保できることをあらためて強調する。松本さんは「ソフトのバージョンの整合性チェックにしろ、ほとんどは細かい話なのですが、結局そうした手間が省かれることが大事なんですよね。こうした手間を大幅に省略することで、本来時間を割くべき分析に集中できますからね」と笑顔で語った。
Copyright © ITmedia, Inc. All Rights Reserved.
提供:富士通株式会社
アイティメディア営業企画/制作:ITmedia NEWS編集部/掲載内容有効期限:2019年2月21日