Special
» 2019年07月18日 10時00分 公開

機械学習専用サーバは何が違う? ”データ”を価値に変えるインフラの選び方

[PR/ITmedia]
PR

 デジタルトランスフォーメーション(DX)というキーワードと共に、企業・組織のIT活用は新しい局面を迎えている。ポイントは「データの活用」だ。データを“資産”と捉え、意思決定やプロダクト開発にうまく生かせるかが重要になってくる。

 もちろん、データを保有しているだけでビジネス改革が進むわけではない。いまはビッグデータを分析するためのAI(人工知能)技術に注目が集まっているが、多くの企業はAIを有効活用できていないのが現状だ。

 その理由は、「AIが分かる人材がいない」「データ分析を行う組織体制ができていない」などさまざまだ。経営層が思いつきで「今日から我が社でもAIをやるぞ」と言っても、現場はどこから手を付けていいのか分からないだろう。

「AIは経営課題」 トップダウンで推進を

 そんなとき、どうすればいいのか。社内でAI人材を育成したり、即戦力の人材を採用したりする方法もあるが、これらは社内にある程度のノウハウがたまっていることが前提になる。自社だけでどうにもならないときは、AI導入と活用を支援してくれるパートナーを頼るのも手だ。データの活用方法はもちろん、分析プラットフォームの構築、データサイエンティストの育成など、幅広い悩みに応えてくれるベンダーがいると心強い。

 PCやサーバ製品などで知られるDell Technologiesも、企業のAI活用を支えるベンダーの1つだ。インフラ面はもちろん、コンサルティングや人材育成、運用ツールの提供などをワンストップでサポート。金融、生命科学、農業、建設など幅広い分野で、世界中の企業を支援してきた実績がある。

Dell Technologies(デル株式会社)の増月孝信氏(インフラストラクチャ・ソリューション事業統括 ソリューション本部 シニアビジネス開発マネージャー)

 Dell Technologies(デル株式会社)の増月孝信氏(インフラストラクチャ・ソリューション事業統括 ソリューション本部 シニアビジネス開発マネージャー)は、「AIの必要性を感じているものの、具体的な課題を把握できていない企業は多いです。Dell Technologiesはハードウェアビジネスに投資している会社ですが、データ活用の経験も豊富なので、幅広い顧客のニーズに応えられます」と自信を見せる。

 多くの企業のAI導入をサポートしてきた増月氏は、AIプロジェクトの工程は大きく5ステップに分けられると話す。

 それは、(1)戦略と計画の策定、(2)データ分析に関わる現状の把握、(3)ユースケースの定義、(4)ロードマップの策定、(5)これらのプロセス管理の策定――という工程だ。まずは、何のためにAIを使うのかビジョンを明確にする必要があるが、増月氏は「ユースケースの定義が意外と見落とされがち」だと指摘する。ここが不明瞭だと具体的なゴールを決められない。どの事業にAIを適用するかを決めるのはユーザー企業自身なので、丁寧な議論を重ねる必要があるという。

デジタルトランスフォーメーションのステップ

 また、新規でAIプロジェクトを立ち上げるには、お金も時間もかかる。これを成功に導くには、経営者がAI活用を経営課題として認識し、トップダウンでプロジェクトを推進する必要があるとしている。

 「Dell Technologiesは、分析とAIの分野でも経験を積んでおり、会社として幅広い知見と技術を持っています。ビジネス戦略からディスカッションすることで、最適な技術を提案できるでしょう」(増月氏)

AIに最適化された分析基盤のメリット

 ビジネス面の議論が終わった後は、技術面の課題解決に進む。Dell Technologiesでは、企業がスムーズにAIを導入できるよう、環境構築済みのAIインフラを提供するサービス「Ready Solutions for AI」を提供している。Dell TechnologiesのAI技術に関する知見と経験が生かされており、データサイエンティストがすぐに分析を始められるよう、必要なソフトウェアの設定やデータ投入環境の準備などの煩雑な作業を自動化した。設定の手間が省けるので、データサイエンティストは分析業務に集中できる。

 Ready Solutions for AIでは、用途に合わせて2つのモデルを用意した。「Deep Learning with NVIDIA」は、AI分野で定評のあるNVIDIAのGPU「Tesla V100」を搭載したPowerEdgeサーバとIsilonストレージをベースにしている小型筐体で、AIモデル開発の現場などに手早く導入できる。

「Deep Learning with NVIDIA」

 もう一つの「Machine Learning with Hadoop」は、Hadoop基盤とIntel Xeonプロセッサをベースに、高度かつセキュアなAI環境を提供するもの。サービス基盤としての活躍も期待できる。

「Machine Learning with Hadoop」
Dell Technologies(デル株式会社)の岡野家和氏(ISG事業統括 製品本部 シニア プロダクトマネージャー)

 Dell Technologies(デル株式会社)の岡野家和氏(ISG事業統括 製品本部 シニア プロダクトマネージャー)は、「両方のデータ分析基盤をハイブリッドな構成で活用している企業もいます。例えば、膨大なデータをセキュアに処理しないといけないクレジットカード業界などで採用されています」と述べる。

 Ready Solutions for AIでは、データサイエンティストの育成を含め、企業のAI活用をトータルで支援するコンサルティングも行う。システムのサポートも一元的に受けられるので、実際にサーバなどを導入する情報システム部門にとっても魅力的だろう。

AIで成功するには? サーバ選びのポイント

 いざ本格的なAI導入を進めるとなると、幅広い領域で環境を整える必要があることに気付かされる。特にプラットフォームは、予算や目的に合わせて最適なものを選びたい。Dell Technologiesは多様なニーズに応えるべく豊富なポートフォリオをそろえているが、今回は特に中核的な役割を担うサーバ選びに注目したい。

 「PowerEdge C4140」は、Ready Solutions for AI Deep Learning with NVIDIAの計算ノードとして採用されるサーバ。1U(ユニット)サイズの筐体に4基のGPUを搭載できる、機械学習とディープラーニングに最適化された“超”高密度な筐体だ。

「PowerEdge C4140」

 GPUにはNVIDIAの「Tesla V100」を採用。V100にはNVIDIA独自の「NVLink」対応のタイプと業界標準のPCI Expressモジュールがあるが、C4140では両方のモデルがあってどちらかを選択できる。NVLinkはPCI Expressよりも高速なGPU間接続を実現するが、その分コストと消費電力は高い。ユーザー企業は、自社の事情に合わせて構成を選べる。

 C4140ではさらに、GPU−CPU間の接続方法(トポロジー)も選択可能。AI・機械学習のアプリケーションは、CPUやGPUの使い方がそれぞれ異なるという特性がある。最適なトポロジーを選択することで、パフォーマンスを最高の状態に保てるというわけだ。

 機械学習用サーバで重要な冷却・廃熱設計にもこだわった。C4140は、フロントの吸気口直下にGPUが並ぶ構成で、効率よく本体を冷却できるようになっている。

 岡野氏は「AI基盤にとって、発熱と消費電力は非常に大きな問題。こうした細かな工夫をすることで、GPUの演算能力を引き出しているのです。他の製品群と同じくDell Technologiesの自社設計で、当社の知見が最大限に生かされている部分でもあります」と説明する。

 もう一つの注目マシンは「Dell EMC DSS 8440」だ。極めてハイパフォーマンスな要件に応えるべく、4Uサイズの筐体に最大で10基の「Tesla V100」GPUを搭載できるようにした。また、2019年後半の登場が期待されている英GraphcoreのIPU(Intelligent Processing Unit)ベースのアクセラレーターも、最大で8基搭載するという。IPUとはAI専用プロセッサで、GPUと比べディープラーニングで約100倍の推論性能を示すデータもあるという。

「Dell EMC DSS 8440」

 C4140と同様に、10基のGPUをフロントの吸気口側に並べることで、効率的な冷却を実現。室温35度の動作環境でTesla V100を10基とTDP 250WのXeon プロセッサをフル稼働する。最大処理性能は1120テラフロップスに達するという。

 また、DSS 8440は内部にデータを保有して稼働させることを前提に設計しており、ストレージは最大10基のNVMe SSD、SAS/SATAドライブを搭載できる。最大8基のPCI Express x16スロットを活用し、ネットワーク環境を強化することも可能だ。

 筐体サイズにもこだわりがある。DSS 8440は、日本でスタンダードな奥行き1000〜1100ミリのサーバラックに収まるよう、筐体の奥行きを865ミリに抑えた。

 岡野氏は「4UサイズのGPUサーバは奥行き1000ミリを超えるものが大半ですが、それは欧米基準の設計なので、日本のサーバラック環境には適しません。DSS 8440は、GPUとNVMe SSDの搭載数、PCIe x16スロットの数でいずれも他社製品にない価値を提供しており、これほど高密度で高性能なサーバは他にないと自負しています」と胸を張る。

AIは“総合力”で勝負

 AIへの取り組みを成功させる道筋は、決して1つではない。企業が抱える課題や目的、事業の特性などに合わせて、多様なアプローチが考えられる。データ分析の環境ひとつとっても、オンプレミスにするかクラウドにするか、もしくはエッジ側で処理するかという選択肢がある。

 「前提として、われわれはクラウドに対して否定的な考え方ではありません。データ分析環境は適材適所で、今後はオンプレとクラウドのハイブリッド環境で物事が進むと思っています。中長期的な視点で全体のシステムを考えないといけないんです」(増月氏)

 特にインフラ面で課題を抱えている企業にとっては、サーバ事業で豊富な知見を持つDell Technologiesは心強いのではないだろうか。

Copyright © ITmedia, Inc. All Rights Reserved.


提供:デル株式会社
アイティメディア営業企画/制作:ITmedia NEWS編集部/掲載内容有効期限:2019年8月12日