AIの産業利用が叫ばれて久しい。しかし、企業がAI導入による業務の最適化や加速を検討する中で、AIモデルを構築できるデータサイエンティストの数が不足しているという現状がある。政府はAI人材の育成を急いでいるが、2020年の先端IT人材は需要に対し、約4.8万人の不足になるという(経済産業省「平成28年 IT人材の最新動向と将来推計に関する調査結果」)。
AIの導入が企業の明暗を分けるとすれば、データサイエンティストの争奪戦となるのは言うまでもない。だが、適切な人材を確保できたとしても、AIの実用化まで道のりは長い。精度の高いAIモデルを作るには、モデル自体の選択やパラメータの調整が必要で、データ規模によっては年単位の時間がかかってしまうからだ。
こうした険しい道のりすらも、AIで解決しようというソリューションが近年出てきている。つまり、作業者は整形したデータを用意するだけでいい。後はデータを読み込ませ、行いたいことをマウスで数クリックするだけで、高精度なAIモデルが自動的に生成されるというものだ。しかも、人が1年以上かけて構築したAIモデルと同等かそれ以上の精度を、たった数分〜数時間で生成してしまうという。
この「AIモデラー」は、2018年ごろから数社が開発し提供を始めている。中でも注目されているツールの一つが、米SparkCognitionのAIモデラーだ。同社は13年設立のAIベンチャーで、ボーイングやベライゾンが出資するなど、大企業から有望視されている。
同社のAIモデラーの日本総代理店には日立ハイテクソリューションズが名乗りを上げた。すでに販売を開始しており、10月に行われる「人工知能/ビジネスAI 2019」や「Japan IT Week 秋」などの展示会に出展予定だ。
SparkCognitionのAIモデラーは、データサイエンスの主要プロセスである「データ加工」や「特徴抽出」「AIモデル構築」を自動化するツールだ。
AIモデルには、「回帰」「分類」などの「教師あり学習」に加え、顧客セグメンテーションなどに用いられる「教師なし学習」や、装置の故障検知などに用いられる「半教師あり学習」など、さまざまなタイプがある。SparkCognitionのAIモデラーはこれら全てを1つのツールでカバーできるのが強みだ。
人間がAIモデルを作成する従来の手法では、1つの問題解決に数カ月から数年を要することが大きな課題となっているが、本AIモデラーであれば数時間〜数日にまで短縮できる。
そのため、企業側は問題定義とデータ準備に注力でき、AIモデルの調整ばかりに費やしていたリソース問題を解決できる。また操作は数クリックでよく、データサイエンティストとしての知識はほとんど不要で、CSVを整形できればいい。
日立ハイテクソリューションズ AIビジネス開発グループで本AIモデラーを担当する落合響子さんは、「操作する人は、データを用いて何を解析したいのか、分析の目的を明確にできれば大丈夫。あとはデータを用意してクラウドにアップロードし、マウスでクリックしていくだけ」と説明する。
いうなれば、必要なデータさえ準備できれば高速で高精度なAIモデルが完成するソリューションなのだが、仕組みが面白い。
本AIモデラーのコアは「Neuroevolution」(ニューロエボリューション)というSparkCognitionの特許技術で、ディープラーニングと独自アルゴリズムを組み合わせたものだ。準備されたデータに基づき、一定数のモデルを第1世代で構築し、そこでモデル同士で競わせ、もっとも優れたモデルを第2世代として採用。そこから再び異なるモデルを一定数構築……というサイクルを、すべて自動かつ高速で行う。
Neuro“evolution”という名称は、生物の「進化」のようなステップを踏んでAIモデルの精度を上げる様子にちなんでいる。
19年8月時点では、10分で約160世代まで進めることができるため、短時間でも精度の高いAIモデルが生成される。10分という短時間にもかかわらず、精度は約95%を超えるケースも多いという。
そこからさらに時間をかければ精度が上がるのかというのはケースバイケースで、どちらかといえば、時間よりもデータを追加して精度を高めていくほうがいいようだ。
SparkCognitionのAIモデラーの強みはまだある。総務省による「ICTによるイノベーションと新たなエコノミー形成に関する調査研究」では、「AIの導入に当たっての課題」の中で、「AIの処理プロセスを対外的に説明できない」ということを挙げている。本AIモデラーはこの問題もクリアし、いわゆる「説明できるAI」を実現している。
本AIモデラーは「モデルの可視化」にも対応している。データ間の関係が可視化されるため、出力に対する元データの影響度合いなどが分かるだけでなく、可視化データから得られた知見を基に別のAIモデルの生成も検討できる。このため、従来一つのAIモデルの調整に忙殺されていたデータサイエンティストはより高度な作業に専念できることになる。
日立ハイテクソリューションズは、「データサイエンティストからは優れた補助ツールとして受け入れられるだろう」と自信をもっている。
すでに、国内半導体メーカーでの導入事例もある。製造過程の歩留まり改善のAIモデル構築を目的としたもので、センサーが得たデータから品質を予測することが狙いだ。
製造過程のセンサー数は約800。この膨大な数のパラメータに対し、約1年をかけてデータサイエンティストらが調整したAIモデルと、SparkCognitionの AIモデラーが1日で生成したAIモデルとで、ほぼ同等の結果が得られた。
モデルの可視化の部分では、どの装置のどのセンサーのパラメータが影響しているかが分かり、センサー数を800から400に減らしても問題がないことも判明した。
海外では、自動車メーカーの部品製造ラインでの不良品判定に利用されたケースもある。
いくつか製造業の事例を取り上げたが、時系列データや多変量データにも柔軟性があり、「説明できるAI」を高速・高精度に生成できるという特長があるため、AIモデラーは金融や通信、流通・小売といった方面でも採用が進んでいる。
海外では大手金融機関や通信会社で、見込み客や離脱客を予測することに用いられているほか、カスタマーサポートの応答フローにも採用されている。
カスタマーサポートの事例では、質問内容を数値化しCSVデータにすることでAIモデラーがモデルを生成。質問に対し、24個ある部門の中から最適な部門へ振り分けるために使用されている。
日立ハイテクソリューションズでは、SparkCognitionのAIモデラーを3つの形態で提供する。SparkCognitionによるクラウド版での提供や、顧客サイドに環境を構築するオンプレミス版での提供に加え、日立ハイテクソリューションズが提供するプライベートクラウド「ayamo」上でも提供する。導入や運用に関するさまざまなニーズに応えられるメニューを用意した。
同社のプライベートクラウド環境をオプションとして提供することで、セキュリティ性を重視しながらクラウドを利用したいという企業ニーズに応える考えだ。
日立ハイテクソリューションズは、AIモデラーによる自動化・効率化で、会社内部のデータサイエンティストがより高度な作業へリソースを割り振れることを強調している。モデル生成までの試行錯誤の部分をAIモデラーが担ってくれるからだ。
同社がSparkCognitionのAIモデラーの代理店となった理由の中には、同社自身が業務の中で感じてきた課題があったという。他社からAIモデルの作成依頼を受ける場合、機密性の観点からデータラベルの提供がないことが多い。時間をかけて作成したモデルの出力結果をみても、意図したものになっているのか検証・調整にさらなる時間がかかり、顧客の抱える多くの課題に対し、タイムリーに解決策を提示することが難しいという課題があった。こうした現場の課題に対応できるツールを探す中で、SparkCognitionのAIモデラーに出会ったという。
AI導入の流れは止まらない。SparkCognitionのAIモデラーに限らず、AIモデラーはこれから多くの企業で導入され、各企業のAI実用化に貢献していくだろう。
AIを専門とするデータサイエンティストを抱えなくても、あらゆる分野で誰もが簡単にAIを活用できる時代はすぐそこに迫っている。
Copyright © ITmedia, Inc. All Rights Reserved.
提供:日立ハイテクソリューションズ
アイティメディア営業企画/制作:ITmedia NEWS編集部/掲載内容有効期限:2019年9月22日