サプライチェーンゲームにおける損失を人の判断と比べて4分の1に削減――自己競争で学習する日立の新AI技術

日立製作所は、人が用意した実績データに頼らずに、自己競争によって学習を行うAI技術を開発した。不確定要素の多いビジネスの問題に適用可能だという。

» 2017年12月27日 08時00分 公開
[金澤雅子ITmedia]

 日立製作所は2017年12月25日、ディープラーニングを用いた複数のAIから成るAI群が相互に自己競争することで最適解を追求する新しいAI技術を開発したと発表した。ビジネスを模したAI群がアウトカムを競う自己競争を行うことで、自律的に学習し、最良のアウトカムを追求するという。

Photo 複数のAI群による学習と自己競争

 このAI技術では、小売・卸売・仲卸・工場というサプライチェーンの各プロセスに相当する企業に見立てた複数のAI(AIエージェント)を相互接続した「AI群」でビジネスを構成。各AIエージェントは、ディープラーニングを用いて、置かれた状況を考慮しながら相互に情報のやりとりを繰り返し、損失低減などのアウトカムの向上に有効なアクションを学習していく。

 さらに、このAI群をコンピュータ上に複数生成し、各AI群の全体のアウトカムを競わせる「自己競争」を繰り返すことで、アウトカムの精度を向上するという。

 同技術は、AI群全体のアウトカムを向上させるため、AIエージェント間の学習を制御する学習管理機能と、AIエージェントの学習結果(モデル)の偏りをなくし、AIエージェントを進化させる技術を用いている。

 AIエージェント間の学習管理機能は、各AIエージェントの学習が相互に悪影響を与えることを防止するもの。各AIエージェントにおける学習のタイミングの制御を担い、学習の初期段階では1つのAIエージェントのみに学習させ、徐々に学習するAIエージェントの数を増やしていくことにより、AIエージェントが同時に学習する際に生じる競合を避け、AIエージェント同士の協調を学習させることができ、その結果、AI群のアウトカムの向上につながるという。

Photo AIエージェント同士の協調を学習させる学習管理機能

 AIエージェントを進化させる技術は、学習モデルを交叉させることでより優れたモデルを生成し、AIエージェントを進化させる。AIエージェントが何度も学習を繰り返すと、学習モデルに偏りが生じ、AI群のアウトカムが個別最適の状態に陥り、アウトカムの向上が停滞することがあるという。これを避けるため、AI群の間で、AIエージェント同士のモデルのパラメータを掛け合わせる(交叉させる)ことで、新たなモデルを持つAIエージェントを生成し、新たなAI群を構築する。その後、複数生成されたAI群のアウトカムを比較し、アウトカムが劣るAI群は消滅させ、アウトカムが優れるAI群を残す処理(自己競争)を繰り返す。これにより、アウトカムの向上を図る。

Photo AIエージェントを進化させる技術。AIエージェント同士のモデルのパラメータを交叉させることで、新たなモデルを持つAIエージェントを生成し、新たなAI群を構築する
Photo AI群による自己競争。複数生成されたAI群のアウトカムを比較し、アウトカムが劣るAI群は消滅させ、アウトカムが優れるAI群を残す処理を繰り返す

 同社は、この技術をサプライチェーン上のビジネスを模擬した「ビールゲーム」で検証したところ、人の経験に基づいた判断と比べて、在庫や欠品による損失を約4分の1に低減できることを確認した。この結果は、不確定要素の多いビジネスの問題についても、自己競争により学習するAIが有効であることを示しているという。

 日立は今後、このAI技術のソースコードを日立グループ内でグローバルに公開し、サービスや製品に組み込むことで、電力・エネルギー、産業・流通・水、アーバン、金融・公共・ヘルスケアなど、幅広い分野における事業に活用することを目指す。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ