ITmedia NEWS > 科学・テクノロジー >

東芝、大量欠損データから高精度な回帰モデルを作るアルゴリズム開発 製造工程の品質向上に

» 2019年08月02日 18時42分 公開
[ITmedia]

 東芝は8月2日、情報・システム研究機構 統計数理研究所とともに、欠損値の多い数値データから高精度な回帰モデルを作る機械学習アルゴリズム「HMLasso」を開発したと発表した。工場での品質低下や歩留まり悪化の要因分析などに役立てる。

欠損値の多い数値データから高精度な回帰モデルを作る機械学習アルゴリズム「HMLasso」

 欠損値のある数値データから要因分析をする際、従来は欠損値を補完して回帰モデルを作る手法と、欠損値を補完しないままモデル化する手法の「CoCoLasso」があるという。

 東芝のHMLassoはCoCoLassoを改良したもの。あらかじめ計測しておいた欠損率を数式に入れることで、高い欠損率でも高精度かつ高速に回帰モデルを作成できる。欠損率の高いデータでは、CoCoLassoに比べて推定誤差を約41%小さくできるとしている。

 東芝は、統計数理研究所と同アルゴリズムを解析し、実測値だけでなく、理論的にもCoCoLassoより誤差を少なく計算できることを証明したという。

 同社は「工場のほか、さまざまな分野の課題への適用検証を進めていきたい」としている。

 研究成果の詳細は、8月10日から7日間開催される国際人工知能会議(IJCAI)で発表する。また、同アルゴリズムの簡易版をR言語のオープンソースパッケージとして近く公開するという。

Copyright © ITmedia, Inc. All Rights Reserved.