ITmedia NEWS > 科学・テクノロジー >
ニュース
» 2019年08月02日 18時42分 公開

東芝、大量欠損データから高精度な回帰モデルを作るアルゴリズム開発 製造工程の品質向上に

東芝と情報・システム研究機構 統計数理研究所は、欠損値の多い数値データから高精度な回帰モデルを作る機械学習アルゴリズムを開発した。工場での品質低下や歩留まり悪化の要因分析などに役立てる。

[ITmedia]

 東芝は8月2日、情報・システム研究機構 統計数理研究所とともに、欠損値の多い数値データから高精度な回帰モデルを作る機械学習アルゴリズム「HMLasso」を開発したと発表した。工場での品質低下や歩留まり悪化の要因分析などに役立てる。

欠損値の多い数値データから高精度な回帰モデルを作る機械学習アルゴリズム「HMLasso」

 欠損値のある数値データから要因分析をする際、従来は欠損値を補完して回帰モデルを作る手法と、欠損値を補完しないままモデル化する手法の「CoCoLasso」があるという。

 東芝のHMLassoはCoCoLassoを改良したもの。あらかじめ計測しておいた欠損率を数式に入れることで、高い欠損率でも高精度かつ高速に回帰モデルを作成できる。欠損率の高いデータでは、CoCoLassoに比べて推定誤差を約41%小さくできるとしている。

 東芝は、統計数理研究所と同アルゴリズムを解析し、実測値だけでなく、理論的にもCoCoLassoより誤差を少なく計算できることを証明したという。

 同社は「工場のほか、さまざまな分野の課題への適用検証を進めていきたい」としている。

 研究成果の詳細は、8月10日から7日間開催される国際人工知能会議(IJCAI)で発表する。また、同アルゴリズムの簡易版をR言語のオープンソースパッケージとして近く公開するという。

Copyright © ITmedia, Inc. All Rights Reserved.