ITmedia NEWS > 社会とIT >
ニュース
» 2019年04月04日 15時43分 公開

第3回 AI・人工知能EXPO:ディープラーニングの「教師ラベル不足」とNTTの解決策

応用範囲の広さから期待が集まるディープラーニングの技術だが、AIに読み込ませるための膨大な学習データが必要なため、ハードルが高いと考える人は多い。NTT研究所が、少ない学習データから効率的に学習できる技術を開発した。

[村上万純,ITmedia]

 ディープラーニング(深層学習)を活用する上でのネックとして「教師ラベル不足」がしばしば挙げられる。ディープラーニングの学習には教師ラベルが付いた大量のデータが必要で、このラベル付け作業には膨大な時間と手間がかかる。特に、専門性の高い分野ではこうしたデータを大量に集めるのはなかなか難しい。

 こうした課題を受け、NTT研究所は少ない学習データから効率的に学習できる「教師ラベル補正技術」を開発。この技術を応用した、AI(人工知能)で道路の陥没を未然に防ぐサービスを、NTTテクノクロスが「第3回 AI・人工知能EXPO」(4月3〜5日、東京ビッグサイト・青海展示棟)で参考展示している。

NTT NTTグループのブース

専門性の高い「道路の陥没」判定

 道路陥没の一因として挙げられるのが、地下にある配管の老朽化だ。配管が破損したりして水が地中に漏れることで周辺の地盤が削られ、陥没を引き起こす空洞が生じるという。国や自治体では、道路の下の空洞を検知して陥没を未然に防ぐ取り組みをしているが、これをAIでサポートする。

 空洞を調査するには、地表からレーダーを当てて取得した画像を専門家が目視で確認する必要がある。空洞があるかどうかの判定は熟練者でないと難しく、1日に調査できる道路の距離にも限界があるという。

NTT 地表からレーダーを当てて取得した路面下の空洞画像(データ提供:アイレック技建)

 この確認作業をAIで効率化。AIが地中画像データを解析し、空洞になっていそうな箇所を赤色に塗りつぶす。空洞の見逃しも防止する狙いだ。

 NTTテクノクロスの担当者は「例えば道路2キロ分の画像データを判定するには目視だと数日〜数十日かかることもあるが、AIを使えば40〜50分に短縮できる。現状、AIの認識精度は80%ほど」と説明する。

 AIの精度を上げるには、専門家が画像内のどこに空洞があるか印を付けて(正解ラベルの付与)、AIに読み込ませる必要がある。同社のメディアイノベーション事業部の松浦宣彦さん(第一ビジネスユニット 統括マネージャー、工学博士)は「学習用データを大量に用意するには、熟練した作業者が見つけた空洞箇所について、実際に道路を掘って正解だったかどうか確認する必要があり、膨大なコストがかかる」と話す。

 NTT研究所が開発した「教師ラベル補正技術」は、少ない教師データで効率的な学習を可能にする技術。正解ラベルが付与されたデータと、ラベルなしのデータを適切に組み合わせて学習させることで正解ラベルを“疑似的”に生成できるとしている。

 松浦さんは「例えば“サビ”がある箇所とそうでない箇所を画像内でラベル付けした場合、ラベルのない画像内でサビがありそうな箇所を自動的にラベル付けする」と話す。少量の正しい教師ラベルさえあれば、ラベルが不明な多数のデータに対して自動でラベル付けを行えるという。

 「実用化については検討中だが、AIがどれほど作業者の負担を軽減できるか引き続き検証していきたい」(松浦さん)

Copyright © ITmedia, Inc. All Rights Reserved.