NEC、従来の半分のデータ量で精度良く学習するディープラーニング技術を開発

元データの種類を問わないため、画像や音声などさまざまなデータに対し適用できるとしている。

[ITmedia] PC用表示関連情報

LINE

Hatena

　NECは8月19日、従来の半分の学習データ量で高い識別精度を維持できるディープラーニング技術を発表した。元データの種類を問わないため、画像や音声などさまざまなデータに対し適用できるとしている。

NECが開発したディープラーニング技術の概要

　ディープラーニングには、元データを示す「入力層」と回答を示す「出力層」の間に、元データの特徴を抽出する「中間層」が複数ある。NECが開発した技術では、中間層の特徴量を意図的に変化させ、識別が難しいデータを集中的に生成して識別精度を高めている。

　同社によると、文字認識や物体認識の標準的なデータセットに対し同技術を適用したところ、従来の半分の学習データ量で従来と同等の精度を実現できたという。

従来の半分の学習データ量で従来と同等の精度を実現できたという

　一般的にディープラーニングの識別精度を高めるには、識別が難しいデータを多く学習することが有効とされている。従来は学習用の画像データを意図的に加工、変形させてデータ量を増やす「データ拡張」という手法を使っていたが、十分な学習効果が得られていなかったという。

　また、従来の手法ではデータの種類ごとにデータ生成方法を変える必要があり、学習に悪影響を及ぼすデータが発生しないよう専門家が調整する必要があった。

　NECが提案する手法では、元のデータセットに手を加えないことから、データセットの種類に応じた専門家の調整も不要になるとしている。