NECは8月19日、従来の半分の学習データ量で高い識別精度を維持できるディープラーニング技術を発表した。元データの種類を問わないため、画像や音声などさまざまなデータに対し適用できるとしている。
ディープラーニングには、元データを示す「入力層」と回答を示す「出力層」の間に、元データの特徴を抽出する「中間層」が複数ある。NECが開発した技術では、中間層の特徴量を意図的に変化させ、識別が難しいデータを集中的に生成して識別精度を高めている。
同社によると、文字認識や物体認識の標準的なデータセットに対し同技術を適用したところ、従来の半分の学習データ量で従来と同等の精度を実現できたという。
一般的にディープラーニングの識別精度を高めるには、識別が難しいデータを多く学習することが有効とされている。従来は学習用の画像データを意図的に加工、変形させてデータ量を増やす「データ拡張」という手法を使っていたが、十分な学習効果が得られていなかったという。
また、従来の手法ではデータの種類ごとにデータ生成方法を変える必要があり、学習に悪影響を及ぼすデータが発生しないよう専門家が調整する必要があった。
NECが提案する手法では、元のデータセットに手を加えないことから、データセットの種類に応じた専門家の調整も不要になるとしている。
関連記事
- 文系記者が「データサイエンティスト育成スクール」に通った結果
AI担当の記者が「データサイエンティスト育成スクール」に半年間の体験取材。未経験の文系記者はデータサイエンティストになれるのか。 - 「量子理論の副産物に過ぎなかった」──東芝の「量子コンピュータより速いアルゴリズム」誕生秘話
量子コンピュータよりも速い「シミュレーテッド分岐アルゴリズム」を開発した後藤隼人主任研究員に、開発背景を聞いた。 - 「海外は量子アニーリングに見切り」──ハードもソフトも開発する量子ベンチャー「MDR」に聞いた「量子コンピュータの今」
世界有数の競争力を持つ日本の量子コンピュータのベンチャー企業MDRを立ち上げた湊雄一郎さんに「量子コンピュータの今」を聞く。 - 「世界最速・最大規模」──東芝、量子コンピュータより高速に組み合わせ最適化問題を計算するアルゴリズムを開発
東芝が、組み合わせ最適化問題を従来のコンピュータで、量子コンピュータより高速に解けるアルゴリズムを開発した。同アルゴリズムを活用したサービスプラットフォームの19年中の事業化を目指す。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.