「機械学習」には、「学習」と「推論」の2つのプロセスがあります。それぞれの役割を整理しつつ、ディープラーニングが機械学習にもたらした変化について併せて解説します。
いまさら聞けないITの最新トレンドやビジネス戦略を、体系的に整理して分かりやすく解説する連載です。「この用語、案外、分かっているようで分かっていないかも」「IT用語を現場の社員にもっと分かりやすく説明できるようになりたい」――。情シスの皆さんのこんな課題を解決します。
「機械学習」は、大量の学習データを機械に読み込ませ、そのデータを分析することで分類や識別のルールを作ろうというプログラム。そのプロセスは、「学習」と「推論」の2つに分けられます。
大量の学習データの統計的分布から、特徴の組み合せパターンを作り出すプロセスです。
例えば、学習データである「ネコ」「イヌ」「トリ」の画像から、それぞれに典型的な特徴の組合せパターン(=推論モデル)を作ります。
学習方式には、「ネコの画像」と「ネコであるという答え」といった「データとそれを説明する答え」の組み合せを学習データとして使う「教師あり学習」と、学習データだけを与える「教師なし学習」などがあります。
分類や識別をしたいデータを、「学習」で生成しておいた「推論モデル」に当てはめて、その結果を導くプロセスです。
例えば、未知の写真から、その特徴を抽出し、「推論モデル」にその特徴を照合します。そして、ネコの特徴の組み合せパターンから作られた推論モデルが、最もその特徴パターンに近いと判断すれば、「ネコ」という推論結果を出力します。
機械学習は、ディープラーニング(深層学習)と呼ばれるアルゴリズムの登場によって飛躍的な精度の向上を果たしました。
ディープラーニング以前は、画像を認識し、それを識別するために、どのような特徴なのか――例えば、「ネコ」であれば「目の配置」や「鼻の形」に着目して識別するように人間が設定しなければなりませんでした。この特徴の組み合せを「特徴量」といいます。
その上で、「ネコの画像」と「ネコであるという答え」をセットにした画像を大量に入力して、ネコの特徴の組み合せパターンを「推論モデル」として生成していました。
ディープラーニングでは、この特徴量を人間が設定するのではなく、データを分析することで自ら作り出すことができます。そのため、人間には気付かない、より際だった特徴を示す「特徴量」を見つけ出せるようになり、精度の高い分類や判別が可能になったのです。
日本IBMで営業として大手電気・電子製造業の顧客を担当。1995年に日本IBMを退職し、次代のITビジネス開発と人材育成を支援するネットコマースを設立。代表取締役に就任し、現在に至る。詳しいプロフィールはこちら。最新テクノロジーやビジネスの動向をまとめたプレゼンテーションデータをロイヤルティーフリーで提供する「ITビジネス・プレゼンテーション・ライブラリー/LiBRA」はこちら。
Copyright © ITmedia, Inc. All Rights Reserved.