最近よく耳にするようになった「機械学習」という言葉。ビジネスで活用するには機械学習でできることとその限界を理解しておく必要があるだろう。
前回記事では、機械学習には大きく分けて「教師あり学習」「教師なし学習」「強化学習」の3種類が存在することを解説した。今回はこの3つについて、もう少し詳しく整理してみたい。
いまや毎日のようにAI(人工知能)の話題が飛び交っている。しかし、どれほどの人がAIについて正しく理解し、他人に説明できるほどの知識を持っているだろうか。本連載では「AIとは何か」といった根本的な問いから最新のAI活用事例まで、主にビジネスパーソン向けに“いまさら聞けないAIに関する話”を解説していく。
(編集:ITmedia村上)
人間でも、何の手掛かりもなしに学習することは不可能だ。ちょうどいま皆さんがしているように、何らかの解説記事や参考書を読んで、そこに書かれている内容を覚えて知識にする場合もあれば、英会話の授業のように、教師のまねをして発音や表現を身に付けていく場合もあるだろう。
AIの場合、前者のアプローチに近いのが、第2回の記事で触れた「エキスパートシステム」だ。つまり事前にルールを整理しておき、AIがそれに従って判断するようにプログラムを組むわけである。
そして後者のアプローチに近いのが「機械学習」である。参考になるデータと、そこから知識を導き出すやり方(アルゴリズム)を用意して、あとは機械に何らかの判断を行うための知識(モデル)を構築させるのである。
この場合にどのようなデータを与えるか、またどのようなアルゴリズムで処理させるかによって、同じ機械学習でもいくつかに細分化される。その整理法の1つが、「教師あり学習」「教師なし学習」「強化学習」の3つに分ける方法だ。
教師あり学習の場合、あらかじめ質問とその答えになるデータが与えられる。前回の記事でも例として挙げたが、クレジットカード使用履歴のような大量の金融取引データを用意し、記録されている個々のトランザクションを「正しい取引」「不正な取引」に分類(つまり機械が参考にできる「教師データ」を与える)した上で、「あるトランザクションが不正かどうかを判断しろ」と命じるといった具合だ。
このような教師データが得られる場合に、どのようなアルゴリズムを採用すれば目標を達成できるのか。教師あり学習に限った話ではないが、機械学習を使ったアプリケーションの構築では、そうした判断を通じてデータとアルゴリズムの用意を進める。時には使いたいアルゴリズムに応じたデータを用意することもあるだろう。
教師あり学習で使われるアルゴリズムの単純な例として、線形回帰を挙げよう。Excelを使って簡単な売上分析などをしたことがある人なら、おなじみの話のはずだ。
例えばある店舗における過去のアイスの売上データと、周辺地域の気温データがそろっていれば、これを「教師データ」として、「ある気温のときにアイスが何個売れそうか」を判断するモデルを線形回帰で構築することができる(しかもExcelの機能を使えば数クリックで済む)。気温はアイスの売上を左右する重要な変数で、その変化に応じてアイスの売上という結果も一定のパターンに沿って変化すると期待できるからだ。
しかし「こんなのAIじゃない」と思われたかもしれない。確かに私たちが「人工知能」という言葉から連想するものとは程遠いが、「教師あり学習」さらには「機械学習」という分類には、回帰分析も十分当てはまる。一口に機械学習といっても、その中身は千差万別であるということを覚えておこう。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR