ITmedia NEWS > 社会とIT >

未経験から“AI人材”に データサイエンティストが伝える「機械学習を学ぶ意味」(2/5 ページ)

» 2020年05月01日 07時00分 公開
[堅田洋資ITmedia]

AIができることは主に3つ

 このようにAI・機械学習のできることは、限られているともいえます。AI・機械学習ができることは、主に次の3つがあります。

(1)分類

(2)回帰

(3)クラスタリング

 まずは(1)の「分類」の例。人事業務について、退職しそうな従業員を早めに特定して退職を食い止めたい、という課題があったとします。勤怠データや人事評価データ、アンケートなどをインプットします。答えとなるデータは「退職する」「退職しない」の2値です。これらのインプットと答えのデータを機械学習アルゴリズムに学習させると、従業員ごとの退職確率のスコアを予測値として出力できるようになります(精度はともかく)。この出力されるスコアが一定の値以上であれば「退職する」、未満であれば「退職しない」といった具合に2値の分類ができます。複数カテゴリがあっても同じ仕組みです。このように、AI・機械学習では、2値、もしくは多値の分類をすることができます。

 (2)の「回帰」について話を進めましょう。チケットの売上を上げたいスポーツチームがあったとします。この課題を解決するため、チケット価格や、予約状況、天候のデータなどをインプットデータ、チケット販売数を答えのデータとして準備します。このインプットと答えのデータを機械学習アルゴリズムに学習させます。すると、チケット価格が1000円で、予約状況は20%、天候は晴れで気温20度、対戦チームはXチームといったインプットのデータを入れることで、チケット販売数の予測値を出力してくれるわけです。

 この学習済みの変換器を使えば、価格を動かしたときにどのくらいの入場者数になるかをシミュレーションできます。そうすれば、最も売上が大きくなるチケット価格を導き出せます。この例のどの部分が「回帰」なのかというと、チケット販売数を予測する部分です。回帰というのはチケット販売数のように数値の予測のことをいいます。

 (3)の「クラスタリング」は言い換えると自動グルーピングです。例として、旅行サイトの運営者が顧客に合わせたマーケティング施策を考えるとしましょう。この旅行サイト上の行動ログデータやユーザーの属性データを準備し、クラスタリングができる機械学習アルゴリズムに投入すると、自動的に類似しているユーザーをグルーピング、つまりクラスタリングしてくれます。その結果、「近距離を移動する出張ユーザー」や「大型連休で家族で旅行先を探しているユーザー」といったユーザーのグループを見つけることができます。

 このように関連するデータを準備し、そのデータを使えば機械学習アルゴリズムは分類、回帰、クラスタリングを行ってくれます(100%の精度ではないですが)。ということは、機械学習アルゴリズムで成果を上げるには、自身の業務の中から機械学習アルゴリズムを適用するとうれしい業務を見つけられることが重要になってきます。

Copyright © ITmedia, Inc. All Rights Reserved.