AIに不可欠な機械学習の仕組みとFinTech活用での注意点ビッグデータ利活用と問題解決のいま(2/3 ページ)

» 2016年07月05日 08時00分 公開
[笹原英司ITmedia]

FinTechを牽引するビッグデータと機械学習による最適化

 AIは、FinTechのスタートアップ企業のビジネスモデルに欠かせない存在であり、AIを構築する上で、大きな役割を果たしているのが、機械学習(Machine Learning)技術だ。機械学習は、コンピュータが自動的にパターンを学習し、データから推論を行う機能であり、大規模な多次元構造のデータから自動的に知見を導くことを可能にする。下記の図1は、機械学習アルゴリズムの分類を示している。

図1.機械学習アルゴリズムの分類(出典:Cloud Security Alliance Big Data WG「Big Data Taxonomy」、2014年9月)

 機械学習を大別すると、第1に入力データを与えられた目標値、またはクラスラベルにマッピングする「教師あり学習(Supervised)」がある。代表例は、多項式回帰(Polynomial Regression)、多変量適応型回帰スプライン(MARS)、決定木(Decision Trees)、ナイーブベイズ(Naive Bayes)、サポートベクターマシン(Support Vector Machines)などだ。

 第2に、人間によるラベルのマッピングを必要とせずに入力データの隠された構造を学習する「教師なし学習(Unsupervised)」がある。代表例は、K-Meanクラスタリング(K-Mean Clustering)、ガウス混合モデリング(Gaussian Mixture Modeling)、主成分分析(Principal Component Analysis)などである。

 第3に、少量のラベル付けされたデータを大規模のラベル付けされていないデータに融合させて適切なアルゴリズムに近づける「半教師あり学習(Re-enforcement)」がある。代表例は、能動学習(Active Learning)、共訓練(Co-training)などだ。

 第4に、報酬の最大化を図るために観察と行動の間のマッピング関数を学習する「強化学習(Semi-supervised)」がある。代表例は、マルコフ決定過程(Markov Decision Process)、Q学習(Q-Learning)などであり、ロボットを利用した強化学習も含まれるが、ビッグデータ分野での適用は限定的な段階にある。

 そして、ビッグデータ分析のために選択した機械学習ツールを評価するための基準として、下記のようなパラメータがある。

  • 正確性:与えられた分類と推測が、新しいデータまたは従来見えていなかったデータのクラスラベルと価値を正しく予測するための能力
  • 速さ:与えられた分類と推測を生成し、利用するのに必要なコスト
  • 堅牢性:ノイズの多いデータや値が不足したデータから、正確な予測に導くための分類や予測するための能力
  • 拡張性:与えられた大量のデータを効率的に分類や予測するための能力
  • 解釈可能性:分類や予測によって提供される理解と知見のレベル

 伝統的な金融分野のビッグデータ分析では、上記のような機械学習アルゴリズムを、時系列データに対して適用させることが多い。FinTechの場合、異業種・異分野で培われたナレッジ/ノウハウを生かしながら、時系列データのほか、グラフデータ、空間データ、マルチメディアデータなど、さまざまなタイプのデータと機械学習アルゴリズムを組み合わせて、新たなイノベーションを生み出そうと切磋琢磨している。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ