AIは、FinTechのスタートアップ企業のビジネスモデルに欠かせない存在であり、AIを構築する上で、大きな役割を果たしているのが、機械学習(Machine Learning)技術だ。機械学習は、コンピュータが自動的にパターンを学習し、データから推論を行う機能であり、大規模な多次元構造のデータから自動的に知見を導くことを可能にする。下記の図1は、機械学習アルゴリズムの分類を示している。
機械学習を大別すると、第1に入力データを与えられた目標値、またはクラスラベルにマッピングする「教師あり学習(Supervised)」がある。代表例は、多項式回帰(Polynomial Regression)、多変量適応型回帰スプライン(MARS)、決定木(Decision Trees)、ナイーブベイズ(Naive Bayes)、サポートベクターマシン(Support Vector Machines)などだ。
第2に、人間によるラベルのマッピングを必要とせずに入力データの隠された構造を学習する「教師なし学習(Unsupervised)」がある。代表例は、K-Meanクラスタリング(K-Mean Clustering)、ガウス混合モデリング(Gaussian Mixture Modeling)、主成分分析(Principal Component Analysis)などである。
第3に、少量のラベル付けされたデータを大規模のラベル付けされていないデータに融合させて適切なアルゴリズムに近づける「半教師あり学習(Re-enforcement)」がある。代表例は、能動学習(Active Learning)、共訓練(Co-training)などだ。
第4に、報酬の最大化を図るために観察と行動の間のマッピング関数を学習する「強化学習(Semi-supervised)」がある。代表例は、マルコフ決定過程(Markov Decision Process)、Q学習(Q-Learning)などであり、ロボットを利用した強化学習も含まれるが、ビッグデータ分野での適用は限定的な段階にある。
そして、ビッグデータ分析のために選択した機械学習ツールを評価するための基準として、下記のようなパラメータがある。
伝統的な金融分野のビッグデータ分析では、上記のような機械学習アルゴリズムを、時系列データに対して適用させることが多い。FinTechの場合、異業種・異分野で培われたナレッジ/ノウハウを生かしながら、時系列データのほか、グラフデータ、空間データ、マルチメディアデータなど、さまざまなタイプのデータと機械学習アルゴリズムを組み合わせて、新たなイノベーションを生み出そうと切磋琢磨している。
Copyright © ITmedia, Inc. All Rights Reserved.