ビッグデータで株式投資はどう変わる? カブドットコムの先進事例API公開からAI活用まで(2/3 ページ)

» 2017年01月20日 08時00分 公開
[寺澤慎祐ITmedia]

 もちろん、ヤフーなどの検索サイトでも株価を見ることができるが、投資家向けのカブドットコムの場合、高いリアルタイム性が求められる。

 分析に使うデータはアクセスログが多いが、ほとんどは外部のマーケットデータを使うそうだ。中でも最もよく使うデータは、現在の注文数などの状況を示す「板情報」で、株の約定を時系列で表示する「歩み値」を獲得して計算し、1秒後の株価を予想しているという。

 同社がユニークなのは、口座数や受注件数をはじめ、システムの稼働状況までも企業情報として開示している点だ。これは、齋藤氏自身がデータを扱えることで生まれたポリシーだ。

 「こうした情報は法的には開示する必要がないものです。各社員には、『社長の自分がデータを扱えるのだから、皆で開示するデータを分析してまとめなさい』と伝えています。情報開示は一度行うと基本的にやめることができないものですが、各種情報を慎重に扱うことにもつながるため、いい企業文化だと思っています」(齋藤氏)

カブドットコムのデータ活用、7つの課題

 ビジネスにデータ分析を生かす取り組みを続ける同社だが、まだまだ道半ばとのことで、データ活用における課題として、齋藤氏は以下の7つを挙げた。

  1. データを管理する部門(システム部)とデータを必要とする部門(マーケティング部・リスク管理等)の分断による非効率化
  2. 膨大な取引データ、ログデータ、属性データは蓄積しているだけで活用できていない
  3. 各部門で積極的にKPIを開示する志向はあるものの、それらを横断的にひもづける横断的な視点の不在
  4. ユーザー部門にとって、簡単にアクセスできるDWH環境がない
  5. バッチ処理で1日1回の更新するデータもあり、市況に合わせたリアルタイム性が確保できていない。データ量や複雑性が増大しており、求められる検索速度に至らない
  6. 分析者の試行錯誤やイマジネーション、都度のPDCAに耐え得る検索速度の確保
  7. ユーザー部門がデータソース設計に携わることがなく、リテラシーが向上していない。そのため要件ごとにシステム部に依頼し、データを抽出する体制になってしまい、対応コストが増大している

 特に齋藤氏が課題に感じているのが、「ユーザー部門にとってアクセスが容易なDWH環境がない」ことと「バッチ的な処理もまだあるため、リアルタイム性に欠ける」ことだという。

 「中には、SQLを自分で書いてデータをまとめられるメンバーもいますが、全てのユーザー部門にとってDWHが容易に扱えるかというとそうでもありません。そして、リアルタイム性が低くなるということは、データの価値が下がるということ。それが、当社の価値を下げてしまうことにもなりかねないので、リアルタイム性をどんどん追求していくようにしています」(齋藤氏)

 そこで同社は2016年、プロジェクトチームを組成してDWH/BI基盤の導入を進め、「HPE Vertica」や「Tableau」を導入している。その結果、大規模データ処理の速度は向上し、BIツールも使いやすくなったという。特にBIツールについては、いくつかの製品で、実際の業務(顧客)データを使った(Proof of Concept=概念実証)を実施して検討した。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ