ITmedia NEWS > STUDIO >
ニュース
» 2018年06月20日 11時34分 公開

これからのAIの話をしよう(人脈編):5億枚の名刺データ×AIで何ができる? “人脈”から生まれる新たな出会い (1/2)

「5億枚の名刺データ」を抱えるITベンチャーのSansan。同社がAI技術の研究・開発に注力する理由は。

[村上万純,ITmedia]

 優秀なAI人材の獲得に、国内外のIT企業がし烈な競争を繰り広げている。中でも、優秀なデータサイエンティストが集まるとされるプラットフォーム「Kaggle」(カグル)を利用する人材に注目が集まっており、国内でもディー・エヌ・エーなどがKaggle人材の獲得に注力している。データ分析や機械学習に関するさまざまなコンペに参加できるプラットフォームで、Kaggle内で優秀な成績を収めた人材を各企業が狙っているという状況だ。

 法人向け名刺管理サービス「Sansan」と個人向け名刺管理アプリ「Eight」を手掛けるITベンチャーのSansanもその1つ。全世界で100万人以上いるKaggle参加者のうち、日本では数人しかいないとされる「Grandmaster」(Kaggle内の称号)が2人も在籍するなど、他社に先駆けて優秀な人材を抱えている。

 「当初はそこまでKaggle人材には期待していなかった。しかし、こんなに優秀な人が多くいて、(Kaggle人材の)新しい知識を得ることで事業の可能性がここまで広がるのかと驚いた」と、Sansanの常樂諭取締役(CISO:最高情報セキュリティ責任者 兼 Data Strategy & Operation Center センター長)は話す。

常樂さん Sansanの常樂諭取締役(CISO:最高情報セキュリティ責任者 兼 Data Strategy & Operation Center センター長)

 2015年に最初のKaggle人材を獲得してから、今もその採用には注力している。優秀なデータサイエンティストに加え、特定分野に絞らず幅広いバックグラウンドを持つ人材を採用するのも同社の特徴だ。その内訳は、画像処理や機械学習、言語処理から社会科学・行動経済学のスペシャリストまでさまざま。

 13年には通称「DSOC」(Data Strategy & Operation Center)と呼ばれる研究開発部門を立ち上げ、現在は50人体制で日々AI研究や製品開発などに取り組んでいる。

 同社が抱える名刺データは5億枚。その膨大な量のデータを管理し、有効活用する上でAIの活用は欠かせないという。同社がAIを活用して実現したいことやKaggle人材の重要性などについて常樂取締役に聞いた。

「人力のデータ入力は限界」 AIに活路

 日々膨大な量の名刺データを扱うSansanでは、AI事業に取り組むのは業務効率化のため、ある種必然だった。

 DSOCが発足した13年当時は、月平均30〜40万枚追加される名刺データの入力を約100人のオペレーターが人力で行っていたという。しかし、日々増えていく名刺データをさばくのに人員が追い付かない。繁忙期とそうでない時期で作業量に違いがあり、担当者の教育コストを考えると人員増加は難しかった。

 そこで「自動化できる部分はAIにやらせてしまおう」と考えた。今では、月1500万枚の名刺データ化をAIと人力の併用で行っている。1枚の名刺をデータ化する際の工程は約20。画像認識による社名や個人名などの判別、言語判定など自動化できる部分をAIが担当し、ミスがないかの判断や最終的な入力は人間が行うことで「99.9%まで精度を高められた」(常樂取締役)。

 Sansanが集める名刺データは、単に名刺上にある社名や部署名、個人名といったテキスト情報だけではない。いつ、どこで、誰と名刺を交換したのかといったメタデータも利用約款の範囲内で収集・匿名化した上で活用する。

 例えばこれらのデータを基に「次に出会うべき相手は誰か」をレコメンドする機能なども実験的に提供している。

 このようなリッチなデータを扱う上で重要になるのがKaggle人材の存在だ。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.