ITmedia NEWS > 企業・業界動向 >
ニュース
» 2019年06月17日 05時00分 公開

名刺管理のSansan、「ほぼ手作業」だったデータ入力はどう進化した? CTOが語った軌跡 (2/2)

[濱口翔太郎,ITmedia]
前のページへ 1|2       

機能を改善も、手作業による処理が限界に

 こうして07年にリリースしたSansanは軌道に乗り、09年には使い勝手をさらに改善。名刺情報を1枚ずつ保存する方式を廃し、人にひもづける形で複数の名刺情報を統合する「名寄せ」機能に対応した。

 登録済みの人物の名刺を別の担当者が入手・登録した場合、システム内には2つのデータが存在する。これらを1人にひもづく情報として集約しつつ、肩書や部署が異なる際に、どちらが新しいのかを判定する――というのが名寄せの特徴だ。

 「この後Sansanによく似たサービスが市場に出てきたが、データ管理の中心にあったのは名刺で、人物ではなかった。結果的に、この判断が競合製品との差別化につながった」

photo 「名寄せ」機能の仕組み

 独自の武器を得たSansanは、12年には導入企業が500社に達し、社員数も増えた。だがここで、再び課題に直面する。ユーザー増によってスキャンする名刺の量がかなり増えたため、オペレーターの手作業による処理に限界が来たのだ。

 Sansanでは当時、約100人のオペレーターがチェックに当たっていたが、ユーザー企業と名刺情報は増え続ける一方だった。その中で正確性を保ち続けるには、人数を増やすのではなく、業務プロセスを見直す必要があると経営陣は判断した。だが、チェック業務の全てを機械に委ねると、ミスを見落とす危険性が残る。最後の砦としてオペレーターを起用することは譲れなかった。

クラウド×画像認識で効率化

 そこでSansanが活用したのが画像認識だ。同社のR&D部門は「名刺上の文字列を20個ほどの単語に分けて読み取り、どれが社名・個人名・アドレスなのかを判別する」という技術を開発。入力の一部も自動化したため、オペレーターの業務は最終的なチェックと入力に減り、短期間で効率よくデータベースに納品できるようになった。

 19年現在、この技術はさらに進化している。万が一のミスを防ぐため、「人が見落としやすい入力ミス」をAIに学習させ、オペレーターの入力後に再チェックする仕様にしたのだ。かつての“3人目”に似た役割をAIに代替させ、ミスが疑われる場合は人に修正させることで、正確性をさらに100%に近づけている。

photo 現在のデータ入力のフロー

 各技術の裏側では、Amazon Web Servicesやオープンソースのクラウドツールを使っている。具体的には、オープンソースのデータ収集ツール「fluentd」がバラバラの文字データを取得し、クラウドストレージ「Amazon S3」に集約。データの加工・抽出ツール「AWS Glue」で氏名やメールアドレスなどを検出し、データ分析基盤「Amazon Redshift」でチェックしている。

 一連のトランザクションは、クラウド型のワークフロー管理アプリ「Amazon Simple Workflow Service」(SWF)が制御。顧客向けのデータベースもオープンソースのRDBMSから「Amazon Aurora」に移行し、インフラコストを3分の1に低減した。

photo データ入力を支えるクラウドツール

大きなビジョンと、課題解決の両立が必要

 こうしてデータの入力・処理を効率化したSansanは、ノウハウを生かして12年にEightをリリース。19年までの8年間で累計230万人が名刺情報を登録している。

 昨今は、名刺交換をした人の勤務先が異動情報やプレスリリースなどを発表した際、内容をユーザーに自動配信する機能なども実装。ユーザーが商談などを有利に運べるよう改善を続けている。将来的には「こんな人に会いたいのでは?」と、ユーザーに適したビジネスパーソンをお勧めする機能の導入も視野に入れている。

 先進的な機能を相次いで導入しつつも、しばらくは人の手によるチェックは継続する。完全自動化を目指して努力を続けているが、実現はまだ先になりそうだ。

 「中には、『まずは市場に投入して声を聴きたい』という意見もある。だが、0.1%の精度が欠けることで、ユーザーの課題を解決できないのであれば、出す意味はまったくない」と藤倉CTOは正確性へのこだわりを強調し、セッションを締めくくった。

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.