ITmedia NEWS > AI+ >
ニュース
» 2017年09月19日 12時00分 公開

AIベンチャーが実現した“99.2%”手書き文字認識ソフトの重要性──日本企業がAIを導入できない理由とは (1/2)

99.22%という、高い手書き文字認識精度をAIで実現した日本のベンチャー企業Cogent Labs。AI導入を検討する企業にとっての手書き文字認識の重要性を語る。

[井上輝一,ITmedia]

 「Tegaki」という日本語の手書き文字認識(OCR)サービスがある。そのソフトはディープラーニングなど機械学習のアルゴリズムを用い、認識精度は99.22%という精度で、平仮名、片仮名、漢字、数字、アルファベット、記号を認識できる。申し込み用紙やアンケート用紙など、複雑な形式の紙からでも正確に手書き文字を読み取れるという。8月23日に企業向け提供を始め、有料ながら個人も使えるように調整中だ。

 例として、公式サイトには江戸川乱歩『青銅の魔人』を複数人で手書きしたものをTegakiで認識したサンプルが公開されている。

江戸川乱歩『青銅の魔人』を手書きして認識させたサンプル

 「通り」が「通いり」に、「レール」の音引きが全角ハイフンになっているほかは手書き文字を正しく認識しているようだ。他社のOCRサービスでは約7割の認識精度に落ちるというから、かなり高い認識精度ということになる。

 Tegakiを作ったベンチャー企業の名はCogent Labs(コージェントラボ)。

 米Bloombergが2016年に発表した「The Current State of Machine Intelligence 3.0」という機械学習関連企業の業界地図では、世界の注目企業がピックアップされる中で数少ない日本企業としてCogent Labs(当時の社名はReactive)が取り上げられた。

米Bloombergが2016年に発表した「The Current State of Machine Intelligence 3.0」(shivonzilis.com/BloombergBETAより) 右カラムの中央やや上にReactiveがある

 そんな“注目株”のベンチャー企業は、なぜ日本語の手書き文字認識に目を付けたのか。同社創業者の飯沼純代表取締役とエリック・ホワイトウェイ代表取締役に取材した。

開放的なCogent Labsのオフィスで働く研究者や職員の皆さん

AI導入への壁は「紙の文書のデジタル化」

飯沼純代表取締役

 「“AI”(人工知能)という言葉が市場でバズワードになったのは2015年の夏ごろから。大手企業でも『AIで何かやろう』という話がトップダウンで降りてくるような時代だった」と飯沼さんが当時を振り返る。

 しかし、それを受け取った現場や役員からは「AIで何ができるのだろう」という疑問の声が上がっていた。Reactiveが本格的に稼働し始めた頃と重なったこともあり、飯沼さんはAIの課題を抱えた企業と話す機会が何度もあったという。

 企業と話していると、「AIでなんでもできる」と彼らが思いがちであることに気が付いた。しかし、AIで分析するにはまず学習させるための大量のデータが必要だ。そのようなデータがあるかと聞くと、どの業界もAIに使えるテキストデータを持っていなかった。

 では企業は何を持っているかというと、紙の文書だ。AIでそれを分析するには、紙を何万枚とテキストデータに変換しなければならないという壁があった。

 「紙の文書をまずテキストデータ化することが、どの企業に対しても価値あるソリューションになるはず」――これが、飯沼さんが手書き文字認識に目を付け始めたきっかけだった。

高精度アルゴリズムの要は「多様な分野からのアプローチ」

 なぜ既存のOCRでは約7割の認識精度しか出なかったのか。飯沼さんは「新しい技術が用いられておらず、古い機械学習アルゴリズムでの認識が続いていたようだ」と分析する。

 一方で99%まで精度を上げたTegaki。彼らは約4カ月で自分たち独自のアルゴリズムをプログラムとして実装し、高い認識精度が出ることを確かめた。

取材時に筆者も文字を書いてみたところ、全ての文字が正しく認識された

 なぜTegakiはそれだけの認識精度を出せるのか。Cogent Labsは機械学習の研究者だけではなく、天体物理学や量子物理学、神経科学など多様な研究者を世界中から集めている。それぞれが得意分野からのアプローチを提案し、議論できることが独自アルゴリズム実装の秘訣(ひけつ)だと飯沼さん。

 具体的なアプローチについては企業秘密ということもあり、明言を避けたが「今までOCRをやってきた人から見ると、『そのアプローチは思い付かない』というケースが多いと思う」と、飯沼さん。

 オフィスには大きなホワイトボードがあり、研究者たちが数式や概念図を書いていつも議論している。時には飯沼さんが「何が書いてあるか分からない」という概念図のようなものもあり、もう必要ないだろうと思って消そうとすると「お願いだから消さないで!」と研究者たちに止められることもあるという。

 世界中の多種多様な研究者を、Cogent Labsという日本の企業に集めるのはなぜだろう。米国のシリコンバレーでもいいのではないか。飯沼さんと共同で会社を立ち上げた、エリック・ホワイトウェイ代表取締役が口を開いた。

       1|2 次のページへ

Copyright© 2017 ITmedia, Inc. All Rights Reserved.