少ない学習データでも高精度で文字認識 富士通が開発、ディープラーニングを効率化
富士通が、中国の古文書文字を画像認識するディープラーニング技術を改良。従来よりも少ない数の学習データでも高精度で認識できるという。
中国の富士通研究開発中心(FRDC)は2月21日、古文書文字を画像認識するディープラーニングに改良を加え、少ない数の学習データでも高精度で認識できる仕組みを開発したと発表した。従来技術と比べると、1文字当たり約70%少ないデータ数で同じ精度を実現でき、古文書文字を電子化する作業の効率化につながるという。
ディープラーニングを用いた従来の文字認識では、あらかじめ文字画像と正解の文字を正しくひも付けたデータを認識エンジンに学習させる。学習するデータが多いほど認識精度は高くなるが、中国の古文書文字だとさまざまな書体がある上に、同じ文字でも字形が異なる場合もあり、十分な量の学習データを用意することが難しかった。
新技術では、これまでは正解の文字とひも付かずに学習データに使われていなかった文字画像データも学習に活用。(1)認識エンジンが文字画像に、正解と考えられる「仮の文字ラベル」を与える、(2)それらの文字画像をランダムで2枚ずつペアにする、(3)2枚が同じ文字かどうかを別の認識エンジンが判断、(4)判断結果を認識エンジンにフィードバックして違いを学習させる――という手順を繰り返すことで、認識精度を向上させるという。
同社のベンチマークテストによれば、新技術は81%の認識精度を達成するのに必要な学習データの数(1文字当たり)が、従来技術よりも約70%少なくて済むという。1文字当たり50個のデータを使って学習させた場合は、従来技術だと約82%だった認識率が、新技術では88%まで向上したという。
新技術は、中国各地の図書館や古文書データベース向けに提供する予定。日本語や韓国語などにも応用できるという。2018年度には富士通の人工知能(AI)技術「Human Centric AI Zinrai」への活用を目指し、植物の識別など、認識すべき対象が多い用途に導入するとしている。
関連記事
- 「きのこの山」は翻訳できるが「たけのこの里」は認識できず はやりの“リアルタイム翻訳”より高性能? “カメラ翻訳”使ってみた
話題の「リアルタイムカメラ翻訳機能」より性能がいい……とな? - 「アニメ制作は全てAIに代替されるかもしれない」 AT-X・岩田社長「創造領域の侵食が始まっている」
機械的な業務は人工知能(AI)に仕事を奪われる。クリエイティブな仕事なら安心。そんな安全神話が崩れる日も近いかもしれない。AT-Xの岩田社長がアニメ業界を例に、AIの可能性を語った。 - 線画を自動でカラーに ディープラーニング応用のWebサービスが登場
ディープラーニングを応用し、線画を自動でカラーにしてくれるWebサービスが公開された。大まかに色を指定して塗ってもらうことも可能だ。 - 東芝、ディープラーニングを低消費電力で実現する「脳型プロセッサ」開発
東芝は、ディープラーニングを低消費電力で実行する、人間の脳を模した半導体回路を開発した。 - 人工知能で「手書きの漢字」認識 部首を学んで賢く 富士通が開発
中国語の手書き文字列を高精度で認識するAI技術を富士通が開発。日本語にも応用でき、手書き帳票の電子化などで活用を見込む。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.