ITmedia NEWS > 社会とIT >
ITmedia AI+ AI活用のいまが分かる

少ない学習データでも高精度で文字認識 富士通が開発、ディープラーニングを効率化

» 2017年02月22日 17時51分 公開
[ITmedia]

 中国の富士通研究開発中心(FRDC)は2月21日、古文書文字を画像認識するディープラーニングに改良を加え、少ない数の学習データでも高精度で認識できる仕組みを開発したと発表した。従来技術と比べると、1文字当たり約70%少ないデータ数で同じ精度を実現でき、古文書文字を電子化する作業の効率化につながるという。

 ディープラーニングを用いた従来の文字認識では、あらかじめ文字画像と正解の文字を正しくひも付けたデータを認識エンジンに学習させる。学習するデータが多いほど認識精度は高くなるが、中国の古文書文字だとさまざまな書体がある上に、同じ文字でも字形が異なる場合もあり、十分な量の学習データを用意することが難しかった。

photo 新技術の仕組み

 新技術では、これまでは正解の文字とひも付かずに学習データに使われていなかった文字画像データも学習に活用。(1)認識エンジンが文字画像に、正解と考えられる「仮の文字ラベル」を与える、(2)それらの文字画像をランダムで2枚ずつペアにする、(3)2枚が同じ文字かどうかを別の認識エンジンが判断、(4)判断結果を認識エンジンにフィードバックして違いを学習させる――という手順を繰り返すことで、認識精度を向上させるという。

 同社のベンチマークテストによれば、新技術は81%の認識精度を達成するのに必要な学習データの数(1文字当たり)が、従来技術よりも約70%少なくて済むという。1文字当たり50個のデータを使って学習させた場合は、従来技術だと約82%だった認識率が、新技術では88%まで向上したという。

photo

 新技術は、中国各地の図書館や古文書データベース向けに提供する予定。日本語や韓国語などにも応用できるという。2018年度には富士通の人工知能(AI)技術「Human Centric AI Zinrai」への活用を目指し、植物の識別など、認識すべき対象が多い用途に導入するとしている。

Copyright © ITmedia, Inc. All Rights Reserved.