少ない学習データでも高精度で文字認識　富士通が開発、ディープラーニングを効率化

富士通が、中国の古文書文字を画像認識するディープラーニング技術を改良。従来よりも少ない数の学習データでも高精度で認識できるという。

[ITmedia] PC用表示関連情報

LINE

Hatena

　中国の富士通研究開発中心（FRDC）は2月21日、古文書文字を画像認識するディープラーニングに改良を加え、少ない数の学習データでも高精度で認識できる仕組みを開発したと発表した。従来技術と比べると、1文字当たり約70％少ないデータ数で同じ精度を実現でき、古文書文字を電子化する作業の効率化につながるという。

　ディープラーニングを用いた従来の文字認識では、あらかじめ文字画像と正解の文字を正しくひも付けたデータを認識エンジンに学習させる。学習するデータが多いほど認識精度は高くなるが、中国の古文書文字だとさまざまな書体がある上に、同じ文字でも字形が異なる場合もあり、十分な量の学習データを用意することが難しかった。

新技術の仕組み

　新技術では、これまでは正解の文字とひも付かずに学習データに使われていなかった文字画像データも学習に活用。（1）認識エンジンが文字画像に、正解と考えられる「仮の文字ラベル」を与える、（2）それらの文字画像をランダムで2枚ずつペアにする、（3）2枚が同じ文字かどうかを別の認識エンジンが判断、（4）判断結果を認識エンジンにフィードバックして違いを学習させる――という手順を繰り返すことで、認識精度を向上させるという。

　同社のベンチマークテストによれば、新技術は81％の認識精度を達成するのに必要な学習データの数（1文字当たり）が、従来技術よりも約70％少なくて済むという。1文字当たり50個のデータを使って学習させた場合は、従来技術だと約82％だった認識率が、新技術では88％まで向上したという。

　新技術は、中国各地の図書館や古文書データベース向けに提供する予定。日本語や韓国語などにも応用できるという。2018年度には富士通の人工知能（AI）技術「Human Centric AI Zinrai」への活用を目指し、植物の識別など、認識すべき対象が多い用途に導入するとしている。

少ない学習データでも高精度で文字認識　富士通が開発、ディープラーニングを効率化

関連記事

関連リンク

少ない学習データでも高精度で文字認識 富士通が開発、ディープラーニングを効率化

関連記事

関連リンク

少ない学習データでも高精度で文字認識　富士通が開発、ディープラーニングを効率化