ITmedia NEWS > STUDIO >
ITmedia AI+ AI活用のいまが分かる

人工知能で「手書きの漢字」認識 部首を学んで賢く 富士通が開発

» 2016年11月09日 17時20分 公開
[ITmedia]

 中国の富士通研究開発中心(FRDC)と富士通研究所は11月8日、人工知能(AI)を活用し、中国語の手書き文字列を高精度で認識する技術を開発したと発表した。日本語にも応用でき、手書きテキストを電子化する作業の効率化につながるという。

 AIを用いた従来の文字認識技術では、まず大量の文字パターンの特徴を学習して記憶。文字列の画像から空白部分を判別して「部首」や「つくり」など複数の領域に切り分け、それらが独立して字になるか、隣接したものと組み合わせて字になるかを判別する方式だった。だが手書きなど1つ1つの文字の区切りが明確でない文字の場合、正しく区切りを判別するのが難しかったという。

photo 従来の技術では正しく区切りを判別するのが難しかった

 新技術では、従来の文字サンプルに加え、部首やつくりなどのパーツと“文字にならないパーツ”を組み合わせた「非文字サンプル」を用いた異種深層学習モデルを構築。正しい文字のみに高い信頼度を振り分ける技術を開発した。

 さらに、既存の中国語の言語処理モデルも用い、認識候補が正しい中国語の文章になっているかをチェックする仕組みも搭載した。ベンチマークテストによれば、従来技術を5%上回る96.3%の精度で手書きの中国語を認識できたという。

photo 非文字サンプルを用いた異種深層学習モデルを構築
photo 96.3%の精度を実現したという

 新技術は中国語のほか、スペースによる単語の区切りがない日本語、韓国語などの言語にも応用できるという。富士通研究所が開発する言語処理技術とも融合させ、日本語の手書き文字にも認識精度の向上を見込む。富士通は2017年以降、日本市場向け手書き帳票電子化ソリューションなどに同技術を順次導入する予定。

Copyright © ITmedia, Inc. All Rights Reserved.