中国の富士通研究開発中心(FRDC)と富士通研究所は11月8日、人工知能(AI)を活用し、中国語の手書き文字列を高精度で認識する技術を開発したと発表した。日本語にも応用でき、手書きテキストを電子化する作業の効率化につながるという。
AIを用いた従来の文字認識技術では、まず大量の文字パターンの特徴を学習して記憶。文字列の画像から空白部分を判別して「部首」や「つくり」など複数の領域に切り分け、それらが独立して字になるか、隣接したものと組み合わせて字になるかを判別する方式だった。だが手書きなど1つ1つの文字の区切りが明確でない文字の場合、正しく区切りを判別するのが難しかったという。
新技術では、従来の文字サンプルに加え、部首やつくりなどのパーツと“文字にならないパーツ”を組み合わせた「非文字サンプル」を用いた異種深層学習モデルを構築。正しい文字のみに高い信頼度を振り分ける技術を開発した。
さらに、既存の中国語の言語処理モデルも用い、認識候補が正しい中国語の文章になっているかをチェックする仕組みも搭載した。ベンチマークテストによれば、従来技術を5%上回る96.3%の精度で手書きの中国語を認識できたという。
新技術は中国語のほか、スペースによる単語の区切りがない日本語、韓国語などの言語にも応用できるという。富士通研究所が開発する言語処理技術とも融合させ、日本語の手書き文字にも認識精度の向上を見込む。富士通は2017年以降、日本市場向け手書き帳票電子化ソリューションなどに同技術を順次導入する予定。
人工知能が書いた書籍「賢人降臨」発売 あえて無校正、「AIの未来感じて」
人工知能の創作物に著作権? 政府が知財制度を見直しへ
星新一ワールドが現実間近 「人造小説家」の次は?
人工知能が描くレンブラントの“新作”絵画 機械学習・3Dプリンタを活用Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR