人工知能で「手書きの漢字」認識 部首を学んで賢く 富士通が開発
中国語の手書き文字列を高精度で認識するAI技術を富士通が開発。日本語にも応用でき、手書き帳票の電子化などで活用を見込む。
中国の富士通研究開発中心(FRDC)と富士通研究所は11月8日、人工知能(AI)を活用し、中国語の手書き文字列を高精度で認識する技術を開発したと発表した。日本語にも応用でき、手書きテキストを電子化する作業の効率化につながるという。
AIを用いた従来の文字認識技術では、まず大量の文字パターンの特徴を学習して記憶。文字列の画像から空白部分を判別して「部首」や「つくり」など複数の領域に切り分け、それらが独立して字になるか、隣接したものと組み合わせて字になるかを判別する方式だった。だが手書きなど1つ1つの文字の区切りが明確でない文字の場合、正しく区切りを判別するのが難しかったという。
新技術では、従来の文字サンプルに加え、部首やつくりなどのパーツと“文字にならないパーツ”を組み合わせた「非文字サンプル」を用いた異種深層学習モデルを構築。正しい文字のみに高い信頼度を振り分ける技術を開発した。
さらに、既存の中国語の言語処理モデルも用い、認識候補が正しい中国語の文章になっているかをチェックする仕組みも搭載した。ベンチマークテストによれば、従来技術を5%上回る96.3%の精度で手書きの中国語を認識できたという。
新技術は中国語のほか、スペースによる単語の区切りがない日本語、韓国語などの言語にも応用できるという。富士通研究所が開発する言語処理技術とも融合させ、日本語の手書き文字にも認識精度の向上を見込む。富士通は2017年以降、日本市場向け手書き帳票電子化ソリューションなどに同技術を順次導入する予定。
関連記事
- 人工知能が書いた書籍「賢人降臨」発売 あえて無校正、「AIの未来感じて」
人工知能に福沢諭吉と新渡戸稲造の作品を学習させて書かせた書籍「賢人降臨」が発売。現時点での技術レベルを知ってもらうため、あえて無校正で出したという。 - 人工知能の創作物に著作権? 政府が知財制度を見直しへ
政府の知的財産戦略本部が、人工知能(AI)による創作物に対応した知財制度の在り方を検討する方針を示した。 - 星新一ワールドが現実間近 「人造小説家」の次は?
AIが書いた小説はコンテストの一次予選を通過した。一方で、過去の小説家が自作の朗読をしてくれるかもしれない。 - 人工知能が描くレンブラントの“新作”絵画 機械学習・3Dプリンタを活用
オランダの画家・レンブラントの画風を分析し、3Dプリンタを使って新作を作り出す――米Microsoftなどのプロジェクト「The Next Rembrandt」が完成した作品を発表した。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.