ITmedia NEWS >

8万字に対応 富士通研が手書き漢字入力技術

» 2006年04月24日 20時39分 公開
[ITmedia]

 富士通研究所は4月24日、8万字超の漢字に対応した手書き入力技術を開発したと発表した。1〜2万字程度だった従来技術に比べ対応字数が大幅に向上しており、多数の字に対応する必要がある自治体向け電子戸籍システムなどに搭載する予定。

 画数や筆順に関係なく、部首など字の一部をマウスなどで手書き入力することで、読み方が不明な漢字でも検索して入力できるようになる。約8万2000字に対応した。

 従来も同様の技術はあったが、実際の手書き文字を採取し、認識辞書に学習させる必要がある。8万字の中にはほとんど使われない漢字も多数含まれ、手書き文字を収集すること自体が困難だった。また筆順や画数が正しくない場合に検索精度が下がるのも課題だった。

 新技術では、既存の文字フォントからOCR技術を利用して文字を分解し、部品と、部品の位置関係を抽出する。手書きデータは部品についてのみ収集し、最終的な字形データは部品データと位置関係データから合成するようにしたことで、収集する手書きデータは約40分の1に削減できた。手書き入力データと、辞書との類似度を高速計算する独自手法により、異なる筆順でも類似漢字を検索、類似度順に提示することが可能になったという。

 同社の実験では、全画数を筆記した場合、検索率(上位30候補に正解が含まれる率)が97.9%、全画数の6割を筆記した場合で58%と精度が高く、検索時間も1文字当たり0.8秒(Pentium 4/1.7GHz機)と高速だった。

 多種の漢字を扱う業務の文字入力効率を向上できるとして、自治体向け戸籍システムや汎用日本語入力パッケージに搭載する予定。

Copyright © ITmedia, Inc. All Rights Reserved.