ITmedia NEWS > 製品動向 >
ニュース
» 2021年02月16日 18時04分 公開

凸版印刷、“くずし字”を解読する画像認識AIを開発 研究機関向けに月額7万円から提供

凸版印刷が画像認識AIを活用して古文書に書かれた“くずし字”の解読を支援するツール「ふみのはゼミ」を開発した。

[ITmedia]

 凸版印刷は2月16日、画像認識AIを活用して古文書に書かれた“くずし字”の解読を支援するツール「ふみのはゼミ」を開発したと発表した。オンラインで複数人による解読作業が可能で、解読精度は90%にも上るという。価格は月額7万円(税別、以下同)から。

photo 他の参加者が編集している箇所をリアルタイムで表示

 くずし字は江戸時代以前に使用されていた文字の一種。凸版印刷は解読済みのくずし字の形を学習させた画像認識AIを生成。画像の文字を読み取ってテキストデータに変換するOCR(光学的文字認識)技術と組み合わせた。

 古文書のスキャン画像からくずし字を指定すると、AIが自動的に解読する。目視による結果を再学習させることで、文字認識の精度を上げられるという。

 解読した文字や単語へのコメント機能や、解読作業の参加者が交流できるチャット機能など共同作業機能も備える。

photo 画像認識AIのイメージ
photo 目視との併用で精度が高まる

 くずし字は現在の日本語で使用される文字とは形が大きく異なるため解読が困難で、当時の記録や文献を解読を進める上での障壁になっている。資料の経年劣化や専門家の減少に加え、近年は台風や地震などの自然災害への備えとして、資料をデジタルデータとして保存する機運が高まっていた。

photo くずし字の例(出典:国文学研究資料館の公式ページ)

 価格は3コースに分かれる。研究機関向けの利用は月額7万円、授業で使う場合は半期で10万円、ワークショップやイベントでの利用は1回20万円から。利用するデータ容量や人数などで価格は変動するという。

 凸版印刷は教育機関、博物館・資料館、地方自治体などを中心に販売を開始し、2023年までに約10億円の売上を目指す方針。

photo 料金表

Copyright © ITmedia, Inc. All Rights Reserved.