ITmedia NEWS > 科学・テクノロジー >
ニュース
» 2022年01月07日 08時00分 公開

テキストから御朱印を自動生成するシステム、筑波大が開発 寺社1000カ所以上から御朱印収集、データ化Innovative Tech

筑波大学落合研究室の研究チームは、テキストから御朱印を自動生成する学習ベースのシステムを開発。訓練用のデータセットは、寺社1000カ所以上を訪問し取得した御朱印を基に大規模にデータ化した。

[山下裕毅,ITmedia]

Innovative Tech:

このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。

 筑波大学落合研究室の研究チームが開発した「Goshuin 2.0: Construction of the World’s Largest Goshuin Dataset and Automatic Generation System of Goshuin with Neural Style Transfer」(御朱印2.0)は、テキストから御朱印を自動生成する学習ベースのシステムだ。訓練用のデータセットは、寺社1000カ所以上を訪問し取得した御朱印を基に大規模にデータ化した。

提案モデルで生成した御朱印の例

 御朱印とは、日本の神社やお寺に参拝した証として集められるものだ。御朱印はおおむね、印章と寺社の名称や本尊/祭神の名前などの墨書きで構成する。この研究の目的は、御朱印データの活用の可能性を探り、現在の御朱印に関する問題点を明らかにし、御朱印データの活用による解決策を提案する。

 御朱印の問題点は4つ。

  • 利用可能な御朱印を含むデータセットがなく、関連する書籍やWebサイトは著作権の問題で研究目的であっても利用が困難であること。
  • 御朱印は無形文化なので、突然消えてしまう可能性があること。
  • 海外では御朱印の知名度が低く、御朱印に関する技術的な研究事例がないこと。
  • 御朱印は人気が出て需要が増えているが、一方で高齢化が進み御朱印を書ける人が減っているため、寺社が御朱印を授与できなくなる可能性があること。

 これらの問題を解決するために2つのアプローチを提案。御朱印データセットの構築と、機械学習モデルを使った自動御朱印生成システムの構築だ。

 御朱印データセットを構築するために、合計4000個の御朱印を集めた。このうち約1000件は、実際に寺社を訪れて収集したもので、残りの3000件は、御朱印関連書籍の最大手である地球の歩き方社から提供されたものを使用。ユーザーはデータベースに対して、名前検索や御朱印の属性に応じて絞り込み検索が行えて、御朱印データセットをダウンロードできる。施設の種類(神社・仏閣)や信仰の種類、宗派の種類、場所、宗派数、グループの6つのフィルターで検索結果を絞り込める。

寺社1000件以上を訪問し集めた御朱印

 次に、ユーザーが入力した文字から御朱印を自動生成するシステムを構築した。これはユーザーが入力したテキストとデータセットに収録してあるフォントを組み合わせて御朱印画像を出力するジェネレーター。ユーザーは任意の書体と全体のスタイルを選択でき、それに応じてリアルタイムに生成できる。

御朱印自動生成システムのユーザーインタフェース

 御朱印自動生成システムは公開されており、Webブラウザ上で実際に試すことができる。

 システムを構築するにあたって、画像の画風をスタイル変換するNeural Style Transferの中でも、少数のスタイル画像でフォントを作成できる事前学習済みモデル「EMD」(Empirical mode decomposition)ネットワークを使った。作成した御朱印データセットを使い、入力したテキストから任意の書体とデザインの御朱印に自動変換するように学習する。

EMDネットワークの概要と自動生成システムのパイプライン

 構築した御朱印の自動生成システムを全国の寺社に見てもらい意見を聞いたところ、「非常に便利」というポジティブな意見と、「宗教的に問題がある」というネガティブな意見が混在した。

Copyright © ITmedia, Inc. All Rights Reserved.