ITmedia NEWS > 企業・業界動向 >
ITmedia AI+ AI活用のいまが分かる

官庁出版物30万点、AIモデルに活用へ 国会図書館がNIIに提供

» 2025年10月02日 17時58分 公開
[ITmedia]

 国立国会図書館は10月1日、国立情報学研究所(NII)に対して、官庁出版物のテキストデータを提供することで合意したと発表した。1995年までに刊行された図書が中心で、この他雑誌や官報など約30万点を、NIIが構築を進める大規模言語モデル(LLM)の学習用データとして活用する。

photo (出典:大規模言語モデル研究開発センターの公式Webサイト)

 9月5日付で合意を結んだ。出版物のデジタル化画像からOCR(光学文字認識)技術で作成した全文検索用データを提供し、NII内の大規模言語モデル研究開発センターで利用できるようにする。

 大規模言語モデル研究開発センターは、NIIが2024年4月に開設。研究開発用LLMの構築に加え、透明性・信頼性の確保や高度化に向けた研究開発を進めている。

photo 発表全文(出典:国立国会図書館公式Webサイト)

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ

あなたにおすすめの記事PR