ITmedia AI＋
生成AI
デジタル庁、AI「源内」向け国産LLM再公募　有償の政府調達へ　評価テストは50問→300問に

デジタル庁、AI「源内」向け国産LLM再公募　有償の政府調達へ　評価テストは50問→300問に

公開 2026年05月29日 11時54分

[ITmedia]

印刷する

　デジタル庁は5月29日、政府の生成AI基盤「ガバメントAI『源内』」で使用する国産LLM（大規模言語モデル）の2027年度向け公募を、11月に実施すると予告した。

　2025年12月～2026年1月に行った初回公募は無償試用を前提に募集したが、27年度向け公募では政府調達（有償）に移行。標準的なベンチマークで測れない行政実務能力を確認するため、事前に評価方法を公表した上で、300問の評価テストを行う。

ニュースリリースより

公募概要のPDFより｜公募概要のPDFより

　応募は1社1モデルに限り、ガバメントクラウド上で動作することが条件。提出書類では、モデルの概要、源内での活用法、外部ツールをAIから呼び出す機能の説明、主要フロンティアモデルとのベンチマーク比較、学習データの法令遵守状況、料金体系などを求める。

　前回の評価テストは、問題数や内容を試験当日に初めて開示し、50問で評価したが、今回は事前に評価方法を公表した上で、300問に拡充。質問はすべてテキストで行い、応募者ごとに異なる内容を用意する。行政実務で求められる35項目の能力領域が対象で、法律・制度や行政課題、日本語理解など8領域から出題。1問当たりの制限時間は3分で、全体の上限は15時間。

　スケジュールとしては、26年11月に公募を始め、締め切りは12月。書類審査を実施し、27年1月に評価テスト、2月に結果通知・入札。3月に落札者を決定し、4月から源内での使用を始める。

　初回の公募では5社（NTTデータ、ソフトバンク、NEC、富士通、Preferred Networks）と契約。26年度はこれらのモデルを源内上で試用し、能力を評価・検証する予定だ。

　27年度の公募には初回で採用された5社以外も参加できるが、初回の評価検証結果も選定時に考慮する。

印刷する