デジタル庁、AI「源内」向け国産LLM再公募 有償の政府調達へ 評価テストは50問→300問に

 デジタル庁は5月29日、政府の生成AI基盤「ガバメントAI『源内』」で使用する国産LLM(大規模言語モデル)の2027年度向け公募を、11月に実施すると予告した。

 2025年12月~2026年1月に行った初回公募は無償試用を前提に募集したが、27年度向け公募では政府調達(有償)に移行。標準的なベンチマークで測れない行政実務能力を確認するため、事前に評価方法を公表した上で、300問の評価テストを行う。

ニュースリリースより
公募概要のPDFより

 応募は1社1モデルに限り、ガバメントクラウド上で動作することが条件。提出書類では、モデルの概要、源内での活用法、外部ツールをAIから呼び出す機能の説明、主要フロンティアモデルとのベンチマーク比較、学習データの法令遵守状況、料金体系などを求める。

 前回の評価テストは、問題数や内容を試験当日に初めて開示し、50問で評価したが、今回は事前に評価方法を公表した上で、300問に拡充。質問はすべてテキストで行い、応募者ごとに異なる内容を用意する。行政実務で求められる35項目の能力領域が対象で、法律・制度や行政課題、日本語理解など8領域から出題。1問当たりの制限時間は3分で、全体の上限は15時間。

 スケジュールとしては、26年11月に公募を始め、締め切りは12月。書類審査を実施し、27年1月に評価テスト、2月に結果通知・入札。3月に落札者を決定し、4月から源内での使用を始める。

 初回の公募では5社(NTTデータ、ソフトバンク、NEC、富士通、Preferred Networks)と契約。26年度はこれらのモデルを源内上で試用し、能力を評価・検証する予定だ。

 27年度の公募には初回で採用された5社以外も参加できるが、初回の評価検証結果も選定時に考慮する。

印刷する
SNSでシェア

この記事の著者

岡田有花

岡田有花

関連記事

こんなメディアも見られています

ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。

メールマガジンを配信中
メールマガジンを配信中

国内外の業界動向、AIやクラウドなどの最新技術、キャリア情報など今知りたい情報をまとめてお届けします。

いますぐご登録

よく見られているカテゴリー

アクセスランキング

  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  6. 6
  7. 7
  8. 8
  9. 9
  10. 10

SpecialPR

ITmedia AI+ SNS

X @itm_aiplusをフォロー

インフォメーション

ITmedia AI+をフォロー

あなたにおすすめの記事PR