デジタル庁、AI「源内」向け国産LLM再公募 有償の政府調達へ 評価テストは50問→300問に
デジタル庁は5月29日、政府の生成AI基盤「ガバメントAI『源内』」で使用する国産LLM(大規模言語モデル)の2027年度向け公募を、11月に実施すると予告した。
2025年12月~2026年1月に行った初回公募は無償試用を前提に募集したが、27年度向け公募では政府調達(有償)に移行。標準的なベンチマークで測れない行政実務能力を確認するため、事前に評価方法を公表した上で、300問の評価テストを行う。
応募は1社1モデルに限り、ガバメントクラウド上で動作することが条件。提出書類では、モデルの概要、源内での活用法、外部ツールをAIから呼び出す機能の説明、主要フロンティアモデルとのベンチマーク比較、学習データの法令遵守状況、料金体系などを求める。
前回の評価テストは、問題数や内容を試験当日に初めて開示し、50問で評価したが、今回は事前に評価方法を公表した上で、300問に拡充。質問はすべてテキストで行い、応募者ごとに異なる内容を用意する。行政実務で求められる35項目の能力領域が対象で、法律・制度や行政課題、日本語理解など8領域から出題。1問当たりの制限時間は3分で、全体の上限は15時間。
スケジュールとしては、26年11月に公募を始め、締め切りは12月。書類審査を実施し、27年1月に評価テスト、2月に結果通知・入札。3月に落札者を決定し、4月から源内での使用を始める。
初回の公募では5社(NTTデータ、ソフトバンク、NEC、富士通、Preferred Networks)と契約。26年度はこれらのモデルを源内上で試用し、能力を評価・検証する予定だ。
27年度の公募には初回で採用された5社以外も参加できるが、初回の評価検証結果も選定時に考慮する。
Copyright © ITmedia, Inc. All Rights Reserved.
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
それで、メモリ不足はいつまで続くの? なかなか終わらない狂騒のウラ側
-
2
「Mythos級モデル」一般提供、数週間以内に 米Anthropic「Opus 4.8」リリース
-
3
NEC、日立、富士通が“Anthropic協業”でそろい踏み 狙いは? 【3社の幹部コメントまとめ】
-
4
「国会議員マップ」話題 建設職人が個人で開発、議員の発言や政治の動きを分かりやすく 生成AI活用
-
5
「AIに任せ過ぎて本番データ消失」 活用率98%のGMOが導き出した、生成AIを使いこなせる人の5つの特徴
-
6
「国産人型ロボ」量産化へ 東大発スタートアップ 三菱自動車も出資
-
7
「Google Antigravity 2.0と戯れながら感じたこと」と「LLM Wikiを実践して『ロケスマペディア』を作ってみた」
-
8
OpenAI、Anthropicが新会社設立 国内SIerは「黒船襲来」に対抗できるか?
-
9
ローカルLLMは本当に手元で動くのか? ハードウェアとモデルの現実的な選び方【2026年春】
-
10
失敗データこそ資産だ――3Dモデルや解析結果をAIで統合、一目で探せるナレッジに
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR