メディア

プロポーザルによる事業者選定、自治体は提案書をどう評価すればいいか？　「審査基準」のポイントを紹介（1/2 ページ）

» 2025年03月10日 07時00分公開

[川口弘行，ITmedia]

著者プロフィール：川口弘行（かわぐち・ひろゆき）

川口弘行合同会社代表社員。芝浦工業大学大学院博士（後期）課程修了。博士（工学）。2009年高知県CIO補佐官に着任して以来、省庁、地方自治体のデジタル化に関わる。

2016年、佐賀県情報企画監として在任中に開発したファイル無害化システム「サニタイザー」が全国の自治体に採用され、任期満了後に事業化、約700団体で使用されている。

2023年、公共機関の調達事務を生成型AIで支援するサービス「プロキュアテック」を開始。公共機関の調達事務をデジタル、アナログの両輪でサポートしている。

現在は、全国のいくつかの自治体のCIO補佐官、アドバイザーとして活動中。総務省地域情報化アドバイザー。公式Webサイト：川口弘行合同会社、公式X：@kawaguchi_com

　こんにちは。全国の自治体のデジタル化を支援している川口弘行です。

　筒井康隆氏の『ホンキイ・トンク』という短編小説をご存じでしょうか。

　この作品は、小国に導入された調子はずれのコンピュータが次々と奇妙な政策提言を行うというユーモラスな近未来を描いています。作品が書かれた当時（1969年頃）は、コンピュータと人工知能は同じような扱いだったようですが、50年経ってようやく筒井氏が描いた未来が到来したのかもしれません。

　この作品の面白さは、導入先の為政者が、コンピュータが導き出した奇妙な回答をそのまま受け入れていく、というところにあります。そこには深い理由もあるのですが、それは作品を読んでのお楽しみです。

　一方、こんなニュースもありました。

「10億円かけた虐待判定AI、こども家庭庁が導入見送り…ミス6割で『実用化困難』（読売新聞オンライン 2025年3月3日）

国が2021年度から約10億円をかけて開発を進め、最終的な判断を下す児童相談所の職員を補助する役割が期待されていたが、テスト段階で判定ミスが6割に上った。AIは虐待の判断にはなじまず、実用化は困難と結論付けた。（記事より抜粋）

　目指す方向は悪くないのですが、「AIを活用する際の制約を理解しないまま、多額の税金を投入しているという判断の甘さ」を感じます。記事ではプロジェクトの失敗要因として「判断の根拠となるデータの不足（学習不足）」を挙げているのですが、仮にデータが潤沢にあったとしても、それで成功するというわけではありません。

　深層学習AIの領域では、AIが大量のデータで学習を重ねることで、逆に学習データに過剰に適応し、新しい未知のデータに対してうまく適応できず汎用性が失われる状態に陥りがちです。これを過学習（オーバーフィッティング）と言います。

　優秀なAIというのは、回答精度を高くしたまま、さまざまな条件下でも精度が維持されるというバランスが求められるため、AIシステムの開発は、この「過学習への対応」が多くを占めていると言ってよいでしょう。

　したがって、10億円かけて学習不足の状態ならば、過学習への対応にはその何倍ものコストが掛かることが予想されます。

　また「AIに対する過度な期待」も感じ取れます。記事の中で有識者の方がコメントをしていましたが、AIに馴染みがない方にとっては、AIがどんな問題に対しても的確な回答を出す「魔法の杖」のように見えているのかもしれません。その背景にあるのは「ワンショット推論」（One-Shot Inference：一度の問い合わせで精度の高い回答を得たい）という欲求です。

　あまり注目されていませんが、生成AIが普及した要因の一つは、「チャット」というユーザインターフェース（UI）だったのではないかと思います。

　最初は漠然とした質問に対して、AIが曖昧（あいまい）な回答を返しますが、その後、さらに追加でプロンプトを投入し、それまでの会話履歴がコンテキスト（文脈）として共有されることで、次第に回答精度が高まっていく。こども家庭庁のAIも、このように人間との相互運用（Human-in-the-Loop）を機能させていく仕組みにしていれば、最初から過剰な投資は不要だったのかもしれません。

　ホンキイ・トンクのコンピュータが導き出した政策提言を為政者は実行します。そして、コンピュータは実行した政策の結果を受けて、新たに奇妙な政策提言をすることでしょう。それは大国に挟まれた小国が生き残るためのしたたかな戦略であり、ここにもHuman-in-the-Loopが成立しているのです。

　前回は自治体の調達方式の一つである「プロポーザル型事業者選定」を想定した調達仕様書の構成について解説しました。調達仕様書の構成を整えて、「調達仕様書」と「事業者からの提案書」と「審査基準」の項目を整合させることが必要なのでした。

　今回は調達仕様書と審査基準をどのように整合させていくのかについて、一緒に考えていきましょう。

調達仕様書と審査基準をどのように整合させていけばいいのか。写真はイメージ（ゲッティイメージズ）

事業者の提案を評価する「審査基準」の定め方

　例えば、調達仕様書の中で次のような要件が示されていたとしましょう。

目標復旧水準（業務停止時）

RPO（目標復旧地点）: ５営業日前の時点に復旧できること
RTO（目標復旧時間）: １営業日以内に復旧できること
RLO（目標復旧レベル）: 発注者があらかじめ指定する特定の業務が復旧できること

　これは、運用するシステムが障害などで停止した場合に、どれだけ迅速に復旧してもらいたいのか、どれだけ新しい状態に復旧してもらいたいのか、について、そのレベルを示したものです（調達仕様書における非機能要件としては、よくある指標です）。

　では、この要件に対して、事業者からどのような提案があると、高く評価することができるのでしょうか。ここで、審査基準というものが必要になってきます。

　審査基準を考える際に、基本となる考え方として「MUST-WANT法」というものがあります。事業者からの提案を、MUST（必須要件）とWANT（提案事項）の2段階に分けて考えるというものです。

　上述した目標復旧水準の場合、RPO（目標復旧地点）は、少なくとも５営業日前の時点に復旧できることを求めていますが、なるべく新しい状態にして復旧してもらえるほうがうれしい場合もあります。したがって、MUSTとWANTは次のように整理できます。

MUST：5営業日前の時点に復旧できる

WANT：なるべく新しい状態で復旧できる

　もし事業者が、7営業日前の時点にしか復旧できない、と回答した場合は、MUSTを満たさないので、点数をつけることができません（0点）。

　5営業日前の時点に復旧できる、と回答した場合は、MUSTを満たすので必須要件分の点数（配点が10点なら10点）を獲得します。

　それよりも短く、3営業日前の時点に復旧できる、と回答した場合は、MUSTを満たしたうえで、さらにWANT（提案事項）分の点数が加点されます。どの程度加点されるかは、後に示す全体の配点ルールや他の事業者からの提案により変わるのですが、少なくとも5営業日前に復旧できる、と回答した事業者よりは高い評価をすることになります。

　このように「絶対実現してほしいこと」（MUST）と「MUSTを満たしたうえで、発注者にとってさらにうれしいこと」（WANT）を分類することが必要なのです。

MUST-WANTの考え方

　この作業は「自分たちが本当は何を求めているのか」を考える上で非常に大切な手順となります。なぜならば、自分たちが求めていない過剰な提案は評価から外すことができるようになるためです。

　RPOの例ですと、システムの特性により、特に新しい状態で復旧する必要がない（蓄積しておくデータがない、など）という場合もあります。それに対して「3営業日前の時点まで復旧できますが、そのためのコストが過剰に掛かります」という提案は不要なのです。

　調達仕様書で示した項目をMUSTとWANTに整理し、最低限この要件を満たさないと事業が成立しない、というレベルでMUSTの基準を設定します。

　その上で、MUSTの基準を超えて、何がすばらしければ事業の目標達成に寄与できるのか、という評価軸をWANTの基準として設定します。

　なお、MUSTさえ満たせば充分という項目はWANTの設定を外すか、WANTの配点を低くすることで、提案事項は重要視しないというメッセージを事業者に伝えることができます。

審査項目の配点はどう決めるべきか

プロポーザル型事業者選定、自治体職員が押さえておきたい「調達仕様書」の書き方
今回は「プロポーザル型事業者選定」のための調達仕様書の書き方を解説する。
DeepSeekの破壊的な推論能力　自治体にとって“転換点”だと言えるワケ
今回のテーマはローカルLLM。中国のAI企業DeepSeekが自社開発の大規模言語モデル「DeepSeek-V3」「DeepSeek-R1」を発表した。ローカルLLMとしてのDeepSeekの出現は、自治体にとっての一つの転換点となる可能性がある。
動画生成AI「Sora」でプロモーション動画を制作してみた　自治体での活用法は？
今回は、自治体のプロモーション動画制作などにも応用できそうなAIによる動画生成を活用した事例を紹介する。
ChatGPTを使って「文書機密レベル」を判別する方法　自治体の情報セキュリティについて考える
今回は「自治体における情報セキュリティの考え方」について見ていきたい。情報資産の「重要性レベル」をいかに判別していくべきなのか。
ChatGPTに重要な情報を送っても安全か？　自治体のネットワーク分離モデルから考える
自治体における生成AIの利活用、今回は「送信された情報の管理の問題」、つまり「ChatGPTに重要な情報を送信しても安全なのか？」という点について考えたい。