速報
「法務でAIがどこまで使えるか」を測るデータセット、デジタル庁が公開
デジタル庁は、AIが法務でどれほど使えるかを測る「日本の法令に関する多肢選択式QAデータセット」を公開した。行政機関や企業の法務部門AI導入に役立てたい考えだ。
デジタル庁は10月9日までに、AIが法務でどれほど使えるかを測る「日本の法令に関する多肢選択式QAデータセット」を公開した。同データセットは、法令分野に関する4択問題と回答、問題の背景となる法令の抜粋などを含む。行政機関や企業の法務部門でのAI導入に役立てたい考えだ。
同データセットは、複数の大規模言語モデル(LLM)により作成・検証したもの。含まれる問題が選択式のため、AIの回答を自動で採点・評価しやすいのが特徴だ。政府が持つデータのAI開発での活用を目指し、同庁が実施した「政府等保有データのAI学習データへの変換にかかる調査研究」で利用した。
同データセットの主な利用方法として、AIが法務でどれほど使えるかを測る評価データを想定する。また、同庁のテストによると、同データセットをPreferred NetworksのLLM「PLaMo-100B」の継続事前学習と指示学習に利用することで、AIの法務能力が高まったことを確認したという。
同データセットは、GitHubで公開中。ライセンスは、同庁が定める「公共データ利用規約(第1.0版)」で、利用ルールのもと商用利用もできる。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
「自主的な対応を強く求める」――平デジタル相、動画生成AI「Sora 2」に言及 人気アニメの“類似動画”問題巡り
デジタル庁の平将明大臣は、10月7日の記者会見で、米OpenAIの動画生成AI「Sora 2」に言及した。Sora 2で日本のIP(知的財産)に類似した動画を生成できることに対し「(OpenAIの)自主的な対応を強く求めたい」と説明した。
デジタル庁とOpenAIが連携 職員用AIプラットフォームにAIモデル追加 「ISMAP」も取得へ
デジタル庁は、米OpenAIとの連携を始めると発表した。同庁内で展開する生成AIプラットフォーム「源内」(げんない)で、OpenAIの大規模言語モデル(LLM)を活用したサービスを使えるようにする。
行政・金融・医療が続々導入する謎の生成AIサービス「GaiXer」とは
複数の自治体や金融、医療機関が導入する生成AIサービス「GaiXer」とは何者か、開発元のFIXERの松岡清一社長にインタビューした。
デジタル庁、政府のAI基盤「ガバメントAI」(仮称)を開発へ 26年度までの提供目指す
デジタル庁は6月13日、政府のAI基盤として「ガバメントAI」(仮称)を開発すると発表した。
デジタル庁は生成AIをどう使う? 「日本の法令に特化したdeep research」「補助金の自動審査」などに期待 実用への道のりは
霞ヶ関の生産性向上を目指し、行政現場でのAI活用を後押しする取り組みが本格化している。

