ニュース
NII、「日本の判例HTMLデータ」研究者に無償提供 約6万5000件の判例収録
国立情報学研究所(NII)は、最高裁判所が公開している判例集のPDFデータをテキスト化した「日本の判例HTMLデータ」の提供を、研究者向けに始めた。
国立情報学研究所(NII)はこのほど、最高裁判所が公開している判例集のPDFデータをテキスト化(HTMLデータ化)した「日本の判例HTMLデータ」の研究者向け無償提供を始めた。
情報・システム研究機構から受け入れたもので、情報学研究データリポジトリ(IDR)のサイトからオンライン申請すれば入手できる。
最高裁判所のサイトで検索可能な、最高裁判所判例集、高等裁判所判例集、下級裁判所裁判例速報、行政事件裁判例集、労働事件裁判例集、知的財産裁判例集のPDFデータをHTML化。1947年〜2023年の約6万5000件の判例データを収録する。
HTMLデータでは、本文に無関係な部分を除去した上で、小見出し、箇条書き、段落などの構造を認識。それぞれに応じたタグを付与している。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
メルカリの出品データ、研究者向けに無償提供 国立情報学研究所と連携
メルカリの研究開発組織であるmercari R4Dと国立情報学研究所(NII)は大学などの公的な研究機関向けにフリマアプリ「メルカリ」の出品データの無償提供すると発表した。
約16万件の商品・サービスの口コミデータ、NIIが無償提供 自然言語処理などの研究向けに
国立情報学研究所(NII)は、商品・サービスの口コミサイト「みん評」を運営するマイスタースタジオと提携し、同サイトの口コミデータ約16万件を研究者向けに無償提供を始めた。
