LLMの学習データ「枯渇元年」にどう立ち向かうか 国・組織を横断したデータ連携の仕組み実現へ、IPAが成果物公開

 情報処理推進機構(IPA)は4月1日、国や組織を超えてデータを連携させられるルールや仕組み「データスペース」の日本版となる技術コンセプト「Open Data Spaces」(ODS)の実現に向けたソフトウェア開発キットやオープンソースソフトウェア群などを公開した。IPAは各業界でこれらの活用を推進。LLMが学習する高品質なデータの枯渇に備え、AIの発展を支えるデータ活用基盤の社会実装やその加速を目指す。

 非営利研究機関Epoch AIの推計では、主要LLMが学習を進めた場合、高品質なデータが2026~2032年の間に枯渇するとされている。IPAのデジタルアーキテクチャ・デザインセンター(DADC)はこの状況を「2026年は、多くのテクノロジー市場関係者にとって『データ枯渇元年』と呼べる転換点」だと評し、企業内にとどまっている「ダークデータ」を社会に提供することの重要性を説く。ODSは、データの枯渇を見据え、各組織に散逸するデータを適切に管理し活用できる仕組みを目指す技術コンセプト。IPAはソフトウェア開発キットやオープンソースソフトウェア群に加え、ODSを導入する事業者や、現場の技術者向けの技術書類も合わせて公開した。

インターネットのテキストデータ量とLLMの学習で消費されるデータ量の推移(出典:IPAのWebサイト)

 ODSを含むデータスペースの特徴は、データ提供元がデータの権利を保持する「データ主権」、各ステークホルダーが共通の基盤を利用することによる「公平性」、データ提供元と利用者が相互に信頼性を確保した上でデータを転送できる「相互運用性」だ。

 企業はODSのコンセプトを基にしたデータスペースに参画することで、自社が保有する貴重なデータを安全かつ効率的に提供し、適切な対価が得られるようになると共に、信頼性のある外部データにアクセスし、ビジネス価値の創出に役立てられるという。

 IPAは、ドイツのハノーバーで2026年4月20~24日(現地時間)に開催される産業見本市「HANNOVER MESSE 2026」に出展し、ODSの周知を図る。

印刷する
SNSでシェア

この記事の著者

村田知己

村田知己

ITmedia AI+ 編集記者。市場調査会社でのエンジニア職を経て、2022年アイティメディア入社。キーマンズネット編集部、社内のデータ分析基盤構築担当、ITmedia エンタープライズ編集部を経て現職。

関連記事

こんなメディアも見られています

ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。

メールマガジンを配信中
メールマガジンを配信中

国内外の業界動向、AIやクラウドなどの最新技術、キャリア情報など今知りたい情報をまとめてお届けします。

いますぐご登録

よく見られているカテゴリー

アクセスランキング

  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  6. 6
  7. 7
  8. 8
  9. 9
  10. 10

SpecialPR

ITmedia AI+ SNS

X @itm_aiplusをフォロー

インフォメーション

ITmedia AI+をフォロー

あなたにおすすめの記事PR