検索
ニュース

LLMの学習データ「枯渇元年」にどう立ち向かうか 国・組織を横断したデータ連携の仕組み実現へ、IPAが成果物公開

AIの進化を支える高品質なデータの不足が懸念される中、IPAは2026年は「データ枯渇元年」になると説く。企業に眠る情報の活用が急務となる今、国境や組織を越えた新たなデータ連携の形「データスペース」を実現するための成果物が公開された。

Share
Tweet
LINE
Hatena

 情報処理推進機構(IPA)は4月1日、国や組織を超えてデータを連携させられるルールや仕組み「データスペース」の日本版となる技術コンセプト「Open Data Spaces」(ODS)の実現に向けたソフトウェア開発キットやオープンソースソフトウェア群などを公開した。IPAは各業界でこれらの活用を推進。LLMが学習する高品質なデータの枯渇に備え、AIの発展を支えるデータ活用基盤の社会実装やその加速を目指す。

 非営利研究機関Epoch AIの推計では、主要LLMが学習を進めた場合、高品質なデータが2026〜2032年の間に枯渇するとされている。IPAのデジタルアーキテクチャ・デザインセンター(DADC)はこの状況を「2026年は、多くのテクノロジー市場関係者にとって『データ枯渇元年』と呼べる転換点」だと評し、企業内にとどまっている「ダークデータ」を社会に提供することの重要性を説く。ODSは、データの枯渇を見据え、各組織に散逸するデータを適切に管理し活用できる仕組みを目指す技術コンセプト。IPAはソフトウェア開発キットやオープンソースソフトウェア群に加え、ODSを導入する事業者や、現場の技術者向けの技術書類も合わせて公開した。


インターネットのテキストデータ量とLLMの学習で消費されるデータ量の推移(出典:IPAのWebサイト)

 ODSを含むデータスペースの特徴は、データ提供元がデータの権利を保持する「データ主権」、各ステークホルダーが共通の基盤を利用することによる「公平性」、データ提供元と利用者が相互に信頼性を確保した上でデータを転送できる「相互運用性」だ。

 企業はODSのコンセプトを基にしたデータスペースに参画することで、自社が保有する貴重なデータを安全かつ効率的に提供し、適切な対価が得られるようになると共に、信頼性のある外部データにアクセスし、ビジネス価値の創出に役立てられるという。

 IPAは、ドイツのハノーバーで2026年4月20〜24日(現地時間)に開催される産業見本市「HANNOVER MESSE 2026」に出展し、ODSの周知を図る。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る