検索
速報

OpenAI、トレーニング用の安全で広範なデータセット構築目指す「Data Partnerships」立ち上げ

OpenAIは、AIモデルをトレーニングするための安全で広範なデータセットを構築するためのパートナーシップ「OpenAI Data Partnerships」を発表した。安全で有益なAGIを実現するには、AIモデルがすべてのテーマ、業界、文化、言語を深く理解する必要があり、そのために可能な限り広範なトレーニングデータセットが必要だとしている。

Share
Tweet
LINE
Hatena

 米OpenAIは11月9日(現地時間)、AIモデルをトレーニングするためのパブリックおよびプライベートのデータセットを構築するためにサードパーティと協力するパートナーシップ「OpenAI Data Partnerships」の立ち上げを発表した。

 openai

 同社は公式ブログで、このパートナーシップの目的は「より多くの組織がAIの将来の舵取りを支援できるようにし」「より有用なモデルから恩恵を受けられるようにすること」と語った。

 「最終的に全人類にとって安全で有益なAGIを実現するには、AIモデルがすべてのテーマ、業界、文化、言語を深く理解」する必要があり、そのために可能な限り広範なトレーニングデータセットが必要だとしている。

 データには、画像、音声、動画などを含める予定で、多様な言語、トピック、形式での長文のテキストや会話など、「人間の意図を表現する」データも含める計画。

 パートナーシップ参加組織と協力し、光学式文字認識ツールと自動音声認識ツールを組み合わせてトレーニングデータをデジタル化し、必要に応じて機密情報や個人情報を削除するという。

 まずは、誰もが利用できるオープンソースのデータセットと、独自のAIモデルをトレーニングするためのプライベートデータセットの2種類を構築する。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る