ITmedia NEWS > 企業・業界動向 >
ITmedia AI+ AI活用のいまが分かる

OpenAI、トレーニング用の安全で広範なデータセット構築目指す「Data Partnerships」立ち上げ

» 2023年11月10日 11時01分 公開
[ITmedia]

 米OpenAIは11月9日(現地時間)、AIモデルをトレーニングするためのパブリックおよびプライベートのデータセットを構築するためにサードパーティと協力するパートナーシップ「OpenAI Data Partnerships」の立ち上げを発表した。

 openai

 同社は公式ブログで、このパートナーシップの目的は「より多くの組織がAIの将来の舵取りを支援できるようにし」「より有用なモデルから恩恵を受けられるようにすること」と語った。

 「最終的に全人類にとって安全で有益なAGIを実現するには、AIモデルがすべてのテーマ、業界、文化、言語を深く理解」する必要があり、そのために可能な限り広範なトレーニングデータセットが必要だとしている。

 データには、画像、音声、動画などを含める予定で、多様な言語、トピック、形式での長文のテキストや会話など、「人間の意図を表現する」データも含める計画。

 パートナーシップ参加組織と協力し、光学式文字認識ツールと自動音声認識ツールを組み合わせてトレーニングデータをデジタル化し、必要に応じて機密情報や個人情報を削除するという。

 まずは、誰もが利用できるオープンソースのデータセットと、独自のAIモデルをトレーニングするためのプライベートデータセットの2種類を構築する。

Copyright © ITmedia, Inc. All Rights Reserved.