OpenAI、トレーニング用の安全で広範なデータセット構築目指す「Data Partnerships」立ち上げ
OpenAIは、AIモデルをトレーニングするための安全で広範なデータセットを構築するためのパートナーシップ「OpenAI Data Partnerships」を発表した。安全で有益なAGIを実現するには、AIモデルがすべてのテーマ、業界、文化、言語を深く理解する必要があり、そのために可能な限り広範なトレーニングデータセットが必要だとしている。
米OpenAIは11月9日(現地時間)、AIモデルをトレーニングするためのパブリックおよびプライベートのデータセットを構築するためにサードパーティと協力するパートナーシップ「OpenAI Data Partnerships」の立ち上げを発表した。
同社は公式ブログで、このパートナーシップの目的は「より多くの組織がAIの将来の舵取りを支援できるようにし」「より有用なモデルから恩恵を受けられるようにすること」と語った。
「最終的に全人類にとって安全で有益なAGIを実現するには、AIモデルがすべてのテーマ、業界、文化、言語を深く理解」する必要があり、そのために可能な限り広範なトレーニングデータセットが必要だとしている。
データには、画像、音声、動画などを含める予定で、多様な言語、トピック、形式での長文のテキストや会話など、「人間の意図を表現する」データも含める計画。
パートナーシップ参加組織と協力し、光学式文字認識ツールと自動音声認識ツールを組み合わせてトレーニングデータをデジタル化し、必要に応じて機密情報や個人情報を削除するという。
まずは、誰もが利用できるオープンソースのデータセットと、独自のAIモデルをトレーニングするためのプライベートデータセットの2種類を構築する。
関連記事
- OpenAIにDDoS攻撃で断続的な停止(復旧済み)
OpenAIのChatGPTやAPIのサービスが11月8日正午ごろ(米国時間)から断続的に停止していた。既に復旧しているが、OpenAIはDDoS攻撃を受けていたと発表した。 - OpenAI、GPT-4の活用で人間のコンテンツモデレータの負担軽減が可能と主張
OpenAIは、コンテンツモデレーションにGPT-4のようなLLM(大規模言語モデル)を活用できるとし、そのプロセスをブログで紹介した。これにより、人間のモデレータの負担を軽減できるとしている。 - OpenAI、Webデータ収集クローラー「GPTBot」のブロック方法を説明
OpenAIは生成AIトレーニング用データをインターネット上のWebサイトから収集する自社製クローラー「GPTBot」をひっそり紹介し、Webオーナー向けにこのクローラーのブロック方法を説明した。 - OpenAI、「AI の安全性に対する当社のアプローチ」を説明 「年齢確認オプション検討中」
OpenAIが「AIの安全性に対する当社のアプローチ」を説明した。「GPT-4より強力なAIの開発を直ちに停止せよ」という署名運動などを受けたものとみられる。「悪用する方法をすべて予測することはできない」が新しいシステムのリリースは慎重に行っていると主張する。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.