OpenAI、GPT-4のエラーを指摘するGPT-4ベースの「CriticGPT」リリース
OpenAIは、ChatGPTが生成するコードに潜むエラーを検出するモデル「CriticGPT」を発表した。人間がChatGPTの誤りを発見するのを支援する。
米OpenAIは6月27日(現地時間)、ChatGPTなどのLLMの出力の誤りを検出するためのGPT-4ベースのモデル「CriticGPT」を発表した。
人間によるAIトレーニングの際に、ChatGPTの回答の誤りを指摘することで、トレーニングの精度向上を支援する。
ChatGPTは、RLHF(人間からのフィードバックによる強化学習)と呼ばれる手法を用いて、人間との対話に適したモデルへと調整されている。RLHFでは、人間のAIトレーナーがChatGPTの異なる回答を比較評価し、その結果を学習にフィードバックする。だが、モデルの推論能力や挙動が高度化するにつれ、ChatGPTの誤りはより微妙化し、AIトレーナーにとって誤りを発見することが困難になっている。これはRLHFの根本的な限界であり、モデルが人間の能力を超えていくにつれて、モデルの調整はますます困難になる可能性がある。
CriticGPTはこの課題に対処するために開発された。CriticGPTは、ChatGPTの回答の不正確な点を指摘する批評文を作成する。
CriticGPTもChatGPTと同様にRLHFを用いてトレーニングされているが、ChatGPTとは異なり、誤りを含む大量の入力を学習データとして使用し、それらの誤りを批評するように訓練されている。
具体的には、AIトレーナーがChatGPTによって書かれたコードに手動で誤りを挿入し、その誤りを発見した場合にどのようなフィードバックを行うかを記述した例を作成。次に同じトレーナーが、修正されたコードに対する複数の批評文を比較し、どの批評文が挿入された誤りを正しく指摘しているかを評価する。
CriticGPTの提案は必ずしも常に正しいわけではないが、AIトレーナーがモデルの回答の誤りを発見するのを大きく支援することが分かっているという。
CriticGPTの支援を受けてコードレビューを行った場合、支援なしの場合と比較して、約60%の確率でパフォーマンスが向上した。
また、CriticGPTを用いることで、AIトレーナーはより包括的な批評文を作成することができ、モデル単独で批評文を作成する場合よりも誤った指摘を減らすことができた。
現時点ではChatGPTの比較的短い回答を対象にトレーニングされている。OpenAIは、より長文で複雑なタスクを評価できるようにするために、CriticGPTの改良が必要だとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
GPT-4に日本語特化モデル OpenAI Japan始動会見で発表
米OpenAIは4月15日、大規模言語モデル「GPT-4」について、日本語に最適化したカスタムモデルを発表した。
大規模言語モデルの「幻覚」を軽減する32の最新テクニック バングラデシュなどの研究者らが発表
バングラデシュのIslamic University of Technology、米サウスカロライナ大学、米スタンフォード大学、米Amazon AIに所属する研究者らは、大規模言語モデルにおける幻覚を軽減するための32のテクニック(研究)を紹介した研究報告を発表した。
OpenAI、企業向け「ChatGPT Enterprise」提供開始 高速GPT-4でプライバシーも安全
OpenAIはMicrosoftの「Bing Chat Enterprise」と競合する企業向けAIチャットサービス「ChatGPT Enterprise」の提供を開始した。高速なGPT-4を利用でき、プロンプトやデータがトレーニングに使われることはない。
ChatGPTなどLLMの弱点“ハルシネーション” 「GPTは要素技術だ。商用という意味では遠い」
ChatGPTのビジネス利用はブームだが、これをビジネスで活用しようとした場合、さまざまな課題がある。AIを活用したチャットボット開発などで知られ、ChatGPTのようなLLMの活用も進めているPKSHA Technologyが、商用利用のポイントについて語った。

