マイページ

注目記事を集めた総合ページ

ITの今と未来を見通す

スマホと通信の最新トレンド

進化するPCとデバイスの未来

好きが集まる　比べて選べる

ビジネスと働き方のヒント

AI活用のいまが分かる

企業ITのトレンドを詳説

経営リーダーのコミュニティ

マーケ×ITの今がよく分かる

ITエンジニア向け専門サイト

企業向けIT製品の総合サイト

IT製品の技術・比較・事例

製造業のIT導入・活用を支援

モノづくり技術者専門サイト

エレクトロニクス専門サイト

電子設計の基本と応用

エネルギーの専門メディア

建設×テクノロジーの最前線

ちょっと気になるネットの話題

AIは強化学習で“人間のだまし方”を学ぶ──RLHFの副作用、海外チームが24年に報告　「正解っぽい回答」を出力

長文理解のための質問応答データセットによる、RLHF前（青）とRLHF後（黄色）のAIモデルにおける、人間の承認率（左）、実際の性能（中央）、人間のエラー率（右）を表した図

記事に戻る

Copyright © ITmedia, Inc. All Rights Reserved.

SpecialPR