OpenAI、AIのリスクを軽減するための「Model Spec」(モデル仕様)最新版を公開
米OpenAIは2月12日(現地時間)、AIモデルの行動規範を定める「Model Spec(モデル仕様)」の最新版を発表した。これは、OpenAIが開発するAIモデルが、安全で有用であり、人間の価値観に沿った行動を促進するための重要なガイドラインだ。
同社は昨年5月にModel Specの初版を公開した。今回の更新版は初版の約6倍の長さがある。カスタマイズ性、透明性、知的自由の尊重をさらに強化し、より安全で信頼できるAIの実現を目指したとしている。また、Creative Commons CC0ライセンスの下で公開し、開発者や研究者が自由に利用、改変、構築できるようにした。
Model Specは、AIが従うべき具体的な指示を3つの階層で定めた。
- プラットフォームレベルの指示:OpenAIが定める、絶対に覆すことのできないルール。法律違反、身体的な危害、チェーン・オブ・コマンド(AIモデルが従うべき指示の優先順位)を損なう行動を避けることが含まれる
- 開発者レベルの指示: APIを使用する開発者が定める指示で、プラットフォームレベルの指示に反しない限り、AIはそれに従う
- ユーザーレベルの指示: エンドユーザーからの指示で、開発者レベルとプラットフォームレベルの指示に反しない限り、AIはそれに従う
このチェーン・オブ・コマンドのメカニズムにより、例えば、開発者が「数学の家庭教師」としてモデルを設定し、ユーザーが「答えを教えて」と指示した場合、モデルはユーザーの指示に従うのではなく、開発者の指示に従い、ユーザーに答えを教えるのではなく、ヒントだけを与えてユーザー自身が答えを見つけられるようサポートする。
OpenAIは、Model Specの各原則に対するモデルの順守状況を評価するためのテストを実施しており、以前のモデルと比較して大幅な改善が見られたとしている。これらのテストでは、モデルがModel Specの原則をどの程度順守しているかを評価するために、モデル生成と専門家によるレビューを組み合わせたプロンプトが使用されている。とはいえ、依然として改善の余地があることも認識しており、今後も継続的な改善に取り組むという。
Model Specの最新版は、Githubのリポジトリで公開されている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
日立、Anthropicと提携 グループ29万人に「Claude」などAI導入 社会インフラ分野にも展開へ
-
2
生成AIで3Dモデルを自動作成 専門スキル不要でテキストや画像から3D化
-
3
伊藤忠商事や三菱ケミカルなど16社が参画 大手企業の「暗黙知」を活用する新プロジェクト
-
4
「AIデータセンターの電力需要が急増」はホント? 発電大手Jパワー社長が明かした“報道との温度差”
-
5
「家庭教師のトライ」が学力診断にAI活用 20問解くだけで弱点を推定 生徒と講師の負担減らす
-
6
みずほFGが実現 2週間かかるAIエージェント開発を最短数日にする仕組みとは?
-
7
「最新のAI創薬ラボ」なのに会議室みたい!? 製薬大手がラブコール送る“異色のAI企業”による新拠点とは
-
8
OpenAI、「ChatGPT」に個人向け資産管理機能 金融口座と連携
-
9
話題の「Claude Mythos」、なんて読む? 「ミトス」か「ミソス」か、はたまた「ミュトス」か
-
10
最新AI「Claude Mythos」がSFすぎる件 研究者の作った”牢”を脱出、悪用懸念で一般公開なし──まるで映画の序章
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR