米OpenAIは3月11日(現地時間)、開発者や企業が信頼性の高いエージェントを構築するための「Responses API」と「Agents SDK」を発表した。
同社の「Operator」やChatGPTの「deep research」などのエージェントは、指示されたタスクを理解し、複数のタスクを組み合わせて、より複雑な問題を解決するAIだ。
OpenAIは、これらのツールの提供は、開発者や企業からの、同社のモデルの能力を本番環境で使えるエージェントに変換するには課題があるという声を受けてのものだと説明した。
Responses APIは、従来の「Chat Completions API」と「Assistants API」の機能を統合し、Web検索、ファイル検索、コンピュータの使用などの機能をエージェントに組み込むことを可能にするAPI。単一のAPI呼び出しで、複数のツールとモデルのターンを使用して、より複雑なタスクを解決できるようにすることで、エージェント開発を簡素化する。
例えば、ユーザーが「最新のAI研究に関する論文を探して、要約して」と依頼した場合、エージェントはWeb検索機能を使って関連する論文を検索し、その内容を要約してユーザーに提示することができる。
さらに、Responses APIを使用すると、OpenAIにデータを簡単に保存できるため、開発者はトレースや評価などの機能を使用してエージェントのパフォーマンスを評価できる。
Responses APIの使用には追加料金はかからないが、Web検索、ファイル検索などのツールを使用すると、それぞれの使用量に応じて料金が発生する。
例えば、Responses APIでWeb検索を使用する場合、GPT-4o検索プレビューとGPT-4o mini検索プレビューに対してそれぞれ1000クエリ当たり30ドルと25ドルの料金が発生する。
なお、データがOpenAIに保存されている場合でも、デフォルトではビジネスデータでモデルをトレーニングすることはないとしている。
Agents SDKは、昨年実験的にオープンソースでリリースし、既に開発者コミュニティに広く採用されている、エージェントのワークフローを管理するためのツールキット。
OpenAIは、エージェントのワークフローをオーケストレーションする方法と説明する。複数のエージェントを連携させ、複雑なタスクを分担して実行させることができる。例えば、顧客サポートのエージェントと、技術的な問題を解決するエージェントを連携させることで、より高度な問題解決が可能になるとしている。
詳細は、開発者向けドキュメントを参照されたい。
Copyright © ITmedia, Inc. All Rights Reserved.