OpenAI、エージェントコーディングモデル「GPT-5.3-Codex」発表　Anthropicの新Opus発表直後に

OpenAIは、自律型コーディングモデル「GPT-5.3-Codex」をリリースしたと発表した。Anthropicの新モデル「Claude Opus 4.6」発表直後のことだ。PC操作ベンチマークで前モデルの約1.7倍となるスコアを記録し、設計からデバッグ、資料作成まで自律遂行する。

[ITmedia] PC用表示関連情報

LINE

Hatena

　米OpenAIは2月5日（現地時間）、ソフトウェア開発者向けのエージェント型コーディングツール「GPT-5.3-Codex」をリリースしたと発表した。同社はこのモデルを、これまでで最も有能なエージェント型コーディングモデルと位置付けており、従来モデルよりも推論能力や専門知識が強化されている。この発表は、米Anthropicが高度な推論とコーディング能力を備えた「Claude Opus 4.6」を発表した直後（約15分後）に行われた。

　OpenAIは、Codexの役割が劇的に変化したと主張している。これまでCodexは単にコードを記述し、レビューするだけのエージェントだったが、新モデルでは開発者や専門家がコンピュータ上で行うほぼすべての作業を実行できるエージェントへと進化したという。まるで同僚のように、作業中に対話や方向修正を行うことが可能で、コンテキストを失うことなく長時間のタスクを遂行できるとしている。

　GPT-5.3-Codexは昨年12月発表の「GPT-5.2-Codex」より速度が25％向上。ベンチマークテストでは、ソフトウェアエンジニアリング能力を測る「SWE-Bench Pro」で56.8％（前モデルは56.4％）、ターミナル操作スキルを測る「Terminal-Bench 2.0」で77.3％（前モデルは64.0％）を記録したほか、コンピュータ操作の「OSWorld-Verified」では64.7％と、前モデルの38.2％から大幅な向上を見せている。サム・アルトマンCEOはXへのポストで、ベンチマークの数値以上に大きな前進を感じられるモデルだと述べている。

各種ベンチマークでの比較（画像：OpenAI）

　このモデルはコーディングだけでなく、ソフトウェアのライフサイクル全体（デバッグ、PRD作成、コピー編集、ユーザーリサーチなど）を支援するように設計されているという。さらに、スライド資料の作成やスプレッドシートでのデータ分析といった専門的な知識労働でも高いパフォーマンスを発揮し、単一の汎用エージェントへの一歩を踏み出したとしている。

金融アドバイススライドを生成する例（画像：OpenAI）

　安全性については、OpenAIのAIモデルの能力とそれに伴うリスクを評価・分類し、適切な安全対策を講じるための枠組み「Preparedness Framework」で、サイバーセキュリティ関連タスクで初めて「High」の能力を持つと分類されたモデルとしている。サイバー攻撃の自動化に関する決定的な証拠はないものの、予防的なアプローチとして包括的な安全対策を講じており、サイバー防御を加速させるためにAPIクレジットとして1000万ドルの提供を確約している。

　GPT-5.3-Codexは、ChatGPTの有料プランユーザー向けに、アプリ、CLI、IDE拡張機能、Webを通じて提供が開始されている。APIアクセスについては現在準備中であり、安全に利用可能になり次第提供される予定だ。

OpenAI、エージェントコーディングモデル「GPT-5.3-Codex」発表　Anthropicの新Opus発表直後に

関連記事

関連リンク

OpenAI、エージェントコーディングモデル「GPT-5.3-Codex」発表 Anthropicの新Opus発表直後に

関連記事

関連リンク

OpenAI、エージェントコーディングモデル「GPT-5.3-Codex」発表　Anthropicの新Opus発表直後に