米OpenAIは2月5日(現地時間)、ソフトウェア開発者向けのエージェント型コーディングツール「GPT-5.3-Codex」をリリースしたと発表した。同社はこのモデルを、これまでで最も有能なエージェント型コーディングモデルと位置付けており、従来モデルよりも推論能力や専門知識が強化されている。この発表は、米Anthropicが高度な推論とコーディング能力を備えた「Claude Opus 4.6」を発表した直後(約15分後)に行われた。
OpenAIは、Codexの役割が劇的に変化したと主張している。これまでCodexは単にコードを記述し、レビューするだけのエージェントだったが、新モデルでは開発者や専門家がコンピュータ上で行うほぼすべての作業を実行できるエージェントへと進化したという。まるで同僚のように、作業中に対話や方向修正を行うことが可能で、コンテキストを失うことなく長時間のタスクを遂行できるとしている。
GPT-5.3-Codexは昨年12月発表の「GPT-5.2-Codex」より速度が25%向上。ベンチマークテストでは、ソフトウェアエンジニアリング能力を測る「SWE-Bench Pro」で56.8%(前モデルは56.4%)、ターミナル操作スキルを測る「Terminal-Bench 2.0」で77.3%(前モデルは64.0%)を記録したほか、コンピュータ操作の「OSWorld-Verified」では64.7%と、前モデルの38.2%から大幅な向上を見せている。サム・アルトマンCEOはXへのポストで、ベンチマークの数値以上に大きな前進を感じられるモデルだと述べている。
このモデルはコーディングだけでなく、ソフトウェアのライフサイクル全体(デバッグ、PRD作成、コピー編集、ユーザーリサーチなど)を支援するように設計されているという。さらに、スライド資料の作成やスプレッドシートでのデータ分析といった専門的な知識労働でも高いパフォーマンスを発揮し、単一の汎用エージェントへの一歩を踏み出したとしている。
安全性については、OpenAIのAIモデルの能力とそれに伴うリスクを評価・分類し、適切な安全対策を講じるための枠組み「Preparedness Framework」で、サイバーセキュリティ関連タスクで初めて「High」の能力を持つと分類されたモデルとしている。サイバー攻撃の自動化に関する決定的な証拠はないものの、予防的なアプローチとして包括的な安全対策を講じており、サイバー防御を加速させるためにAPIクレジットとして1000万ドルの提供を確約している。
GPT-5.3-Codexは、ChatGPTの有料プランユーザー向けに、アプリ、CLI、IDE拡張機能、Webを通じて提供が開始されている。APIアクセスについては現在準備中であり、安全に利用可能になり次第提供される予定だ。
Anthropic、「エージェントチーム」搭載の「Claude Opus 4.6」リリース
Anthropic、スーパーボウル向けCMを公開 OpenAIのアルトマンCEOは「不誠実な印象操作だ」と批判
OpenAI、macOS版「Codex」アプリを公開 複数AIエージェントの統合管理をGUIで実現
Anthropic、自律型AI「Cowork」発表 デスクトップ作業を丸投げ可能にCopyright © ITmedia, Inc. All Rights Reserved.