OpenAI、エージェントコーディングモデル「GPT-5.3-Codex」発表 Anthropicの新Opus発表直後に
OpenAIは、自律型コーディングモデル「GPT-5.3-Codex」をリリースしたと発表した。Anthropicの新モデル「Claude Opus 4.6」発表直後のことだ。PC操作ベンチマークで前モデルの約1.7倍となるスコアを記録し、設計からデバッグ、資料作成まで自律遂行する。
米OpenAIは2月5日(現地時間)、ソフトウェア開発者向けのエージェント型コーディングツール「GPT-5.3-Codex」をリリースしたと発表した。同社はこのモデルを、これまでで最も有能なエージェント型コーディングモデルと位置付けており、従来モデルよりも推論能力や専門知識が強化されている。この発表は、米Anthropicが高度な推論とコーディング能力を備えた「Claude Opus 4.6」を発表した直後(約15分後)に行われた。
OpenAIは、Codexの役割が劇的に変化したと主張している。これまでCodexは単にコードを記述し、レビューするだけのエージェントだったが、新モデルでは開発者や専門家がコンピュータ上で行うほぼすべての作業を実行できるエージェントへと進化したという。まるで同僚のように、作業中に対話や方向修正を行うことが可能で、コンテキストを失うことなく長時間のタスクを遂行できるとしている。
GPT-5.3-Codexは昨年12月発表の「GPT-5.2-Codex」より速度が25%向上。ベンチマークテストでは、ソフトウェアエンジニアリング能力を測る「SWE-Bench Pro」で56.8%(前モデルは56.4%)、ターミナル操作スキルを測る「Terminal-Bench 2.0」で77.3%(前モデルは64.0%)を記録したほか、コンピュータ操作の「OSWorld-Verified」では64.7%と、前モデルの38.2%から大幅な向上を見せている。サム・アルトマンCEOはXへのポストで、ベンチマークの数値以上に大きな前進を感じられるモデルだと述べている。
このモデルはコーディングだけでなく、ソフトウェアのライフサイクル全体(デバッグ、PRD作成、コピー編集、ユーザーリサーチなど)を支援するように設計されているという。さらに、スライド資料の作成やスプレッドシートでのデータ分析といった専門的な知識労働でも高いパフォーマンスを発揮し、単一の汎用エージェントへの一歩を踏み出したとしている。
安全性については、OpenAIのAIモデルの能力とそれに伴うリスクを評価・分類し、適切な安全対策を講じるための枠組み「Preparedness Framework」で、サイバーセキュリティ関連タスクで初めて「High」の能力を持つと分類されたモデルとしている。サイバー攻撃の自動化に関する決定的な証拠はないものの、予防的なアプローチとして包括的な安全対策を講じており、サイバー防御を加速させるためにAPIクレジットとして1000万ドルの提供を確約している。
GPT-5.3-Codexは、ChatGPTの有料プランユーザー向けに、アプリ、CLI、IDE拡張機能、Webを通じて提供が開始されている。APIアクセスについては現在準備中であり、安全に利用可能になり次第提供される予定だ。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Anthropic、「エージェントチーム」搭載の「Claude Opus 4.6」リリース
Anthropicは、新フラグシップモデル「Claude Opus 4.6」を発表した。Opusクラス初の100万トークン対応や、複数AIが並列作業する「Agent Team」機能を搭載。PowerPoint連携による資料自動作成も可能だ。前モデルから推論、コーディング能力が大幅に向上し、金融やソフトウェア開発など専門業務の自律化を加速させるとしている。
Anthropic、スーパーボウル向けCMを公開 OpenAIのアルトマンCEOは「不誠実な印象操作だ」と批判
Anthropicは、AIへの広告導入を揶揄するスーパーボウル向けCMを公開した。これに対しOpenAIのアルトマンCEOは、実態と異なる「不誠実な描写」だとXで批判した。OpenAIも、今年もスーパーボウルでCMを放映すると予告した。
OpenAI、macOS版「Codex」アプリを公開 複数AIエージェントの統合管理をGUIで実現
OpenAIは、コーディングエージェント「Codex」のmacOS向けデスクトップアプリの提供を開始した。複数のAIエージェントをGUI上で並列管理し、複雑な開発タスクを統合制御できる。外部ツール連携やオートメーション機能も備え、既存のモバイル版やIDE拡張機能と設定を共有する。有料プランユーザー向け。
Anthropic、自律型AI「Cowork」発表 デスクトップ作業を丸投げ可能に
Anthropicは、macOS上で動作する自律型AIツール「Cowork」を発表した。ユーザーの指示に基づき、ローカル環境のファイルを自動で読み込み、整理、編集する。複数のサブエージェントによる並行処理で、ファイル整理や複雑な調査を自律的に完遂する。


