メディア
ITmedia AI+ >

OpenAIからコーディングエージェント「Codex」 ソフトウェア開発で「o3-high」上回る【更新終了】

» 2025年05月17日 00時26分 公開
[ITmedia]

 米OpenAIは5月17日、コーディングエージェント「Codex」を発表した。大規模言語モデル「o3」をソフトウェアエンジニアリング向けに最適化した「codex-1」を利用。ユーザーはChatGPTからアクセスし、Codexにコーディングやバグの修正、コードに関する質問を依頼できる。複数のタスクを並行して行うことも可能という。まずは有料プラン「Pro」「Enterprise」「Team」ユーザー向けにプレビュー版を提供。近日中に「Plus」や教育機関向けプランのユーザーにも開放する。

photo Codex(画像は同社の発表から引用、以下同)

 OpenAIの社内ベンチマークによれば、codex-1はソフトウェアエンジニアリングにおいて「o1-high」「o4-mini-high」「o3-high」といったモデルを上回る性能を正確性を発揮したという。

photo OpenAIの社内ベンチマーク

 ユーザーの依頼を受けたcodex-1は、インターネットに接続されていない、ユーザーのリポジトリを読み込んだ独自のクラウドコンテナ環境で作業を行う。codex-1はファイルの読み取りや編集、テスト、型チェックなどのコマンドも実行でき、ユーザーはその様子をリアルタイムで確認できる。作業に当たっての不明点やテストの失敗があった際、ユーザーに通知する機能も備えるという。リポジトリ内にMarkdown形式の手順書を配置することで、コードの読み方やテストで実行するコマンドなどを指示できる。

photo 利用のイメージ
photo

 タスクの処理にかかる時間は、難易度に応じて1分から30分程度。マルウェアなど悪意あるソフトウェア開発のリクエストはブロックし、外部のWebサイトやサービス、APIにはアクセスしない。作業の完了後は、追加の修正を依頼したり、GitHubにプルリクエストを送信したり、変更をローカル環境に統合したりできる。

 Codexは米Ciscoなどの企業が先行して利用し、OpenAIにフィードバックを提供しているという。OpenAIは今後数週間以内は追加費用なしでCodexを提供するとしている。それ以降はレート制限を設け、上限を超えて利用したいユーザー向けの料金形態を設定する方針だ。

Copyright © ITmedia, Inc. All Rights Reserved.