検索
速報

OpenAI、「Codex」刷新 PCの直接操作に対応し汎用作業エージェントへ

OpenAIは、コーディングエージェント「Codex」の大幅アップデートを発表した。画面認識によるPCの直接操作や、90以上の外部ツール連携に対応し、「汎用作業エージェント」へと進化。画像生成モデルとの統合やメモリ機能も追加され、UI設計から開発ワークフローの自動化まで、広範なタスク実行を支援する。

Share
Tweet
LINE
Hatena

 米OpenAIは4月16日(現地時間)、コーディングエージェント「Codex」の大幅アップデートを発表した。今回の更新では、従来のコード生成支援にとどまらず、PC操作や外部ツール連携などを含めた「汎用作業エージェント」としての機能強化が図られている。

 codex 1
(画像:OpenAI)

 最も大きな変更点は、ユーザーのPC上のアプリを直接操作できる「computer use」機能の導入だ。Codexは画面を認識し、自らカーソル操作や入力を行い、アプリの起動や操作を実行できるようになった。さらに複数のエージェントを並列で動作させることも可能で、ユーザーの作業を妨げずにバックグラウンドでタスクを進められる。これにより、APIが用意されていないアプリやフロントエンドのテスト作業などにも対応できるようになる。

 codex 2
MacOS上でCodexを操作(画像:OpenAIの動画より)

 Webや各種ツールとの連携も大幅に強化された。アプリ内ブラウザを備え、Webページ上に直接コメントして指示を与えられるほか、JIRAやGitLab、Microsoftの製品群などと連携する90以上のプラグインが追加された。これにより、開発管理やCI/CD、データ基盤など、開発ワークフロー全体を横断した作業が可能になる。

 生成機能も拡張された。画像生成モデル「gpt-image-1.5」との統合により、コードと画像を組み合わせたUI設計やモックアップ作成が同一環境で行えるようになった。また、ユーザーの操作履歴や設定を記憶するメモリ機能や、継続的・反復的な作業を自動化する機能も追加され、より長期的なタスク実行に対応する。

 加えて、開発者向け機能として、GitHubのレビューコメントへの対応、複数ターミナルの同時利用、SSH経由でのリモート開発環境接続(α版)などが導入された。ファイルのプレビュー表示や、エージェントの計画や進行状況を可視化するサマリーパネルも備え、開発プロセス全体の効率化を支援する。

 これらのアップデートは同日から、ChatGPTアカウントでログインしたCodexのデスクトップアプリ(MacおよびWindows)ユーザー向けに順次提供される。PC操作機能は当初macOSでのみ利用可能で、今後EUや英国などにも展開予定。メモリなどのパーソナライズ機能はEnterprise、Eduユーザー、欧州・英国ユーザー向けに順次提供される見込みだ。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る