OpenAI、Codexに「自律型UI操作」機能など追加 PC画面の直接操作で定型業務と開発フローを高速化:AIニュースピックアップ
OpenAIはAIコーディング支援ツール「Codex」を大幅に刷新し、PC画面を視覚的に認識して直接操作する「自律型UI操作」など多くの機能を導入した。外部ツール連携やメモリ機能によって複雑な事務作業や長期プロジェクトの自律的な遂行を支援する。
OpenAIは、2026年4月16日(現地時間)、AIコーディング支援ツール「Codex」の機能を大幅に拡張した。今回のアップデートにより、Codexはコード生成だけでなく、システムの理解、デバッグ、チームとの調整、長期的なタスク管理などを一つのワークスペースで完結させるツールとして実行できるようになった。
追加された主な機能は以下の通り。
コンピュータ操作でUIベースの自動化を実現
コンピュータ操作
Codexが画面を視覚的に認識し、自らカーソルを動かしてクリックやタイピングをできるようになった。APIを持たないアプリケーションやフロントエンドのテストも、人間と同じように操作、検証できる。
インアプリ・ブラウザ
アプリ内にブラウザが統合された。開発者は表示されたページに直接コメントを残すだけで、Codexにプログラムの修正やデザインの変更を指示できる。
画像生成の搭載
画像生成モデル「gpt-image-1.5」が搭載された。コードやスクリーンショットを基に、フロントエンドのモックアップやゲーム素材などの画像をワークフロー内で直接生成、編集できるようになった。
プラグインの充実
90以上の新規プラグイン(「Jira」「 Slack」「 Notion」「Microsoft 365」など)に対応し、外部ツールからの文脈収集とアクション実行ができるようになった。
統合開発ワークフローの強化
ソフトウェア開発ライフサイクルの統合支援
GitHubのプルリクエストレビューへの対応、複数ターミナルの同時起動、SSHによるリモート開発環境への接続機能(α版のみ)を実装。
リッチプレビュー
PDF、スプレッドシート、スライド、ドキュメントをアプリ内のサイドバーで直接プレビューでき、エージェントの計画や実行状況をCodex内の「サマリーペイン」パネルで追跡できる。
長期的なタスク実行とパーソナライズ
自動化の拡張
会話のスレッドを再利用し、過去の文脈を保持したまま作業を継続できる。タスクのスケジュール実行にも対応し、数日〜数週間にわたる長期プロジェクトを自律的に進められる。
メモリパーソナライズ機能(プレビュー版)
ユーザーの好みや過去の修正履歴を記憶し、使えば使うほど個別のニーズに最適化された回答に変化する。
プロアクティブな提案
接続されたツール(「Google Docs」やSlackなど)から優先順位の高いタスクを特定し、業務の開始時に「どこから着手すべきか」をユーザーに能動的に提案する。
これらのアップデートは、2026年4月16日から、ChatGPTにログインしているCodexデスクトップアプリのユーザー向けにロールアウトが開始されている。コンピュータ操作機能については、macOS向けに提供され、まもなくEUおよび英国でも利用可能となる。メモリパーソナライズ機能は、「Enterprise」「Edu」プランおよびEU、英国のユーザー向けにも順次展開を予定している。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
OpenAI、チーム開発向けにCodexの「従量課金制」を導入 ChatGPT Businessの値下げも
OpenAIはコード生成AI「Codex」にチーム向けの従量課金制を導入した。「ChatGPT Business」「Enterprise」のユーザーは、固定費のかからない「Codex-only seats」を通じて、Codexの全機能にアクセスできるようになる。
OpenAI、1220億ドル調達で評価額8520億ドルに到達
OpenAIは1220億ドルの資金調達を完了し、評価額は8520億ドルに達した。最新モデル投入やインフラ拡充、統合型アプリの構築を進める。月間売上は20億ドル規模に成長し、社会基盤としての地位確立を加速させる。
ChatGPTでDNSを介したデータ流出の脆弱性、Check Pointが指摘
Check Pointは、ChatGPTのコード実行環境に潜むDNS経由の情報流出経路を報告した。単一の不正プロンプトで会話内容や生成結果が外部へ送信され得る問題があるとしている。
「Claude Cowork」とRPAの根本的な違い AIが“ソフトウェアを殺す”メカニズム
Anthropicの自律型AI「Claude Cowork」がSaaS業界に激震を走らせている。なぜ「Anthropicショック」は起きたのか。そして、従来のRPAやGUI操作AIとは何が異なるのか。その仕組みを詳解する。

