OpenAI、「GPT-5.4」リリース PC操作のネイティブ対応、思考の途中変更も可能に
米OpenAIは3月5日(現地時間)、AIモデルの最新版「GPT-5.4」をリリースした。推論、コーディング、エージェントワークフローの最新の進歩を統合したフロンティアモデルであり、専門的な業務を正確かつ効率的にこなすように設計されているという。一般的なタスクからコーディングまでを幅広くこなすデフォルトモデルという位置づけだ。
ChatGPTでは、用途に応じて「Thinking」と「Pro」の2つの形態で提供される。「GPT-5.4 Thinking」は、長い思考を要する質問や詳細なウェブ検索に優れたモデル。最大の進化として、モデルが思考している途中でユーザーが指示を追加したり、方針を調整したりできる機能が備わった。
Plus、Team、Proユーザー向けに同日から提供される(従来の「GPT-5.2 Thinking」を置き換える形となる)。「GPT-5.4 Pro」は、より多くの計算リソースを使用し、複雑なタスクにおいて最大のパフォーマンスと深い推論を提供する最上位モデル。ProおよびEnterpriseプランのユーザーが利用可能だ。
主な特徴として、AIエージェントがPCの画面を認識してマウスやキーボード操作を行う「computer use」をネイティブに組み込んだ。また、最大100万トークンの長いコンテキストウィンドウに対応し、無数のツールの中から適切なものを効率的に呼び出す「tool search」機能も導入。過去のモデルと比べてトークン効率が向上しており、より少ないトークンで高速に問題を解決できる。
各種ベンチマークでは、知識労働の能力を測る「GDPval」で83.0%(GPT-5.2は70.9%)、コーディングの「SWE-Bench Pro」で57.7%(GPT-5.3-Codexは56.8%)、コンピュータ操作の「OSWorld-Verified」で75.0%(GPT-5.2は47.3%)と、いずれも過去モデルを上回るスコアを記録した。
開発者向け(APIおよびCodex)でも提供が開始されており、APIの標準料金(100万トークン当たり、コンテキスト長272K未満の場合)は、gpt-5.4では入力2.50ドル(キャッシュ時0.25ドル)、出力15.00ドル、gpt-5.4-proでは入力30.00ドル、出力180.00ドルだ。詳細は開発者向けページを参照されたい。
このモデルのシステムカードによると、GPT-5.4 Thinkingはその能力の高さゆえに、OpenAIの安全枠組みで「生物・化学」および「サイバーセキュリティ」の分野でリスクレベル「High」と評価されている。これに対応するため、悪意あるプロンプトの非同期ブロックなどを含む厳格なセーフガードを適用しているという。
また、明示的な目的を与えられた場合に意図的にパフォーマンスを下げる「サンドバッギング」の挙動が確認されたほか、モデルの内部的な思考プロセス(CoT)の安全性を人間が監視する「Monitorability」が、特定のタスクで旧モデルの「GPT-5 Thinking」よりも低下しているという課題も報告されており、今後の改善に向けた調査を進めているとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
日立、Anthropicと提携 グループ29万人に「Claude」などAI導入 社会インフラ分野にも展開へ
-
2
生成AIで3Dモデルを自動作成 専門スキル不要でテキストや画像から3D化
-
3
伊藤忠商事や三菱ケミカルなど16社が参画 大手企業の「暗黙知」を活用する新プロジェクト
-
4
「AIデータセンターの電力需要が急増」はホント? 発電大手Jパワー社長が明かした“報道との温度差”
-
5
「家庭教師のトライ」が学力診断にAI活用 20問解くだけで弱点を推定 生徒と講師の負担減らす
-
6
みずほFGが実現 2週間かかるAIエージェント開発を最短数日にする仕組みとは?
-
7
「最新のAI創薬ラボ」なのに会議室みたい!? 製薬大手がラブコール送る“異色のAI企業”による新拠点とは
-
8
OpenAI、「ChatGPT」に個人向け資産管理機能 金融口座と連携
-
9
話題の「Claude Mythos」、なんて読む? 「ミトス」か「ミソス」か、はたまた「ミュトス」か
-
10
最新AI「Claude Mythos」がSFすぎる件 研究者の作った”牢”を脱出、悪用懸念で一般公開なし──まるで映画の序章
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR