OpenAIはGPT-5.6系を限定公開した。旗艦モデルの「Sol」、日常業務に適したバランス型の「Terra」、低コストで高速な「Luna」で構成する。安全策を厚くし、APIとCodexで先行提供してからChatGPTを含む広い公開を予定している。
この記事は会員限定です。会員登録すると全てご覧いただけます。
AI業界では、性能が急伸した新型の大規模言語モデル(LLM)を、まず一般公開せずにごく少数の組織に限定提供する「限定プレビュー」という手法が広がりつつある。Anthropicは2026年4月、サイバーセキュリティ領域で突出した能力を持つ「Claude Mythos」を、一般提供せずパートナー企業・組織限定で公開しており、同社は当時、今後半年から1年程度で他のAI企業も同様に高性能なモデルを抱えるようになるとの見方を示していた。
OpenAIは2026年6月26日(現地時間)、次世代モデル群「GPT-5.6」シリーズの限定プレビュー開始を発表した。シリーズは、旗艦モデルの「Sol」、日常業務に適したバランス型の「Terra」、低コストで高速な「Luna」で構成する。
しかし今回は、単なる性能面の理由にとどまらない。OpenAIは米政府との協議を経て提供範囲を絞るという、これまでにない経緯をたどった。
今回の限定プレビューは、米政府との継続的な協議が背景にある。OpenAIは発表前に、計画とモデルの能力を米政府に共有した。政府側の要請を受け、参加者情報が政府に共有された少数の信頼できるパートナーから提供を始める。OpenAIは、この種の政府アクセス手続きが長期的な標準になるべきではないとの考えを示しつつ、今後数週間で幅広い提供に移るための短期的措置と説明した。加えて、サイバー関連の大統領令フレームワークに即しつつ、今後のモデル公開に使える再現性ある手続きを政権側と作る考えも示した。
性能面では、GPT-5.6 Solを同社の現時点で最上位のモデルと位置付ける。評価については、コーディングや生物学、サイバーセキュリティの分野で、エージェンティックな能力の向上を示した。詳細な安全性と準備状況の評価はシステムカードで公開し、一般提供時には評価結果の拡充版を出す予定だ。GPT-5.6では、新たに最大推論努力設定を導入し、Solが深い推論に時間を使えるようにした。単一エージェントの能力を超える「ultra mode」も導入し、サブエージェントを活用して複雑な作業を速める。
GPT-5.6 Solはコーディング領域において、Terminal-Bench 2.1で最先端の水準を示した。同ベンチマークは、計画、反復、ツール連携を要するコマンドライン作業を測るものだ。サイバーセキュリティ領域においては、脆弱(ぜいじゃく)性研究やエクスプロイトを含む長期的なセキュリティ作業で、性能と効率の境界を押し上げた。脆弱性をどこまで悪用できるかを測るベンチマーク「ExploitBench」では、Mythos Previewに近い性能を約3分の1の出力トークンで実現した。UC Berkeleyの研究者がOpenAIなどと協力して作ったエクスプロイト能力を評価する「ExploitGym」でも、推論量の増加に伴いSol、Terra、Lunaの各モデルがサイバー能力を高めた。
安全対策について、OpenAIはGPT-5.6 Sol、Terra、Lunaに過去最も堅牢(けんろう)な保護策を導入したと説明した。各モデルの能力に応じて設定を変え、実世界の敵対的圧力に耐える設計を目指した。正当なコードレビュー、脆弱性研究、パッチ開発、デバッグ、セキュリティ教育、防御的テストへのアクセスを保ちながら、禁止される攻撃的活動をより困難で、不確実で、検知可能にすることを目標に掲げる。OpenAIの評価では、正当な防御作業には大きな利益が見込まれ、禁止される攻撃的利用は意味のある形で制約される。
GPT-5.6 Solは、脆弱性の発見・修正支援で高い能力を持つが、エンド・ツー・エンドの攻撃を安定して実行する段階には至らないとOpenAIは説明した。同社が独自に定めるリスク評価基準「Preparedness Framework」上では、最高警戒レベルに当たる「Cyber Critical」のしきい値を超えていないという。「Chromium」と「Mozilla Firefox」による評価において、バグやエクスプロイトの構成要素は見つけたが、テスト条件下で機能するフルチェーンエクスプロイトを自律的には生成しなかった。ただし、ベンチマークの評価基準だけでは、モデルが他のツールと組み合わされる場合を含む全利用形態を捕捉しきれない。OpenAIは、この不確実性と能力の段階的変化を踏まえ、保護策と段階的公開を組み合わせる。
保護策は複数層で構成する。モデル自体には、禁止されたサイバー支援を拒否する訓練を施した。ユーザーが意図を隠した場合や脱獄を試みた場合も対象になる。生成中にはサイバーと生物学の不正利用分類器が出力を評価し、高リスクの場合は生成を止め、大型推論モデルが会話と文脈を確認する。許可されない出力と判断された場合、ユーザーに届く前に差し止める。フラグが立った活動は、利用規約やポリシーに沿って、関連会話やリスクシグナルを含むアカウント単位の確認につながる場合がある。
プレビュー中は、正当な作業でも拒否やブロックが発生する可能性がある。特に防御的活動と攻撃的活動が初期段階で似て見えるデュアルユース領域では、保護策が作業を止める場合がある。OpenAIは、プレビューを通じて、悪用を抑えつつ通常業務を安定して効率よく完了できるかを確認する。企業顧客とは、プライバシーを保つ検知、顧客側が運用する安全管理、顧客・ユーザー・ワークロードのリスクに応じたアクセス管理など、長期的な方策も探る。
堅牢性強化において、自社モデルを使った自動レッドチーミングに70万A100相当GPU時間超を投じた。狙いは、多様なプロンプトや文脈で効く汎用(はんよう)的な脱獄手法を見つけ、保護策を早く改善することだ。人間の専門家による第三者レッドチーミングも実施し、プレビュー期間中も継続する。OpenAIは、評価だけでは全ての製品構成や複数段階の攻撃、実世界の作業を代表できないとしている。そのため、新たに見つかった脱獄を再現や評価、優先付け、修正し、継続評価に組み込む迅速対応プロセスを維持する。
価格は100万トークン当たりで、Solが入力5ドル、出力30ドル、Terraが入力2.50ドル、出力15ドル、Lunaが入力1ドル、出力6ドルだ。GPT-5.6以降では、より予測可能なプロンプトキャッシュも導入する。明示的なキャッシュ区切りと30分の最小キャッシュ保持期間をサポートし、キャッシュ書き込みは非キャッシュ入力料金の1.25倍、キャッシュ読み取りは90%割引を継続する。2026年7月中に、Cerebras上でGPT-5.6 Solを最大毎秒750トークンで提供する計画も示した。初期アクセスは、容量拡大に沿って一部顧客に限定する。
“ほぼ全ての人間を上回る”未公開AIモデル「Claude Mythos Preview」、悪用防止の緊急プロジェクト発足
「ExcelのためのChatGPT」ついに登場 GPT-5.4で実用レベルに?
米2強が狙う“AI社員”の普及 Anthropicは「業務代行」、OpenAIは「運用プラットフォーム」
Claudeが驚異の1100%成長でシェア17%に急拡大、急落するCopilot――米生成AIアプリ市場動向調査Copyright © ITmedia, Inc. All Rights Reserved.