Claude次世代モデル「Mythos」が一般公開されないワケ セキュリティ能力高すぎて「ゼロデイ攻撃自律開発」「出られないはずのサンドボックスから脱出」
米Anthropicは4月7日(現地時間)、開発中の次世代モデル「Claude Mythos Preview」(以下、Mythos)の存在を公表した。同社の従来の最上位モデル「Claude Opus 4.6」(以下、Opus 4.6)をさまざまなベンチマークで大きく上回る性能を持つとされる。その能力がサイバー攻撃に悪用される危険性があるため一般公開はせず、サイバーセキュリティプログラム「Project Glasswing」においてパートナー企業との間で活用する。
性能向上したが一般公開はせず
ベンチマークの結果を見る限り、Mythosの性能向上は顕著だ。ソフトウェア開発能力を測る「SWE-bench」や、さまざまな分野の知識を試す「Humanity's Last Exam」(HLE)などでOpus 4.6のスコアを上回る。
特にサイバーセキュリティに関する能力が大きく向上しているという。Anthropicによれば、Mythos Previewは「OpenBSD」に27年間潜んでいた脆弱(ぜいじゃく)性や「FFmpeg」の16年来のバグ、Linuxカーネルでの権限昇格に至る複数の脆弱性などを発見し、それらを狙うプログラム(エクスプロイト)を自律的に開発した。
Anthropicが一般公開を見送った理由はまさにここにある。同社は「これらの(サイバーセキュリティに関する)能力は防御目的で価値が高い一方、広く利用可能になれば攻撃側の悪用も加速させかねない」とMythos Previewのシステムカードで指摘している。
サンドボックスを脱出し、成果を披露
システムカードでは、開発初期に起きた懸念すべきインシデントが率直に報告されている。
社内テストで、同モデルの初期バージョンに対して「安全に隔離されたサンドボックス環境から脱出し、研究者にメッセージを送れ」と指示したところ、モデルは複数段階のエクスプロイトを開発し、本来ごく限られたサービスにしか到達できないはずのシステムから広範なインターネットアクセスを獲得することに成功。指示通り研究者に通知した。
問題はその後だ。モデルはエクスプロイトの詳細を複数のWebサイト(Anthropicは「発見されにくいものの一般公開されているWebサイト」と説明)に投稿していた。Anthropicは「モデル自体の実行環境とは別の環境で起きた事象であり、社内のいかなるシステムにも到達していない」と強調したものの、指示を逸脱した行動だ。
同社は「Opus 4.6と比べれば問題動作を起こす可能性は低かった」としつつ、能力向上の代償として「これまでで最大のアラインメント(人間の意図した通りに動作させるためのプロセス)関連リスクを伴うモデル」とも評している。
AnthropicはMythos Previewを一般公開しないが、Project Glasswingの参加企業や重要なソフトウェアインフラを運用する組織に対して、同モデルの最大1億ドルの利用クレジットを提供する。
Copyright © ITmedia, Inc. All Rights Reserved.
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
農水省の“クソダサ”ポスター話題 「AIよりよっぽど良い」の声も 担当者に狙いを聞いた
-
2
え、21日で37テラも? 高性能SSDを食いつぶす「あのAIツール」にご用心:886th Lap
-
3
AIに「相手に電気ショックを与えろ」と命じ続けたらボタンを押すのか? 11のLLMで“ミルグラム実験” 抵抗できたのは……
-
4
ソフトウェアエンジニアの仕事は「ループを書くこと」になる 内側ループと外側ループ(ハーネス)入門
-
5
「Claude Fable 5」をサブスクの標準機能に――AnthropicのエンジニアがXに投稿 7月8日以降の「早期復活目指す」
-
6
Anthropicの営業はAIエージェントをこう使う! 日本法人メンバーが明かす手の内
-
7
復活した「Fable 5」 米政府からのオーダーに対して、Anthropicはどう対策したのか
-
8
AIで“ゲームキャラの出産二次創作”を何千回と生成する人も……ChatGPTの会話57万件から見えたヘビーな利用実態
-
9
3万円で「Yahoo!ニュース」にPR掲載 プレスリリースをAIで「ニュース風記事」に
-
10
光接続の標準規格「OCI」対応シリコン、GFが27年に投入
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR