米Anthropicは5月28日(現地時間)、同社の最上位AIモデル「Claude Mythos (クロード・ミュトス) Preview」クラスのAIモデルについて、より強力な安全策を講じた上で、数週間以内に全顧客に提供するとの見通しを明らかにした。
Mythos Previewは4月に発表した同社最高性能のモデルで、ゼロデイ脆弱性の自律的な発見能力を持つ。
悪用リスクの大きさから一般公開を見送り、「Project Glasswing」として米AppleやGoogle、Microsoftなど限られたパートナー企業にのみ、防御目的で提供していた。
日本では三菱UFJ銀行、三井住友銀行、みずほ銀行がアクセス権確保を目指しているほか、日本政府も交渉を進めていると報じられている。
同日発表した最新AIモデル「Claude Opus 4.8」は、前世代のOpus 4.7からコーディング、推論、エージェント能力などの各ベンチマークで性能を向上させたという。
「誠実さ」を改善したのが特徴。自身が書いたコードの欠陥を見逃す可能性が、前世代の約4分の1に減少しているという。コンテキストを維持しながら自律的に長く独立して作業する能力も改善した。
ユーザーを欺いたり、有害な要求に応えるなど、Anthropicの安全基準や意図に反する「アライメント不良行動」の発生率はOpus 4.7よりも大幅に低く、最もアラインメントが高い(Anthropicの意図通りに行動する)Claude Mythos Previewと同程度だという。
価格はOpus 4.7から据え置きで、100万入力トークンあたり5ドル、100万出力トークンあたり25ドル。
「Claude Mythos」が1万件以上の脆弱性を発見 しかし修正追い付かず Anthropicが報告書
話題の「Claude Mythos」、なんて読む? 「ミトス」か「ミソス」か、はたまた「ミュトス」か
Appleが5年がかりで開発したセキュリティ対策を5日で突破 「Mythos」が見せつけた脆弱性攻撃の威力
金融庁・日銀、金融機関にAIサイバー攻撃の対策要請 対応の優先度決定など9項目Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR