検索
速報

Anthropic、「Claude Code」の品質低下問題を修正 全サブスクユーザーの使用制限枠をリセット

Anthropicは、「Claude Code」の品質低下を招いた3つの技術的要因を特定し、修正したと発表した。デフォルトの推論エフォート変更、キャッシュ最適化のバグ、システムプロンプトによる過度な文字数制限が原因だった。全サブスクユーザーの使用制限枠をリセットし、今後はテスト体制の強化と透明性の高い情報発信に努める方針だ。

Share
Tweet
LINE
Hatena

 米Anthropicは4月23日(現地時間)、「Claude Code」の品質低下に関するユーザーからの報告を受け、その原因となった3つの技術的要因を特定し、修正したと発表した。過去1カ月間、ユーザーからはClaudeの知能が低下したように感じられるという声や、物忘れや同じ発言の繰り返し、不自然なツールの選択が行われるといった問題が報告されていた。さらに、コーディングの品質低下や、一部のユーザーで使用制限枠が予想以上に早く消費される事象も発生していたという。

 claude code

 これらの問題は基盤となるAPIそのものには影響しておらず、Claude Code、Claude Agent SDK、Claude Coworkで発生していた。

 品質低下を引き起こした3つの要因のうち、1つ目は3月4日に実施された推論エフォートのデフォルト設定の変更だった。処理の遅延やUIのフリーズを軽減する目的でデフォルトを「high」から「medium」に引き下げたが、知能の低下を招いたため、4月7日にOpus 4.7では「xhigh」、その他のモデルでは「high」をデフォルト設定とする修正が行われた。

 code
Claude Code(バージョン2.1.111)ではデフォルトがmediumだった(画像:Anthropic)

 2つ目は、3月26日に導入されたキャッシュ最適化機能のバグ。1時間以上待機状態だったセッションの古い思考履歴を消去して遅延やコストを削減する意図だったが、バグにより毎ターン履歴が消去されてしまう状態に陥り、モデルが自身の推論過程を継続的に忘れる原因となっていた。この不具合は4月10日のアップデートで修正された。

 3つ目は、4月16日にモデルの回答の冗長さを抑える目的で追加されたシステムプロンプトの指示だった。文字数を厳しく制限する指示が意図せずコーディングの品質を低下させていることが事後の評価テストで判明したことから、4月20日に該当のプロンプトを元に戻す対応が行われた。

 すべての問題は4月20日のバージョン2.1.116で解決されており、4月23日に全サブスクユーザーの使用制限枠をリセットする措置を講じている。

 Anthropicは今後に向けて、同様の問題の再発を防ぐための体制強化を発表した。社内テストでユーザーと全く同じ公開ビルドや設定を使用する割合を大幅に増やすほか、システムプロンプトの変更に対する管理を厳格化し、モデルごとの広範な評価テストや段階的な展開を実施するとしている。さらに、開発者向けの公式XアカウントやGitHubを活用し、製品に関する決定やその背景となる理由について、コミュニティに対する透明性の高い情報発信を継続していく方針としている。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る