検索
ニュース

やはりClaude Codeの品質は下がっていた Anthropicが調査し特定した3つの要因AIニュースピックアップ

AnthropicはClaude Codeの品質低下報告の原因が設定変更や不具合、プロンプト調整の3点にあったと公表した。各問題は修正済みで、再発防止策として検証強化や運用改善に努める方針を示した。

Share
Tweet
LINE
Hatena

 Anthropicは2026年4月23日(現地時間、以下の日付は全て同年)、対話型AI「Claude」に関する品質低下の報告について、複数の変更が重なったことが原因だったと発表した。対象は開発者用機能であるClaude Codeや関連ツールで、API自体には影響がなかったとしている。問題は4月20日までに修正されている。

 今回の品質低下は単一の要因ではなく、3つの変更が異なるタイミングと利用範囲で作用した結果、広範で不安定な挙動として認識された。Anthropicは3月初旬から調査を開始したが、初期段階では通常のフィードバックのばらつきと区別が難しく、原因特定に時間を要したとしている。

最適化のつもりが裏目に 品質劣化を招いた「3つの変更」

 1つ目は、推論量設定の変更とされる。2月に公開されたモデル「Opus 4.6」では高い推論設定が初期値だったが、処理時間の長さに不満を受け、3月4日に中程度へ変更された。この調整は応答速度やコスト面では有利だったものの、出力の質が低下したと感じる利用者が増加した。その後の意見を踏まえ、4月7日に高い推論設定へ戻されている。

 2つ目は、セッション管理に関する不具合だ。3月26日に導入された最適化において、長時間操作がない場合に過去の思考履歴を削除する仕組みが追加された。しかし実装上の問題によって、この削除処理が以後の全てのやり取りで継続され、モデルが過去の判断理由を保持できなくなった。その結果、回答の一貫性低下や繰り返し、ツール選択の不自然さが発生した。この不具合は4月10日に修正された。

 この問題はキャッシュの利用効率にも影響し、利用制限の消費が想定以上に速いとの報告にもつながった。加えて、内部実験や表示仕様の変更が重なり、検証環境では症状が再現しにくい状況となっていた。

 3つ目は、冗長な出力を抑えるためのプロンプト変更だ。4月16日、応答の長さを制限する指示が追加されたが、他の調整と組み合わさることでコーディング性能に悪影響を与えた。追加検証で性能低下が確認され、4月20日に元の設定へ戻された。

 Anthropicはこれらの事象を受け、開発・検証体制を見直すという。実際の公開版と同一環境での利用を社内で拡大し、コードレビュー機能を強化する。プロンプト変更については評価範囲を拡大し、段階的な導入や検証期間を設けることで影響の早期把握を目指す。

 モデルごとの差異を考慮した制御や監査を容易にする仕組みも導入する。今回の不具合検出においては新モデルが旧モデルと比べて高い検出能力を示したことから、レビュー体制にもその知見を反映させる方針だ。

 同社は利用者からの報告が問題解決に大きく寄与したとし、謝意を示すと同時に、全利用者の使用制限をリセットする対応を実施した。今後は情報発信の強化も進め、製品変更の背景や意図をより明確に共有するとしている。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る