Claude Code の品質に関する最新レポート
アンソトロピックは、過去 1 ヶ月間に報告された Claude Code の品質低下問題に関する調査結果と対応策を発表しました。同社によると、API や推論層には影響がなく、問題は Claude Code の 3 つの別個の変更によって引き起こされたと特定しました。これらすべての問題は 4 月 20 日にリリースされたバージョン v2.1.116 で修正されました。最初の不具合は 3 月 4 日、遅延を減らすためデフォルトの推論効率を「高」から「中」に変更したことが原因でした。この変更はユーザーから知能レベルが低下したとの報告を受け、4 月 7 日に元に戻され、Opus 4.6 以外のモデルでは高、Opus 4.7 では超高に設定されています。2 番目の問題は 3 月 26 日、1 時間以上のアイドル状態後に古い思考履歴を削除するキャッシュ最適化機能にバグがあったことで発生しました。本来はセッション再開時に一度だけ実行されるべきものが、以降の全てのターンで実行され、Claude が過去の文脈を忘れて反復したり不自然な選択をしたりする原因となりました。このバグは 4 月 10 日に修正されました。3 番目の問題は 4 月 16 日、Opus 4.7 のリリースに合わせて、出力の冗長さを減らすためのシステムプロンプト変更がコード品質を低下させたことが原因でした。この変更は 4 月 20 日に差し戻されました。これらの複合的な影響により、ユーザーには広範囲で一貫しない品質低下のように見えたものの、各変更は異なるタイミングで異なるユーザー層に影響を与えていました。調査の過程で、これらの問題は内部評価やテストでは初期段階では再現が困難でした。再発防止策として、同社は将来のシステムプロンプト変更に対してより厳格な評価プロセスを導入し、全社員が公開ビルドを使用するよう徹底し、変更の監査と管理を強化します。また、GitHub や X での情報発信を強化し、ユーザーからのフィードバックをより重視する体制を整備します。加えて、問題発覚に伴い、4 月 23 日時点で全ての契約者に対して使用制限をリセットする措置が取られました。
