Anthropic 确认:Claude Code 质量下滑背后是三项产品层变更,而非模型问题

Gate News 消息,4月23日——Anthropic 的工程团队确认,用户在过去一个月中报告的 Claude Code 质量退化源于三个相互独立的产品层变更,而非 API 或底层模型问题。这三个问题分别在 4月7日、4月10日和 4月20日得到修复,当前最终版本为 v2.1.116。

第一项变更发生在 3月4日。为了解决在 Opus 4.6 高推理强度下偶发出现的极端延迟峰值,团队将 Claude Code 的默认推理工作量等级从 “high” 降为 “medium”。在大量用户抱怨性能下降后,团队在 4月7日撤回了该变更。目前在 Opus 4.7 上默认为 “xhigh”,在其他模型上默认为 “high”。

第二个问题是在 3月26日引入的一个漏洞。系统被设计为在对话不活跃超过一小时后清除旧的推理记录,以降低会话恢复成本。然而,实现中的缺陷导致清除操作在之后每一次轮次中反复执行,而不是只执行一次,从而使模型逐步丢失既有推理上下文。该问题表现为越来越健忘、重复操作以及异常的工具调用。该漏洞还导致每次请求都发生缓存未命中,从而加速用户配额的消耗。两个彼此无关的内部实验掩盖了复现条件,使得调试过程延长到超过一周。在 4月10日修复后,团队使用 Opus 4.7 检查了有问题的代码,并发现 Opus 4.7 能识别该漏洞,而 Opus 4.6 无法。

第三项变更于 4月16日与 Opus 4.7 同期上线。团队在系统提示词中加入了指令,以减少冗余输出。几周的内部测试表明不会出现回归,但上线后与其他提示词的交互会降低编码质量。更长时间的评估显示 Opus 4.6 和 4.7 的性能均下降 3%,因此团队在 4月20日执行了回滚。

这三项变更在不同时间影响了不同用户群体,它们叠加产生了广泛且不一致的质量下滑,使得诊断变得更加复杂。Anthropic 表示,现在它将需要更多内部员工像用户一样使用相同的公开构建版本,对每一次系统提示词修改都运行完整的模型评估套件,并实施分阶段的灰度发布期。作为补偿,Anthropic 已重置所有订阅用户的使用配额。

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Прогнозы Intel превзошли ожидания: спрос на ИИ оживил рынок CPU; после того как Чэнь Ли-ву вступил в должность, акции INTC выросли в 3 раза

Выручка Intel за квартал составила 13,6 млрд долларов, EPS 0,29; в прогнозе на второй квартал медиана 14,3 млрд, что значительно превзошло ожидания, маржа валовой прибыли 41%. Спрос на AI-датацентры подталкивает поворот для CPU, Xeon и другие серверные решения пользуются спросом. Чэнь Ливу возглавляет трансформацию: IFS за первый квартал — 5,4 млрд долларов, рост 16%, внешние клиенты, такие как Tesla, следят за тем, как Terafab использует технологии Intel. После закрытия торгов цена акций выросла примерно на 20%, достигнув исторического максимума; с прошлого года рост составил почти 3 раза.

ChainNewsAbmedia4м назад

Cognition AI привлекает финансирование при оценке $25B в рамках ранних переговоров

Сообщение Gate News, 24 апреля — Cognition AI, стартап по разработке ИИ, ведет ранние переговоры о новом раунде финансирования, который, согласно источникам, знакомым с ситуацией, более чем удвоит его оценку до $25 миллиардов. Компания планирует привлечь сотни миллионов долларов или более, поскольку спрос на технологии генеративного ИИ в разработке программного обеспечения продолжает расти.

GateNews1ч назад

NEC 株式会社 станет первым в Японии глобальным партнером Anthropic

NEC объявила о том, что станет первым в Японии глобальным партнером Anthropic; обе стороны будут разрабатывать безопасные и учитывающие отраслевую экспертизу решения на базе ИИ для высокорегулируемых отраслей, таких как финансы, производство и местные органы власти, а также интегрируют серию Claude в NEC BluStellar, делая акцент на управлении, ориентированном на данные, и трансформации клиентского опыта. При этом будут внедрены Claude Cowork и интеграция с SOC, чтобы повысить уровень защиты кибербезопасности. Чтобы подтвердить эффективность, NEC запустила программу для «нулевого клиента» (Zero Customer) для проведения всеобъемлющих внутренних испытаний ИИ-агентов, и планирует в дальнейшем продвигать развертывание Claude по всему миру, создавая крупнейший в Японии масштабный Центр передового опыта (CoE) для AI-native-инженеров.

ChainNewsAbmedia3ч назад

Утечка в системе безопасности Vercel расширилась до сотен пользователей; разработчики ИИ находятся в группе повышенного риска

Сообщение Gate News, 23 апреля — Vercel сообщила 19 апреля, что ее инцидент в области безопасности, первоначально описанный как затрагивающий «ограниченное подмножество клиентов», расширился и теперь затрагивает гораздо более широкое сообщество разработчиков, особенно тех, кто создает рабочие процессы для ИИ-агентов. Атака может затронуть сотни пользователей

GateNews4ч назад

OpenAI 推出 GPT-5.5:12M контекст, AA-индекс на первом месте, Terminal-Bench 82,7% переписывает эталон для агентов

OpenAI опубликовала GPT-5.5, с акцентом на агентную работу и обработку корпоративных знаний, и одновременно запустила его в ChatGPT и Codex. Ключевые моменты включают контекстное окно 12 000 000 token, AA Intelligence Index 60, опережение Claude Opus на 4.7 и Gemini на 3.1 Pro; цена — 5 долларов за 1 млн token на вход и 30 долларов за 1 млн token на выход, количество выходных token снижено примерно на 40%, а фактическая стоимость выросла примерно на 20%.

ChainNewsAbmedia5ч назад

Cluster Protocol привлекает $5M , чтобы ускорить CodeXero, браузерно-нативную AI IDE для EVM

Сообщение Gate News от 23 апреля — Cluster Protocol, компания в сфере AI deeptech и Web3-инфраструктуры, объявила, что привлекла $5 миллиона в новом раунде финансирования под руководством DAO5, при участии Paper Ventures, JPEG Trading и Mapleblock Capital. Общий объем привлеченного финансирования составил $7.75 миллиона. Средства будут

GateNews6ч назад
комментарий
0/400
Нет комментариев