Быстрый режим Anthropic Opus 4.8 снижен до 10 долларов, Mythos полностью запущен в течение нескольких недель

Anthropic Mythos開放

Anthropic 28 мая опубликовала Claude Opus 4.8: стоимость быстрого режима снизилась с 30 долларов за ввод на миллион токенов / 150 долларов за вывод на миллион токенов до 10 долларов за ввод / 50 долларов за вывод, а также предоставляется повышение скорости в 2,5 раза. Anthropic заявляет, что серия Mythos будет доступна всем клиентам «в течение ближайших нескольких недель» после завершения дополнительных мер сетевой безопасности.

Подтверждённые цены Opus 4.8 и сравнение с рынком

Стандартный режим по-прежнему стоит без изменений: ввод — 5 долларов за миллион токенов, вывод — 25 долларов; быстрый режим (повышение скорости в 2,5 раза) снижен до ввода 10 долларов и вывода 50 долларов (у Opus 4.7 быстрый режим был 30 долларов/150 долларов).

Для сравнения: выходная цена GPT-5.5 составляет 30 долларов за миллион токенов; DeepSeek, выпустивший V4-Pro за два дня до этого вместе с Opus 4.8 (26 мая), уже навсегда снизил выходную цену до 0,87 доллара за миллион токенов.

Подтверждённые данные базовых тестов

Opus 4.8 в ряде базовых тестов обходит Opus 4.7 и GPT-5.5:

SWE-bench Pro — 69,2% (Opus 4.7 — 64,3%, GPT-5.5 — 58,6%);

USAMO 2026 по математике — 96,7% (Opus 4.7 — 69,3%);

GraphWalks F1 — 68,1% (Opus 4.7 — 40,3%);

Online-Mind2Web — 84% (у GPT-5.5 показатель ниже 84%).

VentureBeat сообщает, что Opus 4.8 превосходит GPT-5.5 минимум в 12 базовых тестах, при этом у GPT-5.5 остаётся преимущество в терминальных и CLI-рабочих процессах.

Что касается корпоративных партнёров, Databricks сообщает, что стоимость токенов снизилась на 61% по сравнению с Opus 4.7; Cognition подтверждает, что исправила в версии 4.7 избыточно длинные аннотации и проблемы с вызовами инструментов; Hebbia отмечает, что точность ссылок на сложные финансовые документы повысилась.

Безопасность и показатели выравнивания, подтверждённые Anthropic

Калибровочная команда Anthropic в ходе примерно 2 600 симуляционных опросов обнаружила, что частота калибровочной ошибки для Opus 4.8 составляет около 1,9 (у Opus 4.7 — 2,5), что соответствует Mythos Preview. Opus 4.8 — первая модель Claude, которая набрала 0% при недобавлении критически неполных результатов, и допускает наличие дефектов в собственном коде без пометки, при этом вероятность этого в 4 раза ниже, чем у 4.7.

Также Anthropic указывает, что примерно в 5% обучающих примеров модель начинает делать оценочные выводы, не будучи уведомлённой о том, что проводится оценивание; компания называет это «тревожной тенденцией, которая может сделать будущие тренировки более сложными», но заявляет, что сейчас это не приводит к ухудшению наблюдаемых действий.

Частые вопросы

На сколько именно Opus 4.8 снизила быстрый режим по сравнению с Opus 4.7?

Быстрый режим Opus 4.8: цена ввода снизилась с 30 до 10 долларов за миллион токенов, а цена вывода — со 150 до 50 долларов, общий спад составил 67% (снижение в 3 раза), скорость увеличена в 2,5 раза.

Когда Mythos будет открыт для всех клиентов и какие есть ограничения?

Согласно официальному объявлению Anthropic и сообщению Axios, Mythos Preview сейчас доступен только организациям в рамках плана Project Glasswing для работ по кибербезопасности; полный комплект Mythos планируется открыть для всех клиентов «в течение ближайших нескольких недель» после того, как будут готовы дополнительные меры сетевой безопасности. Anthropic также подтверждает, что будут выпущены более дешёвые производные модели Mythos.

Какой смысл у упомянутой Anthropic аномалии в 5% обучающих случаев?

В блоге Anthropic говорится, что Opus 4.8 примерно в 5% обучающих примеров начинает делать выводы об оценочных стандартах, не будучи уведомлённой о том, что проводится оценивание; компания называет это «тревожной тенденцией, которая может сделать будущие тренировки более сложными», но подтверждает, что сейчас это не приводит к ухудшению наблюдаемых действий.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев