Последние тесты, проведённые Институтом безопасности ИИ Великобритании (AISI), показывают, что модель Anthropic Claude Mythos Preview в контролируемой среде может автономно выполнить полный 32-шаговый симулятор корпоративной сетевой атаки, достигая 73% успешности в задачах CTF экспертного уровня, что знаменует собой преодоление ключевого порога в возможностях ИИ по проведению сетевых атак.
(Предыстория: Claude официально поддерживает изменение Word-файлов, сохранение рабочих процессов как навыков skill, интеграция набора Microsoft Office из трёх компонентов завершена)
(Дополнение по контексту: многостраничный отчёт Института экономических показателей ИИ от Anthropic: частота автоматизированных торговых рабочих процессов удваивается, Claude сейчас превращается из инструмента в помощника по жизни)
Оглавление
Переключатель
13-го числа Институт безопасности ИИ Великобритании (AISI) опубликовал отчёт о тестировании кибербезопасности для сетевых возможностей Anthropic Claude Mythos Preview. Результаты тестирования показывают, что на фоне продолжающегося быстрого роста сетевых атакующих возможностей у передовых моделей Mythos Preview представляет собой очередной заметный скачок в возможностях.
AISI отслеживает возможности ИИ по кибератакам, начиная с 2023 года: ежегодно формируя систему тестирования с возрастающей сложностью — от базовых диалоговых разведок до задач Capture The Flag (CTF), а теперь и до многошаговых симуляций сетевых атак. На этот раз тестирование проводилось с использованием бюджета рассуждений до 100 млн token для выполнения сетевого полигона, и эффективность Mythos Preview в этом пределе продолжала расти.
Capture The Flag (CTF) — один из стандартных методов оценки кибербезопасности: ИИ-модель должна обнаружить уязвимости целевой системы и использовать их, получив скрытую «строку-флаг». Такие задачи моделируют отдельный технический этап в сценариях реальных атак, являясь базовым индикатором для оценки способностей модели к пенетрацонному тестированию.
Результаты показывают, что в задачах CTF экспертного уровня, в которых «до 2025 года апреля не было ни одной модели, способной справиться», успешность Claude Mythos Preview достигла 73%. AISI отмечает, что эта цифра означает: у передовой модели в изолированной технике одноточечной атаки достигнут высокий уровень зрелости.
Однако CTF экспертного уровня проверяет лишь одну техническую способность. Реальные сетевые атаки требуют связать десятки шагов между множеством хостов и различными сетевыми сегментами; такие непрерывные действия часто требуют от человеческих экспертов часов, дней и даже недель.
Чтобы точнее приблизиться к сценариям реальных атак, AISI создал симуляционный полигон корпоративной сетевой атаки под названием «Последние выжившие» (The Last Ones, TLO). TLO включает 32 шага, охватывая весь процесс — от начальной разведки до полного захвата корпоративной сети. AISI оценивает, что на выполнение этого процесса человеку-профессионалу требуется около 20 часов.
Claude Mythos Preview стал первой в истории моделью, которая полностью прошла TLO от начала до конца: в 10 попытках 3 раза были завершены все 32 шага. Даже с учётом неудачных попыток, Mythos Preview в среднем завершает 22/32 шагов. Для сравнения: у занявшей следующее место по результатам Claude Opus 4.6 в среднем выполнено лишь 16 шагов.
Тесты показывают, что в чётко инструктированном контролируемом окружении с предоставленными правами сетевого доступа Mythos Preview может выполнять многоэтапные атаки и автономно находить уязвимости и использовать их; ранее такие задачи требовали, чтобы над ними работали специалисты в течение нескольких дней.
AISI также дополнил, что разрыв между текущими тестовыми рамками и реальным миром существует. Нынешние полигоны не включают характерные для реальной среды элементы множественной защиты: нет вмешательства активного защитника, нет развёртывания защитных инструментов, а действия модели, которые могут вызвать угрозы безопасности, не повлекут никаких наказаний.
AISI честно признаёт: «Это означает, что мы не можем определить, сможет ли Mythos Preview атаковать системы с хорошо продуманной защитой». Наиболее точное описание текущих возможностей Mythos Preview следующее: при условии, что точка входа в сеть уже получена, он может автономно атаковать корпоративные системы меньшего масштаба, с более слабой защитой и с известными уязвимостями.
Выводы AISI напрямую указывают на двойственную природу возможностей ИИ в киберпространстве. С одной стороны, в будущем продолжат появляться всё больше моделей с подобными возможностями, создавая всё более заметные риски для организаций с уязвимой защитой; с другой стороны, возможности ИИ в киберпространстве также способны дать прорывные улучшения на стороне обороны.
Относительно мер реагирования организаций AISI подчёркивает срочность базовых навыков кибербезопасности: регулярно применять обновления безопасности, обеспечивать надёжный контроль доступа, вести управление безопасными настройками и вести полный журнал логирования. AISI отмечает, что способности будущих передовых моделей будут усиливаться, и потому уже сейчас критически важно инвестировать в построение сетевой обороны.
В отношении направлений будущих тестов AISI заявляет, что будет создавать полигоны, усиливающие и оборонительные среды, включая элементы вроде активного мониторинга, обнаружения на конечных устройствах и реагирования на инциденты в реальном времени, чтобы оценивать фактический верхний предел возможностей ИИ в кибератаках более близким к реальному сценарием образом.
Подробный отчёт смотрите по ссылке【原文】
Что такое Claude Code? Самое полное руководство на 2026 год: установка через CLI, настольная версия, автоматизация Routines, MCP и полный разбор структуры прав для .claude
Claude Opus 4.7 Скрытое повышение цен: новый токенизатор заставляет тратить те же самые слова на 37–47% больше токенов, при этом тариф остается прежним, но счет становится дороже
Canva объявила о глубокой интеграции Claude, чтобы превращать AI-черновики в готовые дизайн-макеты
Лидеры глобальных финансов выражают серьезную обеспокоенность по поводу модели Mythos AI
Claude Opus 4.7 от Anthropic: рассуждения развиваются дальше, больше не просто инструмент для ответов