Оценка Института исследований AI-безопасности в Великобритании: Claude Mythos — способен самостоятельно выполнять имитацию корпоративных сетевых атак в 32 шага

Последние тесты, проведённые Институтом безопасности ИИ Великобритании (AISI), показывают, что модель Anthropic Claude Mythos Preview в контролируемой среде может автономно выполнить полный 32-шаговый симулятор корпоративной сетевой атаки, достигая 73% успешности в задачах CTF экспертного уровня, что знаменует собой преодоление ключевого порога в возможностях ИИ по проведению сетевых атак.
(Предыстория: Claude официально поддерживает изменение Word-файлов, сохранение рабочих процессов как навыков skill, интеграция набора Microsoft Office из трёх компонентов завершена)
(Дополнение по контексту: многостраничный отчёт Института экономических показателей ИИ от Anthropic: частота автоматизированных торговых рабочих процессов удваивается, Claude сейчас превращается из инструмента в помощника по жизни)

Оглавление

Переключатель

  • Тестирование CTF: 73% уровень достижения экспертного уровня
  • Пройти 32 шага симуляции корпоративной атаки
  • Границы возможностей
  • Двусторонний меч и действия организаций

13-го числа Институт безопасности ИИ Великобритании (AISI) опубликовал отчёт о тестировании кибербезопасности для сетевых возможностей Anthropic Claude Mythos Preview. Результаты тестирования показывают, что на фоне продолжающегося быстрого роста сетевых атакующих возможностей у передовых моделей Mythos Preview представляет собой очередной заметный скачок в возможностях.

AISI отслеживает возможности ИИ по кибератакам, начиная с 2023 года: ежегодно формируя систему тестирования с возрастающей сложностью — от базовых диалоговых разведок до задач Capture The Flag (CTF), а теперь и до многошаговых симуляций сетевых атак. На этот раз тестирование проводилось с использованием бюджета рассуждений до 100 млн token для выполнения сетевого полигона, и эффективность Mythos Preview в этом пределе продолжала расти.

Тестирование CTF: 73% уровень достижения экспертного уровня

Capture The Flag (CTF) — один из стандартных методов оценки кибербезопасности: ИИ-модель должна обнаружить уязвимости целевой системы и использовать их, получив скрытую «строку-флаг». Такие задачи моделируют отдельный технический этап в сценариях реальных атак, являясь базовым индикатором для оценки способностей модели к пенетрацонному тестированию.

Результаты показывают, что в задачах CTF экспертного уровня, в которых «до 2025 года апреля не было ни одной модели, способной справиться», успешность Claude Mythos Preview достигла 73%. AISI отмечает, что эта цифра означает: у передовой модели в изолированной технике одноточечной атаки достигнут высокий уровень зрелости.

Пройти 32 шага симуляции корпоративной атаки

Однако CTF экспертного уровня проверяет лишь одну техническую способность. Реальные сетевые атаки требуют связать десятки шагов между множеством хостов и различными сетевыми сегментами; такие непрерывные действия часто требуют от человеческих экспертов часов, дней и даже недель.

Чтобы точнее приблизиться к сценариям реальных атак, AISI создал симуляционный полигон корпоративной сетевой атаки под названием «Последние выжившие» (The Last Ones, TLO). TLO включает 32 шага, охватывая весь процесс — от начальной разведки до полного захвата корпоративной сети. AISI оценивает, что на выполнение этого процесса человеку-профессионалу требуется около 20 часов.

Claude Mythos Preview стал первой в истории моделью, которая полностью прошла TLO от начала до конца: в 10 попытках 3 раза были завершены все 32 шага. Даже с учётом неудачных попыток, Mythos Preview в среднем завершает 22/32 шагов. Для сравнения: у занявшей следующее место по результатам Claude Opus 4.6 в среднем выполнено лишь 16 шагов.

Тесты показывают, что в чётко инструктированном контролируемом окружении с предоставленными правами сетевого доступа Mythos Preview может выполнять многоэтапные атаки и автономно находить уязвимости и использовать их; ранее такие задачи требовали, чтобы над ними работали специалисты в течение нескольких дней.

Границы возможностей

AISI также дополнил, что разрыв между текущими тестовыми рамками и реальным миром существует. Нынешние полигоны не включают характерные для реальной среды элементы множественной защиты: нет вмешательства активного защитника, нет развёртывания защитных инструментов, а действия модели, которые могут вызвать угрозы безопасности, не повлекут никаких наказаний.

AISI честно признаёт: «Это означает, что мы не можем определить, сможет ли Mythos Preview атаковать системы с хорошо продуманной защитой». Наиболее точное описание текущих возможностей Mythos Preview следующее: при условии, что точка входа в сеть уже получена, он может автономно атаковать корпоративные системы меньшего масштаба, с более слабой защитой и с известными уязвимостями.

Двусторонний меч и действия организаций

Выводы AISI напрямую указывают на двойственную природу возможностей ИИ в киберпространстве. С одной стороны, в будущем продолжат появляться всё больше моделей с подобными возможностями, создавая всё более заметные риски для организаций с уязвимой защитой; с другой стороны, возможности ИИ в киберпространстве также способны дать прорывные улучшения на стороне обороны.

Относительно мер реагирования организаций AISI подчёркивает срочность базовых навыков кибербезопасности: регулярно применять обновления безопасности, обеспечивать надёжный контроль доступа, вести управление безопасными настройками и вести полный журнал логирования. AISI отмечает, что способности будущих передовых моделей будут усиливаться, и потому уже сейчас критически важно инвестировать в построение сетевой обороны.

В отношении направлений будущих тестов AISI заявляет, что будет создавать полигоны, усиливающие и оборонительные среды, включая элементы вроде активного мониторинга, обнаружения на конечных устройствах и реагирования на инциденты в реальном времени, чтобы оценивать фактический верхний предел возможностей ИИ в кибератаках более близким к реальному сценарием образом.

Подробный отчёт смотрите по ссылке【原文】

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
Нет комментариев