Anthropic встроила примерно шесть инженеров в Агентство национальной безопасности США, чтобы развернуть модель Mythos AI для наступательных киберопераций, сообщила в четверг Financial Times. Инженеры адаптируют модель под конкретные задачи, потенциально включая проникновение в сети в Китае и Иране, говорится в источнике, который цитирует FT. Развертывание произошло параллельно с тем, как Anthropic опубликовала исследования с призывом к согласованной глобальной паузе в разработке ИИ и подала заявку на IPO, которое может оценить компанию более чем в 1 триллион долларов.
Anthropic разместила около шести инженеров внутри Агентства национальной безопасности США, чтобы помочь развернуть Mythos — свою самую способную модель ИИ — для наступательных киберопераций, говорится в сообщении Financial Times. Инженеры — сотрудники, направленные заранее на места и занимающиеся настройкой модели под конкретные применения. Один источник сообщил FT, что модель может быть полезна для проникновения в сети стран вроде Китая и Ирана.
Mythos — это та же модель Anthropic, от которой компания отказывается публиковать публично, ссылаясь на риск злоупотреблений. В компании ограничили доступ проверенными партнёрами через Project Glasswing — закрытую коалицию, в которую входят Microsoft, Apple и Amazon. Не подтверждается, участвуют ли эти инженеры в активных операциях.
Anthropic подаёт в суд на Пентагон после того, как министр обороны Пит Хегсет назначил компании статус риска для цепочек поставок в конце февраля — ярлык, исторически зарезервированный для иностранных противников вроде Huawei. Назначение последовало за крахом контракта на 200 миллионов долларов. Слабое место: Anthropic отказалась разрешить Министерству обороны использовать Claude для полностью автономных вооружений или для внутреннего массового наблюдения. Контракт с NSA был освобождён от этого запрета.
Судья из Калифорнии заблокировал включение в чёрный список как, по-видимому, ответную меру за нарушение Первой поправки. Апелляционный суд округа Колумбия отклонил просьбу Anthropic приостановить назначение, пока идёт разбирательство. Агентство национальной безопасности продолжало использовать Mythos в течение этого периода, как говорится в отчёте FT. Дедлайн Пентагона по исключению Claude из своих систем наступит в августе.
В тот же день, когда стало известно о истории с NSA, внутренний исследовательский институт Anthropic опубликовал «When AI Builds Itself», в котором рассматривается, насколько Claude продвинулся в автоматизации собственной разработки. Теперь Claude пишет более 80% кода, объединённого в производственную кодовую базу Anthropic — тогда как до запуска Claude Code в начале 2025 года эта доля составляла цифры в пределах нескольких процентов. Инженеры поставляют примерно в восемь раз больше кода в день, чем в 2024 году.
В апреле агентам Claude дали открытую задачу по безопасности ИИ — сможет ли более слабая модель надёжно контролировать более сильную — и оставили решить её. Двумя человеческими исследователями примерно за неделю удалось восстановить 23% разрыва в эффективности между моделями. Агенты восстановили 97% за 800 накопленных часов вычислений. Люди сформулировали вопрос, а агенты спроектировали каждый эксперимент. Авторы отчёта — руководитель Anthropic Institute Марины Фаваро и сооснователь Джек Кларк — описали это как первый опубликованный случай, когда Claude проявляет исследовательское суждение, а не просто выполняет задачи, заданные кем-то другим.
В отчёте говорится о необходимости проверяемой глобальной паузы — когда несколько форвардных лабораторий останавливаются одновременно, а независимая верификация подтверждает, что все действительно прекратили работу. Anthropic заявила, что присоединится к такой паузе. Авторы сравнили предлагаемую схему с ядерными соглашениями времён холодной войны, заключёнными между Соединёнными Штатами и Россией.
Anthropic предупредила, что траектория ведёт к рекурсивному самосовершенствованию: системы ИИ, которые автономно проектируют, создают и обучают собственных преемников, при этом на каждом шаге роль людей будет уменьшаться. Как отмечается в отчёте, когда ИИ выбирает, какие эксперименты стоит проводить — а не просто проводит их — люди утрачивают последнюю значимую роль в цикле разработки. Небольшие несоответствия, видимые в моделях сегодня, могут накапливаться на протяжении поколений самоулучшающегося ИИ, пока никто не сможет их исправить.
В 2023 году более сотни крупных имён в сообществе исследователей ИИ подписали открытое письмо с просьбой о глобальных усилиях по снижению риска вымирания, который присущ разработке ИИ по своей природе. За несколько месяцев до этого другое открытое письмо потребовало, чтобы OpenAI приостановила прогресс по ChatGPT из-за его опасной природы. После открытого письма 2023 года никто не остановился. OpenAI — не остановилась. Anthropic — тоже.
Что сделала Anthropic в NSA? Anthropic встроила примерно шесть инженеров в Агентство национальной безопасности США, чтобы развернуть модель Mythos AI для наступательных киберопераций, говорится в сообщении Financial Times, опубликованном в четверг. Инженеры адаптируют модель под конкретные задачи, потенциально включая проникновение в сети в Китае и Иране.
Почему Anthropic судится с Пентагоном? Anthropic подаёт в суд на Пентагон после того, как министр обороны Пит Хегсет назначил компании статус риска для цепочек поставок в конце февраля после краха контракта на 200 миллионов долларов. Anthropic отказалась разрешить Министерству обороны использовать Claude для полностью автономных вооружений или для внутреннего массового наблюдения. Судья из Калифорнии заблокировал включение в чёрный список как, по-видимому, ответную меру за нарушение Первой поправки, а апелляционный суд округа Колумбия отклонил просьбу Anthropic приостановить назначение, пока идёт разбирательство.
Сколько кода пишет Claude для Anthropic? Теперь Claude пишет более 80% кода, объединённого в производственную кодовую базу Anthropic — тогда как до запуска Claude Code в начале 2025 года эта доля составляла цифры в пределах нескольких процентов. Инженеры поставляют примерно в восемь раз больше кода в день, чем в 2024 году, согласно отчёту Anthropic «When AI Builds Itself», опубликованному внутренним исследовательским институтом компании.
Связанные новости
Anthropic подала конфиденциальный проспект IPO и тестирует аппетит рынка к оценке ИИ
Anthropic призывает к глобальному замедлению ИИ на фоне риска рекурсивного самосовершенствования
Акции CrowdStrike падают на 7% несмотря на спрос на кибербезопасность, обусловленный Mythos
Отчёт Anthropic: вероятность победы в решениях ИИ выросла до 64%, оптимизация кода в 52 раза
Искусственный интеллект Anthropic Claude пишет 80% производственного кода по состоянию на май 2026 года