Глава Anthropic Даро Амодей опубликовал policy-эссе 10 июня, призвав к обязательному тестированию со стороны третьих лиц для frontier-моделей ИИ, при этом правительство должно обладать полномочиями блокировать системы, не прошедшие проверки безопасности. Эссе под названием «Policy on the AI Exponential» пришло спустя день после того, как Anthropic выпустила Claude Fable 5, и сопровождалось законодательным предложением по тестированию моделей и рамкой по вытеснению рабочих мест. Амодей заявил, что одной лишь прозрачности больше недостаточно, чтобы соответствовать рискам, которые несет быстро развивающаяся технология ИИ. В 2025 году Anthropic поддерживала законы, основанные на раскрытии информации, включая SB 53 в Калифорнии, RAISE Act в Нью-Йорке и SB 315 в Иллинойсе, однако теперь Амодей предлагает режим, смоделированный по образцу Федерального управления гражданской авиации (FAA): модели, которые выше порога по вычислениям, должны проходить обязательные аудиты в четырех областях: кибербезопасность, биологическое оружие, потеря контроля и автоматизированные исследования ИИ.
Амодей предлагает обязательные ИИ-аудиты третьих лиц
Предложение Амодея требует, чтобы frontier-модели ИИ выше порога по вычислениям сталкивались с обязательными аудитами третьих лиц в четырех областях: кибербезопасность, биологическое оружие, потеря контроля и автоматизированные исследования ИИ. «Frontier-модели ИИ, как самолеты, должны проходить технические тесты и аудит, а их выпуск должен блокироваться или отменяться как угроза общественной безопасности, если они не соответствуют высоким стандартам безопасности», — написал Амодей в эссе. План выходит за рамки июньского Executive Order Белого дома по ИИ, который Амодей приветствовал как шаг вперед. В предложении предусмотрено уведомление о инцидентах по безопасности промптов и жесткая защита весов моделей.
Предпросмотр Claude Mythos Preview решил 73% экспертных киберзадач
Амодей назвал кибербезопасность первым риском, который полностью материализовался, указав на Claude Mythos Preview, который решил 73% экспертных киберзадач, которые не проходила ни одна ИИ-система прежде. В эссе говорится, что frontier-модели могут нарушить работу финансового сектора и критической инфраструктуры. 9 июня Anthropic поставила модель Claude Fable 5 с ограничителями, которые блокируют запросы с высоким риском в части кибербезопасности и биологии. Амодей заявил, что такие добровольные ограничения не могут заменить обязательные правила, применимые по всей отрасли. Данные самой Anthropic показывают, что ИИ создает более качественный ИИ: Claude пишет большую часть кода в крупных AI-лабораториях.
Anthropic предлагает страхование зарплат и гранты на обучение кадров
В эссе предлагаются страхование зарплат, налоговые стимулы для удержания работников и гранты на обучение кадров для решения проблем экономического вытеснения. Если вытеснение окажется устойчивым, Амодей заявил, что универсальный базовый доход можно профинансировать за счет налогов компаний или налога на прирост капитала. В части гражданских свобод Амодей призывает запретить полностью автономные вооружения в законах о внутреннем правоприменении и предлагает Конгрессу закрыть лазейку, связанную с брокерами данных, которая позволяет покупать оптовые системы наблюдения. В геополитическом плане он призывает к коалиции демократий контролировать чипы и оборудование для производства полупроводников, называя готовящиеся законопроекты США MATCH и OVERWATCH первыми шагами к более жесткому, скоординированному контролю экспорта.
FAQ
Что Дарио Амодей предложил 10 июня?
Даро Амодей опубликовал эссе под названием «Policy on the AI Exponential» 10 июня, предложив обязательное тестирование третьими лицами frontier-моделей ИИ с государственными полномочиями блокировать системы, которые не проходят проверки безопасности, в четырех областях: кибербезопасность, биологическое оружие, потеря контроля и автоматизированные исследования ИИ.
Почему Амодей назвал кибербезопасность первым риском, который полностью материализуется?
Амодей сослался на Claude Mythos Preview, который решил 73% экспертных киберзадач, которые не проходила ни одна ИИ-система прежде, и предупредил, что frontier-модели могут нарушить работу финансового сектора и критической инфраструктуры.
Какие экономические меры Anthropic предложила в эссе?
Anthropic предложила страхование зарплат, налоговые стимулы для удержания работников и гранты на обучение кадров для решения проблем вытеснения рабочих мест, при этом универсальный базовый доход должен финансироваться за счет налогов компаний или налога на прирост капитала, если вытеснение окажется устойчивым.