В среду генеральный директор Anthropic Дарио Амодей опубликовал программное эссе, в котором призвал установить обязательные требования по безопасности и сделать обязательным независимое стороннее тестирование для фронтирных ИИ-моделей, по образцу правил FAA для авиации. Предложение предусматривает тестирование по четырем категориям риска: кибербезопасность, биологическое оружие, потеря контроля над ИИ и автоматизированные R&D, а также наличие у государства полномочий блокировать небезопасные развертывания.
Объявление политики совпало с запуском Anthropic Claude Mythos 5 — ограниченной фронтирной модели для организаций по кибербезопасности и государственных партнеров. Параллельно компания выпустила Claude Fable 5 — публичную версию, которая маршрутизирует чувствительные запросы в менее способную модель как мера защиты от злоупотреблений.