Vào hôm thứ Tư, CEO của Anthropic, Dario Amodei, đã công bố một bài tiểu luận chính sách kêu gọi áp dụng các yêu cầu an toàn mang tính bắt buộc và kiểm thử bắt buộc từ bên thứ ba đối với các mô hình AI “frontier”, theo mô hình các quy định của FAA dành cho máy bay. Đề xuất này yêu cầu kiểm thử trên bốn nhóm rủi ro: an ninh mạng, vũ khí sinh học, nguy cơ mất kiểm soát AI và R&D tự động, đồng thời trao thẩm quyền cho chính phủ để chặn các đợt triển khai không an toàn.
Thông báo chính sách trùng thời điểm với việc Anthropic ra mắt Claude Mythos 5, một mô hình “frontier” bị hạn chế dành cho các tổ chức an ninh mạng và các đối tác chính phủ. Cùng lúc, công ty cũng phát hành Claude Fable 5, phiên bản hướng tới công chúng, có cơ chế chuyển các yêu cầu nhạy cảm tới một mô hình kém năng lực hơn như một biện pháp phòng ngừa nhằm chống lạm dụng.