周三,Anthropic 首席执行官 Dario Amodei 发布了一篇政策论文,呼吁制定具有约束力的安全要求,并对前沿 AI 模型实施强制性的第三方测试,做法以针对飞机的 FAA 规定为范本。该提案要求在四个风险类别上进行测试:网络安全、生物武器、失去对 AI 的控制以及自动化研发,并赋予政府权力以阻止不安全的部署。
该政策公告与 Anthropic 推出 Claude Mythos 5 同步,后者是面向网络安全组织及政府合作伙伴的受限制型前沿模型。与此同时,该公司还发布了 Claude Fable 5:一个面向公众的版本,会将敏感请求路由到能力较弱的模型,以作为防止被滥用的安全措施。