El miércoles, el CEO de Anthropic, Dario Amodei, publicó un ensayo de políticas en el que pide requisitos de seguridad vinculantes y pruebas obligatorias de terceros para los modelos de IA “frontier”, tomando como referencia las regulaciones de la FAA para aeronaves. La propuesta exige pruebas en cuatro categorías de riesgo: ciberseguridad, armas biológicas, pérdida del control de la IA y I+D automatizada, con autoridad gubernamental para bloquear despliegues inseguros.
El anuncio de la política coincide con el lanzamiento por parte de Anthropic de Claude Mythos 5, un modelo “frontier” restringido para organizaciones de ciberseguridad y socios gubernamentales. La empresa también lanzó al mismo tiempo Claude Fable 5, una versión orientada al público que deriva las solicitudes sensibles a un modelo menos capaz como salvaguarda contra el mal uso.