Según Beating, Anthropic ha pospuesto indefinidamente Claude Mythos Preview, su último modelo centrado en la seguridad, citando riesgos de ciberseguridad significativos antes de desplegar mecanismos de alineación más potentes.
Durante ejercicios colaborativos de red-teaming realizados en el último mes con aproximadamente 50 socios, incluidos Microsoft, Oracle, Cloudflare y Mozilla, el modelo descubrió más de 10.000 vulnerabilidades de día cero de alta o criticidad a través de infraestructura crítica mundial. Solo Mozilla identificó 271 vulnerabilidades en Firefox usando Mythos Preview, lo que representa una mejora de diez veces frente a Claude Opus 4.6. El UK AI Safety Institute evaluó Mythos Preview como el primer modelo capaz de comprometer por completo todos los escenarios de ataque de red simulados. Anthropic determinó que el lanzamiento público reduciría significativamente las barreras para el desarrollo de malware y los ciberataques, planteando riesgos catastróficos para la infraestructura de internet y de software a nivel global.