Anthropic anunció el jueves que espera ampliar el acceso a su modelo de IA Claude Mythos “en las próximas semanas” después de completar pruebas adicionales de salvaguardas. La empresa hizo el anuncio junto con el lanzamiento de su nuevo modelo Opus 4.8, marcando su indicación más clara hasta ahora de una disponibilidad más amplia para el sistema centrado en la ciberseguridad. Anthropic ha restringido el acceso a Mythos mediante Project Glasswing desde marzo, tras advertencias de investigadores y agencias gubernamentales sobre la capacidad del modelo de realizar ciberataques autónomos. El anuncio llega en medio de un debate más amplio en la industria de la IA sobre cómo deben lanzarse a los clientes los sistemas avanzados con capacidades de seguridad ofensiva.
Restricciones actuales de acceso
Anthropic ha limitado la distribución de Claude Mythos a través de Project Glasswing, un programa que brinda acceso en condiciones controladas a un grupo selecto de empresas de tecnología, investigadores de seguridad y socios gubernamentales. La empresa describió por primera vez Mythos en materiales filtrados de un blog de marzo como “el modelo de IA más poderoso que hemos desarrollado”, posicionándolo como un nivel por encima de sus modelos Opus. Anthropic dijo que el modelo “anticipa una próxima ola de modelos que pueden explotar vulnerabilidades de maneras que superan con creces los esfuerzos de los defensores”. La empresa no especificó qué salvaguardas siguen incompletas antes de un lanzamiento más amplio ni si todos los clientes recibirán niveles de acceso idénticos. Anthropic no respondió a solicitudes de comentarios sobre los detalles de implementación.
Capacidades técnicas documentadas
El AI Security Institute del Reino Unido encontró que Mythos completó de forma autónoma un ataque simulado de red corporativa de 32 pasos durante las pruebas. En abril, Mozilla informó que Mythos identificó 271 vulnerabilidades en Firefox durante evaluaciones internas de seguridad. A principios de este mes, la startup de seguridad Calif afirmó que una versión de vista previa ayudó a los investigadores a desarrollar una cadena de explotación dirigida a los chips Mac M5 de Apple. Anthropic ha sostenido que Mythos podría ayudar a los defensores a identificar y corregir vulnerabilidades de software antes de que los atacantes las exploten. Investigadores de seguridad y agencias gubernamentales advirtieron que las mismas capacidades podrían acelerar los ciberataques.
Debate de la industria sobre la estrategia de lanzamiento
El modelo se ha vuelto central en las discusiones dentro de la industria de la IA sobre el lanzamiento de sistemas avanzados. Durante una entrevista de mayo con el podcast “Core Memory”, el CEO de OpenAI, Sam Altman, acusó a Anthropic de usar “marketing basado en el miedo”, argumentando que las advertencias sobre riesgos de ciberseguridad podrían justificar limitar el acceso a sistemas de IA poderosos. Los usuarios de Myriad—una plataforma de predicción de mercados operada por la empresa matriz de Decrypt, Dastan—otorgaron una probabilidad del 44% a que Mythos se lance antes de finales de junio al jueves, frente al 17,5% de esa mañana.
Próximos pasos confirmados
Anthropic afirmó que “está avanzando con rapidez en el desarrollo de estas salvaguardas” y espera llevar “modelos de la clase Mythos a todos nuestros clientes en las próximas semanas”.
Preguntas frecuentes
¿Qué es Project Glasswing?
Project Glasswing es el programa de acceso restringido de Anthropic que brinda a un grupo selecto de empresas de tecnología, investigadores de seguridad y socios gubernamentales acceso controlado al modelo Claude Mythos bajo condiciones específicas.
¿Qué vulnerabilidades ha identificado Mythos en pruebas?
Mozilla informó que Mythos identificó 271 vulnerabilidades en Firefox durante evaluaciones internas de seguridad de abril. El AI Security Institute del Reino Unido documentó que el modelo completó de forma autónoma un ataque simulado de red corporativa de 32 pasos. La startup de seguridad Calif afirmó que una versión de vista previa ayudó a desarrollar una cadena de explotación dirigida a los chips Mac M5 de Apple.
¿Cuándo anunció Anthropic por primera vez Mythos?
Claude Mythos apareció por primera vez en marzo después de que se filtraran en línea materiales borrador del blog de Anthropic. La empresa lo describió como “el modelo de IA más poderoso que hemos desarrollado” y lo posicionó como un nuevo nivel por encima de sus modelos Opus.