A Anthropic anunciou na quinta-feira que espera alargar o acesso ao seu modelo de IA Claude Mythos «nas próximas semanas», depois de concluir testes adicionais de salvaguardas. A empresa fez a declaração em paralelo com o lançamento do seu novo modelo Opus 4.8, assinalando a sua indicação mais clara até ao momento de uma disponibilidade mais ampla para o sistema focado em cibersegurança. A Anthropic restringiu o acesso ao Mythos através do Project Glasswing desde março, na sequência de alertas de investigadores e de agências governamentais sobre as capacidades autónomas do modelo para ciberataques. O anúncio surge num contexto de debate mais alargado na indústria da IA sobre como sistemas avançados com capacidades de segurança ofensiva devem ser disponibilizados aos clientes.
Restrições actuais de acesso
A Anthropic limitou a distribuição do Claude Mythos através do Project Glasswing, um programa que concede acesso, sob condições controladas, a empresas tecnológicas seleccionadas, investigadores de segurança e parceiros governamentais. A empresa descreveu pela primeira vez o Mythos em materiais de blog de março que foram divulgados com antecedência, como «o modelo de IA mais poderoso que alguma vez desenvolvemos», posicionando-o acima da sua gama de modelos Opus. A Anthropic afirmou que o modelo «antecipa uma vaga de modelos capazes de explorar vulnerabilidades de formas que ultrapassam em larga medida os esforços dos defensores». A empresa não especificou quais as salvaguardas que permanecem incompletas antes de um lançamento mais amplo, nem se todos os clientes receberão níveis de acesso idênticos. A Anthropic não respondeu a pedidos de comentário sobre detalhes de implementação.
Capacidades técnicas documentadas
O U.K.'s AI Security Institute (Instituto de Segurança em IA do Reino Unido) concluiu que o Mythos completou autonomamente um ataque simulado em rede corporativa de 32 etapas durante os testes. Em abril, a Mozilla reportou que o Mythos identificou 271 vulnerabilidades no Firefox durante avaliações internas de segurança. No início deste mês, a startup de segurança Calif declarou que uma versão de pré-visualização ajudou os investigadores a desenvolver uma cadeia de exploração dirigida aos chips Mac M5 da Apple. A Anthropic argumentou que o Mythos poderia ajudar os defensores a identificar e corrigir vulnerabilidades de software antes de os atacantes as explorarem. Investigadores de segurança e agências governamentais alertaram que as mesmas capacidades poderiam acelerar ciberataques.
Debate na indústria sobre estratégia de lançamento
O modelo tornou-se central nas discussões na indústria da IA sobre lançamentos de sistemas avançados. Numa entrevista de maio ao podcast «Core Memory», o CEO da OpenAI, Sam Altman, acusou a Anthropic de usar «marketing baseado no medo», argumentando que os alertas sobre riscos de cibersegurança poderiam justificar a limitação do acesso a sistemas de IA poderosos. Os utilizadores na Myriad — uma plataforma de mercados de previsão operada pela empresa-mãe da Decrypt, a Dastan — atribuíram uma probabilidade de 44% ao lançamento do Mythos até ao final de junho até quinta-feira, acima dos 17,5% dessa manhã.
Próximos passos confirmados
A Anthropic afirmou que «está a fazer progressos rápidos no desenvolvimento destas salvaguardas» e espera disponibilizar «modelos de classe Mythos a todos os nossos clientes nas próximas semanas».
Perguntas frequentes
O que é o Project Glasswing?
O Project Glasswing é o programa de acesso restrito da Anthropic, que oferece a empresas tecnológicas seleccionadas, investigadores de segurança e parceiros governamentais acesso controlado ao modelo Claude Mythos sob condições específicas.
Que vulnerabilidades o Mythos identificou nos testes?
A Mozilla reportou que o Mythos identificou 271 vulnerabilidades no Firefox durante avaliações internas de segurança em abril. O U.K.'s AI Security Institute documentou que o modelo concluiu autonomamente um ataque simulado de 32 etapas numa rede corporativa. A startup de segurança Calif afirmou que uma versão de pré-visualização ajudou no desenvolvimento de uma cadeia de exploração dirigida aos chips Mac M5 da Apple.
Quando é que a Anthropic anunciou pela primeira vez o Mythos?
O Claude Mythos surgiu pela primeira vez em março, depois de materiais de rascunho do blog da Anthropic terem sido divulgados online. A empresa descreveu-o como «o modelo de IA mais poderoso que alguma vez desenvolvemos» e posicionou-o como um novo escalão acima dos seus modelos Opus.