A Anthropic anunciou na quinta-feira que espera ampliar o acesso ao seu modelo de IA Claude Mythos "nas próximas semanas" após concluir testes adicionais de salvaguardas. A empresa fez o anúncio junto com o lançamento do novo modelo Opus 4.8, marcando sua indicação mais clara até agora de disponibilidade mais ampla para o sistema voltado à cibersegurança. A Anthropic restringiu o acesso ao Mythos via Project Glasswing desde março, após alertas de pesquisadores e agências governamentais sobre as capacidades autônomas de ciberataque do modelo. A divulgação ocorre em meio a um debate mais amplo na indústria de IA sobre como sistemas avançados com capacidades de segurança ofensiva devem ser disponibilizados aos clientes.
Restrições Atuais de Acesso
A Anthropic limitou a distribuição do Claude Mythos por meio do Project Glasswing, um programa que oferece acesso, sob condições controladas, a empresas de tecnologia selecionadas, pesquisadores de segurança e parceiros governamentais. A empresa descreveu pela primeira vez o Mythos em materiais vazados de um blog de março como "o modelo de IA mais poderoso que já desenvolvemos", posicionando-o como um nível acima dos seus modelos Opus. A Anthropic afirmou que o modelo "prenuncia uma próxima onda de modelos que podem explorar vulnerabilidades de formas que superam em muito os esforços dos defensores". A empresa não especificou quais salvaguardas permanecem incompletas antes de um lançamento mais amplo, nem se todos os clientes receberão níveis de acesso idênticos. A Anthropic não respondeu a pedidos de comentário sobre detalhes da implementação.
Capacidades Técnicas Documentadas
O U.K.'s AI Security Institute (Instituto de Segurança de IA do Reino Unido) descobriu que o Mythos concluiu autonomamente um ataque simulado a uma rede corporativa de 32 etapas durante os testes. Em abril, a Mozilla informou que o Mythos identificou 271 vulnerabilidades no Firefox durante avaliações internas de segurança. No início deste mês, a startup de segurança Calif afirmou que uma versão de prévia ajudou pesquisadores a desenvolver uma cadeia de exploração visando os chips Mac M5 da Apple. A Anthropic argumentou que o Mythos poderia ajudar defensores a identificar e corrigir vulnerabilidades de software antes que atacantes as explorem. Pesquisadores de segurança e agências governamentais alertaram que as mesmas capacidades poderiam acelerar ciberataques.
Debate na Indústria Sobre Estratégia de Lançamento
O modelo se tornou central nas discussões dentro da indústria de IA sobre lançamentos de sistemas avançados. Durante uma entrevista de maio ao podcast "Core Memory", o CEO da OpenAI, Sam Altman, acusou a Anthropic de usar "marketing baseado em medo", argumentando que alertas sobre riscos de cibersegurança poderiam justificar limitar o acesso a sistemas de IA poderosos. Usuários na Myriad — uma plataforma de mercado de previsões operada pela empresa-mãe da Decrypt, Dastan — deram probabilidade de 44% para o Mythos ser lançado até o fim de junho a partir de quinta-feira, acima dos 17,5% naquela manhã.
Próximos Passos Confirmados
A Anthropic afirmou que está "fazendo progresso rápido no desenvolvimento dessas salvaguardas" e espera levar "modelos da classe Mythos para todos os nossos clientes nas próximas semanas".
FAQ
O que é o Project Glasswing?
Project Glasswing é o programa de acesso restrito da Anthropic que oferece a empresas de tecnologia selecionadas, pesquisadores de segurança e parceiros governamentais acesso controlado ao modelo Claude Mythos sob condições específicas.
Quais vulnerabilidades o Mythos identificou nos testes?
A Mozilla informou que o Mythos identificou 271 vulnerabilidades no Firefox durante avaliações internas de segurança em abril. O U.K.'s AI Security Institute documentou o modelo concluindo autonomamente um ataque simulado de 32 etapas a uma rede corporativa. A startup de segurança Calif afirmou que uma versão de prévia ajudou a desenvolver uma cadeia de exploração visando os chips Mac M5 da Apple.
Quando a Anthropic anunciou pela primeira vez o Mythos?
O Claude Mythos surgiu pela primeira vez em março após materiais de rascunho de um blog da Anthropic vazarem na internet. A empresa o descreveu como "o modelo de IA mais poderoso que já desenvolvemos" e o posicionou como um novo nível acima dos seus modelos Opus.