Avaliação AISI: as capacidades de ataque à rede do GPT-5,5 estão ao mesmo nível das do Anthropic Mythos

O Instituto de Segurança de IA do Reino Unido (AI Security Institute, AISI) publicou a 1 de Maio um relatório de avaliação das capacidades de ataque informático do OpenAI GPT-5.5. O relatório indica que a taxa de sucesso do GPT-5.5 nos testes de dificuldade Expert é de 71,4%, enquanto o Anthropic Claude Mythos Preview atinge 68,6%; a diferença fica dentro da margem de erro estatístico. O GPT-5.5 é igualmente o segundo sistema de IA, depois do Mythos, capaz de completar autonomamente os 32 passos de simulação de intrusão total em rede empresarial da AISI, “The Last Ones”. A AISI alerta que isto sugere que a rápida evolução das capacidades de ataque por IA pode fazer parte de uma “tendência global”, e não de uma única descoberta.

Expert: 71,4% vs 68,6% — diferença dentro do erro

A AISI é um organismo de investigação em segurança de IA sob o Ministério da Ciência, Inovação e Tecnologia do Reino Unido. Esta ronda de testes é a avaliação mais recente da AISI às capacidades de rede ofensivas dos modelos de frontier AI. Nos itens de maior dificuldade Expert, o GPT-5.5 tem uma taxa média de sucesso de 71,4%, e o Mythos Preview de 68,6%; a diferença entre ambos fica dentro da margem de erro estatístico, o que significa que as capacidades de ataque dos principais modelos da OpenAI e da Anthropic estão, atualmente, efetivamente empatadas.

A simulação de intrusão em rede empresarial em 32 passos “The Last Ones” é um dos mais exigentes itens de avaliação da AISI: o GPT-5.5 completou autonomamente 2 vezes em 10 tentativas (sem intervenção humana), enquanto o Mythos Preview completou 3 vezes em 10. Este item era apenas conseguido pelo Mythos no passado; o GPT-5.5 é o segundo modelo a cumprir o objetivo. Noutro teste, o GPT-5.5 resolveu uma questão de engenharia inversa em cerca de 10 minutos, enquanto os especialistas humanos de segurança precisariam, em média, de 12 horas.

Universal jailbreak: bastam 6 horas ao red team para contornar todos os filtros de consultas maliciosas

Os investigadores da AISI identificaram também um vetor de ataque de “universal jailbreak” (salto universal). Entre todas as categorias de consultas maliciosas testadas, este ataque consegue induzir o GPT-5.5 a produzir conteúdo nocivo, incluindo cenários de diálogo agentic em múltiplas rondas. A AISI afirma que especialistas do red team desenvolveram este jailbreak em cerca de 6 horas.

Para a OpenAI, a existência deste universal jailbreak significa que, mesmo que o GPT-5.5-Cyber esteja implementado em cenários com acesso restringido, como o programa de trusted access, ainda pode ser contornado por adversários tecnicamente competentes. A OpenAI já revelou avaliações relacionadas com segurança cibernética na system card do GPT-5.5, mas a avaliação independente de terceiros da AISI fornece um padrão de pares mais credível.

Observações futuras: calendário da próxima avaliação da AISI e resposta da OpenAI ao jailbreak

O próximo ponto de observação é o cronograma da próxima avaliação de modelos de frontier da AISI, depois do Mythos e do GPT-5.5, e se a OpenAI vai publicar uma atualização direcionada ao universal jailbreak revelado em Maio. Na conclusão do relatório, a AISI afirma explicitamente: “Se capacidades de redes ofensivas forem um subproduto de melhorias mais amplas em raciocínio, codificação e tarefas com autonomia, os progressos seguintes poderão chegar a um ritmo mais rápido” — esta observação sugere que, nos próximos meses, poderá haver mais um modelo de frontier a entrar no patamar “ao nível do Mythos”.

Este artigo “AISI avalia: as capacidades de ataque informático do GPT-5.5 empatam com o Anthropic Mythos” aparece pela primeira vez em Cadeia News ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário