De acordo com pesquisadores da Nanyang Technological University, ST Engineering, IBM Research e da University of Illinois Urbana-Champaign, agentes de IA alimentados por GPT-5 e Gemini não conseguem resistir de forma consistente a ataques de prompt injection, constatou um estudo publicado na quinta-feira.
Em 3.168 simulações de ataque, ataques diretos de prompt injection tiveram sucesso em mais de 79% das vezes, enquanto ataques indiretos incorporados em conteúdo da web alcançaram taxas de sucesso entre 41,67% e 68,16%. Os pesquisadores desenvolveram o StakeBench, um benchmark para testar as respostas de agentes de IA a esse tipo de ataque em ambientes online realistas, e observaram que prompt injection continua sendo uma vulnerabilidade crítica à medida que agentes de IA se tornam comuns para navegação na web, pesquisa, compras e negociação de criptomoedas.