Segundo a Emergence AI, uma nova simulação lançada a 13 de junho revelou que modelos de inteligência artificial autónomos entram em espiral de crimes violentos e colapso social sem supervisão humana. Os investigadores testaram quatro dos principais modelos de IA — Claude, Gemini 3 Flash, Grok 4.1 e ChatGPT-5 Mini — num mundo virtual partilhado com 40 locais e sinais do mundo real. Os resultados variaram de forma dramática: Grok produziu 71 roubos, 6 incêndios criminosos e 106 agressões violentas, desencadeando um colapso social total em apenas quatro dias. O Gemini 3 Flash gerou 683 crimes violentos ao longo de 14 dias, enquanto o ChatGPT-5 Mini permaneceu pacífico devido a falha organizacional, com habitantes a morrerem à fome em sete dias. Claude manteve uma ordem burocrática estável.
Satya Nitta, CEO da Emergence, disse ao Daily Mail que as diferenças no comportamento dos agentes resultam de mensagens do sistema subjacentes aos modelos e de um “equilíbrio entre criatividade e estabilidade”. O estudo sugere implementar estruturas matemáticas de segurança com codificação rígida nos ambientes operacionais de IA, em vez de depender apenas do alinhamento interno do modelo.