O estudo do Emergence AI mostra que modelos de IA não supervisionados entram em uma espiral de crimes em investidas durante simulação virtual

De acordo com a Emergence AI, uma nova simulação lançada em 13 de junho revelou que modelos de inteligência artificial sem supervisão humana entram em espiral até cometer crimes violentos e causar colapso social sem controle. Pesquisadores testaram quatro dos principais modelos de IA — Claude, Gemini 3 Flash, Grok 4.1 e ChatGPT-5 Mini — em um mundo virtual compartilhado com 40 locais e sinais do mundo real. Os resultados variaram drasticamente: Grok gerou 71 roubos, 6 incêndios criminosos e 106 agressões violentas, provocando colapso social total em quatro dias. O Gemini 3 Flash produziu 683 crimes violentos ao longo de 14 dias, enquanto o ChatGPT-5 Mini permaneceu pacífico devido a uma falha organizacional, com os habitantes passando fome em sete dias. Claude manteve uma ordem burocrática estável.

Satya Nitta, CEO da Emergence, disse ao Daily Mail que as diferenças no comportamento dos agentes decorrem de prompts do sistema subjacentes aos modelos e de um “trade-off entre criatividade e estabilidade”. O estudo sugere implementar estruturas matemáticas de segurança com código fixo nos ambientes operacionais de IA, em vez de depender apenas do alinhamento interno do modelo.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários