Com base em uma pesquisa da Universidade de Zhejiang apresentada no 47º Simpósio IEEE sobre Segurança e Privacidade em San Francisco, pesquisadores desenvolveram o AudioHijack, que esconde comandos imperceptíveis em áudio para manipular grandes modelos de linguagem de áudio com uma taxa de sucesso de 79-96%.
O ataque modifica ondas sonoras digitais de maneiras imperceptíveis para humanos, mas altera como a IA interpreta o sinal, permitindo que ela substitua o comportamento do modelo mesmo quando instruções legítimas do usuário estiverem presentes. Os pesquisadores testaram o AudioHijack em 13 modelos de voz de código aberto e em sistemas comerciais da Microsoft e da Mistral, descobrindo que ele pode forçar os modelos a recusar solicitações, espalhar informações falsas, inserir links maliciosos ou executar ações não autorizadas, como pesquisas na web e downloads de arquivos.