De acordo com uma investigação da Universidade de Zhejiang apresentada no 47.º Simpósio IEEE sobre Segurança e Privacidade, em São Francisco, os investigadores desenvolveram o AudioHijack, que esconde comandos impercetíveis em áudio para manipular grandes modelos áudio-idioma com uma taxa de sucesso de 79-96%.
O ataque altera formas de onda de áudio digitais de um modo impercetível para os humanos, mas muda a forma como a IA interpreta o sinal, permitindo-lhe substituir o comportamento do modelo mesmo quando estão presentes instruções legítimas do utilizador. Os investigadores testaram o AudioHijack em 13 modelos de voz open source e em sistemas comerciais da Microsoft e da Mistral, concluindo que consegue forçar os modelos a recusarem pedidos, a difundirem informação falsa, a inserir ligações maliciosas ou a executar ações não autorizadas, como pesquisas na web e transferências de ficheiros.