De acuerdo con una investigación de la Universidad de Zhejiang presentada en el 47º Simposio IEEE sobre Seguridad y Privacidad en San Francisco, los investigadores desarrollaron AudioHijack, que oculta comandos imperceptibles en audio para manipular grandes modelos de lenguaje de audio con una tasa de éxito del 79-96%.
El ataque modifica las formas de onda de audio digital de maneras que son imperceptibles para los humanos, pero alteran la forma en que la IA interpreta la señal, lo que le permite anular el comportamiento del modelo incluso cuando hay instrucciones legítimas del usuario presentes. Los investigadores probaron AudioHijack en 13 modelos de voz de código abierto y en sistemas comerciales de Microsoft y Mistral, y encontraron que puede forzar a los modelos a rechazar solicitudes, difundir información falsa, insertar enlaces maliciosos o ejecutar acciones no autorizadas como búsquedas web y descargas de archivos.