AudioHijack 攻击以最高 96% 的成功率劫持 AI 语音模型,研究发现

根据在旧金山举行的第 47 届 IEEE 安全与隐私研讨会(47th IEEE Symposium on Security and Privacy)上由浙江大学提交的研究,研究人员开发了 AudioHijack,该方案在音频中隐藏难以察觉的指令,以 79-96% 的成功率操纵大型音频-语言模型。

该攻击以人类难以感知的方式修改数字音频波形,但会改变 AI 对信号的解释方式,使其即使在存在合法用户指令的情况下也能覆盖模型行为。研究人员在 13 个开源语音模型以及来自微软和 Mistral 的商用系统上测试了 AudioHijack,发现它可以迫使模型拒绝请求、传播虚假信息、插入恶意链接,或执行未经授权的操作,例如网页搜索和文件下载。

免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论