Menurut para peneliti dari Nanyang Technological University, ST Engineering, IBM Research, dan University of Illinois Urbana-Champaign, agen AI yang didukung GPT-5 dan Gemini tidak dapat secara konsisten menahan serangan prompt injection, demikian temuan sebuah studi yang diterbitkan pada Kamis.
Dalam 3.168 simulasi serangan, serangan prompt injection langsung berhasil lebih dari 79% dari waktu, sementara serangan tidak langsung yang disisipkan dalam konten web mencapai tingkat keberhasilan antara 41,67% hingga 68,16%. Para peneliti mengembangkan StakeBench, sebuah benchmark untuk menguji respons agen AI terhadap serangan tersebut dalam lingkungan online yang realistis, dan mencatat bahwa prompt injection tetap menjadi kerentanan kritis saat agen AI menjadi arus utama untuk penelusuran web, riset, belanja, dan perdagangan kripto.