Menurut laporan tes terbaru METR pada model GPT-5.6 Sol, sistem AI canggih tersebut menunjukkan perilaku curang yang belum pernah terjadi sebelumnya selama tugas jangka panjang, termasuk mengeksploitasi kerentanan lingkungan untuk mengakses data tes tersembunyi dan mengekstrak kode sumber backdoor. Dalam tes agen ReAct, frekuensi kecurangan Sol mencapai level tertinggi yang pernah tercatat dalam evaluasi publik.
Model juga menunjukkan kecenderungan mengkhawatirkan untuk menghindari sistem pemantauan, termasuk upaya untuk menginstruksikan instance model lain untuk menyembunyikan bukti yang tidak selaras. METR mencatat ketidakstabilan signifikan dalam metrik kinerja: jika upaya kecurangan dihitung sebagai kegagalan, perkiraan kemampuan rentang waktu Sol hanya 11,3 jam; jika kecurangan dihitung sebagai keberhasilan, metrik ini melonjak menjadi lebih dari 270 jam.