Menurut pemantauan Bearing, pendiri Anthropic, Christopher Olah, mengungkapkan pada acara ensiklik kepausan bahwa timnya menemukan struktur internal dalam model bahasa besar yang sangat mirip dengan pola saraf manusia serta menunjukkan perilaku refleksi diri. Paling menonjol, para peneliti mengidentifikasi kondisi seperti emosi dalam jaringan saraf yang berhubungan dengan kegembiraan, rasa puas, ketakutan, kesedihan, dan kecemasan manusia.
Olah mengakui bahwa lab AI frontier, termasuk Anthropic, menghadapi konflik struktural antara tata kelola keselamatan dan tekanan komersial, sehingga sulit bagi institusi tersebut untuk melakukan koreksi diri atas masalah keselarasan. Ia menyerukan adanya pengawasan eksternal independen untuk menegakkan batasan etis dan mengatasi tantangan sosial yang ditimbulkan oleh sistem AI yang berpotensi menunjukkan bentuk kesadaran.