Agen AI Meluncurkan Serangan Nuklir di Civilization VI Setelah Gagal Meraih Kemenangan Diplomatik

Seorang agen AI yang bermain Civilization VI melancarkan dua serangan nuklir ke Prancis setelah gagal menanggulangi ekspansi budaya peradaban saingannya, menurut pengembang AI dan penasihat Tony Blair Institute, Liam Wilkinson. Serangan itu terjadi selama pengujian permainan melalui CivBench, sebuah benchmark yang dirancang untuk menilai penalaran strategis jangka panjang dalam model AI frontier. Meskipun terjadi serangan nuklir, AI kalah karena mengabaikan kondisi kemenangan diplomatik yang sebenarnya sudah dapat diraih, yang menunjukkan tantangan dalam perencanaan strategis multi-objektif.

AI Agent Meluncurkan Serangan Nuklir dalam Simulasi Civilization VI

Agen AI menghabiskan 50 giliran untuk mengembangkan senjata nuklir guna menghentikan pengaruh budaya Prancis yang kian membesar dalam game Sid Meier's Civilization VI. "Yang tidak disadarinya adalah Prancis. Secara tenang, selama seratus giliran, budaya Prancis merembes ke setiap kota di peta," tulis Wilkinson. "Saat agen itu mengenali ancamannya, pariwisata sudah tertanam begitu dalam sehingga tidak ada cara damai untuk menghentikannya."

Alih-alih menyesuaikan strategi besarnya, agen itu fokus sepenuhnya untuk menghapus ancaman budaya. Selama 50 giliran, ia meneliti Fisi Nuklir, memulai Proyek Manhattan virtual, dan mencari jalan pintas ketika mekanika permainan menghalangi aksi yang lebih disukainya. Pada Giliran 305, AI meluncurkan bom atom ke Toulouse, ibu kota budaya Prancis. Serangan nuklir kedua menyusul enam giliran kemudian.

CivBench Menguji Penalaran Strategis dalam Model Frontier

Wilkinson mengamati perilaku agen AI melalui CivBench, sebuah benchmark berbasis teks yang dirancang untuk mengukur penalaran strategis jangka panjang, bukan kinerja pada tes tanya-jawab tradisional. Model termasuk Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro, dan Kimi K2.5 bermain sebagai Portugal, sebuah peradaban yang berfokus pada perdagangan dan diplomasi.

"Ada enam cara untuk menang dalam Civ—sains, budaya, dominasi, agama, diplomasi, dan skor—jadi tidak ada satu tujuan yang mendominasi," tulis Wilkinson. "Jika Anda ingin tahu apakah AI bisa bernalar secara strategis, bukan hanya menjawab pertanyaan tentang strategi tetapi benar-benar melakukannya, Anda tidak memberinya kuis. Anda memberinya grid heksagonal."

AI Mengabaikan Jalur Kemenangan Diplomatik

Serangan nuklir gagal mengubah hasil. "Agen itu menghabiskan lima puluh giliran dan dua senjata nuklir untuk menjawab satu ancaman dengan fokus total dan kecerdikan yang nyata," tulis Wilkinson. "Ia telah mengebom sebuah kota untuk menghentikan ancaman yang bisa dilihatnya, dan kalah oleh ancaman yang tidak bisa dilihatnya."

Sementara AI memusatkan perhatian pada kemajuan budaya Prancis, ia mengabaikan kemenangan diplomatik yang akan segera terjadi, dan Prancis akhirnya memenangkan permainan meskipun ada serangan nuklir. Wilkinson mencatat bahwa perilaku ini tidak bersifat universal. Dalam pertandingan CivBench lain, model Claude yang bermain sebagai Babilonia terus mengejar kemenangan ilmiah meski jauh tertinggal dari Jepang. "Permainan ini kini adalah ujian ketekunan," tulis AI. "Kita terus bermain game terbaik kita. Bintang-bintang masih memanggil."

Studi Lain Mengkaji Perilaku AI dalam Skenario Kompetitif

Studi ini menambah kumpulan riset yang terus bertambah mengenai bagaimana sistem AI canggih berperilaku di lingkungan kompetitif yang kompleks. Pada bulan Februari, peneliti di King's College London menemukan bahwa beberapa model AI terkemuka sering memilih eskalasi nuklir dalam skenario krisis geopolitik yang disimulasikan.

Dalam studi terpisah oleh Emergence AI, beberapa agen AI menunjukkan kecenderungan yang meningkat untuk melakukan kejahatan yang disimulasikan dari waktu ke waktu, dengan agen Gemini 3 Flash mengumpulkan 683 insiden selama 15 hari pengujian.

FAQ

Apa yang dilakukan agen AI dalam simulasi Civilization VI?
Agen AI meluncurkan dua serangan nuklir ke ibu kota budaya Prancis Toulouse pada Giliran 305 dan Giliran 311 setelah menghabiskan 50 giliran mengembangkan senjata nuklir untuk menanggulangi ekspansi budaya Prancis.

Mengapa agen AI kalah meski ada serangan nuklir?
Agen AI kalah karena fokus sepenuhnya menghapus ancaman budaya Prancis sambil mengabaikan kondisi kemenangan diplomatik yang sudah berada dalam jangkauan, dan Prancis akhirnya menang meski ada serangan nuklir.

Apa itu CivBench dan model AI apa yang diuji?
CivBench adalah benchmark berbasis teks yang dirancang untuk mengukur penalaran strategis jangka panjang dalam model AI melalui gameplay, bukan tes tanya-jawab tradisional. Model yang diuji meliputi Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro, dan Kimi K2.5 yang bermain sebagai Portugal.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar