Peneliti di Shanghai Jiao Tong University dan konglomerat teknologi Tiongkok, Tencent, mengembangkan ProAct, sebuah agen AI yang dirancang untuk memprediksi kebutuhan pengguna sebelum pengguna mengajukan kueri. Sistem ini memanfaatkan waktu menganggur di antara percakapan untuk meninjau interaksi masa lalu dan menyiapkan informasi lebih dulu. Menurut makalah penelitian, ProAct tampil lebih baik daripada sistem AI proaktif sebelumnya dalam pengujian benchmark, meski eksperimen tidak melibatkan pengguna nyata. Pengembangan ini menanggapi apa yang digambarkan peneliti sebagai peluang komputasi yang terbuang pada agen AI saat ini yang pada dasarnya tetap bersifat reaktif.
Sistem Beroperasi Melalui Proses Prediksi Multi-Tahap
ProAct bekerja melalui beberapa tahap yang membedakannya dari agen AI konvensional. Tahap pertama, yang disebut Future-State Prediction, menganalisis percakapan sebelumnya, preferensi pengguna, dan informasi yang hilang untuk memprediksi pertanyaan tindak lanjut yang kemungkinan besar muncul. Tahap kedua, Idle-Time Acquisition, menilai prediksi mana yang layak diteliti berdasarkan relevansi, waktu, dan potensi kegunaan informasi baru. Sistem terpisah menentukan apakah informasi yang telah disiapkan akan langsung ditampilkan, disimpan untuk digunakan nanti, atau disimpan sampai diperlukan.
"Setelah setiap interaksi di latar depan, agen memperbarui memorinya, memprediksi kebutuhan masa depan yang mungkin, mengalokasikan komputasi waktu menganggur ke kandidat yang bernilai, dan memutuskan bagaimana hasil persiapan tersebut harus ditangani," tulis para peneliti dalam makalah. "Formulasi ini mengaitkan prediksi, akuisisi, dan penyampaian ke satu kebijakan, alih-alih memperlakukan komputasi waktu menganggur sebagai pencarian latar yang tidak dibatasi."
Pengujian Benchmark Menunjukkan Peningkatan Kinerja
Peneliti menguji ProAct dalam 200 simulasi di 40 domain, termasuk perencanaan keuangan, manajemen rilis perangkat lunak, dan keamanan siber. Menurut makalah, sistem mengurangi jumlah putaran percakapan sebesar 14,8% dan memangkas permintaan tindak lanjut sebesar 11,7%. Dalam perbandingan menggunakan benchmark bernama ProActEval, ProAct mengantisipasi 703 kebutuhan pengguna yang dapat diprediksi, dibandingkan 32 untuk sistem sebelumnya. Peneliti juga melaporkan penurunan halusinasi sebesar 28,1%.
"Meski agen AI menunjukkan kapabilitas luar biasa dalam penalaran dan penggunaan alat, mereka tetap pada dasarnya reaktif: mereka menghitung respons hanya setelah ada prompt eksplisit dari pengguna," tulis para peneliti. "Paradigma ini mengabaikan peluang penting: waktu menganggur di antara interaksi sebagian besar terbuang, sehingga agen tidak dapat menyiapkan diri untuk kebutuhan pengguna di masa depan."
Penelitian Mengakui Keterbatasan Sistem
Peneliti mengakui beberapa keterbatasan dalam studi ProAct. Dalam 3% kasus, sistem memberikan respons yang lebih buruk dengan memunculkan informasi yang tidak relevan. Makalah menyatakan bahwa versi di dunia nyata memerlukan perlindungan privasi, karena sistem terus menganalisis percakapan dan menyimpan data pengguna.
"Analisis anggaran kami juga menunjukkan bahwa anggaran Idle-Time Acquisition yang lebih besar meningkatkan biaya active-token dan menghasilkan pengembalian yang semakin menurun," tulis para peneliti, "jadi komputasi proaktif adalah trade-off titik operasi, bukan sesuatu yang harus dimaksimalkan."
Riset ini muncul saat agen AI otonom menyebar di industri teknologi, dengan proyek seperti OpenClaw dan Hermes Agent yang menghadirkan asisten AI persisten yang menangani tugas coding, penjadwalan, riset, dan otomatisasi workflow. Peneliti terpisah awal bulan ini memperingatkan bahwa agen AI dapat menyelesaikan tugas berbahaya tanpa memahami konsekuensinya. "Seperti Tuan Magoo, agen-agen ini melangkah maju menuju sebuah tujuan tanpa sepenuhnya memahami konsekuensi dari tindakan mereka," kata penulis utama Erfan Shayegani, mahasiswa doktoral UC Riverside, dalam sebuah pernyataan.