Meituan LongCat Merilis Secara Open-Source VitaBench 2.0 untuk Pemodelan Pengguna Jangka Panjang

Menurut Jin10, Meituan LongCat hari ini merilis sumber terbuka VitaBench 2.0, tolok ukur pertama untuk mengevaluasi agen model bahasa besar dalam skenario interaksi pengguna dinamis jangka panjang di dunia nyata. Tolok ukur ini secara sistematis menilai kemampuan personalisasi dan proaktif LLM dalam interaksi pengguna yang berkelanjutan.
Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar