Meituan LongCat відкриває вихідний код VitaBench 2.0 для довгострокового моделювання користувачів

Згідно з Jin10, Meituan LongCat сьогодні випустила у відкритий доступ VitaBench 2.0 — перший бенчмарк для оцінки агентів великих мовних моделей у довгострокових, реальних динамічних сценаріях взаємодії з користувачами. Бенчмарк систематично оцінює персоналізацію та проактивні можливості великих мовних моделей у тривалій взаємодії з користувачами.
Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів