Meituan LongCat phát hành mã nguồn mở VitaBench 2.0 cho mô hình hóa người dùng dài hạn

Theo Jin10, hôm nay Meituan LongCat đã mã nguồn mở VitaBench 2.0, chuẩn mực đầu tiên để đánh giá các tác nhân mô hình ngôn ngữ lớn trong các tình huống tương tác người dùng động, thực tế và dài hạn. Chuẩn mực này đánh giá một cách có hệ thống khả năng cá nhân hóa và chủ động của các LLM trong việc tương tác liên tục với người dùng.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận