Tencent công bố thuật toán Stem Sparse Attention, cắt giảm độ trễ token đầu tiên 3,7 lần ở ngữ cảnh 128K

Theo Guru Club, vào ngày 5 tháng 6, Tencent Hunyuan đã công bố thuật toán Stem sparse attention, được chấp nhận tại hội nghị machine learning hàng đầu ICML-26. Thuật toán đạt độ chính xác gần như không mất mát với ngân sách 25% nhờ Token Position Decay (TPD) và Output-Aware Metric (OAM), đồng thời giảm độ trễ token đầu tiên 3,7 lần ở độ dài ngữ cảnh 128K khi kết hợp với các toán tử HPC.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận