Zhipu phát hành GLM-5.1 API tốc độ cao, đạt kỷ lục toàn cầu 400 token/giây

Theo Beating Monitoring, Zhipu đã ra mắt GLM-5.1 High-Speed API cho một số khách hàng doanh nghiệp chọn lọc, với tốc độ đầu ra của mô hình đạt 400 token/giây, thiết lập kỷ lục toàn cầu mới về băng thông (throughput) giao diện chính thức của mô hình ngôn ngữ lớn. Phiên bản tốc độ cao được trang bị một công cụ suy luận hiệu năng cao đồng phát triển bởi Zhipu và đội ngũ TileRT, vẫn duy trì đầy đủ năng lực của mẫu flagship trong khi giảm đáng kể độ trễ nhờ tối ưu hóa kernel GPU và lập lịch tác vụ theo từng tile.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận