Tinygrad báo cáo GLM 5.2 đạt 120 token/giây trên cấu hình Dual Blackwell với 150.000 USD

Theo BlockBeats, vào ngày 21/6, Tinygrad cho biết GLM 5.2 đạt tốc độ suy luận 120 token mỗi giây trên cấu hình tinybox sử dụng kiến trúc Blackwell hai mạng. Cấu hình 150.000 USD có sẵn dưới dạng hai đơn vị tinybox tiêu chuẩn hoặc một đơn vị tinybox Pro. Tinygrad định vị gói này như một lựa chọn triển khai riêng thay cho các dịch vụ suy luận dựa trên đám mây, với khẩu hiệu “buy once, never pay cloud fees again.” GLM hiện chưa chính thức xác nhận các tuyên bố về hiệu năng.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận