Huawei's Ascend 910C hoàn tất quá trình hậu huấn luyện cho mô hình 1,6 nghìn tỷ tham số của DeepSeek với hơn 1.000 GPU

Theo Beating, một nhóm liên kết từ Trường Cao đẳng Hà Tạo Thâm Quyến, Đại học Công nghệ Cáp Nhĩ Tân (Thâm Quyến), Viện Nghiên cứu Dữ liệu Lớn Thâm Quyến, Huawei và Deepcity AI đã công bố hoàn tất thành công giai đoạn tinh chỉnh hậu huấn luyện toàn bộ tham số cho DeepSeek-V4-Pro, một mô hình với 1,6 nghìn tỷ tham số, trên hạ tầng AI trong nước. Đây là lần đầu tiên một tổ chức bên thứ ba hoàn thành tinh chỉnh hậu huấn luyện toàn bộ tham số cho một mô hình có quy mô như vậy trên phần cứng Trung Quốc.

Nhóm đã tận dụng một cụm gồm hơn 1.000 chip Huawei Ascend 910C để vượt qua nút thắt truyền thông nhờ tối ưu cân bằng tải phân tán. Trong quá trình huấn luyện gồm 1.500 bước, hệ thống vận hành liên tục không gián đoạn, đạt tỷ lệ sử dụng FLOPs của mô hình (MFU) vượt 30% và nâng cao hiệu suất của các toán tử quan trọng lên 14%, đáp ứng các tiêu chuẩn hiệu năng ở mức công nghiệp.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận