DeepSeek V4 Gây Tranh Cãi Ở Mỹ: Think Tank Đặt Câu Hỏi Về Việc Dùng Chip, CEO Replit Bảo Vệ Sự Đổi Mới Mở

Tin tức Cổng thông tin, ngày 24 tháng 4 — Một cuộc tranh luận đã bùng nổ tại Hoa Kỳ về năng lực công nghệ và mức độ tuân thủ của DeepSeek V4. Chris McGuire, một nghiên cứu viên cấp cao tại Hội đồng Quan hệ Đối ngoại (CFR) và là cựu quan chức của Hội đồng An ninh Quốc gia Nhà Trắng cũng như Bộ Quốc phòng, đã đăng tải phân tích cho rằng V4 chưa làm thay đổi bức tranh cạnh tranh AI giữa Mỹ và Trung Quốc. Theo McGuire, chính báo cáo V4 của DeepSeek thừa nhận rằng năng lực suy luận của họ tụt hậu so với các mô hình đầu nguồn (frontier) khoảng 3 đến 6 tháng, dựa trên điểm chuẩn so với GPT-5.2 và Gemini 3.0 Pro được phát hành trước đó sáu tháng.

McGuire nêu lo ngại rằng trong khi báo cáo V4 tiết lộ việc thích ứng ở giai đoạn suy luận với GPU NVIDIA và NPU Huawei Ascend, thì họ không công khai nêu rõ các mẫu GPU hoặc chi phí đào tạo được dùng trong quá trình phát triển. Ông đặt câu hỏi liệu sự im lặng đó có ám chỉ việc sử dụng chip NVIDIA Blackwell chịu kiểm soát xuất khẩu hay không, lưu ý rằng V3 trước đó từng tuyên bố sử dụng 2.000 GPU H800 với chi phí 5,57 triệu USD. DeepSeek đã phủ nhận việc sử dụng Blackwell, cho biết mô hình đã được huấn luyện trên bộ xử lý NVIDIA H800 và Huawei Ascend 910C.

CEO Replit Amjad Masad phản biện phân tích của McGuire, cho rằng các nhà khoa học Trung Quốc đang công khai chia sẻ những đột phá AI thật sự, trong khi các nhà hoạch định chính sách và giới vận động hành lang của Mỹ lại khuếch đại mối lo "chưng cất (distillation) của Trung Quốc". Masad nhấn mạnh các đổi mới về kiến trúc được nêu trong những tuyên bố chính thức của DeepSeek, bao gồm tính nén sự chú ý ở cấp độ token (DeepSeek Sparse Attention) và những cải thiện hiệu quả đáng kể cho tính toán ngữ cảnh dài. Ông cho biết V4-Pro cho thấy mức tính toán suy luận trên mỗi token và yêu cầu bộ nhớ đệm KV cache thấp hơn đáng kể ở độ dài ngữ cảnh 1M so với V3.2, nhấn mạnh rằng những tiến bộ kiến trúc này không liên quan đến việc chưng cất dữ liệu huấn luyện và rằng mọi nhà nghiên cứu, kể cả các phòng thí nghiệm của Mỹ, đều có thể hưởng lợi từ các phát triển mã nguồn mở.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận