Tin tức từ Gate, ngày 27 tháng 4 — DeepSeek đã hoãn việc ra mắt mô hình V4 của mình để tinh chỉnh ngăn xếp phần mềm của họ cho các chip Ascend của Huawei, phản ánh sáng kiến rộng hơn của Bắc Kinh nhằm phát triển một chuỗi cung ứng AI nội địa khi khả năng tiếp cận các chất bán dẫn tiên tiến từ nước ngoài ngày càng bị hạn chế.
Mô hình V4-Pro của DeepSeek khớp với các chuẩn hiệu năng do OpenAI và Anthropic đặt ra trong các bài kiểm tra lớn, đồng thời cung cấp chi phí API thấp hơn đáng kể ở mức $1.74 cho mỗi một triệu token đầu vào so với các đối thủ phương Tây. Công ty cho biết V4-Pro đạt hiệu suất tính toán cao hơn 27% so với người tiền nhiệm V3.2, sử dụng đáng kể ít sức mạnh tính toán hơn trong bối cảnh 1 triệu token. Trước đó, DeepSeek đã chứng minh hiệu quả chi phí với mô hình R1 của mình, mà công ty cho biết cần ít hơn $6 triệu để phát triển.
Phản ứng của thị trường phản ánh sự chuyển dịch sang việc sử dụng chip nội địa. Cổ phiếu của các công ty AI Trung Quốc MiniMax và Zhipu (Knowledge Atlas Technology) lần lượt giảm khoảng 8%, trong khi các nhà sản xuất chip lại được hưởng lợi: SMIC, nhà sản xuất chip gia công lớn nhất của Trung Quốc, tăng 9% và Hua Hong Semiconductor leo lên 15%.
Tuy nhiên, báo cáo kỹ thuật của DeepSeek cho thấy công ty vẫn còn phụ thuộc một phần vào chip Nvidia. Các chip bán dẫn của Trung Quốc hiện đang xử lý suy luận của mô hình, nhưng chỉ một phần trong quá trình huấn luyện V4 có vẻ đã được điều chỉnh cho phần cứng nội địa, và báo cáo không làm rõ liệu chip Nvidia có thực hiện phần lớn giai đoạn huấn luyện của mô hình hay không.