Tin Gate News, ngày 24 tháng 4 — DeepSeek V4-Pro và DeepSeek V4-Flash đã được phát hành chính thức và công bố mã nguồn mở vào ngày 24 tháng 4; độ dài xử lý theo ngữ cảnh được mở rộng đáng kể từ 128K lên 1M, tương đương mức tăng dung lượng gần gấp 10 lần. Huawei Computing cho biết các sản phẩm siêu điểm nút (supernode) Ascend của họ hỗ trợ đầy đủ các mô hình thuộc dòng DeepSeek V4 thông qua sự hợp tác chặt chẽ giữa công nghệ chip và công nghệ mô hình.
Huawei Ascend 950 đạt triển khai suy luận mô hình DeepSeek V4 với thông lượng cao và độ trễ thấp nhờ các kỹ thuật kernel hợp nhất (fused kernel) và song song đa luồng (multi-stream parallelism) nhằm giảm chi phí tính toán Attention và chi phí truy cập bộ nhớ. Đối với DeepSeek V4-Pro với đầu vào 8K, Ascend 950 đạt khoảng 20ms TPOT với thông lượng Decode 4,700 TPS trên một thẻ đơn; đối với DeepSeek V4-Flash với đầu vào dưới 8K, nó đạt khoảng 10ms TPOT với thông lượng 1,600 TPS. Dòng siêu điểm nút (supernode) Ascend A3 cũng đạt tương thích hoàn toàn, kèm theo các triển khai mã huấn luyện mẫu để tinh chỉnh nhanh. Dựa trên siêu điểm nút 64 thẻ Ascend A3 với chế độ EP lớn, DeepSeek V4-Flash đạt hơn 2,000 TPS thông lượng Decode trên một thẻ đơn trong các tình huống đầu vào/đầu ra 8K/1K bằng cách sử dụng công cụ suy luận vLLM. Toàn bộ các dòng sản phẩm Huawei Ascend A2, A3 và 950 đều hỗ trợ cả DeepSeek V4-Flash và V4-Pro.
Huawei Cloud công bố khả năng tương thích theo phương thức “đi trước” với DeepSeek V4, cung cấp cho nhà phát triển dịch vụ token API chỉ với một lần nhấp thông qua nền tảng MaaS của họ. Huawei Cloud đã tối ưu năng lực của lớp hệ thống (system layer), lớp toán tử (operator layer) và lớp cụm (cluster layer) để đảm bảo thích nghi nhanh mô hình và triển khai hiệu năng cao. Các doanh nghiệp bao gồm Kingsoft WPS và 360 đã tích hợp mô hình mới của DeepSeek thông qua Huawei Cloud.
Cambricon cũng công bố tương thích “Day 0” với DeepSeek V4-Flash và V4-Pro dựa trên khung suy luận vLLM, đồng thời mã thích nghi được công bố mã nguồn mở cho cộng đồng GitHub. Cambricon trước đó cũng đã đạt khả năng thích nghi theo phương thức “đi trước” khi DeepSeek V3.2 được phát hành vào năm ngoái, nhờ đã thực hiện tối ưu hóa hiệu năng sâu về phần mềm-hardware (phần mềm–phần cứng) đồng tác giữa các mô hình thuộc dòng DeepSeek.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
Các lãnh đạo công nghệ Thung lũng Silicon tăng cường chi tiết an ninh sau các cuộc tấn công gần đây nhằm vào Altman và những người khác
Tin tức từ Gate News, ngày 27 tháng 4 — Sau các cuộc tấn công gần đây nhằm vào các lãnh đạo công nghệ nổi bật, bao gồm nơi ở tại San Francisco của Sam Altman và CEO của UnitedHealthcare, các lãnh đạo điều hành thuộc Thung lũng Silicon đang nâng cấp đáng kể các biện pháp an ninh cá nhân. Tâm lý bài xích AI ngày càng gia tăng, kết hợp với những vụ việc gây chú ý như vậy, đã khiến các nhà sáng lập công nghệ phải xem xét lại các sắp xếp an ninh riêng tư, chuyển từ sự miễn cưỡng trước đây trong việc thuê vệ sĩ sang việc coi bảo vệ toàn diện là thông lệ tiêu chuẩn.
Các rủi ro về an ninh bắt nguồn từ cả các cuộc biểu tình ngoài đời lẫn các mối đe dọa trực tuyến. Theo các chuyên gia an ninh, mạng xã hội có thể nhanh chóng tập trung sự bất mãn của công chúng nhắm vào các cá nhân cụ thể trong vòng vài ngày, trong khi các bức ảnh, lịch trình và thông tin địa điểm được chia sẻ công khai tạo ra các lỗ hổng có thể khai thác. Các lãnh đạo công nghệ phải đối mặt với các mối đe dọa trải rộng từ bảo vệ cá nhân và an ninh nơi ở đến việc đánh giá rủi ro khi di chuyển và giám sát các mối đe dọa trên mạng.
Các công bố của doanh nghiệp phản ánh xu hướng này. Theo phân tích của Equilar về các hồ sơ ủy quyền của S&P 500, 37,8% công ty đã cung cấp các lợi ích an ninh cho ít nhất một số lãnh đạo điều hành trong năm 2025, tăng từ 33,5% trong năm 2024. Trong số các công ty cung cấp các lợi ích như vậy, chi tiêu an ninh trung vị đã tăng từ $108.700 lên $130.500. Hồ sơ ủy quyền năm 2026 của Meta tiết lộ rằng do Mark Zuckerberg có mức độ nổi tiếng cao và đối mặt với các mối đe dọa an ninh cụ thể, công ty đã cung cấp cho ông các sắp xếp an ninh toàn diện, chi khoảng $8,50 triệu cho an ninh dân cư và an ninh khi di chuyển cá nhân trong năm 2025, cộng thêm một khoản phụ cấp an ninh trước thuế bổ sung million. Các công ty cung cấp dịch vụ an ninh tư nhân cũng đang điều chỉnh mô hình phục vụ, chuyển từ đội ngũ vệ sĩ mặc vest và đeo tai nghe theo kiểu truyền thống sang những người có thể hòa nhập vào phòng họp của ban điều hành, các bữa tối và bối cảnh gia đình.
GateNews10phút trước
Meta hợp tác với Overview Energy và Noon Energy cho các dự án điện mặt trời và lưu trữ 1GW
Tin từ Gate News, ngày 27 tháng 4 — Meta đã công bố hai thỏa thuận năng lượng để cung cấp năng lượng cho hạ tầng AI và các trung tâm dữ liệu của mình bằng các công nghệ phát điện và lưu trữ năng lượng tái tạo mang tính đột phá. Công ty sẽ hợp tác với Overview Energy trong một dự án điện mặt trời không gian công suất 1 gigawatt được thiết kế để cho phép phát điện liên tục 24/7 và nâng cao hiệu suất của các trang trại điện mặt trời hiện có.
GateNews20phút trước
Moonshot AI Ra mắt Kimi K3 theo kế hoạch vào Q3 2026 với 2,5T+ Tham số và Ngữ cảnh 1M Token trong Thử nghiệm
Tin tức Cổng thông tin, ngày 27 tháng 4 — Theo các báo cáo, Moonshot AI dự định ra mắt Kimi K3 trong Q3 2026 (Tháng Bảy-Tháng Chín). Mô hình sẽ có hơn 2,5 nghìn tỷ tham số, và các thử nghiệm nội bộ cho thấy khả năng cửa sổ ngữ cảnh vượt quá 1 triệu token.
Tuy nhiên, liệu ngữ cảnh 1M này có sẽ
GateNews50phút trước
OpenAI's Greg Brockman: AI Shifting from Chat to Autonomous Task Execution
Gate News message, April 27 — Greg Brockman, president and co-founder of OpenAI, says the next wave of artificial intelligence will move users from chatting with AI bots to assigning real-world tasks. This shift requires enterprises to rethink operational workflows and establish new protocols for se
GateNews1giờ trước
B.AI Nâng Cấp Cơ Sở Hạ Tầng, Ra Mắt Các Tính Năng Kỹ Năng Lớn
Tin tức của Gate, ngày 27 tháng 4 — B.AI đã công bố nhiều tiến bộ về sản phẩm và hệ sinh thái trong tuần này. Trang đích BAIclaw đã được đại tu hoàn toàn về giao diện trực quan và tương tác, đồng thời hỗ trợ đa ngôn ngữ trên website được mở rộng lên 10 ngôn ngữ, giúp nâng cao khả năng sử dụng trên phạm vi toàn cầu.
Ở mảng hạ tầng
GateNews1giờ trước
Bắc Kinh yêu cầu dỡ bỏ lệnh cấm giao dịch! Meta đã rót 2 tỷ USD để mua lại công ty khởi nghiệp AI tại Trung Quốc Manus nhưng thương vụ thất bại
Ủy ban Phát triển và Cải cách Quốc gia Trung Quốc hôm nay (ngày 27 tháng 4) chính thức ban hành thông báo. Văn phòng Cơ chế công tác thẩm tra an ninh đầu tư nước ngoài đã “theo đúng pháp luật và đúng quy định đưa ra quyết định cấm đầu tư đối với việc nhà đầu tư nước ngoài mua lại dự án Manus, đồng thời yêu cầu các bên liên quan hủy bỏ giao dịch mua lại đó”. Đây là, kể từ khi các “Biện pháp thẩm tra an ninh đầu tư nước ngoài” của Trung Quốc được thực thi, một số ít trường hợp sử dụng biện pháp xử lý “cấm đầu tư” với mức độ cao nhất và yêu cầu hủy bỏ giao dịch đã được xác lập.
Meta đổ 2 tỷ USD, mua vào ứng dụng AI rẻ nhất
Thời gian quay lại ngày 29 tháng 12 năm 2025. Meta công bố việc mua lại startup AI đại lý Trung Quốc Manus, thị trường dự đoán giá nằm trong khoảng từ 2 đến 3 tỷ USD. Manus là AI đa năng do Công ty phát triển Công nghệ Butterfly Effect ở Bắc Kinh phát triển, sau khi ra mắt vào ngày 6 tháng 3 năm 2025, nhờ thành tích nổi bật trong benchmark GAIA nên chỉ trong một đêm
ChainNewsAbmedia1giờ trước