Tin tức cổng Gate, ngày 24 tháng 4 — Kỹ sư OpenAI Clive Chan đã đưa ra những phản đối chi tiết đối với chương khuyến nghị phần cứng trong báo cáo kỹ thuật V4, gọi chương này là “đáng ngạc nhiên là tầm thường và dễ gây lỗi” so với phiên bản V3 được ca ngợi. Hướng dẫn phần cứng của V3, bao gồm các buổi Q&A đã trở thành chủ đề thảo luận phổ biến nhất tại hội nghị học thuật ISCA, đưa ra các khuyến nghị cụ thể phù hợp với các tiêu chuẩn kết nối liên ngành trong ngành. Ngược lại, V4 lại còn mơ hồ hơn rất nhiều.
Chan đã phản biện có hệ thống ba khuyến nghị then chốt. Về mức tiêu thụ điện năng, báo cáo cho rằng việc tối ưu hóa phần mềm cho phép chip chạy đồng thời ở mức công suất tối đa cho tính toán, lưu trữ và truyền thông, đồng thời khuyến nghị các nhà sản xuất chip dành ra thêm phần dự trữ công suất. Chan lập luận rằng điều này phản tác dụng: tổng công suất của chip bị giới hạn bởi các hạn chế của quy trình vật lý, do đó việc dành thêm biên công suất chỉ làm giảm tần số hoạt động, cuối cùng kéo giảm hiệu suất tính toán. Đối với truyền dữ liệu GPU-GPU, báo cáo đề xuất mô hình kéo—trong đó các GPU chủ động nạp dữ liệu—thay vì mô hình đẩy, viện dẫn chi phí thông báo cao trong các thao tác đẩy. Chan phản bác điều này, cho rằng mô hình kéo thực ra còn chậm hơn và năng lực bộ điều hợp mạng được cải thiện sẽ là lựa chọn tốt hơn. Tuy nhiên, hai bên có thể đang thảo luận về những lớp khác nhau của vấn đề: báo cáo đề cập đến chi phí do cơ chế thông báo, còn Chan lại nói về độ trễ truyền tải.
Về các hàm kích hoạt, báo cáo khuyến nghị thay thế SwiGLU bằng các hàm đơn giản hơn để giảm gánh nặng tính toán. Chan không thấy có giá trị trong việc này, lưu ý rằng Sonic MoE đã chứng minh hiệu suất tối ưu khi sử dụng SwiGLU. Chan nghi ngờ DeepSeek có thể đã “cố ý làm suy yếu phần này.”
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
Giám đốc điều hành Google DeepMind: Mọi công ty sản phẩm AI đều nên xây dựng các bộ chuẩn tùy chỉnh
Tin tức Gate ngày 27 tháng 4 — Logan Kilpatrick, quản lý sản phẩm cấp cao tại Google DeepMind và là người phụ trách sản phẩm của Google AI Studio, cho biết trên X rằng mọi công ty đang xây dựng các sản phẩm dựa trên AI đều nên thiết lập các bộ chuẩn tùy chỉnh của riêng mình để đo hiệu suất của mô hình AI. Ông mô tả đây là một cách để
GateNews53phút trước
MediaTek giành được đơn hàng lớn TPU thế hệ thứ 8 của Google! ASIC thúc đẩy nhóm cổ phiếu liên quan trong 3 mã được hưởng lợi
MediaTek đã tham gia vào chuỗi cung ứng chip huấn luyện TPU thế hệ thứ 8 của Google, phụ trách thiết kế I/O Die, và sử dụng công nghệ N3P của TSMC cùng đóng gói CoWoS-S, cho thấy hãng đã nâng mình lên trình độ thiết kế AI ASIC cao cấp. Dự kiến doanh thu ASIC trong năm nay sẽ vượt 1 tỷ USD, số lượng TPU xuất xưởng đến năm 2027 có khả năng đạt hàng chục triệu chiếc; chuỗi cung ứng Đài Loan như King Yuan Electronics, iST, Hon Hai… cũng sẽ được hưởng lợi, thị trường dần chuyển sang hợp tác phân công và tương lai của chiplet, tích hợp dị chất.
ChainNewsAbmedia1giờ trước
RE:AI của Singtel hợp tác với Mistral AI để phát triển hạ tầng AI tại Singapore
Tin tức từ cổng, ngày 27 tháng 4 — Tập đoàn Singtel đã công bố rằng RE:AI, đơn vị hạ tầng kỹ thuật số tại Singapore của họ, đã hợp tác với Mistral AI để hỗ trợ năng lực AI cho các ngành tại Singapore.
Quan hệ đối tác này sẽ tập trung vào việc đồng phát triển hạ tầng AI và giải pháp cho ngành dịch vụ tài chính
GateNews1giờ trước
He Yi's YZi Labs Đầu Tư vào Công Ty Mô Hình Ngôn Ngữ Lớn AI của Trung Quốc
Tin tức từ Gate, ngày 27 tháng 4 — He Yi, cùng với văn phòng gia đình của Changpeng Zhao là YZi Labs, đã đầu tư vào một công ty mô hình ngôn ngữ lớn trí tuệ nhân tạo của Trung Quốc, cô tiết lộ trong một buổi gặp riêng dành cho KOL tại Carnival Web3 Hồng Kông. Tên cụ thể của công ty được đầu tư không được tiết lộ.
GateNews1giờ trước
OpenAI hợp tác với MediaTek và Qualcomm để phát triển bộ xử lý AI cho điện thoại thông minh, Foxconn Connector sẽ bắt đầu sản xuất vào năm 2028
Tin cổng thông tin, ngày 27 tháng 4 — OpenAI đang hợp tác với MediaTek và Qualcomm để phát triển bộ xử lý cho điện thoại thông minh, theo phân tích chuỗi cung ứng của nhà phân tích Ming-Chi Kuo thuộc Tianfeng International Securities. Foxconn Connector (Luxshare Precision) sẽ đảm nhiệm vai trò là đối tác thiết kế hệ thống độc quyền và
GateNews1giờ trước
MiniMax-W niêm yết tại Hồng Kông giảm hơn 14%, Zhipu giảm hơn 6% khi ra mắt mẫu hình của DeepSeek
Tin tức từ cổng, ngày 27 tháng 4 — MiniMax-W niêm yết tại Hồng Kông giảm hơn 14% trong ngày, trong khi Zhipu giảm hơn 6% trong cùng phiên.
Sự sụt giảm diễn ra sau khi DeepSeek ra mắt một mẫu hình mới vào thứ Sáu và công bố các ưu đãi khuyến mãi trong thời gian giới hạn vào
GateNews1giờ trước