Google phát hành thuật toán TurboQuant: Lượng tử hóa KV cache 3 bit không mất độ chính xác, tốc độ suy luận tăng lên tối đa 8 lần

Tin tức Gate News, ngày 25 tháng 3, Viện Nghiên cứu Google đã công bố thuật toán nén lượng tử TurboQuant, có thể nén bộ đệm KV của mô hình ngôn ngữ lớn xuống còn 3 bit, giảm tiêu thụ bộ nhớ ít nhất 6 lần, không cần huấn luyện hoặc tinh chỉnh, không làm giảm độ chính xác của mô hình. Trong chế độ 4 bit, tốc độ tính toán chú ý trên GPU NVIDIA H100 tăng tối đa 8 lần so với mức cơ sở không nén 32 bit. Nhóm nghiên cứu đã xác nhận hiệu quả của TurboQuant trên các bộ chuẩn dài như LongBench, Needle In A Haystack, ZeroSCROLLS bằng cách sử dụng các mô hình Gemma và Mistral, đạt hiệu suất tối ưu trong tất cả các thử nghiệm. Thuật toán này gồm hai phần: PolarQuant sử dụng biến đổi tọa độ cực để loại bỏ chi phí bộ nhớ của phương pháp lượng tử truyền thống, QJL chỉ dùng 1 bit để hiệu chỉnh sai số còn lại. Nghiên cứu do Amir Zandieh của Viện Nghiên cứu Google và Phó Chủ tịch kiêm Google Fellow Vahab Mirrokni dẫn đầu, hợp tác với KAIST Hàn Quốc và Đại học New York, sẽ được trình bày tại ICLR 2026. Google cho biết một trong những ứng dụng chính của công nghệ này là giải quyết nút thắt về bộ đệm KV của các mô hình như Gemini.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Hyperliquid ghi nhận $820M doanh thu hằng năm, xếp thứ tư toàn cầu về khối lượng giao dịch tương lai vĩnh viễn

Tin tức từ Gate News, ngày 27 tháng 4 — Theo một báo cáo nghiên cứu của Bitcoin Suisse, Hyperliquid đã tạo ra $820 triệu doanh thu hằng năm trong 12 tháng qua và xếp thứ tư trên toàn cầu về khối lượng giao dịch tương lai vĩnh viễn, khẳng định mình là một trong số ít

GateNews22phút trước

Khảo sát: 36% nhà giao dịch Crypto cắt giảm chi tiêu khi thị trường suy giảm, nhưng 79% dự định nắm giữ hoặc tăng nắm giữ

Bản tin Gate News, ngày 27 tháng 4 — Một cuộc khảo sát với 1.100 người dùng hoạt động tại một CEX lớn cho thấy 36% nhà giao dịch crypto ở Mỹ đã cắt giảm chi tiêu hằng ngày do đợt suy giảm thị trường hiện tại. Trong số đó, 10% mô tả điều này là một sự hy sinh lớn để duy trì vị thế của họ, trong khi 37% đã trì hoãn hoặc hủy

GateNews1giờ trước

Nghiên cứu: Chỉ 3% nhà giao dịch Polymarket có kỹ năng; Thiểu số nắm 30%+ mọi khoản lãi

Tin cổng thông tin, ngày 27 tháng 4 — Một bài nghiên cứu học thuật mới phân tích tất cả các giao dịch trên Polymarket từ năm 2023 đến 2025 kết luận rằng độ chính xác của nền tảng phản ánh "tầm khôn ngoan của một thiểu số có hiểu biết, chứ không phải tầm khôn ngoan của đám đông." Bài nghiên cứu làm việc, được rà soát lại ngày 25 tháng 4, do Roberto Gómez-Cram,

GateNews5giờ trước

Fireblocks' 30 Web3 Partners Manage Over $200B in Monthly Stablecoin Flows

Tin tức từ Gate, ngày 26 tháng 4 — Fireblocks, một nền tảng chuyển giao tài sản cấp tổ chức hàng đầu, vận hành một mạng lưới gồm 30 đối tác kinh doanh Web3 trải dài qua các giao thức DeFi, thanh toán đối soát, phân tích tuân thủ, các tổ chức giao dịch và hạ tầng đa chuỗi. Hệ sinh thái hợp tác được tổ chức

GateNews18giờ trước

Doanh thu Q1 của Moore Threads tăng vọt 155% so với cùng kỳ năm trước lên 104 triệu USD, chuyển sang có lãi

Tin tức từ cổng thông tin, ngày 26 tháng 4 — Moore Threads công bố doanh thu quý 1 năm 2026 đạt 738 triệu nhân dân tệ (xấp xỉ $104 triệu), tương ứng tăng 155,35% so với cùng kỳ năm trước. Công ty đã chuyển từ thua lỗ sang có lãi với lợi nhuận ròng 29,36 triệu nhân dân tệ, so với mức lỗ 112 triệu nhân dân tệ trong kỳ sa

GateNews19giờ trước

Tiền ổn định không chỉ thanh toán xuyên biên giới, mà còn được bản địa hóa! Báo cáo mới nhất của a16z: Châu Á chiếm 2/3 khối lượng giao dịch

Tập đoàn đầu tư mạo hiểm tiền mã hóa a16z mới đây đã phát hành báo cáo “9 charts on what stablecoins are becoming” bằng chín biểu đồ quan trọng, mô tả sự thay đổi mang tính cấu trúc mà stablecoin đang trải qua. Kết luận cốt lõi của báo cáo này không phải là một token hay một câu chuyện mới, mà là vai trò của stablecoin đang chuyển từ “công cụ giao dịch”, “phương tiện lưu trữ” sang “hạ tầng tài chính cốt lõi”, và ngày càng mang tính bản địa, tạo ra sự chênh lệch rõ rệt so với kỳ vọng ban đầu của thị trường về thanh toán xuyên biên giới. Đạo luật GENIUS của Mỹ thúc đẩy khối lượng giao dịch stablecoin lên 4.5 nghìn tỷ USD trong quý 4 Trong nhiều năm qua, sự không chắc chắn về quy định luôn là trần cản trở sự tham gia của các tổ chức vào stablecoin. Điểm ngoặt đến từ việc Đạo luật GENIUS của Mỹ thiết lập khuôn khổ phát hành stablecoin cấp liên bang đầu tiên. Dữ liệu của a16z cho thấy, khối lượng giao dịch stablecoin đã điều chỉnh trước khi dự luật được thông qua đã liên tục trong vài quý

ChainNewsAbmedia19giờ trước
Bình luận
0/400
Không có bình luận