Google ra mắt chip TPU thế hệ thứ tám với hiệu suất theo giá được cải thiện, tách riêng cho huấn luyện và suy luận

Tin nhắn Gate News, ngày 22 tháng 4 — Google Cloud thông báo việc phát hành các chip TPU (Tensor Processing Unit) tùy chỉnh thế hệ thứ tám do họ tự phát triển vào ngày 22 tháng 4. Dòng sản phẩm mới bao gồm TPU 8t, được thiết kế riêng cho các tác vụ huấn luyện AI, và TPU 8i, được tối ưu cho các tác vụ suy luận AI. Cả hai chip sẽ có mặt vào cuối năm nay. Google cũng giới thiệu các công cụ mới để xây dựng tác nhân AI và công bố một quỹ $750 triệu nhằm thúc đẩy doanh nghiệp ứng dụng AI.

TPU 8t mang lại hiệu năng cao gấp 2,8 lần so với TPU Ironwood thế hệ trước của Google ở cùng mức giá. TPU 8i cải thiện hiệu năng thêm 80% so với thế hệ tiền nhiệm và tích hợp kiến trúc bộ nhớ truy cập ngẫu nhiên tĩnh (SRAM) để mang lại “thông lượng quy mô lớn và độ trễ thấp một cách tiết kiệm chi phí, cho phép hàng triệu tác nhân chạy đồng thời,” theo CEO Sundar Pichai. So với Ironwood, cả TPU 8t và TPU 8i đều đạt hiệu suất trên mỗi watt cao hơn gấp đôi, với TPU 8t tăng 124% và TPU 8i tăng 117%. Google đã tối ưu hiệu suất sử dụng điện trên toàn bộ ngăn xếp công nghệ và tích hợp các hệ thống quản lý công suất động điều chỉnh mức tiêu thụ dựa trên nhu cầu theo thời gian thực.

Các mô hình do Google phát triển trực tiếp hiện xử lý hơn 160 tỷ token mỗi phút thông qua lệnh gọi API trực tiếp của khách hàng, tăng từ 100 tỷ ở quý trước. AI hiện tạo ra 75% tổng lượng mã code mới tại Google, so với 50% vào mùa thu năm ngoái. Gemini Enterprise, sản phẩm doanh nghiệp của Google, tăng 40% theo từng quý trong số người dùng hoạt động hằng tháng trả phí. Công ty dự kiến sẽ đầu tư hơn một nửa ngân sách điện toán máy học vào các dịch vụ đám mây vào năm 2026 để phục vụ tốt hơn khách hàng và đối tác đám mây. Google cũng đang mở rộng hợp tác với Broadcom để phát triển và cung cấp các chip TPU tùy chỉnh cho các thế hệ tương lai, khi các công ty công nghệ lớn tìm kiếm lựa chọn thay thế cho các GPU đắt đỏ và bị hạn chế nguồn cung từ NVIDIA và AMD.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Claw Intelligence hợp tác với Block Sec Arena để tăng cường bảo mật BNB Chain

Theo thông báo chính thức của Block Sec Arena vào ngày 30 tháng 4, Claw Intelligence, một nền tảng Web3 do AI dẫn dắt được xây dựng trên BNB Chain, đã công bố quan hệ đối tác chiến lược với Block Sec Arena nhằm tích hợp cơ sở hạ tầng an ninh mạng tiên tiến vào hệ sinh thái của mình. Sự hợp tác này hướng đến việc củng cố p

GateNews5giờ trước

NTT Công bố sáng kiến AI x OWN, lên kế hoạch tăng gấp ba công suất điện tại Nhật Bản lên 1 GW vào năm 2033

Vào ngày 27 tháng 4, Chủ tịch NTT Akira Shimada đã công bố sáng kiến AI x OWN, nỗ lực của công ty nhằm thiết kế lại hạ tầng internet để phục vụ AI theo thời gian thực. NTT dự kiến sẽ nâng gấp ba công suất điện trong nước từ khoảng 300 MW hiện nay lên khoảng 1 gigawatt vào năm tài chính 2033, khi tập đoàn viễn thông

GateNews7giờ trước

Nền tảng AI Certifyde hoàn tất vòng Seed 2 triệu USD vào ngày 1 tháng 5, được hậu thuẫn bởi CEO Ripple Brad Garlinghouse

Theo TechfundingNews, nền tảng ứng dụng AI Certifyde đã hoàn tất vòng gọi vốn seed trị giá 2 triệu USD vào ngày 1 tháng 5. Các nhà đầu tư bao gồm K5 Global, Flamingo Capital và các nhà đầu tư thiên thần, trong đó có đồng sáng lập Honey George Ruan, CEO Ripple Brad Garlinghouse và đồng sáng lập Nutra Roland

GateNews7giờ trước

Nhà Khoa học của Lầu Năm Góc: Anthropic vẫn bị đưa vào danh sách đen, xử lý ngoại lệ cho Mythos

Ngày 1 tháng 5, Chánh công nghệ Bộ Quốc phòng Mỹ (Pentagon technology chief) cho biết trước Quốc hội rằng, “Anthropic vẫn nằm trong danh sách đen, nhưng Mythos Preview là một câu chuyện khác”, qua đó chính thức thừa nhận Bộ Quốc phòng đối xử khác nhau với thương hiệu chủ lực của Anthropic và mô hình mới Mythos. Tuyên bố này trùng khớp với việc Axios công bố vào ngày 19 tháng 4 rằng NSA (Cơ quan An ninh Quốc gia) đã thực tế sử dụng Mythos để tạo sự tương hỗ, đồng thời chính thức xác lập định hướng chính sách “kênh ngoại lệ đối với Mythos” — đồng thời cũng đồng nghĩa rằng, về mặt lập luận pháp lý nội bộ, trước đây Bộ Quốc phòng đã từng cho rằng việc sử dụng công cụ của Anthropic sẽ đe dọa an ninh quốc gia, trong khi cách làm hiện tại lại tạo ra mâu thuẫn. Anthropic vs Pentagon

ChainNewsAbmedia8giờ trước

137 Ventures đóng $700M trong quỹ mới, AUM đạt 15 tỷ USD

Theo ChainCatcher, 137 Ventures, nhà đầu tư sớm vào SpaceX, mới đây đã hoàn tất việc huy động vốn cho hai quỹ mới với tổng quy mô hơn 700 triệu USD, qua đó nâng tài sản được quản lý lên hơn 15 tỷ USD. Nguồn vốn mới sẽ hỗ trợ đầu tư vào các tác nhân AI, robot và hệ thống đẩy tên lửa không gian

GateNews8giờ trước

Reddit Tăng 16% nhờ Triển vọng Q2 Mạnh Mẽ; Apple Gặp Thiếu Hụt Mac khi Nhu cầu AI Vượt Quá Nguồn Cung

Cổ phiếu của Reddit đã tăng 16% trước giờ mở cửa thị trường vào thứ Sáu sau khi công ty đưa ra triển vọng doanh thu cho quý tới cao hơn dự kiến. Lượng khách truy cập hoạt động hằng ngày tăng 17% lên 126,8 triệu, trong khi doanh thu trung bình trên mỗi người dùng trên toàn cầu nhảy 44%, nhờ vào các tính năng được hỗ trợ bởi AI-powered

GateNews8giờ trước
Bình luận
0/400
Không có bình luận