Microsoft thảo luận về nguồn cung chip Maia 200 cho Anthropic thông qua Azure

CHIP-4,98%
CLOUD-2,01%
TNSR0,45%

Microsoft đang đàm phán để cung cấp các chip AI Maia 200 cho Anthropic, công ty AI có trụ sở tại San Francisco đứng sau Claude, thông qua Azure. Thỏa thuận này vẫn chưa được chốt, nhưng có thể giúp Microsoft thu hẹp khoảng cách với Amazon và Google trong việc cung cấp chip AI tùy chỉnh cho khách hàng đám mây. Tháng 11, Microsoft đã đầu tư 5 tỷ USD vào Anthropic. Anthropic cam kết chi 30 tỷ USD cho Azure, trong khi startup này cũng sử dụng GPU Nvidia cùng các chip tùy chỉnh từ Amazon và Google.

Maia 200 nhắm tới hiệu quả suy luận AI

Maia 200 của Microsoft được thiết kế cho AI inference—việc chạy một mô hình đã được huấn luyện để tạo ra phản hồi—thay vì là chip đa dụng. Việc vận hành các dịch vụ AI lớn trong thời gian dài có thể tốn kém hơn so với ngay từ đầu dùng để huấn luyện mô hình. Microsoft cho biết Maia 200 mang lại hiệu năng tốt hơn 30% trên mỗi USD, điều này có thể cắt giảm chi phí hằng ngày cho khách hàng có khối lượng lớn hoặc cho phép các tính năng như cửa sổ ngữ cảnh dài hơn mà không tăng ngân sách. Con chip cũng nhắm đến việc giữ thời gian phản hồi ổn định hơn trong các đợt tăng tải lưu lượng, điều này quan trọng đối với các công ty xây dựng sản phẩm dựa trên mô hình của Anthropic.

Chip tùy chỉnh định hình lại cuộc cạnh tranh AI

Các cuộc đàm phán cho thấy cuộc đua đang chuyển sang hướng không chỉ mua thêm nhiều bộ xử lý đồ họa (GPU) của Nvidia. Các công ty đang kết hợp nhà sản xuất mô hình với nền tảng chip tùy chỉnh và hệ thống đám mây vận hành chúng. Anthropic đã đi theo cách đó với Google và Broadcom, một công ty thiết kế chip kiêm công ty hạ tầng. Startup này đang tinh chỉnh các mô hình Claude để làm việc chặt chẽ hơn với phần cứng và ngăn xếp phần mềm của Google, bao gồm Tensor Processing Unit (TPU). Một thỏa thuận tương tự với Microsoft cho Maia 200 có thể hỗ trợ kế hoạch đa đám mây với nhiều hơn một nhà cung cấp chip, mở rộng khả năng của Anthropic trong việc tiếp cận silicon tùy chỉnh thông qua Azure. Dự báo lượng chip tùy chỉnh do các nhà cung cấp đám mây chuyển giao sẽ tăng 44,6% trong năm 2026, so với mức tăng trưởng 16,1% của GPU.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận