OpenAI chính thức ra mắt chip AI tự phát triển đầu tiên mang tên Jalapeño vào ngày 24 tháng 6, được phát triển chung với Broadcom, định vị là bộ xử lý suy luận tối ưu hóa cho mô hình ngôn ngữ lớn (LLM); được sản xuất bởi TSMC, và nhà máy điện tử Canada Celestica chịu trách nhiệm xây dựng hệ thống máy chủ. CEO của Broadcom, Hock Tan, cho biết hiệu suất của Jalapeño có thể sánh ngang với NVIDIA Blackwell.
Theo bài viết chính thức của OpenAI, Jalapeño là bộ xử lý được thiết kế riêng cho nhu cầu suy luận, chứ không phải chip đào tạo. Từ thiết kế ban đầu đến khi hoàn thành sản xuất (tape-out) chỉ mất 9 tháng, tiến độ này nhờ vào việc OpenAI sử dụng mô hình AI của riêng mình để hỗ trợ tối ưu hóa thiết kế chip.
Richard Ho, trưởng bộ phận phần cứng của OpenAI, chỉ ra rằng chip có thể thực thi hiệu quả các khối lượng công việc quan trọng; các thử nghiệm chính thức ban đầu cho thấy hiệu suất trên mỗi watt vượt trội đáng kể so với các sản phẩm cùng loại trên thị trường. CEO Broadcom, Hock Tan, tuyên bố hiệu suất đủ sức cạnh tranh với NVIDIA Blackwell và Google TPU.
Hock Tan đã giao mẫu vật lý Jalapeño cho Sam Altman; đồng thời thừa nhận rằng do chip AI yêu cầu lượng lớn bộ nhớ băng thông cao (HBM), tỷ suất lợi nhuận hiện tại của chip tùy chỉnh thấp hơn so với các sản phẩm như bộ chuyển mạch mạng, HBM chủ yếu được cung cấp bởi SK Hynix và Samsung Electronics.
Ông cũng chỉ ra rằng nhu cầu về sức mạnh tính toán của khách hàng bùng nổ, dự kiến sẽ kéo dài đến năm 2028. Chủ tịch OpenAI, Greg Brockman, nói với CNBC rằng mức độ mà mô hình AI giúp tăng tốc nghiên cứu phát triển chip thật đáng kinh ngạc, công ty có nhu cầu cấp thiết về sức mạnh tính toán.
Jalapeño là một phần trong chiến lược đa dạng sức mạnh tính toán của OpenAI. Ben Barringer, trưởng bộ phận nghiên cứu công nghệ tại Quilter Cheviot, phân tích rằng các gã khổng lồ công nghệ tích cực phân tán nguồn cung chip để tránh bị phụ thuộc vào một nhà cung cấp duy nhất. Ngoài hợp tác với Broadcom, OpenAI còn đạt thỏa thuận với AWS để sử dụng chip Trainium, và thiết lập quan hệ hợp tác với AMD cùng Cerebras (niêm yết vào tháng 5 năm 2026).
OpenAI và Broadcom trước đó đã công bố kế hoạch triển khai trung tâm dữ liệu với công suất lên tới 10 GW trong vài năm tới, cùng với các đối tác như Microsoft. Việc ra mắt chip tự phát triển vào thời điểm OpenAI chuẩn bị IPO là giai đoạn then chốt, thị trường dự kiến định giá có thể đạt 1 nghìn tỷ USD, chip tự phát triển giúp xây dựng lợi thế công nghệ full-stack, giảm chi phí dịch vụ, để hỗ trợ kỳ vọng định giá cao hơn.
Jalapeño là một loại ớt Mexico có vị cay nồng mạnh. Tạp chí công nghệ Engadget gọi đây là "khởi đầu cay nồng" của OpenAI khi bước vào lĩnh vực chip; BusinessKorea chỉ ra rằng cách đặt tên này cũng tiết lộ OpenAI nhắm trực tiếp vào thị trường cơ sở hạ tầng tính toán AI độc quyền tập trung vào NVIDIA. Trong ngành bán dẫn và phần mềm, các đội nghiên cứu thường dùng tên thực phẩm, thực vật hoặc địa danh làm mã phát triển, đội ngũ OpenAI đã dùng mã này trong 9 tháng phát triển bí mật và giữ nguyên khi ra mắt.
Theo báo cáo, Jalapeño là bộ xử lý suy luận, được tối ưu hóa cho nhu cầu suy luận (inference) của mô hình ngôn ngữ lớn, chứ không phải chip đào tạo (training). Suy luận là quá trình mô hình AI tạo ra phản hồi trong sử dụng thực tế, nhạy cảm hơn với hiệu suất năng lượng và độ trễ; đào tạo yêu cầu mật độ tính toán cực cao. Các thử nghiệm ban đầu của Jalapeño cho thấy hiệu suất trên mỗi watt vượt trội đáng kể so với các sản phẩm suy luận cùng loại.
Theo đánh giá của nhà phân tích Ben Barringer, các gã khổng lồ công nghệ (bao gồm OpenAI) đang tích cực phân tán nguồn cung chip để tránh phụ thuộc vào một nhà cung cấp duy nhất. Sự ra mắt của Jalapeño giúp OpenAI giảm sự phụ thuộc vào GPU NVIDIA, kết hợp với các nguồn cung đa dạng như AWS Trainium, AMD và Cerebras, xây dựng danh mục sức mạnh tính toán linh hoạt hơn. Tuy nhiên, quy mô và độ chín của Jalapeño hiện vẫn đang trong giai đoạn triển khai ban đầu, khó có thể thay thế hoàn toàn vị thế thị trường của NVIDIA trong ngắn hạn.
Tin tức liên quan
OpenAI và Broadcom công bố Jalapeño, chip AI tùy chỉnh đầu tiên cho suy luận mô hình ngôn ngữ lớn (LLM Inference)
Qualcomm ra mắt CPU trung tâm dữ liệu Dragonfly C1000, Meta là khách hàng đầu tiên
Cambrian huy động $6M Seed để xây dựng mạng lưới Oracle dữ liệu blockchain
OpenAI và Broadcom công bố chip AI tùy chỉnh Jalapeño cho suy luận
Engram nâng $98M để cắt giảm chi phí token AI cho khách hàng doanh nghiệp