OpenAI e Broadcom apresentaram hoje o Jalapeño, o primeiro Processador de Inteligência da OpenAI, projetado para inferência em modelos de linguagem de grande escala. O chip foi entregue ao CEO da OpenAI, Sam Altman, e ao presidente Greg Brockman pelo presidente e CEO da Broadcom, Hock Tan, e pelo presidente Charlie Kawwas. O acelerador representa o primeiro chip de IA de uma plataforma de computação com múltiplas gerações que as empresas estão construindo juntas para tornar a IA avançada mais rápida, confiável e acessível. A OpenAI projetou o chip do zero com base em seu entendimento dos fundamentos de LLMs, com a Broadcom e a Celestica ajudando a industrializar a plataforma por meio da implementação do chip, integração de sistemas de placa e rack, redes de alto desempenho e sistemas de produção escaláveis.
A entrega do chip marca um passo importante na estratégia da OpenAI de construir a pilha completa por trás de seus modelos e produtos. O Jalapeño foi desenvolvido por meio da colaboração entre OpenAI, Broadcom e Celestica, com cada parceiro contribuindo com expertise especializada para a plataforma.
A OpenAI projetou a arquitetura do chip com base em seu roteiro de modelos, kernels, sistemas de serviço e necessidades de produtos. A Broadcom contribuiu com a implementação do chip e tecnologias de rede, incluindo o silício Tomahawk, para levar a plataforma à produção em larga escala. A Celestica forneceu expertise em placas, integração de sistemas de rack e sistemas de produção escaláveis.
O Jalapeño foi projetado com flexibilidade para trabalhar com todos os LLMs, guiado pelos insights da OpenAI sobre as necessidades de inferência de modelos de IA atuais e futuros em toda a indústria. Amostras de engenharia já estão executando cargas de trabalho de ML no laboratório na frequência e potência alvo de produção, incluindo o GPT-5.3-Codex-Spark.
Testes iniciais mostram que o Jalapeño proporcionará um desempenho por watt substancialmente melhor do que o estado da arte atual. A arquitetura reduz a movimentação de dados e equilibra recursos de computação, memória e rede para atingir uma utilização realizada muito mais próxima do pico teórico de desempenho. Um relatório técnico detalhado será apresentado nos próximos meses.
"O Jalapeño foi projetado do zero para inferência de LLMs usando insights detalhados de nossa estreita colaboração com os pesquisadores da OpenAI", disse Richard Ho, que lidera o programa de hardware da OpenAI. "Otimizamos a arquitetura em torno dos kernels, movimentação de memória, rede e padrões de serviço que mais importam para modelos de IA de fronteira. Com base em testes iniciais, o Jalapeño executará com eficiência nossas cargas de trabalho mais importantes próximas aos limites teóricos do hardware."
O chip é um design de folha em branco para inferência moderna de LLMs, não um acelerador de uso geral adaptado de cargas de trabalho de IA anteriores. Ele é informado pelos sistemas que a OpenAI opera todos os dias em ChatGPT, Codex, API e futuros produtos baseados em agentes. O objetivo é combinar a potência e a taxa de transferência dos principais aceleradores de IA atuais com uma latência mais próxima dos sistemas de inferência especializados mais rápidos.
O Jalapeño foi desenvolvido em conjunto, do design inicial à conclusão da fabricação (tape-out), em apenas nove meses. As empresas acreditam que isso representa o ciclo de desenvolvimento de ASIC mais rápido já alcançado em semicondutores avançados de alto desempenho.
O cronograma acelerado reflete um profundo codesenvolvimento de software e hardware com as equipes de engenharia da OpenAI, a expertise de implementação de silício da Broadcom e o uso de modelos da OpenAI para acelerar partes do processo de design e otimização. Os mesmos modelos disponibilizados aos usuários estão ajudando a melhorar a infraestrutura usada para executar modelos futuros.
O Jalapeño é o primeiro passo de uma plataforma de computação com múltiplas gerações que combina aceleradores projetados pela OpenAI com a implementação de silício, redes e tecnologias de conectividade da Broadcom, e a expertise em placas, racks e sistemas da Celestica.
"O mundo está migrando para uma economia movida a computação", disse Greg Brockman, presidente e cofundador da OpenAI. "O Jalapeño faz parte de nossa estratégia de infraestrutura de pilha completa de longo prazo para tornar a computação mais abundante, resultando em uma IA mais rápida, confiável e acessível para pessoas e empresas, e que pode ser usada para resolver problemas mais importantes. Ao projetar mais da pilha nós mesmos, podemos oferecer mais inteligência com maior eficiência e continuar impulsionando a IA avançada em direção a um acesso mais amplo."
A plataforma de computação com múltiplas gerações foi projetada para implantação inicial até o final de 2026, com expansão nos anos seguintes. A OpenAI opera em toda a pilha, incluindo arquitetura de chip, kernels, sistemas de memória, redes, escalonamento, sistemas de implantação e experiência do produto, com cada camada otimizada para tornar seus modelos mais rápidos, confiáveis e acessíveis para os usuários.
O que é o Jalapeño e quando foi apresentado?
O Jalapeño é o primeiro Processador de Inteligência da OpenAI, um acelerador de IA projetado especificamente para inferência em modelos de linguagem de grande escala. A OpenAI e a Broadcom apresentaram o chip hoje.
Quanto tempo levou para desenvolver o Jalapeño?
O Jalapeño foi desenvolvido em conjunto, do design inicial à conclusão da fabricação (tape-out), em nove meses. As empresas acreditam que isso representa o ciclo de desenvolvimento de ASIC mais rápido já alcançado em semicondutores avançados de alto desempenho.
Quando o Jalapeño será implantado?
A plataforma de computação com múltiplas gerações que inclui o Jalapeño foi projetada para implantação inicial até o final de 2026, com expansão planejada nos anos seguintes.
Notícias relacionadas
Qualcomm Apresenta CPU Dragonfly C1000 para Data Center, Meta é a Primeira Cliente
Cambrian levanta $6M Seed para construir rede de oráculo de dados blockchain
OpenAI e Broadcom Revelam Chip de IA Personalizado Jalapeño para Inferência
Engram eleva $98M para reduzir os custos do token de IA para clientes corporativos
O modelo GLM-5.2 da z.AI ganha atenção do mercado com alto desempenho e baixo custo