OpenAI e Broadcom revelam chip de IA Jalapeño para inferência de LLM

TIA-0,94%

A OpenAI e a Broadcom apresentaram o Jalapeño a 24 de junho de 2026, um chip acelerador de IA concebido à medida especificamente para inferência de modelos de linguagem de grande escala. O chip representa o primeiro Processador de Inteligência da OpenAI e o primeiro componente de uma plataforma de computação multigeracional planeada, desenvolvida em conjunto pelas duas empresas, com o objetivo declarado de melhorar a velocidade, a eficiência e a acessibilidade de sistemas de IA avançados. Este marco reflete uma orientação estratégica mais ampla na qual a OpenAI trabalha cada vez mais para obter controlo sobre toda a pilha de infraestrutura que sustenta os seus modelos e aplicações, em vez de depender exclusivamente de plataformas de computação externas.

Arquitetura do Jalapeño e Especificações Técnicas

O Jalapeño foi concebido de raiz com base em investigação interna sobre os requisitos da inferência moderna de LLMs. A sua arquitetura reflete conhecimentos derivados do roteiro de desenvolvimento de modelos da OpenAI, incluindo considerações sobre otimização de kernels, gestão de memória, redes e sistemas de serviço. O chip foi desenvolvido em parceria com a Broadcom e a Celestia, que contribuíram com processos de fabrico, integração de placas e bastidores, sistemas de rede e infraestrutura de implementação em grande escala. De acordo com as empresas, o design pretende manter-se flexível para diferentes modelos de linguagem de grande escala, não se limitando a uma única arquitetura ou linha de produtos.

Amostras de engenharia iniciais já estão a executar cargas de trabalho de aprendizagem automática em ambientes laboratoriais à frequência operacional e níveis de potência alvo, incluindo cargas de trabalho associadas a modelos avançados como o GPT-5.3-Codex-Spark. Avaliações internas iniciais sugerem que o Jalapeño pode obter um desempenho por watt melhorado em comparação com os principais aceleradores de IA existentes. A arquitetura diz-se que enfatiza a redução do movimento de dados e uma distribuição mais equilibrada dos recursos de computação, memória e rede, visando aproximar a utilização real dos limites teóricos do hardware. As tecnologias de silício da Broadcom, incluindo os seus componentes de rede Tomahawk, são posicionadas como facilitadores chave da implementação em grande escala.

Papéis da Parceria com a Broadcom e a Celestia

O chip foi desenvolvido em parceria com a Broadcom e a Celestia. A Broadcom contribuiu com tecnologias de silício e componentes de rede, incluindo sistemas de rede Tomahawk. A Celestia contribuiu com processos de fabrico, integração de placas e bastidores, sistemas de rede e infraestrutura de implementação em grande escala. O design é informado por sistemas de produção utilizados em produtos como o ChatGPT, Codex e serviços baseados em API, bem como pelos requisitos previstos para futuras aplicações baseadas em agentes.

Estratégia de Integração de Infraestrutura Full-Stack da OpenAI

A empresa enquadrou o desenvolvimento como parte de uma mudança mais ampla para um modelo económico orientado pela computação. Neste contexto, o chip é apresentado como um esforço para aumentar a disponibilidade de recursos computacionais, reduzir custos operacionais e melhorar a capacidade de resposta dos sistemas de IA em aplicações de consumo e empresariais. A estratégia subjacente envolve uma integração mais estreita entre o desenvolvimento de modelos, a conceção de hardware e a implementação de infraestrutura, permitindo a otimização em todo o sistema, em vez de em componentes isolados.

A abordagem de engenharia por detrás do Jalapeño é altamente especializada para inferência de LLMs, em vez de cargas de trabalho de computação generalizadas. É informada por sistemas de produção utilizados em produtos como o ChatGPT, Codex e serviços baseados em API, bem como pelos requisitos previstos para futuras aplicações baseadas em agentes. O objetivo do design é combinar alta capacidade de processamento com latência reduzida, permitindo um desempenho mais responsivo para casos de uso interativos de IA à escala.

Um aspeto chave do programa é o co-design de sistemas de software e hardware, onde os modelos e a infraestrutura evoluem em conjunto. Isto inclui arquitetura de chip, sistemas de memória, camadas de rede, mecanismos de escalonamento e estruturas de implementação. Ao alinhar estes componentes, o sistema pretende melhorar a eficiência e reduzir o custo por unidade de inteligência fornecida.

A estratégia de plataforma mais ampla posiciona o Jalapeño como o primeiro passo de um roteiro de infraestrutura a longo prazo, cuja implementação faseada está prevista para começar em 2026, incorporando contribuições da Broadcom em silício e redes e da Celestia em integração de sistemas.

FAQ

O que anunciaram a OpenAI e a Broadcom a 24 de junho de 2026?

A OpenAI e a Broadcom anunciaram o Jalapeño, um chip acelerador de IA concebido à medida especificamente para inferência de modelos de linguagem de grande escala. O chip representa o primeiro Processador de Inteligência da OpenAI e o primeiro componente de uma plataforma de computação multigeracional planeada, desenvolvida em conjunto pelas duas empresas.

Que cargas de trabalho estão as amostras de engenharia iniciais do Jalapeño a executar?

Amostras de engenharia iniciais já estão a executar cargas de trabalho de aprendizagem automática em ambientes laboratoriais à frequência operacional e níveis de potência alvo, incluindo cargas de trabalho associadas a modelos avançados como o GPT-5.3-Codex-Spark.

Quando está previsto o início da implementação faseada do Jalapeño?

A estratégia de plataforma mais ampla posiciona o Jalapeño como o primeiro passo de um roteiro de infraestrutura a longo prazo, cuja implementação faseada está prevista para começar em 2026.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário