D-Matrix Lança o chip de IA Corsair com alegações de 10x de velocidade face a uma GPU da Nvidia

D-Matrix, uma startup de chips de IA apoiada pela Microsoft e sediada no Vale do Silício, lançou o seu chip de inferência Corsair com a alegação de que consegue executar cargas de inferência 10 vezes mais rápido e consumindo cinco vezes menos energia do que uma GPU Nvidia autónoma em cargas de trabalho pequenas. A empresa, fundada em 2019 e avaliada em cerca de 2 mil milhões de dólares após angariar aproximadamente 500 milhões de dólares, começa a enviar para os clientes este mês. O lançamento surge num momento em que o mercado de chips de IA evidencia uma oportunidade substancial para intervenientes especializados, na sequência do IPO da Cerebras do mês passado, que levantou mais de 5,5 mil milhões de dólares e avaliou a empresa em mais de 50 mil milhões de dólares, e da aquisição pela Nvidia de Groq por 20 mil milhões de dólares em dezembro.

D-Matrix Usa Arquitetura de Memória SRAM para Inferência com Baixa Latência

O chip Corsair da D-Matrix atinge inferência com baixa latência e baixo consumo de energia ao integrar de forma estreita memória e computação num único chip. Tal como Groq e Cerebras, a D-Matrix recorre a SRAM, um tipo de memória que pode ser fabricada em fabs de lógica como a Taiwan Semiconductor Manufacturing Company e integrada no mesmo chip. As GPUs dependem de grandes quantidades de outro tipo de memória chamado DRAM, embalada em pilhas de high bandwidth memory adicionadas em torno do chip de lógica. O cofundador e CEO Sid Sheth afirmou que a empresa não está a tropeçar num gargalo em torno da DRAM, porque o produto não depende da DRAM para ser bem-sucedido.

Combinado com uma GPU Nvidia Blackwell, a D-Matrix afirma, citando investigação da Gimlet Labs, que o Corsair pode executar inferência 10 vezes mais rápido, três vezes mais barato e até cinco vezes mais eficiente em termos energéticos do que uma GPU autónoma. Sheth diz que o Corsair foi concebido para inferência de IA, otimizando para interatividade ou velocidade em vez do tamanho do modelo de linguagem, visando casos de uso como chatbots, agentes de voz e ferramentas agenticas.

Empresa Garante Compromissos com Hiperescalares e Laboratórios de IA

Sheth afirmou que a empresa tem compromissos com hiperescalares de elevado perfil, neoclouds e laboratórios de IA de fronteira. A D-Matrix começa a enviar para esses clientes este mês. Cerca de 90% dos clientes estão nos EUA, enquanto os clientes no exterior se encontram no Médio Oriente e no Sudeste Asiático, disse Sheth. A Microsoft investiu através do seu braço de venture M12.

Sheth afirmou que não tem intenção de vender a empresa e chamou ao mercado de chips de IA “um mercado de 1 trilião de dólares em construção”. O analista de semicondutores Stacy Rasgon, da Bernstein Research, observou que a D-Matrix tem um número razoável de envolvimentos reais com clientes, com clientes a usarem frequentemente os chips em conjunto com a Nvidia.

Chip Corsair Enfrenta Limitações com Modelos em Grande Escala

Rick Bahr, professor associado de engenharia elétrica na Universidade de Stanford, identificou uma limitação significativa: embora a SRAM no chip permita velocidades de inferência notáveis porque os dados percorrem distâncias curtas, não consegue lidar com os biliões de parâmetros que agora compõem modelos grandes de líderes como a OpenAI e a Anthropic. Bahr afirmou que esse número de parâmetros simplesmente não pode ser colocado numa conceção baseada em SRAM.

CEO da Nvidia Responde às Alegações de Concorrência na Inferência

O CEO da Nvidia, Jensen Huang, disse na semana passada que a sua empresa continua a ser a líder na inferência de baixo custo com o seu sistema Vera Rubin porque não é apenas uma questão de velocidade. Em Computex, em Taiwan, Huang disse que a razão é que a Nvidia integra tudo, desenha tudo a partir do zero, simula todo o sistema e recorre a co-design extremo. A Nvidia lançou um novo chip Groq na GTC em março, chamado unidade de processamento de linguagem.

D-Matrix Envia Cartões de Quatro Chips Baseados no Processo de 6 Nanómetros da TSMC

A D-Matrix vende quatro chips Corsair empacotados em conjunto dentro de um cartão que desliza para dentro das ranhuras num servidor de rack de centro de dados e custa dezenas de milhares de dólares. Sheth chamou ao Corsair a solução de SRAM mais densa do mercado hoje, com até 128 gigabytes de memória SRAM num único servidor. O chip é fabricado em Taiwan no nó de 6 nanómetros da TSMC.

A D-Matrix fez equipa com a Arista, a Broadcom e a Super Micro para construir um sistema completo à escala de rack chamado SquadRack para instalar os seus chips em centros de dados de IA. O próximo chip da empresa, Raptor, está agendado para ser lançado no próximo ano na TSMC de 4 nanómetros, o que Sheth disse que poderia sair da fábrica da empresa taiwanesa no Arizona.

FAQ

Que alegações de desempenho faz a D-Matrix para o seu chip Corsair?
A D-Matrix afirma que o seu chip Corsair consegue executar cargas de inferência 10 vezes mais rápido e com cinco vezes menos energia do que uma GPU Nvidia autónoma para cargas de trabalho pequenas. Quando emparelhado com uma GPU Nvidia Blackwell, citando investigação da Gimlet Labs, o Corsair consegue executar inferência 10 vezes mais rápido, três vezes mais barato e até cinco vezes mais eficiente em termos energéticos do que uma GPU autónoma.

Quais são as limitações técnicas da abordagem da D-Matrix baseada em SRAM?
De acordo com Rick Bahr, professor associado de engenharia elétrica na Universidade de Stanford, a conceção baseada em SRAM não consegue lidar com os biliões de parâmetros que compõem modelos grandes de líderes como a OpenAI e a Anthropic. Embora a SRAM no chip permita velocidades de inferência notáveis, esse número de parâmetros simplesmente não pode ser colocado numa conceção baseada em SRAM.

Quando é que a D-Matrix começa a enviar os chips Corsair aos clientes?
A D-Matrix começa a enviar os chips Corsair aos clientes este mês. A empresa tem compromissos com hiperescalares, neoclouds e laboratórios de IA de fronteira, com cerca de 90% dos clientes nos EUA e clientes no exterior no Médio Oriente e no Sudeste Asiático.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário