Yuntianliyifei apresenta uma arquitectura de memória em camadas 3D no desenvolvimento de chips de inferência

De acordo com as divulgações das relações com investidores a 12 de maio, o chip de inferência em desenvolvimento de Yuntianliyifei adota uma arquitetura GPNPU como sua principal folha de rota tecnológica. Os principais destaques técnicos incluem uma capacidade de programação universal ao nível de GPGPU compatível com os ecossistemas CUDA mais comuns, núcleos NPU otimizados para eficiência de inferência e uma arquitetura de memória empilhada em 3D concebida para aumentar a largura de banda e reduzir a latência de acesso, ultrapassando o gargalo do problema de largura de banda da memória.

A empresa também utiliza uma arquitetura modular de computação para suportar a construção de supernós escalados ao nível de racks, para inferência de modelos MoE em escalas de biliões e centenas de biliões. A folha de rota da tecnologia tem como objetivo reduzir exponencialmente os custos por token e acelerar a implementação de aplicações de grandes modelos.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário