De acordo com as divulgações das relações com investidores a 12 de maio, o chip de inferência em desenvolvimento de Yuntianliyifei adota uma arquitetura GPNPU como sua principal folha de rota tecnológica. Os principais destaques técnicos incluem uma capacidade de programação universal ao nível de GPGPU compatível com os ecossistemas CUDA mais comuns, núcleos NPU otimizados para eficiência de inferência e uma arquitetura de memória empilhada em 3D concebida para aumentar a largura de banda e reduzir a latência de acesso, ultrapassando o gargalo do problema de largura de banda da memória.
A empresa também utiliza uma arquitetura modular de computação para suportar a construção de supernós escalados ao nível de racks, para inferência de modelos MoE em escalas de biliões e centenas de biliões. A folha de rota da tecnologia tem como objetivo reduzir exponencialmente os custos por token e acelerar a implementação de aplicações de grandes modelos.
Related News
A OpenAI lança o seu plano de cibersegurança Daybreak, com uma arquitectura em três camadas do GPT-5,5 para fazer frente à Anthropic Mythos
A NVIDIA anuncia uma parceria estratégica de longo prazo com a IREN para preparar 5 GW de infraestruturas de IA
Acordo da IREN com a Nvidia sinaliza viragem para a IA no valor de 3,4 mil milhões de dólares