Mensaje de Gate News, 24 de abril — Cambricon anunció hoy que ha completado la adaptación del Día 0 de DeepSeek-V4, el último modelo de lenguaje grande de DeepSeek, utilizando su ecosistema propietario de software NeuWare y el framework vLLM. El código de adaptación se ha publicado simultáneamente como código abierto, marcando la segunda vez consecutiva que Cambricon ha entregado soporte nativo de chips el mismo día del lanzamiento del nuevo modelo de DeepSeek.
Para optimizar la arquitectura novedosa de DeepSeek-V4, Cambricon aprovechó su biblioteca de operadores Torch-MLU-Ops de alto rendimiento para una aceleración especializada de módulos que incluyen Compressor y mHC. La empresa también utilizó el lenguaje de programación BangC para desarrollar kernels altamente optimizados para operadores críticos como Attention dispersa/compresa y GroupGemm, aprovechando plenamente las capacidades subyacentes del hardware. Los esfuerzos previos de co-optimización software-hardware entre las dos compañías han logrado índices de utilización de cómputo líderes en la industria.
DeepSeek-V4, que se lanzó hoy y es de código abierto, cuenta con una ventana de contexto extendida de un millón de tokens, capacidades sólidas de Agente y un rendimiento de inferencia sobresaliente. Cambricon afirmó que DeepSeek-V4 ejecutándose de forma nativa en los chips de Cambricon representa un hito significativo para la industria de IA de China.
Related News
Tencent lanza en código abierto Hy3, versión preliminar; las pruebas de referencia del código mejoran un 40% con respecto a la generación anterior
OpenAI presenta GPT-5.5: 12M de contexto, el índice AA llega al primer puesto, Terminal-Bench 82,7% reescribe el punto de referencia de los agentes
Google Jules abre la nueva lista de candidatos para la versión, y se reposiciona como una plataforma de desarrollo de productos de extremo a extremo