Gate 新闻消息,4月24日——DeepSeek V4-Pro 和 DeepSeek V4-Flash 已于 4月24日正式发布并开源;上下文处理长度从 128K 显著扩展至 1M,容量提升接近 10 倍。华为计算宣布其 Ascend 超级节点产品通过芯片与模型技术的紧密协同,已全面支持 DeepSeek V4 系列模型。
华为 Ascend 950 通过融合算子核与多流并行技术,实现高吞吐、低延迟的 DeepSeek V4 模型推理部署,从而降低 Attention 计算与内存访问的开销。对于输入 8K 的 DeepSeek V4-Pro,Ascend 950 实现约 20ms TPOT,单卡 Decode 吞吐为 4,700 TPS;对于输入 <8K 的 DeepSeek V4-Flash,达到约 10ms TPOT,吞吐为 1,600 TPS。Ascend A3 超级节点系列同样实现完全兼容,并提供训练参考实现以便快速微调。基于具备大 EP 模式的 Ascend A3 64 卡超级节点,DeepSeek V4-Flash 在使用 vLLM 推理引擎的 8K/1K 输入输出场景中实现单卡 Decode 吞吐超过 2,000 TPS。华为全系 Ascend A2、A3 和 950 产品线均支持 DeepSeek V4-Flash 与 V4-Pro。
华为云宣布与 DeepSeek V4 率先实现兼容,通过其 MaaS 平台为开发者提供一键式 API 令牌服务。华为云针对系统层、算子层与集群层能力进行了优化,确保模型快速适配与高性能部署。包括金山 WPS 和 360 在内的企业已通过华为云集成了 DeepSeek 的新模型。
昆仑芯片同样宣布基于 vLLM 推理框架,与 DeepSeek V4-Flash 和 V4-Pro 实现 Day 0 兼容,并将适配代码开源给 GitHub 社区。昆仑芯片此前在去年 DeepSeek V3.2 发布时已率先完成适配:通过对 DeepSeek 系列模型开展深度的软件-硬件协同性能优化。
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
Google Planea Invertir Hasta $40 Mil Millones en Anthropic, Promete 5+ Gigavatios de Potencia de Computación
Mensaje de Gate News, 24 de abril — Según fuentes del mercado, Google planea invertir hasta $40 mil millones en Anthropic. La inversión comenzará con un inicial $10 mil millones en efectivo, seguido de hasta un adicional $30 mil millones condicionado al logro de hitos específicos.
Google también proporcionará a Anthropic
GateNewsHace29m
El regulador suizo FINMA advierte que la herramienta de IA Mythos de Anthropic plantea riesgos financieros
Mensaje de Gate News, 24 de abril — la Autoridad de Supervisión de los Mercados Financieros de Suiza (FINMA) ha declarado que permitir que los bancos adopten rápida y cómodamente la herramienta de inteligencia artificial de Anthropic Mythos supondría riesgos graves para el
GateNewsHace52m
Fere AI completa una ronda de financiación de $1.3M liderada por Ethereal Ventures
Mensaje de Gate News, 24 de abril — Fere AI, una plataforma de agentes de trading de activos digitales impulsada por IA, anunció la finalización de una ronda de financiación de $1.3 millones liderada por Ethereal Ventures, con la participación de Galaxy Vision Hill y Kosmos Ventures.
La plataforma admite redes entre cadenas, incluidas Ethereum,
GateNewshace2h
Anthropic revierte los cambios de Claude Code tras una caída de calidad; todas las correcciones están completas
Mensaje de Gate News, 24 de abril — Anthropic ha reconocido una reciente disminución en la calidad de Claude Code y ha confirmado que todos los problemas relacionados se han resuelto mediante retrocesos (rollbacks) y correcciones. Los problemas surgieron a partir de tres ajustes de producto y de prompts realizados entre principios y mediados de abril.
El 4 de marzo, el
GateNewshace3h
Cofundador de NeoSoul Kaelan: La industria de la IA debería permitir que existan juguetes; la innovación a menudo comienza como productos experimentales
Mensaje de Gate News, 24 de abril — En un reciente foro en Hong Kong sobre finanzas inteligentes cifradas, el cofundador de NeoSoul, Kaelan, compartió ideas para evaluar proyectos de IA en la etapa inicial, en una industria de IA que evoluciona rápidamente. Más allá de evaluar los productos actuales, los equipos deben demostrar la capacidad de mantenerse al ritmo con las capacidades del modelo subyacente, en un
GateNewshace4h
Meta desplegará decenas de millones de chips AWS Graviton5 en un acuerdo multimillonario plurianual
Mensaje de Gate News, 24 de abril — Meta ha firmado un acuerdo plurianual con Amazon Web Services para desplegar decenas de millones de procesadores Graviton5 para su infraestructura de IA, convirtiendo a Meta en uno de los mayores clientes globales de Graviton de AWS. El acuerdo, con una duración de entre tres y cinco años, tiene un valor de miles de millones de d
GateNewshace4h