Gate News 消息,4月27日——DeepSeek 推迟了其 V4 模型的发布,以便为华为的昇腾芯片微调其软件栈,反映出北京更广泛的举措:在获取先进的外国半导体日益受限的情况下,发展本土 AI 供应链。
DeepSeek 的 V4-Pro 模型在主要测试中与 OpenAI 和 Anthropic 设定的性能基准相匹配,同时将 API 成本显著降低至每百万输入 tokens 仅 $1.74,相比西方竞争对手。公司表示,V4-Pro 相较其 V3.2 前代实现了 27% 更高的计算效率,在 1 million-token 的语境中使用了大幅更少的计算能力。DeepSeek 之前曾通过其 R1 模型展示了成本效率,公司称开发 R1 所需投入少于 $6 million。
市场反应体现了向国产芯片采用的转变。中国 AI 公司 MiniMax 和智谱 (Knowledge Atlas Technology) 的股价分别约下跌 8%,而芯片制造商则受益:中芯国际——中国最大的代工芯片制造商——上涨 9%,华虹半导体攀升 15%。
然而,DeepSeek 的技术报告表明,公司仍在一定程度上依赖 Nvidia 芯片。目前,中国半导体用于模型推理,但仅有部分 V4 训练似乎已为本土硬件进行了适配;该报告未能澄清 Nvidia 芯片是否执行了模型训练阶段的大部分工作。
Related News
DeepRoute.ai sistema avanzado de asistencia a la conducción supera las 300.000 unidades desplegadas: objetivo 2026 de 1.000.000 flotas urbanas NOA
El Departamento de Estado de EE. UU. advierte sobre la destilación del modelo de IA DeepSeek
DeepSeek V4-Flash se lanza en Ollama Cloud, servidor en EE. UU.: Claude Code, OpenClaw con un clic para conectar