DeepSeek V4 引发美国争论:智库质疑芯片使用,Replit CEO 为开放创新辩护

Gate News 消息,4 月 24 日——围绕 DeepSeek V4 的技术能力与合规性,美国爆发了一场争论。Chris McGuire 是外交关系委员会 (CFR) 的资深研究员,曾任白宫国家安全委员会以及国防部官员,发表了分析文章,称 V4 并未改变美中 AI 的竞争格局。根据 McGuire 的说法,DeepSeek 自己的 V4 报告承认,其推理能力比前沿模型大约落后 3 到 6 个月,并以发布于六个月前的 GPT-5.2 与 Gemini 3.0 Pro 作为基准。

McGuire 提出担忧:尽管 V4 报告披露了在推理阶段对 NVIDIA GPU 以及华为 Ascend NPU 的适配,但并未公开说明开发过程中所使用的 GPU 型号或训练成本。他质疑这种沉默是否意味着使用了受出口管制的 NVIDIA Blackwell 芯片,并指出 V3 先前曾声称使用了 2,000 张 H800 GPU,成本为 5.57 million 美元。DeepSeek 已否认使用 Blackwell,表示该模型是在 NVIDIA H800 与华为 Ascend 910C 处理器上训练的。

Replit 首席执行官 Amjad Masad 反驳了 McGuire 的分析,认为中国科学家正在公开分享真正的 AI 突破,而美国政策制定者与游说者则放大“China distillation”(中国蒸馏)的担忧。Masad 强调了 DeepSeek 在官方声明中披露的架构创新,包括 (DeepSeek 稀疏注意力) 的按 token 级别注意力压缩,以及针对长上下文计算的显著效率提升。他指出,V4-Pro 在 1M 上下文长度下,展现出比 V3.2 更低得多的按 token 推理计算量与 KV 缓存需求,并强调这些架构进展与训练数据蒸馏无关,所有研究人员——包括美国的实验室——都可以从开源发展中获益。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明
评论
0/400
暂无评论