DeepSeek V4 Pro 在 Ollama Cloud 上:Claude Code 一键串接

根据 Ollama 官方 4 月 27 日推文,由中国 AI 公司 DeepSeek 于 4 月 24 日发布的旗舰模型 DeepSeek V4 Pro,正式以云端模式进驻 Ollama 官方目录,使用者只需一行指令即可从 Claude Code、Hermes Agent、OpenClaw、Codex、OpenCode 等主流 agent 工具调用该模型。这是 Ollama 整合主流大模型最快速的一次同步——从 DeepSeek 释出权重到 Ollama Cloud 上线,仅相隔三天。

DeepSeek V4 Pro:1.6T 参数、1M context

V4 Pro 采用 Mixture-of-Experts 架构,总参数规模 1.6 兆(49 亿活跃参数),上下文窗口 1M token。第三方基准 Artificial Analysis 指出,V4 Pro 在 SWE-bench(80.6%)、LiveCodeBench(93.5%)、Terminal-Bench(67.9%)等程序编写基准上与 Kimi K2.6 并列开源模型前段班,整体 Intelligence Index 落后 Kimi K2.6 一个身位。

同期 DeepSeek 也释出较轻量的 V4 Flash 模型,两者皆采用 MIT 授权开源,可从 Hugging Face 下载权重。

Ollama Cloud 云端推理、权重不下载到本机

deepseek-v4-pro:cloud 为 Ollama Cloud 模型——推理在 Ollama 云端进行、权重不下载到使用者本机。这是 Ollama 处理超大模型的标准作法,先前 Kimi K2.6 也采用同样方式收录。对使用者而言,最大的优势是不需自备数十张 GPU 即可调用旗舰级模型;缺点是仍需网络连接,并依 Ollama 云端负载分配运算资源。

若要完全本地执行,须自 Hugging Face 取得 deepseek-ai/DeepSeek-V4-Pro 权重,搭配 INT4 量化版本(如 Unsloth 释出的 GGUF)与多卡 GPU 配置才有可行性。一般消费级硬件不足以承载完整模型。

一行指令串接 Claude Code、Hermes Agent、OpenClaw

Ollama 同步释出对主流 agent 工具的整合 launcher 指令:

直接對話 ollama run deepseek-v4-pro:cloud # 串接 Claude Code ollama launch claude --model deepseek-v4-pro:cloud # 串接 Hermes Agent ollama launch hermes --model deepseek-v4-pro:cloud # 串接 OpenClaw / OpenCode / Codex ollama launch openclaw --model deepseek-v4-pro:cloud ollama launch opencode --model deepseek-v4-pro:cloud ollama launch codex --model deepseek-v4-pro:cloud

意义在于:开发者过去在 Claude Code 内若想换用 DeepSeek,需透过 OpenAI 兼容 API 自行串接、处理 endpoint 与认证;现在透过 Ollama 一行指令即可完成。对 Claude Code 重度使用者而言,这提供了一条把 Anthropic 模型替换为 DeepSeek(或同理可换 Kimi)以降低成本的快速路径。

早期测试者反馈:速度从 30 tok/s 到峰值 1.1 tok/s

推文下方社群讨论显示,云端推理的速度视 Ollama 云端负载而异。多位早期测试者回报峰值时段速度偏慢,从常态 30 tokens/s 降至 1.1 tokens/s 级别,使用者 @benvargas 直接贴出截图抱怨“Need More Compute”。Ollama 在另一条回复中坦承官方团队“也在玩这個模型”,意指流量仍处于探索期,尚未做完整的容量规划。

对追求稳定产线速度的开发者,目前的建议是:用云端模式作为原型测试与成本评估,正式产品仍需自建 GPU 推理设施或选择商用 API。Ollama 完整教学已同步补上 V4 Pro 条目与云端/本地的取舍说明。

这篇文章 DeepSeek V4 Pro 上 Ollama Cloud:Claude Code 一键串接 最早出现于 链新闻 ABMedia。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明
评论
0/400
暂无评论