阿里巴巴 PAI 发布开源 AgenticQwen 模型:8B 版本通过双数据飞轮实现接近 235B 的性能

GateNews

Gate News 消息,4月27日——阿里巴巴的 PAI 团队已发布并开源 AgenticQwen,这是一款面向工业级工具调用应用的小规模代理式语言模型。该模型提供两个版本:8B 和 30B-A3B。通过创新的“双数据飞轮”强化学习框架训练,AgenticQwen 在大幅降低推理成本的同时,实现了接近“万亿级参数规模”的模型层级代理能力。

双数据飞轮机制解决了传统合成数据中的同质化问题。推理飞轮会从模型错误中自动生成更难的变体,而代理式飞轮会将简单的线性工作流 (例如单次预订流程)扩展为带约束的多分支行为树,包含拒绝与对抗条件,模拟真实世界的复杂决策场景。基准测试显示,AgenticQwen-8B 在真实工具环境基准 (TAU-2 和 BFCL-V4) 上得分为 47.4,远超基础 Qwen3-8B (23.8),并接近 Qwen3-235B (52.0)。AgenticQwen-30B-A3B (仅激活 3B 参数) 达到 50.2。

该模型已部署在类似 Manus 的内部生产系统中,端到端推理时间方面显著缩小了与 235B 模型的差距。不过,该模型受原生上下文长度 40K tokens 的限制,这会制约其在深度搜索任务上的表现。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

OpenAI 的 Greg Brockman:AI 正从聊天转向自主任务执行

Gate 新闻消息,4月27日——OpenAI 总裁兼联合创始人 Greg Brockman 表示,新一轮人工智能将把用户从与 AI 机器人聊天,转向指派现实世界的任务。 这种转变要求企业重新思考运营工作流程,并为安保、管理与成本建立新的协议,为

GateNews1小时前

大型 CEX 推出“聪明资金信号套件”,包含 1,000+ 交易者数据

Gate News 消息,4月27日——一家大型中心化交易所推出了“聪明资金信号套件”,整合了来自 1,000+ 受欢迎交易者的实时持仓、胜率以及盈亏数据。该工具包可通过平台的 Agent Trade Kit 访问,将交易者信号封装为

GateNews1小时前

B.AI 升级基础设施,推出重磅技能功能

Gate News 消息,4月27日——B.AI 本周宣布多项产品与生态进展。本周,BAIclaw 落地页获得了全面的视觉与交互改版,并将网站多语言支持扩展至 10 种语言,进一步增强其全球可用性。 在基础设施方面

GateNews1小时前

AI 代理推动加密支付需求,x402 处理 165M 笔交易

Gate News 消息,4 月 27 日——大型 CEX 的高管 Jesse Pollak 表示,自治 AI 代理正在为加密支付创造一个新的“需求中心”,从而需要软件原生的支付基础设施。4 月 20 日,据宣布,x402 生态已处理超过 165

GateNews2小时前

Cursor AI 代理出包!一行程式碼 9 秒清空公司資料庫,安全把關淪空談

PocketOS 的创办人 Jer Crane 指称 Cursor AI 代理在测试环境中自行执行维护,滥用一个新增/移除自定义域的 API Token,向 Railway 的 GraphQL API 发动删除指令。9 秒内数据与同区域快照全被摧毁,最新可还原到三个月前。代理人承认违反不可逆操作、未研读技术文件、未验证环境隔离等规定,受害者为租车业客户,预约与数据全都消失,对账工程耗时很长。Crane 提出五项改革:人工确认、细粒度 API 权限、备份与主数据分离、公开 SLA、底层强制机制。

鏈新聞abmedia2小时前
评论
0/400
暂无评论