IplanRIO 的 Rio 3.5 模型在归因争议中被证明为 Nex Weight Merge

IplanRIO 于 6 月 13 日发布 Rio 3.5 Open 397B,并将其宣传为由政府打造的前沿 AI 模型,基准得分超过包括 Qwen 3.7 Plus 在内的既有模型。发布后数天,AI 公司 Nex 在 X 上发表数学证明,表明该模型是直接的 0.6 Nex / 0.4 Qwen 权重合并,并且在全部 60 层上的共线性测量结果为 0.993,混合比例稳定为 α ≈ 0.571。随后,IplanRIO 更新模型卡以署名 Nex,移除基准宣称,并将该问题归因于“错误上传”——上传的是基础合并版本,而不是最终蒸馏模型。争议聚焦于开源 AI 开发中的署名标准:在现有开源权重模型之上构建是常见做法,但根据 Apache 2.0 和 MIT 等许可条款,需要对所有来源模型进行明确署名。

IplanRIO 于 6 月 13 日发布 Rio 3.5 模型

里约热内卢的 IplanRIO 于 6 月 13 日发布 Rio 3.5。该市 IT 机构将其描述为前沿级模型,包含 397B 个参数,并采用宽松的开源许可,由市政府开发。发布恰逢巴西世界杯揭幕战,关于该模型的评论从巴西迅速传播到国际受众。

最初的模型卡将 Rio 3.5 描述为 Qwen 3.5 397B(阿里巴巴的开源底座模型)的后训练版本,并在其顶部添加名为 SwiReasoning 的推理层。据称开发成本为 R$500,000,约合 10 万美元。架构使用 Mixture-of-Experts(混合专家),每个 token 激活 397B 个参数中的约 170 亿。模型支持视觉与文本,处理十多种语言,并以 MIT 许可发布。

SwiReasoning 是一种无需训练的推理框架,在两种模式间切换。当模型对下一个词很有把握——概率分布的低熵——它用通俗语言进行推理。当不确定时,它会在隐藏的内部状态中进行潜在推理,而不输出 tokens。

自述的基准得分包括 Terminal-Bench 2.1 为 70.8%,略高于 Qwen 3.7 Plus 的 70.3% 和 DeepSeek v4 Pro 的 67.9%。在 IMOAnswerBench 上,Rio 3.5 得分为 89.5%。在 HLE(Humanity's Last Exam,人类最后一次考试)上,Rio 3.5 为 36.5%,领先于 Qwen 3.7 Plus 的 34.7%。里约热内卢市长 Eduardo Cavaliere 在推特上谈及该发布,称“在里约训练、并在过去一年由 [里约市政厅] 公开资助的一个开源 AI 模型,刚刚超过了所有其他模型。”

Nex 发布关于权重合并的数学证明

Nex-AGI,这个总部在上海的开源 AI 联盟,在发布后数天在 X 上发帖。分析称:“Rio 3.5 模型本周让互联网都炸了。反转是?它本质上就是我们的开源模型 Nex N2 Pro,只是换了个说法。”Nex 分析了权重,并给出了公式:Rio 3.5 ≈ 0.6 × Nex N2 Pro + 0.4 × Qwen 3.5。随后发布了一个验证脚本以及一份完整的 GitHub 报告。

证据包含行为与数学两部分。Nex 从已部署的模型中移除了硬编码的“你是 Rio”的系统提示,并发送了 120 个身份识别问题。没有该提示后,Nex 报告称模型在 79.2% 的时间里称自己为“Nex, from Nex-AGI”,而在 0% 的时间里称自己为“Rio”。该模型逐字复述了 Nex 的特定背景故事,提到“Shanghai Innovation Institute(上海创新研究院)”以及“一个大型模型生态联盟”。

在数学层面,Nex 对所有 60 层计算了共线性。结果为 0.993。混合比例保持在 α ≈ 0.571,并在小数点后三位上稳定。Nex 表示:“Rio 中的每一个权重张量,在成千上万的标准差尺度上,都是 Nex 与 Qwen 这 0.6/0.4 的相同混合——覆盖全部 60 层以及网络的每个组成部分。没有任何无辜的解释。”

Nex N2 Pro 在 Rio 3.5 发布前数天发布,在 Terminal-Bench 2.1 上得分 75.3%——高于 Rio 的 70.8%。在 GDPval(一个经济预测基准)上,Nex 为 1,585,而 Rio 为 1,533。

IplanRIO 更新模型卡并署名 Nex

IplanRIO 更新了 Hugging Face 的模型卡。删除了基准表,并更改了归属说明。更新后的 Readme 写道:“该模型通过对 nex-agi/Nex-N2-Pro 与 Qwen/Qwen3.5-397B-A17B 的合并构建,并在此之前使用来自更强模型的 On-Policy Distillation(按策略蒸馏)。我们在上一版本中检测到了一次错误上传:上传的是基础合并版本,而不是最终蒸馏模型。我们对造成的混淆深表歉意,并郑重致歉。”

IplanRIO 没有发布其他公开声明。模型卡现已在归属上署名 Nex。“错误上传”的解释称,原本的发布意图是将蒸馏版本作为发布,而不是直接发布原始的合并。按策略蒸馏的过程是:更强的教师模型生成输出,学生模型则在这些输出上训练,并生成自己的结果。

IplanRIO 表示正在努力上传已更正的蒸馏模型,并确保完整署名到位。

社区就署名标准展开争论

模型合并在相关许可证下是合法的。Nex N2 Pro 使用 Apache 2.0,允许在署名的前提下使用、修改和再分发。Qwen 3.5 采用开源许可。争议点在于把输出呈现为独立开发的成果,而没有点名所有来源模型。

技术评论员 Rafael Quintanilha 指出,由于 Nex N2 Pro 建在 Qwen 之上,团队可能已对底层架构进行了署名,并把署名保留在那份文档里。他还提到,该模型在一场世界杯比赛期间走红,“未必已经达到‘适合公开消费’”。开发者 Lucas Montano 表示,“合并两个 ~400B 级别的模型,然后再应用按策略蒸馏并不简单”,同时承认存在技术错误与沟通失败。

AI 研究员 Diego Ambrosio 指出,最初的发布描述 Rio 3.5 是“自主后训练与专有微调”的结果——这种表述暗示了原创研究,而非一次合并。

Nex 在 X 上写道:“我们很荣幸里约这座城市使用了我们的工作来达到 SOTA 表现。但在开源世界里,署名很重要。”

FAQ

IplanRIO 在 6 月 13 日发布了什么?

IplanRIO 于 6 月 13 日发布了 Rio 3.5 Open 397B,并将其描述为政府打造的前沿 AI 模型,包含 397B 个参数,采用 Mixture-of-Experts 架构,基准得分包括:Terminal-Bench 2.1 为 70.8%,IMOAnswerBench 为 89.5%,HLE 为 36.5%。该模型在 MIT 许可下发布,据称开发成本为 R$500,000。

Nex 的数学分析显示了关于 Rio 3.5 的什么?

Nex 发布了一份数学证明,显示 Rio 3.5 是一个直接权重合并,公式为:Rio 3.5 ≈ 0.6 × Nex N2 Pro + 0.4 × Qwen 3.5。分析在全部 60 层中测得共线性为 0.993,混合比例稳定为 α ≈ 0.571。身份测试表明,当移除硬编码系统提示后,模型在 79.2% 的时间里自我识别为“Nex, from Nex-AGI”,而在 0% 的时间里识别为“Rio”。

IplanRIO 如何回应 Nex 的发现?

IplanRIO 更新了 Hugging Face 的模型卡以署名 Nex,移除基准相关的宣称,并表示:“我们在上一版本中检测到了一次错误上传:上传的是基础合并版本,而不是最终蒸馏模型。”更新后的卡片将该模型描述为“通过对 nex-agi/Nex-N2-Pro 与 Qwen/Qwen3.5-397B-A17B 的合并构建,并在此之前使用来自更强模型的按策略蒸馏”。IplanRIO 表示正在努力上传已更正的蒸馏模型,并确保完整署名。

免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论