IplanRIO 于 6 月 13 日发布 Rio 3.5 Open 397B，并将其宣传为由政府打造的前沿 AI 模型，基准得分超过包括 Qwen 3.7 Plus 在内的既有模型。发布后数天，AI 公司 Nex 在 X 上发表数学证明，表明该模型是直接的 0.6 Nex / 0.4 Qwen 权重合并，并且在全部 60 层上的共线性测量结果为 0.993，混合比例稳定为 α ≈ 0.571。随后，IplanRIO 更新模型卡以署名 Nex，移除基准宣称，并将该问题归因于“错误上传”——上传的是基础合并版本，而不是最终蒸馏模型。争议聚焦于开源 AI 开发中的署名标准：在现有开源权重模型之上构建是常见做法，但根据 Apache 2.0 和 MIT 等许可条款，需要对所有来源模型进行明确署名。

IplanRIO 于 6 月 13 日发布 Rio 3.5 模型

里约热内卢的 IplanRIO 于 6 月 13 日发布 Rio 3.5。该市 IT 机构将其描述为前沿级模型，包含 397B 个参数，并采用宽松的开源许可，由市政府开发。发布恰逢巴西世界杯揭幕战，关于该模型的评论从巴西迅速传播到国际受众。

最初的模型卡将 Rio 3.5 描述为 Qwen 3.5 397B（阿里巴巴的开源底座模型）的后训练版本，并在其顶部添加名为 SwiReasoning 的推理层。据称开发成本为 R$500,000，约合 10 万美元。架构使用 Mixture-of-Experts（混合专家），每个 token 激活 397B 个参数中的约 170 亿。模型支持视觉与文本，处理十多种语言，并以 MIT 许可发布。

SwiReasoning 是一种无需训练的推理框架，在两种模式间切换。当模型对下一个词很有把握——概率分布的低熵——它用通俗语言进行推理。当不确定时，它会在隐藏的内部状态中进行潜在推理，而不输出 tokens。

自述的基准得分包括 Terminal-Bench 2.1 为 70.8%，略高于 Qwen 3.7 Plus 的 70.3% 和 DeepSeek v4 Pro 的 67.9%。在 IMOAnswerBench 上，Rio 3.5 得分为 89.5%。在 HLE（Humanity's Last Exam，人类最后一次考试）上，Rio 3.5 为 36.5%，领先于 Qwen 3.7 Plus 的 34.7%。里约热内卢市长 Eduardo Cavaliere 在推特上谈及该发布，称“在里约训练、并在过去一年由 [里约市政厅] 公开资助的一个开源 AI 模型，刚刚超过了所有其他模型。”

Nex 发布关于权重合并的数学证明

Nex-AGI，这个总部在上海的开源 AI 联盟，在发布后数天在 X 上发帖。分析称：“Rio 3.5 模型本周让互联网都炸了。反转是？它本质上就是我们的开源模型 Nex N2 Pro，只是换了个说法。”Nex 分析了权重，并给出了公式：Rio 3.5 ≈ 0.6 × Nex N2 Pro + 0.4 × Qwen 3.5。随后发布了一个验证脚本以及一份完整的 GitHub 报告。

证据包含行为与数学两部分。Nex 从已部署的模型中移除了硬编码的“你是 Rio”的系统提示，并发送了 120 个身份识别问题。没有该提示后，Nex 报告称模型在 79.2% 的时间里称自己为“Nex, from Nex-AGI”，而在 0% 的时间里称自己为“Rio”。该模型逐字复述了 Nex 的特定背景故事，提到“Shanghai Innovation Institute（上海创新研究院）”以及“一个大型模型生态联盟”。

在数学层面，Nex 对所有 60 层计算了共线性。结果为 0.993。混合比例保持在 α ≈ 0.571，并在小数点后三位上稳定。Nex 表示：“Rio 中的每一个权重张量，在成千上万的标准差尺度上，都是 Nex 与 Qwen 这 0.6/0.4 的相同混合——覆盖全部 60 层以及网络的每个组成部分。没有任何无辜的解释。”

Nex N2 Pro 在 Rio 3.5 发布前数天发布，在 Terminal-Bench 2.1 上得分 75.3%——高于 Rio 的 70.8%。在 GDPval（一个经济预测基准）上，Nex 为 1,585，而 Rio 为 1,533。

IplanRIO 更新模型卡并署名 Nex

IplanRIO 更新了 Hugging Face 的模型卡。删除了基准表，并更改了归属说明。更新后的 Readme 写道：“该模型通过对 nex-agi/Nex-N2-Pro 与 Qwen/Qwen3.5-397B-A17B 的合并构建，并在此之前使用来自更强模型的 On-Policy Distillation（按策略蒸馏）。我们在上一版本中检测到了一次错误上传：上传的是基础合并版本，而不是最终蒸馏模型。我们对造成的混淆深表歉意，并郑重致歉。”

IplanRIO 没有发布其他公开声明。模型卡现已在归属上署名 Nex。“错误上传”的解释称，原本的发布意图是将蒸馏版本作为发布，而不是直接发布原始的合并。按策略蒸馏的过程是：更强的教师模型生成输出，学生模型则在这些输出上训练，并生成自己的结果。

IplanRIO 表示正在努力上传已更正的蒸馏模型，并确保完整署名到位。

社区就署名标准展开争论

模型合并在相关许可证下是合法的。Nex N2 Pro 使用 Apache 2.0，允许在署名的前提下使用、修改和再分发。Qwen 3.5 采用开源许可。争议点在于把输出呈现为独立开发的成果，而没有点名所有来源模型。

技术评论员 Rafael Quintanilha 指出，由于 Nex N2 Pro 建在 Qwen 之上，团队可能已对底层架构进行了署名，并把署名保留在那份文档里。他还提到，该模型在一场世界杯比赛期间走红，“未必已经达到‘适合公开消费’”。开发者 Lucas Montano 表示，“合并两个 ~400B 级别的模型，然后再应用按策略蒸馏并不简单”，同时承认存在技术错误与沟通失败。

AI 研究员 Diego Ambrosio 指出，最初的发布描述 Rio 3.5 是“自主后训练与专有微调”的结果——这种表述暗示了原创研究，而非一次合并。

Nex 在 X 上写道：“我们很荣幸里约这座城市使用了我们的工作来达到 SOTA 表现。但在开源世界里，署名很重要。”

FAQ

IplanRIO 在 6 月 13 日发布了什么？

IplanRIO 于 6 月 13 日发布了 Rio 3.5 Open 397B，并将其描述为政府打造的前沿 AI 模型，包含 397B 个参数，采用 Mixture-of-Experts 架构，基准得分包括：Terminal-Bench 2.1 为 70.8%，IMOAnswerBench 为 89.5%，HLE 为 36.5%。该模型在 MIT 许可下发布，据称开发成本为 R$500,000。

Nex 的数学分析显示了关于 Rio 3.5 的什么？

Nex 发布了一份数学证明，显示 Rio 3.5 是一个直接权重合并，公式为：Rio 3.5 ≈ 0.6 × Nex N2 Pro + 0.4 × Qwen 3.5。分析在全部 60 层中测得共线性为 0.993，混合比例稳定为 α ≈ 0.571。身份测试表明，当移除硬编码系统提示后，模型在 79.2% 的时间里自我识别为“Nex, from Nex-AGI”，而在 0% 的时间里识别为“Rio”。

IplanRIO 如何回应 Nex 的发现？

IplanRIO 更新了 Hugging Face 的模型卡以署名 Nex，移除基准相关的宣称，并表示：“我们在上一版本中检测到了一次错误上传：上传的是基础合并版本，而不是最终蒸馏模型。”更新后的卡片将该模型描述为“通过对 nex-agi/Nex-N2-Pro 与 Qwen/Qwen3.5-397B-A17B 的合并构建，并在此之前使用来自更强模型的按策略蒸馏”。IplanRIO 表示正在努力上传已更正的蒸馏模型，并确保完整署名。

View Source

免责声明：本页面信息可能来自第三方，仅供参考，不代表 Gate 的观点或意见，亦不构成任何财务、投资或法律建议。数字资产交易风险较高，请勿仅依赖本页面信息作出决策。具体内容详见声明。