Le modèle Rio 3,5 d'IplanRIO prouvé comme preuve de merge de poids Nex dans un litige d'attribution

IplanRIO a sorti Rio 3.5 Open 397B le 13 juin, en le présentant comme un modèle d’IA de pointe construit par un gouvernement, avec des scores de référence supérieurs à des modèles établis, dont Qwen 3.7 Plus. Quelques jours après sa sortie, la société d’IA Nex a publié une preuve mathématique montrant que le modèle est une fusion directe de poids avec une pondération 0,6 Nex / 0,4 Qwen, avec des mesures de colinéarité de 0,993 sur les 60 couches et un ratio de mélange stable de α ≈ 0,571. IplanRIO a ensuite mis à jour la fiche du modèle pour créditer Nex, supprimé les allégations de benchmarks et attribué le problème à un « téléchargement incorrect » d’une version de base fusionnée au lieu d’un modèle final distillé. Le différend porte sur les standards d’attribution dans le développement d’IA open source, où s’appuyer sur des modèles open-weight existants est une pratique courante, mais nécessite un crédit explicite à tous les modèles sources selon des termes de licence comme Apache 2.0 et MIT.

IplanRIO publie le modèle Rio 3.5 le 13 juin

L’agence IT de Rio de Janeiro a publié Rio 3.5 le 13 juin. Le service municipal a décrit le modèle comme un modèle de catégorie « frontier » avec 397 milliards de paramètres et une licence open-source permissive, développé par le gouvernement de la ville. La sortie coïncidait avec le match d’ouverture de la Coupe du monde au Brésil, et les commentaires sur le modèle se sont propagés rapidement du Brésil à des audiences internationales.

La fiche modèle originale décrivait Rio 3.5 comme un post-train de Qwen 3.5 397B, le modèle open-base d’Alibaba, avec une couche de raisonnement appelée SwiReasoning ajoutée par-dessus. Le coût de développement rapporté était de R$500 000, soit environ 100 000 dollars US. L’architecture utilise un Mixture-of-Experts, activant environ 17 milliards des 397 milliards de paramètres par jeton. Le modèle prend en charge la vision et le texte, gère plus d’une douzaine de langues et est distribué sous licence MIT.

SwiReasoning est un cadre d’inférence sans entraînement qui bascule entre deux modes. Lorsque le modèle est confiant sur le prochain mot—faible entropie dans la distribution de probabilités—il raisonne en langage clair. Lorsqu’il est incertain, il passe à un raisonnement latent dans des états internes cachés sans émettre de jetons.

Les scores de benchmarks auto-déclarés incluaient Terminal-Bench 2.1 à 70,8%, dépassant Qwen 3.7 Plus à 70,3% et DeepSeek v4 Pro à 67,9%. Sur IMOAnswerBench, Rio 3.5 a obtenu 89,5%. Sur HLE—Humanity's Last Exam—Rio 3.5 a atteint 36,5%, devant Qwen 3.7 Plus à 34,7%. Le maire de Rio de Janeiro, Eduardo Cavaliere, a tweeté à propos de la sortie en déclarant : « Un modèle d’IA open source entraîné à Rio et financé publiquement au cours de la dernière année par [la Municipalité de Rio] vient de dépasser tous les autres modèles. »

Nex publie une preuve mathématique de la fusion des poids

Nex-AGI, une alliance d’IA open-source basée à Shanghai, a posté sur X quelques jours après la sortie. L’analyse a déclaré : « Le modèle Rio 3.5 a cassé Internet cette semaine. Le twist ? C’est essentiellement notre modèle open-source Nex N2 Pro, portant un autre chapeau. » Nex a analysé les poids et a annoncé la formule : Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. Un script de vérification et un rapport complet sur GitHub ont suivi.

Les preuves comportaient des éléments comportementaux et mathématiques. Nex a retiré du modèle déployé le prompt système codé en dur « You are Rio » et l’a soumis à 120 questions d’identité. Sans le prompt, Nex rapporte que le modèle s’est identifié « Nex, from Nex-AGI » 79,2% du temps et « Rio » 0% du temps. Le modèle a récité mot pour mot l’historique spécifique de Nex, mentionnant le « Shanghai Innovation Institute » et « a large-model ecosystem alliance ».

Mathématiquement, Nex a mesuré la colinéarité sur les 60 couches. Le résultat est revenu à 0,993. Le ratio de mélange est resté à α ≈ 0,571, stable jusqu’à trois décimales. Nex a déclaré : « Chaque tenseur de poids dans Rio est, à des milliers d’écarts-types près, le même mélange 0,6/0,4 de Nex et Qwen—sur les 60 couches et chaque composant du réseau. Il n’y a aucune explication innocente. »

Nex N2 Pro, sorti quelques jours avant Rio 3.5, obtient 75,3% sur Terminal-Bench 2.1—plus que les 70,8% de Rio. Sur GDPval, un benchmark de prévision économique, Nex est à 1 585 contre 1 533 pour Rio.

IplanRIO met à jour la fiche du modèle et crédite Nex

IplanRIO a mis à jour la fiche du modèle sur Hugging Face. Le tableau des benchmarks a été supprimé et l’attribution a été modifiée. Le Readme mis à jour indique : « Le modèle est construit via une fusion de nex-agi/Nex-N2-Pro et Qwen/Qwen3.5-397B-A17B, précédée d’une distillation On-Policy à partir d’un modèle plus fort. Nous avons détecté un téléchargement incorrect dans la version précédente, où la version de base fusionnée a été téléversée au lieu du modèle final distillé. Nous sommes désolés pour la confusion et nous nous excusons sincèrement. »

Aucune autre déclaration publique de la part d’IplanRIO n’a été publiée. Nex est désormais crédité dans la fiche du modèle. L’explication du « téléchargement incorrect » affirme que la sortie prévue était une version distillée de la base fusionnée, et non la fusion brute elle-même. La distillation On-policy implique qu’un modèle enseignant plus fort génère des sorties, tandis que l’étudiant s’entraîne sur ces sorties et génère les siennes.

IplanRIO a déclaré qu’il travaille à téléverser le modèle distillé corrigé, avec une attribution complète en place.

Débat communautaire sur les standards d’attribution

La fusion des modèles est autorisée par les licences en jeu. Nex N2 Pro est Apache 2.0, permettant l’utilisation, la modification et la redistribution avec mention. Qwen 3.5 est sous licence ouverte. Le problème portait sur la présentation de la sortie comme un travail développé indépendamment sans nommer tous les modèles sources.

Le commentateur technique Rafael Quintanilha a noté que, puisque Nex N2 Pro est construit sur Qwen, l’équipe a peut-être crédité l’architecture sous-jacente et l’a laissée telle quelle. Il a souligné que le modèle est devenu viral pendant un match de Coupe du monde, « pas nécessairement “prêt pour une consommation publique” ». Le développeur Lucas Montano a déclaré que « fusionner deux modèles de classe ~400B puis appliquer une distillation par la politique n’est pas trivial », tout en reconnaissant à la fois une erreur technique et un échec de communication.

Le chercheur en IA Diego Ambrosio a noté que le lancement initial décrivait Rio 3.5 comme le résultat de « post-entraînement autonome et d’un fine-tuning propriétaire »—une formulation qui impliquait une recherche originale, plutôt qu’une fusion.

Nex a écrit sur X : « Nous sommes flattés que la Ville de Rio ait utilisé notre travail pour atteindre des performances SOTA. Mais dans le monde de l’open source, l’attribution compte. »

FAQ

Qu’a publié IplanRIO le 13 juin ?

IplanRIO a publié Rio 3.5 Open 397B le 13 juin, décrit comme un modèle d’IA de pointe construit par un gouvernement avec 397 milliards de paramètres, une architecture Mixture-of-Experts, et des scores de benchmarks incluant 70,8% sur Terminal-Bench 2.1, 89,5% sur IMOAnswerBench, et 36,5% sur HLE. Le modèle a été publié sous licence MIT avec un coût de développement rapporté de R$500 000.

L’analyse mathématique de Nex a-t-elle montré quelque chose sur Rio 3.5 ?

Nex a publié une preuve mathématique montrant que Rio 3.5 est une fusion directe de poids avec la formule : Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. L’analyse a mesuré une colinéarité de 0,993 sur les 60 couches, avec un ratio de mélange stable de α ≈ 0,571. Les tests d’identité ont montré que le modèle s’est auto-identifié comme « Nex, from Nex-AGI » 79,2% du temps et « Rio » 0% du temps lorsque le prompt système codé en dur était retiré.

Comment IplanRIO a-t-il répondu aux conclusions de Nex ?

IplanRIO a mis à jour la fiche du modèle sur Hugging Face pour créditer Nex, a supprimé les allégations de benchmarks et a déclaré : « Nous avons détecté un téléchargement incorrect dans la version précédente, où la version de base fusionnée a été téléversée au lieu du modèle final distillé. » La fiche mise à jour décrit le modèle comme « construit via une fusion de nex-agi/Nex-N2-Pro et Qwen/Qwen3.5-397B-A17B, précédée par une distillation On-Policy à partir d’un modèle plus fort ». IplanRIO a déclaré qu’il travaille à téléverser le modèle distillé corrigé avec une attribution complète.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire