O modelo Rio 3,5 da IplanRIO, comprovado como Nex Weight Merge em disputa de atribuição

IplanRIO lançou o Rio 3.5 Open 397B a 13 de junho, apresentando-o como um modelo de IA de fronteira construído pelo governo, com pontuações de benchmarks a ultrapassar modelos estabelecidos, incluindo o Qwen 3.7 Plus. Poucos dias após o lançamento, a empresa de IA Nex publicou uma prova matemática mostrando que o modelo é uma fusão direta de pesos com 0,6 Nex / 0,4 Qwen, com medições de colinearidade de 0,993 em todas as 60 camadas e uma razão de mistura estável de α ≈ 0,571. Posteriormente, o IplanRIO atualizou o cartão do modelo para creditar a Nex, removeu as alegações de benchmark e atribuiu o caso a um “upload incorreto” de uma versão base fundida em vez de um modelo final destilado. A disputa centra-se em padrões de atribuição no desenvolvimento de IA open-source, em que construir em cima de modelos abertos com pesos é prática comum, mas exige crédito explícito a todos os modelos de origem sob termos de licenciamento como Apache 2.0 e MIT.

IplanRIO Releases Rio 3.5 Model on June 13

O IplanRIO, do Rio de Janeiro, lançou o Rio 3.5 a 13 de junho. A agência de TI da cidade descreveu-o como um modelo de classe de fronteira com 397 mil milhões de parâmetros e uma licença de código aberto permissiva, desenvolvida pelo governo municipal. O lançamento coincidiu com a abertura do Mundial no Brasil, e os comentários sobre o modelo espalharam-se rapidamente do Brasil para audiências internacionais.

O cartão original do modelo descrevia o Rio 3.5 como um pós-treino do Qwen 3.5 397B, o modelo open-base da Alibaba, com uma camada de raciocínio chamada SwiReasoning adicionada por cima. O custo de desenvolvimento reportado foi de R$500.000, aproximadamente 100.000 USD. A arquitetura usa Mixture-of-Experts, ativando cerca de 17 mil milhões dos 397 mil milhões de parâmetros por token. O modelo suporta visão e texto, trata mais de uma dezena de línguas e é distribuído sob uma licença MIT.

SwiReasoning é um enquadramento de inferência sem treino que alterna entre dois modos. Quando o modelo está confiante sobre a próxima palavra — baixa entropia na distribuição de probabilidades — raciocina em linguagem simples. Quando está incerto, muda para raciocínio latente em estados internos ocultos sem emitir tokens.

As pontuações de benchmark auto-referidas incluíam Terminal-Bench 2.1 a 70,8%, ultrapassando o Qwen 3.7 Plus em 70,3% e o DeepSeek v4 Pro em 67,9%. No IMOAnswerBench, o Rio 3.5 marcou 89,5%. No HLE — Humanity's Last Exam — o Rio 3.5 ficou em 36,5%, à frente dos 34,7% do Qwen 3.7 Plus. O presidente da câmara do Rio de Janeiro, Eduardo Cavaliere, fez um tweet sobre o lançamento, afirmando: “Um modelo de IA aberto treinado no Rio e financiado publicamente ao longo do último ano por [a Câmara Municipal do Rio] acabou de ultrapassar todos os outros modelos.”

Nex Publishes Mathematical Proof of Weight Merge

A Nex-AGI, uma aliança de IA open-source com sede em Xangai, publicou no X dias após o lançamento. A análise afirmou: “O modelo Rio 3.5 partiu a internet esta semana. A reviravolta? É essencialmente o nosso modelo open-source, Nex N2 Pro, a usar um chapéu diferente.” A Nex analisou os pesos e reportou a fórmula: Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. Seguiu-se um script de verificação e um relatório completo no GitHub.

As evidências incluíam componentes comportamentais e matemáticos. A Nex retirou o prompt de sistema hardcoded “You are Rio” do modelo implementado e fez 120 perguntas de identidade. Sem o prompt, a Nex relata que o modelo se identificou como “Nex, from Nex-AGI” 79,2% das vezes e como “Rio” 0% das vezes. O modelo recitou o historial específico da Nex palavra por palavra, mencionando o “Shanghai Innovation Institute” e uma “aliança de ecossistema de modelos de grande escala”.

Matematicamente, a Nex mediu a colinearidade em todas as 60 camadas. O resultado veio a 0,993. A razão de mistura manteve-se em α ≈ 0,571, estável até três casas decimais. A Nex afirmou: “Cada tensor de pesos no Rio é, a milhares de desvios-padrão, a mesma mistura 0,6/0,4 de Nex e Qwen — em todas as 60 camadas e em cada componente da rede. Não há uma explicação inocente.”

O Nex N2 Pro, lançado dias antes do Rio 3.5, obtém 75,3% no Terminal-Bench 2.1 — acima dos 70,8% do Rio. No GDPval, um benchmark de previsão económica, a Nex está em 1.585 face aos 1.533 do Rio.

IplanRIO Updates Model Card and Credits Nex

O IplanRIO atualizou o cartão do modelo na Hugging Face. A tabela de benchmarks foi removida e a atribuição foi alterada. O Readme atualizado afirma: “O modelo é construído via uma fusão do nex-agi/Nex-N2-Pro e do Qwen/Qwen3.5-397B-A17B, precedida por On-Policy Distillation a partir de um modelo mais forte. Detetámos um upload incorreto na versão anterior, em que foi enviada a versão base fundida em vez do modelo final destilado. Pedimos desculpa pela confusão e apresentamos desculpas de forma profusa.”

Não foi libertado mais nenhum comunicado público pelo IplanRIO. A Nex é agora creditada no cartão do modelo. A explicação do “upload incorreto” afirma que o lançamento pretendido era uma versão destilada da base fundida, e não a fusão crua em si. A distilação on-policy envolve um modelo de professor mais forte a gerar outputs, enquanto o aluno treina com esses outputs e gera os seus próprios.

O IplanRIO afirmou que está a trabalhar para fazer upload do modelo destilado corrigido, com atribuição completa no lugar.

Community Debate on Attribution Standards

A fusão de modelos é legal sob as licenças envolvidas. O Nex N2 Pro é Apache 2.0, permitindo uso, modificação e redistribuição com atribuição. O Qwen 3.5 tem licenciamento abertamente disponível. O problema centrou-se em apresentar o output como trabalho desenvolvido de forma independente, sem nomear todos os modelos de origem.

O comentador técnico Rafael Quintanilha notou que, como o Nex N2 Pro é construído sobre o Qwen, a equipa pode ter creditado a arquitetura subjacente e deixado isso por aí. Referiu que o modelo ficou viral durante um jogo do Mundial, “não necessariamente ‘pronto para consumo público’.” O programador Lucas Montano afirmou que “fundir dois modelos de classe ~400B e depois aplicar policy distillation não é trivial”, ao mesmo tempo que reconheceu tanto um erro técnico como uma falha de comunicação.

O investigador de IA Diego Ambrosio notou que o lançamento original descreveu o Rio 3.5 como resultado de “pós-treino autónomo e fine-tuning proprietário”, enquadrando que implicava investigação original, não uma fusão.

A Nex escreveu no X: “Estamos lisonjeados por a Cidade do Rio ter usado o nosso trabalho para alcançar desempenho SOTA. Mas no mundo open-source, a atribuição importa.”

FAQ

O que é que o IplanRIO lançou a 13 de junho?

O IplanRIO lançou o Rio 3.5 Open 397B a 13 de junho, descrito como um modelo de IA de fronteira construído pelo governo com 397 mil milhões de parâmetros, arquitetura Mixture-of-Experts, e pontuações de benchmarks incluindo 70,8% no Terminal-Bench 2.1, 89,5% no IMOAnswerBench e 36,5% no HLE. O modelo foi lançado sob uma licença MIT com um custo de desenvolvimento reportado de R$500.000.

O que é que a análise matemática da Nex mostrou sobre o Rio 3.5?

A Nex publicou uma prova matemática mostrando que o Rio 3.5 é uma fusão direta de pesos com a fórmula: Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. A análise mediu a colinearidade em 0,993 em todas as 60 camadas, com uma razão de mistura estável de α ≈ 0,571. Os testes de identidade mostraram que o modelo se autoidentificou como “Nex, from Nex-AGI” 79,2% das vezes e “Rio” 0% das vezes quando o prompt de sistema hardcoded foi removido.

Como é que o IplanRIO respondeu às conclusões da Nex?

O IplanRIO atualizou o cartão do modelo na Hugging Face para creditar a Nex, removeu as alegações de benchmark e afirmou: “Detetámos um upload incorreto na versão anterior, em que a versão base fundida foi enviada em vez do modelo final destilado.” O cartão atualizado descreve o modelo como “construído via uma fusão do nex-agi/Nex-N2-Pro e do Qwen/Qwen3.5-397B-A17B, precedida por On-Policy Distillation a partir de um modelo mais forte.” O IplanRIO afirmou que está a trabalhar para fazer upload do modelo destilado corrigido, com atribuição completa.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário