IplanRIO lançou o Rio 3.5 Open 397B a 13 de junho, apresentando-o como um modelo de IA de fronteira construído pelo governo, com pontuações de benchmarks a ultrapassar modelos estabelecidos, incluindo o Qwen 3.7 Plus. Poucos dias após o lançamento, a empresa de IA Nex publicou uma prova matemática mostrando que o modelo é uma fusão direta de pesos com 0,6 Nex / 0,4 Qwen, com medições de colinearidade de 0,993 em todas as 60 camadas e uma razão de mistura estável de α ≈ 0,571. Posteriormente, o IplanRIO atualizou o cartão do modelo para creditar a Nex, removeu as alegações de benchmark e atribuiu o caso a um “upload incorreto” de uma versão base fundida em vez de um modelo final destilado. A disputa centra-se em padrões de atribuição no desenvolvimento de IA open-source, em que construir em cima de modelos abertos com pesos é prática comum, mas exige crédito explícito a todos os modelos de origem sob termos de licenciamento como Apache 2.0 e MIT.
O IplanRIO, do Rio de Janeiro, lançou o Rio 3.5 a 13 de junho. A agência de TI da cidade descreveu-o como um modelo de classe de fronteira com 397 mil milhões de parâmetros e uma licença de código aberto permissiva, desenvolvida pelo governo municipal. O lançamento coincidiu com a abertura do Mundial no Brasil, e os comentários sobre o modelo espalharam-se rapidamente do Brasil para audiências internacionais.
O cartão original do modelo descrevia o Rio 3.5 como um pós-treino do Qwen 3.5 397B, o modelo open-base da Alibaba, com uma camada de raciocínio chamada SwiReasoning adicionada por cima. O custo de desenvolvimento reportado foi de R$500.000, aproximadamente 100.000 USD. A arquitetura usa Mixture-of-Experts, ativando cerca de 17 mil milhões dos 397 mil milhões de parâmetros por token. O modelo suporta visão e texto, trata mais de uma dezena de línguas e é distribuído sob uma licença MIT.
SwiReasoning é um enquadramento de inferência sem treino que alterna entre dois modos. Quando o modelo está confiante sobre a próxima palavra — baixa entropia na distribuição de probabilidades — raciocina em linguagem simples. Quando está incerto, muda para raciocínio latente em estados internos ocultos sem emitir tokens.
As pontuações de benchmark auto-referidas incluíam Terminal-Bench 2.1 a 70,8%, ultrapassando o Qwen 3.7 Plus em 70,3% e o DeepSeek v4 Pro em 67,9%. No IMOAnswerBench, o Rio 3.5 marcou 89,5%. No HLE — Humanity's Last Exam — o Rio 3.5 ficou em 36,5%, à frente dos 34,7% do Qwen 3.7 Plus. O presidente da câmara do Rio de Janeiro, Eduardo Cavaliere, fez um tweet sobre o lançamento, afirmando: “Um modelo de IA aberto treinado no Rio e financiado publicamente ao longo do último ano por [a Câmara Municipal do Rio] acabou de ultrapassar todos os outros modelos.”
A Nex-AGI, uma aliança de IA open-source com sede em Xangai, publicou no X dias após o lançamento. A análise afirmou: “O modelo Rio 3.5 partiu a internet esta semana. A reviravolta? É essencialmente o nosso modelo open-source, Nex N2 Pro, a usar um chapéu diferente.” A Nex analisou os pesos e reportou a fórmula: Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. Seguiu-se um script de verificação e um relatório completo no GitHub.
As evidências incluíam componentes comportamentais e matemáticos. A Nex retirou o prompt de sistema hardcoded “You are Rio” do modelo implementado e fez 120 perguntas de identidade. Sem o prompt, a Nex relata que o modelo se identificou como “Nex, from Nex-AGI” 79,2% das vezes e como “Rio” 0% das vezes. O modelo recitou o historial específico da Nex palavra por palavra, mencionando o “Shanghai Innovation Institute” e uma “aliança de ecossistema de modelos de grande escala”.
Matematicamente, a Nex mediu a colinearidade em todas as 60 camadas. O resultado veio a 0,993. A razão de mistura manteve-se em α ≈ 0,571, estável até três casas decimais. A Nex afirmou: “Cada tensor de pesos no Rio é, a milhares de desvios-padrão, a mesma mistura 0,6/0,4 de Nex e Qwen — em todas as 60 camadas e em cada componente da rede. Não há uma explicação inocente.”
O Nex N2 Pro, lançado dias antes do Rio 3.5, obtém 75,3% no Terminal-Bench 2.1 — acima dos 70,8% do Rio. No GDPval, um benchmark de previsão económica, a Nex está em 1.585 face aos 1.533 do Rio.
O IplanRIO atualizou o cartão do modelo na Hugging Face. A tabela de benchmarks foi removida e a atribuição foi alterada. O Readme atualizado afirma: “O modelo é construído via uma fusão do nex-agi/Nex-N2-Pro e do Qwen/Qwen3.5-397B-A17B, precedida por On-Policy Distillation a partir de um modelo mais forte. Detetámos um upload incorreto na versão anterior, em que foi enviada a versão base fundida em vez do modelo final destilado. Pedimos desculpa pela confusão e apresentamos desculpas de forma profusa.”
Não foi libertado mais nenhum comunicado público pelo IplanRIO. A Nex é agora creditada no cartão do modelo. A explicação do “upload incorreto” afirma que o lançamento pretendido era uma versão destilada da base fundida, e não a fusão crua em si. A distilação on-policy envolve um modelo de professor mais forte a gerar outputs, enquanto o aluno treina com esses outputs e gera os seus próprios.
O IplanRIO afirmou que está a trabalhar para fazer upload do modelo destilado corrigido, com atribuição completa no lugar.
A fusão de modelos é legal sob as licenças envolvidas. O Nex N2 Pro é Apache 2.0, permitindo uso, modificação e redistribuição com atribuição. O Qwen 3.5 tem licenciamento abertamente disponível. O problema centrou-se em apresentar o output como trabalho desenvolvido de forma independente, sem nomear todos os modelos de origem.
O comentador técnico Rafael Quintanilha notou que, como o Nex N2 Pro é construído sobre o Qwen, a equipa pode ter creditado a arquitetura subjacente e deixado isso por aí. Referiu que o modelo ficou viral durante um jogo do Mundial, “não necessariamente ‘pronto para consumo público’.” O programador Lucas Montano afirmou que “fundir dois modelos de classe ~400B e depois aplicar policy distillation não é trivial”, ao mesmo tempo que reconheceu tanto um erro técnico como uma falha de comunicação.
O investigador de IA Diego Ambrosio notou que o lançamento original descreveu o Rio 3.5 como resultado de “pós-treino autónomo e fine-tuning proprietário”, enquadrando que implicava investigação original, não uma fusão.
A Nex escreveu no X: “Estamos lisonjeados por a Cidade do Rio ter usado o nosso trabalho para alcançar desempenho SOTA. Mas no mundo open-source, a atribuição importa.”
O que é que o IplanRIO lançou a 13 de junho?
O IplanRIO lançou o Rio 3.5 Open 397B a 13 de junho, descrito como um modelo de IA de fronteira construído pelo governo com 397 mil milhões de parâmetros, arquitetura Mixture-of-Experts, e pontuações de benchmarks incluindo 70,8% no Terminal-Bench 2.1, 89,5% no IMOAnswerBench e 36,5% no HLE. O modelo foi lançado sob uma licença MIT com um custo de desenvolvimento reportado de R$500.000.
O que é que a análise matemática da Nex mostrou sobre o Rio 3.5?
A Nex publicou uma prova matemática mostrando que o Rio 3.5 é uma fusão direta de pesos com a fórmula: Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. A análise mediu a colinearidade em 0,993 em todas as 60 camadas, com uma razão de mistura estável de α ≈ 0,571. Os testes de identidade mostraram que o modelo se autoidentificou como “Nex, from Nex-AGI” 79,2% das vezes e “Rio” 0% das vezes quando o prompt de sistema hardcoded foi removido.
Como é que o IplanRIO respondeu às conclusões da Nex?
O IplanRIO atualizou o cartão do modelo na Hugging Face para creditar a Nex, removeu as alegações de benchmark e afirmou: “Detetámos um upload incorreto na versão anterior, em que a versão base fundida foi enviada em vez do modelo final destilado.” O cartão atualizado descreve o modelo como “construído via uma fusão do nex-agi/Nex-N2-Pro e do Qwen/Qwen3.5-397B-A17B, precedida por On-Policy Distillation a partir de um modelo mais forte.” O IplanRIO afirmou que está a trabalhar para fazer upload do modelo destilado corrigido, com atribuição completa.
Notícias relacionadas
IREN adquire a Nostrum Group, com sede em Espanha, por 490 MW de energia para centros de dados de IA
AMD ultrapassa $900B de capitalização de mercado enquanto o Ryzen AI Halo desafia a Nvidia DGX spark
Líderes de IA Debatem a Diferenciação dos Modelos e a Oportunidade da Inteligência Incorporada da China na Conferência Zhiyuan
O ChatGPT Pro entrega 14.000 dólares de valor em IA num teste de subscrição da Semianalysis
A Bittensor sobe 16% após ordem de encerramento do modelo de IA da Anthropic