Model Rio 3,5 IplanRIO Terbukti sebagai Nex Weight Merge dalam Sengketa Atribusi

IplanRIO merilis Rio 3.5 Open 397B pada 13 Juni, memposisikannya sebagai model AI frontier buatan pemerintah dengan nilai benchmark yang mengungguli model mapan termasuk Qwen 3.7 Plus. Beberapa hari setelah rilis, perusahaan AI Nex mempublikasikan bukti matematis yang menunjukkan model tersebut merupakan penggabungan bobot langsung dengan rasio 0,6 Nex / 0,4 Qwen, dengan pengukuran kolinearitas 0,993 di seluruh 60 lapisan serta rasio pencampuran yang stabil α ≈ 0,571. IplanRIO kemudian memperbarui kartu model untuk mengkredit Nex, menghapus klaim benchmark, dan menyatakan masalah tersebut berasal dari “unggahan yang tidak benar” dari versi dasar hasil gabungan alih-alih model hasil distilasi final. Sengketa ini berpusat pada standar atribusi dalam pengembangan AI open-source, di mana membangun di atas model open-weight adalah praktik umum, tetapi memerlukan atribusi eksplisit terhadap semua model sumber sesuai ketentuan lisensi seperti Apache 2.0 dan MIT.

IplanRIO Merilis Model Rio 3.5 pada 13 Juni

IplanRIO di Rio de Janeiro merilis Rio 3.5 pada 13 Juni. Badan TI kota tersebut menggambarkannya sebagai model kelas frontier dengan 397 miliar parameter dan lisensi open-source yang permisif, dikembangkan oleh pemerintah kota. Rilis tersebut bertepatan dengan pertandingan pembuka Piala Dunia Brasil, dan komentar tentang model menyebar cepat dari Brasil ke audiens internasional.

Kartu model awal menggambarkan Rio 3.5 sebagai hasil post-train dari Qwen 3.5 397B, model open-base milik Alibaba, dengan lapisan penalaran bernama SwiReasoning yang ditambahkan di atasnya. Biaya pengembangan yang dilaporkan adalah R$500.000, sekitar $100.000 USD. Arsitekturnya memakai Mixture-of-Experts, mengaktifkan sekitar 17 miliar dari 397 miliar parameter per token. Model mendukung visi dan teks, menangani lebih dari selusin bahasa, dan dirilis di bawah lisensi MIT.

SwiReasoning adalah kerangka inferensi tanpa pelatihan yang beralih di antara dua mode. Saat model yakin tentang kata berikutnya—entropi rendah pada distribusi probabilitas—model melakukan penalaran dalam bahasa polos. Saat tidak yakin, ia beralih ke penalaran laten pada keadaan internal tersembunyi tanpa mengeluarkan token.

Skor benchmark yang dilaporkan sendiri mencakup Terminal-Bench 2.1 sebesar 70,8%, mengungguli Qwen 3.7 Plus yang 70,3% dan DeepSeek v4 Pro yang 67,9%. Pada IMOAnswerBench, Rio 3.5 meraih 89,5%. Pada HLE—Humanity's Last Exam—Rio 3.5 berada di 36,5%, melampaui Qwen 3.7 Plus yang 34,7%. Wali Kota Rio de Janeiro Eduardo Cavaliere men-tweet tentang rilis tersebut, menyatakan “Sebuah model AI terbuka yang dilatih di Rio dan didanai publik selama setahun terakhir oleh [Município de Rio] baru saja melampaui semua model lainnya.”

Nex Mempublikasikan Bukti Matematis tentang Penggabungan Bobot

Nex-AGI, aliansi AI open-source berbasis di Shanghai, memposting di X beberapa hari setelah rilis. Analisis tersebut menyatakan: “Model Rio 3.5 memecahkan internet minggu ini. Plot twist-nya? Ini pada dasarnya model open-source kami, Nex N2 Pro, memakai topi yang berbeda.” Nex menganalisis bobot dan melaporkan rumus: Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. Skrip verifikasi dan laporan GitHub lengkap menyusul.

Buktinya mencakup komponen perilaku dan matematis. Nex menghapus prompt sistem “You are Rio” yang tertanam keras dari model yang dideploy lalu mengirim 120 pertanyaan identitas. Tanpa prompt, Nex melaporkan bahwa model menyebut dirinya “Nex, from Nex-AGI” 79,2% dari waktu dan “Rio” 0% dari waktu. Model mengulang latar belakang spesifik Nex secara verbatim, menyebut “Shanghai Innovation Institute” dan “sebuah aliansi ekosistem model skala-besar”.

Secara matematis, Nex mengukur kolinearitas di seluruh 60 lapisan. Hasilnya kembali di 0,993. Rasio pencampuran bertahan pada α ≈ 0,571, stabil hingga tiga angka di belakang koma. Nex menyatakan: “Setiap tensor bobot di Rio, hingga ribuan standard deviasi, adalah campuran 0,6/0,4 yang sama dari Nex dan Qwen—di seluruh 60 lapisan dan setiap komponen jaringan. Tidak ada penjelasan yang ‘tidak bersalah’.”

Nex N2 Pro, yang dirilis beberapa hari sebelum Rio 3.5, mencetak 75,3% di Terminal-Bench 2.1—lebih tinggi dari 70,8% milik Rio. Pada GDPval, sebuah benchmark prakiraan ekonomi, Nex berada pada 1.585 dibanding 1.533 milik Rio.

IplanRIO Memperbarui Kartu Model dan Mengkredit Nex

IplanRIO memperbarui kartu model Hugging Face. Tabel benchmark dihapus dan atribusi diubah. Readme yang diperbarui menyatakan: “Model dibangun melalui penggabungan nex-agi/Nex-N2-Pro dan Qwen/Qwen3.5-397B-A17B, didahului oleh On-Policy Distillation dari model yang lebih kuat. Kami mendeteksi unggahan yang tidak benar pada versi sebelumnya, di mana versi dasar hasil gabungan diunggah alih-alih model distilasi final. Kami mohon maaf atas kebingungan tersebut dan meminta maaf sebesar-besarnya.”

Tidak ada pernyataan publik lain dari IplanRIO yang dirilis. Nex kini dikreditkan di kartu model. Penjelasan “unggahan yang tidak benar” mengklaim bahwa rilis yang dimaksud adalah versi hasil distilasi dari basis hasil gabungan, bukan gabungan mentah itu sendiri. On-policy distillation melibatkan model pengajar yang lebih kuat menghasilkan keluaran, sementara siswa dilatih pada keluaran tersebut dan menghasilkan outputnya sendiri.

IplanRIO menyatakan bahwa pihaknya sedang bekerja untuk mengunggah model distilasi yang sudah dikoreksi dengan atribusi penuh yang sudah dipasang.

Debat Komunitas tentang Standar Atribusi

Penggabungan model sah di bawah lisensi yang terlibat. Nex N2 Pro adalah Apache 2.0, yang mengizinkan penggunaan, modifikasi, dan redistribusi dengan atribusi. Qwen 3.5 dilisensikan secara terbuka. Masalahnya berpusat pada penyajian output sebagai karya yang dikembangkan secara independen tanpa menyebutkan semua model sumber.

Komentator teknologi Rafael Quintanilha mencatat bahwa karena Nex N2 Pro dibangun di atas Qwen, tim mungkin telah mengkredit arsitektur yang mendasarinya dan meninggalkannya di sana. Ia menyoroti bahwa model tersebut menjadi viral saat pertandingan Piala Dunia, “tidak harus berarti ‘siap untuk dikonsumsi publik’.” Pengembang Lucas Montano menyatakan bahwa “menggabungkan dua model kelas ~400B lalu menerapkan policy distillation bukan hal yang sepele” sambil mengakui adanya kesalahan teknis dan kegagalan komunikasi.

Peneliti AI Diego Ambrosio mencatat bahwa peluncuran awal menggambarkan Rio 3.5 sebagai hasil dari “post-training otonom dan fine-tuning proprietar”—pemaparan yang menyiratkan riset orisinal, bukan penggabungan.

Nex menulis di X: “Kami terkesan kota Rio menggunakan pekerjaan kami untuk mencapai performa SOTA. Namun di dunia open-source, atribusi itu penting.”

FAQ

Apa yang dirilis IplanRIO pada 13 Juni?

IplanRIO merilis Rio 3.5 Open 397B pada 13 Juni, yang digambarkan sebagai model AI frontier buatan pemerintah dengan 397 miliar parameter, arsitektur Mixture-of-Experts, dan skor benchmark termasuk 70,8% pada Terminal-Bench 2.1, 89,5% pada IMOAnswerBench, dan 36,5% pada HLE. Model dirilis di bawah lisensi MIT dengan biaya pengembangan yang dilaporkan sebesar R$500.000.

Apa yang ditunjukkan analisis matematis Nex tentang Rio 3.5?

Nex mempublikasikan bukti matematis yang menunjukkan bahwa Rio 3.5 adalah penggabungan bobot langsung dengan rumus: Rio 3.5 ≈ 0,6 × Nex N2 Pro + 0,4 × Qwen 3.5. Analisis mengukur kolinearitas sebesar 0,993 di seluruh 60 lapisan dengan rasio pencampuran yang stabil α ≈ 0,571. Uji identitas menunjukkan model mengidentifikasi dirinya sebagai “Nex, from Nex-AGI” 79,2% dari waktu dan “Rio” 0% ketika prompt sistem yang tertanam keras dihapus.

Bagaimana respons IplanRIO terhadap temuan Nex?

IplanRIO memperbarui kartu model Hugging Face untuk mengkredit Nex, menghapus klaim benchmark, dan menyatakan: “Kami mendeteksi unggahan yang tidak benar pada versi sebelumnya, di mana versi dasar hasil gabungan diunggah alih-alih model distilasi final.” Kartu yang diperbarui mendeskripsikan model sebagai “dibangun melalui penggabungan nex-agi/Nex-N2-Pro dan Qwen/Qwen3.5-397B-A17B, didahului oleh On-Policy Distillation dari model yang lebih kuat.” IplanRIO menyatakan bahwa pihaknya sedang bekerja untuk mengunggah model distilasi yang sudah dikoreksi dengan atribusi penuh.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar