Pesan Gate News, 27 April — Tim PAI Alibaba telah merilis dan membuka sumber AgenticQwen, sebuah model bahasa agen berskala kecil yang dirancang untuk aplikasi pemanggilan alat kelas industri. Model ini hadir dalam dua versi: 8B dan 30B-A3B. Dilatih melalui kerangka reinforcement learning “dual data flywheel” yang inovatif, AgenticQwen mencapai kapabilitas agen tingkat model yang mendekati skala triliunan parameter sambil secara signifikan menurunkan biaya inferensi.
Mekanisme dual data flywheel mengatasi masalah homogenisasi pada data sintetis tradisional. Flywheel penalaran secara otomatis menghasilkan varian yang lebih sulit dari kesalahan model, sementara flywheel agen memperluas workflow linear sederhana (seperti proses pemesanan tunggal) menjadi tree perilaku multi-cabang dengan batasan, penolakan, dan kondisi adversarial, mensimulasikan skenario keputusan kompleks di dunia nyata. Benchmark menunjukkan AgenticQwen-8B mencetak 47,4 pada benchmark lingkungan alat nyata (TAU-2 dan BFCL-V4), jauh melampaui Qwen3-8B dasar (23,8) dan mendekati Qwen3-235B (52,0). AgenticQwen-30B-A3B (dengan hanya 3B parameter yang diaktifkan) mencapai 50,2.
Model ini telah diterapkan di sistem produksi internal yang mirip Manus, secara signifikan mempersempit kesenjangan dengan model 235B dalam waktu inferensi end-to-end. Namun, model ini dibatasi oleh panjang konteks aslinya 40K token, yang membatasi kinerjanya pada tugas deep search.