Mensaje de Gate News, 27 de abril — El equipo de PAI de Alibaba ha lanzado y ha publicado como código abierto AgenticQwen, un modelo lingüístico agentico de pequeña escala diseñado para aplicaciones industriales de llamadas a herramientas. El modelo viene en dos versiones: 8B y 30B-A3B. Entrenado mediante un innovador marco de aprendizaje por refuerzo de “doble volante de datos”, AgenticQwen logra capacidades agenticas a nivel de modelo cercanas a las de un modelo de varios billones de parámetros, al tiempo que reduce significativamente los costos de inferencia.
El mecanismo del doble volante de datos aborda el problema de homogenización en los datos sintéticos tradicionales. El volante de razonamiento genera automáticamente variantes más difíciles a partir de errores del modelo, mientras que el volante agentico amplía flujos de trabajo lineales simples (como procesos de reserva individual) en árboles de comportamiento de múltiples ramas con restricciones, rechazos y condiciones adversarias, simulando escenarios reales de decisiones complejas. Los benchmarks muestran que AgenticQwen-8B obtuvo 47.4 en benchmarks de entorno de herramientas reales (TAU-2 y BFCL-V4), superando muy por encima a Qwen3-8B base (23.8) y acercándose a Qwen3-235B (52.0). AgenticQwen-30B-A3B (con solo 3B parámetros activados) logró 50.2.
El modelo se ha desplegado en sistemas de producción internos similares a Manus, reduciendo de manera significativa la brecha con los modelos de 235B en el tiempo de inferencia de extremo a extremo. Sin embargo, el modelo está limitado por una longitud de contexto nativa de 40K tokens, lo que restringe su rendimiento en tareas de búsqueda profunda.
Related News
DeepSeek V4 Pro en Ollama Cloud: Conecta en un solo clic Claude Code
Guo Ming-chi: OpenAI quiere hacer un teléfono móvil con AI Agent; MediaTek, Qualcomm y Luxshare Precision se convierten en la cadena de suministro clave
Tencent Cloud QClaw se integra con el marco Hermes, admite el cambio entre múltiples modelos como DeepSeek-V4 Pro