Mensaje de Gate News, 27 de abril — El equipo de PAI de Alibaba ha lanzado y ha publicado como código abierto AgenticQwen, un modelo lingüístico agentico de pequeña escala diseñado para aplicaciones industriales de llamadas a herramientas. El modelo viene en dos versiones: 8B y 30B-A3B. Entrenado mediante un innovador marco de aprendizaje por refuerzo de "doble volante de datos", AgenticQwen logra capacidades agenticas a nivel de modelo cercanas a las de un modelo de varios billones de parámetros, al tiempo que reduce significativamente los costos de inferencia.

El mecanismo del doble volante de datos aborda el problema de homogenización en los datos sintéticos tradicionales. El volante de razonamiento genera automáticamente variantes más difíciles a partir de errores del modelo, mientras que el volante agentico amplía flujos de trabajo lineales simples (como procesos de reserva individual) en árboles de comportamiento de múltiples ramas con restricciones, rechazos y condiciones adversarias, simulando escenarios reales de decisiones complejas. Los benchmarks muestran que AgenticQwen-8B obtuvo 47.4 en benchmarks de entorno de herramientas reales (TAU-2 y BFCL-V4), superando muy por encima a Qwen3-8B base (23.8) y acercándose a Qwen3-235B (52.0). AgenticQwen-30B-A3B (con solo 3B parámetros activados) logró 50.2.

El modelo se ha desplegado en sistemas de producción internos similares a Manus, reduciendo de manera significativa la brecha con los modelos de 235B en el tiempo de inferencia de extremo a extremo. Sin embargo, el modelo está limitado por una longitud de contexto nativa de 40K tokens, lo que restringe su rendimiento en tareas de búsqueda profunda.

Ver fuente

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.

Noticias relacionadas

04-27 05:00

El ecosistema FLOA lanza la suite de IA FloaClaw con una matriz de habilidades multi-escenario

04-26 09:00

Baidu Qianfan lanza soporte de Día 0 para DeepSeek-V4 con servicios de API

04-26 01:29

Alibaba Cloud lanza Qwen-Image-2.0-Pro con texto a imagen y edición unificados, compatible con el renderizado de texto multilingüe

04-25 01:21

OpenClaw v2026.4.23 agrega soporte directo de OAuth para gpt-image-2 e introduce el modo de contexto bifurcado para subagentes

04-24 12:31

Gran lanzamiento de la billetera del CEX Agentic Wallet para agentes de IA con cero comisiones durante el periodo promocional

Análisis en profundidad

DeepSeek V4 Pro en Ollama Cloud: Conecta en un solo clic Claude Code

ChainNewsAbmedia04-27 06:34

Guo Ming-chi: OpenAI quiere hacer un teléfono móvil con AI Agent; MediaTek, Qualcomm y Luxshare Precision se convierten en la cadena de suministro clave

ChainNewsAbmedia04-27 06:15

Tencent Cloud QClaw se integra con el marco Hermes, admite el cambio entre múltiples modelos como DeepSeek-V4 Pro

Market Whisper04-27 05:26

Comentar

0/400

Sin comentarios