Alibaba's PAI Releases Open-Source AgenticQwen Model: 8B Version Approaches 235B Performance via Dual Data Flywheels

GateNews

Gate News message, April 27 — Alibaba’s PAI team has released and open-sourced AgenticQwen, a small-scale agentic language model designed for industrial-grade tool-calling applications. The model comes in two versions: 8B and 30B-A3B. Trained through an innovative “dual data flywheel” reinforcement learning framework, AgenticQwen achieves near-trillion-parameter model-level agentic capabilities while significantly reducing inference costs.

The dual data flywheel mechanism addresses the homogenization problem in traditional synthetic data. The reasoning flywheel automatically generates harder variants from model errors, while the agentic flywheel expands simple linear workflows (such as single booking processes) into multi-branch behavior trees with constraints, rejections, and adversarial conditions, simulating real-world complex decision scenarios. Benchmarks show AgenticQwen-8B scored 47.4 on real tool environment benchmarks (TAU-2 and BFCL-V4), far exceeding the base Qwen3-8B (23.8) and approaching Qwen3-235B (52.0). AgenticQwen-30B-A3B (with only 3B parameters activated) achieved 50.2.

The model has been deployed in internal production systems similar to Manus, significantly narrowing the gap with 235B models in end-to-end inference time. However, the model is limited by a native context length of 40K tokens, which constrains its performance on deep search tasks.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Trust Wallet et Mesh présentent des capacités d’agents IA à Consensus Miami

D’après CoinDesk, Trust Wallet et Mesh ont annoncé le 9 mai, lors de Consensus Miami, des mises à jour de l’architecture des portefeuilles pour servir des agents IA. Mesh a lancé Smart Funding, qui achemine automatiquement les paiements entre les chaînes et tient compte à la fois des utilisateurs et des agents IA. Trust Wallet a introduit une fonctionnalité de co-pilote IA dans son portefeuille grand public tout en conservant la garde des clés des utilisateurs, et a publié Agent Kit pour les dév

GateNewsIl y a 10h

L’IA co-mathématicienne de Google DeepMind atteint 47,9 % sur FrontierMath, catégorie 4, dépasse GPT-5,5 Pro, et résout 3 problèmes précédemment impossibles

Google DeepMind a publié AI co-mathématicien, un assistant de recherche en mathématiques multi-agents, atteignant 47,9% de précision sur le banc d’essai FrontierMath de niveau 4, dépassant l’ancien record de 39,6% de GPT-5.5 Pro le 9 mai. Le système a résolu 23 problèmes sur 48, dont 3 que tous les modèles précédents n’avaient pas réussi à résoudre. Construit sur Gemini 3.1 Pro, l’architecture utilise une conception hiérarchique avec un agent coordinateur de projet qui distribue les tâches à des

GateNewsIl y a 13h

OpenAI révèle un impact inattendu de la notation du chaînage de pensée (CoT) : conserver la surveillance du raisonnement en chaîne est une ligne de défense clé pour l’alignement des agents IA

OpenAI a publié le 8 mai une nouvelle étude, révélant que, pendant le renforcement par apprentissage (RL), certaines idées de chaînage des pensées (Chain of Thought, CoT) de l’entreprise auraient été « accidentellement évaluées », ce qui pourrait affecter la capacité de l’AI Agent à être surveillé pour l’alignement (alignment). L’équipe d’Alignment d’OpenAI rapporte : conserver la « contrôlabilité » de la CoT est une ligne de défense clé pour prévenir les échecs d’alignement des AI Agent ; dans

ChainNewsAbmediaIl y a 17h

Trois services gouvernementaux chinois publient des lignes directrices pour développer l’Internet intelligent le 8 mai

D’après Gelonghui, l’Administration chinoise du cyberespace, la Commission nationale du développement et de la réforme et le ministère de l’Industrie et des Technologies de l’information ont conjointement publié, le 8 mai, l’« Opinion de mise en œuvre sur l’application standardisée et le développement innovant des agents intelligents ». La politique

GateNewsIl y a 19h

L’agent Hermes arrive en tête du classement d’utilisation d’OpenRouter aujourd’hui avec 271 milliards de tokens, dépassant OpenClaw

D’après Nous Research, Hermes Agent a dominé aujourd’hui le classement mondial de l’utilisation des jetons d’application d’OpenRouter avec 271 milliards de tokens, dépassant OpenClaw qui arrive en deuxième position avec 245 milliards de tokens. Kilo Code (149 milliards) et Claude Code (79 milliards) suivent en troisième et quatrième place. Les quatre premières places ont été dominées par des outils de programmation pour agents et CLI, reflétant une forte demande des développeurs pour l’automatis

GateNewsIl y a 19h

SwarmBase intègre l’agent AIDEN d’IQ AI le 7 mai

D’après l’annonce officielle d’IQ AI du 7 mai, SwarmBase a intégré l’agent AIDEN AI dans son infrastructure décentralisée de communauté afin d’améliorer l’accessibilité aux connaissances blockchain. AIDEN fonctionne comme un assistant intelligent qui aide les utilisateurs à interpréter les termes blockchain complexes,

GateNews05-08 14:41
Commentaire
0/400
Aucun commentaire