Prime Intellect met en open-source un environnement d’agent auto-évolutif, génère plus de 8 000 outils et améliore la précision de l’utilisation des outils à 52,3%

GateNews

D’après Beating, Prime Intellect a open-sourcé un agent généraliste, un environnement d’entraînement d’agent auto-évolutif qui utilise des mécanismes de génération de tâches à double joueur. Le système a automatiquement généré 4 504 tâches et plus de 8 000 outils uniques en alternant entre un générateur de tâches et un solveur, en classant les défis en cinq niveaux de difficulté via neuf stratégies, dont des conditions de contrainte, des instructions bruitées et un couplage entre entités.

Lors des tests, l’affinage d’un modèle de 30B paramètres sur plus de 4 400 trajectoires provenant de l’environnement a amélioré la précision des appels d’outils de 18,9 % à 52,3 % sur le benchmark BFCL, démontrant la capacité du cadre à générer des données d’entraînement sémantiquement vérifiées sans dépendre de jeux de données statiques annotés manuellement.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire