D’après la divulgation récente de Cursor, la société a dévoilé une technique d’entraînement appelée autoinstall pour sa série de modèles Composer : utiliser un modèle de génération précédente pour configurer automatiquement des environnements exécutables pour l’apprentissage par renforcement de la génération suivante. Lors de l’entraînement de Composer 2, Cursor a utilisé Composer 1,5 pour accomplir cette tâche. La méthode fonctionne en deux étapes : d’abord, un agent lit la documentation et la configuration du dépôt de code afin de générer 10 commandes de vérification avec des sorties attendues ; ensuite, un autre agent utilise 3 de ces commandes pour configurer l’environnement à partir de zéro jusqu’à ce que les commandes s’exécutent avec succès, avec un maximum de 5 tentatives de reprise. Composer 2 a obtenu un score de 61,7% sur Terminal-Bench, un banc d’essai mesurant les capacités de configuration d’environnements, contre 47,9% pour Composer 1,5, soit une amélioration de 14 points de pourcentage.
Related News
Claude/GPT trop complaisant ? Une invite Claude.md incite l’IA à donner des réponses fermes et précises
SpaceX intègre xAI et loue un cluster de 220 000 GPU à Anthropic
Le responsable de Claude Code, Boris : les agents IA améliorent la productivité humaine et réécrivent l’histoire du développement logiciel