Artificial Analysis publie un benchmark d’agent de codage ; Zhipu GLM-5.1 arrive en première place parmi les modèles open-source

Artificial Analysis a publié aujourd’hui un nouvel indice d’agent de codage pour évaluer les performances des modèles d’IA lorsqu’ils sont combinés à des frameworks d’agents sur des benchmarks clés, dont SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 et SWE-Atlas-QnA. Zhipu GLM-5.1 arrive en première position parmi les modèles open source dans cette évaluation, démontrant des performances de premier plan dans des scénarios d’agents de codage en conditions réelles.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

TT Chain intègre le système de sécurité AegisAI pour la protection des RWA le 11 mai

D’après l’annonce de TT Chain du 11 mai, le réseau blockchain de couche 2 a intégré l’infrastructure de sécurité pilotée par l’IA d’AegisAI dans son écosystème d’actifs du monde réel. La collaboration améliore la protection des transactions d’actifs tokenisés et des opérations inter-chaînes grâce à des capacités avancées de détection des menaces et d’audit des smart contracts. Les agents autonomes d’IA d’AegisAI détectent les attaques de phishing, empêchent les tentatives d’accès non autorisé et

GateNewsIl y a 36m

JD.com met à niveau son agent IA développé en interne, la croissance des utilisateurs dépasse 300 % au T1

Lors de la conférence téléphonique sur les résultats du 12 mai, le PDG Xu Ran de JD.com a déclaré que l’entreprise met à niveau de manière exhaustive son agent d’IA développé en interne afin d’identifier, d’activer et d’apparier plus précisément les besoins des utilisateurs. L’assistant IA de JD.com, Jingdong Jingyan, a vu son utilisation par les utilisateurs augmenter de plus de 300 % en glissement annuel au premier trimestre.

GateNewsIl y a 48m

The Graph lance une fonctionnalité de paiement x402 prenant en charge l’accès aux données on-chain à la demande pour USDC le 12 mai

D’après l’annonce officielle de The Graph du 12 mai, Graph Gateway prend désormais en charge les paiements x402, permettant aux développeurs et aux agents IA d’accéder aux données on-chain via des paiements à la demande en USDC sans exiger de clés API, de comptes ou de tableaux de bord. Les utilisateurs reçoivent une réponse HTTP 402 contenant les informations de prix, puis effectuent un paiement en USDC basé sur une signature sur le réseau Base pour récupérer les données lors des requêtes suiva

GateNewsIl y a 1h

SAP investit dans n8n, doublant la valorisation de la plateforme d’automatisation des workflows à 5,2 milliards de dollars

Selon Bloomberg, SAP a investi dans n8n mardi, doublant la valorisation de la plateforme d'automatisation des workflows à 5,2 milliards de dollars. Le géant allemand du logiciel a également signé un accord de partenariat pluriannuel avec n8n afin d'intégrer les outils de la plateforme dans la plateforme de création d'agents d'IA Joule Studio de SAP, d'après la déclaration de SAP.

GateNewsIl y a 2h

DAPPOS lance xBubble, un agent d’IA universel avec plus de 10 fonctionnalités clés pour les utilisateurs non techniques

Selon ChainCatcher, DAPPOS a officiellement lancé xBubble, un produit d’agent IA universel conçu pour les utilisateurs non techniques. Le produit recommande automatiquement des agents spécialisés pour accomplir des tâches avec un minimum d’instructions et moins d’itérations de débogage. xBubble propose 10+ fonctionnalités essentielles couvrant la création d’images, de vidéos, de documents et de sites web, en prenant en charge le déploiement local et dans le cloud.

GateNewsIl y a 7h

Nous Research lance l’agent Hermes pour contrôler des ordinateurs macOS, réduisant la consommation de jetons de 95%

Nous Research a annoncé que son agent Hermes a lancé des fonctionnalités de contrôle d’ordinateurs macOS, d’après le suivi de Beating. La fonctionnalité permet d’effectuer des opérations en arrière-plan, telles que des recherches d’e-mails et l’écriture de code, sans perturber l’entrée de l’utilisateur ni la mise au premier plan des fenêtres. Grâce à un mécanisme de compression de contexte en quatre couches, le framework réduit la consommation de jetons d’environ 600 000 à 30 000 jetons lors de

GateNewsIl y a 9h
Commentaire
0/400
Aucun commentaire