Artificial Analysis publica un benchmark para agentes de codificación; Zhipu GLM-5.1 ocupa el primer lugar entre los modelos de código abierto

Artificial Analysis lanzó hoy un nuevo Coding Agent Index para evaluar cómo se desempeñan los modelos de IA cuando se combinan con marcos de agentes en puntos de referencia clave, incluidos SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 y SWE-Atlas-QnA. Zhipu GLM-5.1 ocupó el primer lugar entre los modelos de código abierto en la evaluación, demostrando un rendimiento líder en escenarios reales de agentes de programación.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

TT Chain integra el sistema de seguridad AegisAI para la protección de RWA el 11 de mayo

Según el anuncio de TT Chain del 11 de mayo, la red blockchain de capa 2 integró la infraestructura de seguridad impulsada por IA de AegisAI en su ecosistema de activos del mundo real tokenizados. La colaboración mejora la protección de las transacciones de activos tokenizados y de las operaciones entre cadenas mediante capacidades avanzadas de detección de amenazas y auditoría de contratos inteligentes. Los agentes autónomos de IA de AegisAI detectan ataques de phishing, evitan intentos de acce

GateNewshace7h

JD.com actualiza su agente de IA de desarrollo propio; el crecimiento de usuarios supera el 300% en el 1T

De acuerdo con el CEO Xu Ran en la llamada de resultados de JD.com el 12 de mayo, la empresa está actualizando de forma integral su agente de IA desarrollado internamente para identificar con mayor precisión, activar y relacionar las necesidades de los usuarios. El asistente de IA de JD.com, Jingdong Jingyan, registró un aumento de más del 300% en el uso por parte de los usuarios, año contra año, en el primer trimestre.

GateNewshace8h

The Graph lanza una función de pagos x402 compatible con el acceso a datos on-chain por solicitud con USDC el 12 de mayo

Según el anuncio oficial de The Graph del 12 de mayo, Graph Gateway ahora admite pagos x402, lo que permite a los desarrolladores y Agentes de IA acceder a datos on-chain mediante pagos por solicitud en USDC sin necesidad de claves de API, cuentas o paneles. Los usuarios reciben una respuesta HTTP 402 que contiene información de precio y, después, completan un pago en USDC basado en una firma en la red Base para recuperar datos en solicitudes posteriores. La actualización incluye un nuevo endpoi

GateNewshace8h

SAP invierte en n8n, duplicando la valoración de la plataforma de automatización de flujos de trabajo a 5,2 mil millones de dólares

Según Bloomberg, SAP invirtió en n8n el martes, duplicando la valoración de la plataforma de automatización de flujos de trabajo hasta 5,2 mil millones de dólares. El gigante alemán del software también firmó un acuerdo de asociación plurianual con n8n para integrar las herramientas de la plataforma en el motor de construcción de agentes de IA de SAP, Joule Studio, según el comunicado de SAP.

GateNewshace9h

DAPPOS lanza xBubble, un agente universal de IA con más de 10 funciones principales para usuarios no técnicos

Según ChainCatcher, DAPPOS lanzó oficialmente xBubble, un producto universal de agente de IA diseñado para usuarios no técnicos. El producto recomienda automáticamente agentes especializados para completar tareas con prompts mínimos y menos iteraciones de depuración. xBubble ofrece 10+ capacidades principales que cubren la creación de imágenes, videos, documentos y sitios web, con soporte tanto para despliegue local como en la nube.

GateNewshace14h

Nous Research lanza el agente Hermes para control informático en macOS, reduciendo el consumo de tokens en un 95%

Nous Research anunció que su agente Hermes ha lanzado funcionalidad de control de computadoras en macOS, según el monitoreo de Beating. La función permite operaciones en segundo plano como búsquedas de correo y escritura de código sin interferir con la entrada del usuario ni el enfoque de la ventana. A través de un mecanismo de compresión de contexto de cuatro capas, el marco reduce el consumo de tokens de aproximadamente 600.000 a 30.000 tokens al ejecutar 20 operaciones consecutivas a una reso

GateNewshace16h
Comentar
0/400
Sin comentarios