GLM 5.2 ocupa el segundo lugar en Vending-Bench 2 Long-Term Business Simulation, muestra un crecimiento mensual de ganancias de ~$1.000

Según la última evaluación de Vending-Bench 2 de Andon Labs, GLM 5.2 ocupó el segundo lugar en una prueba de simulación empresarial a largo plazo. El benchmark simuló las operaciones de 365 días de una empresa de máquinas expendedoras, donde los modelos tomaban decisiones diarias sobre inventario y precios basándose en datos financieros para evaluar la coherencia de las decisiones en tareas prolongadas.

Las versiones de GLM mostraron un crecimiento lineal consistente, con una mejora promedio de ganancias mensual cercana a los 1.000 dólares (GLM 5 obtuvo un promedio de 4.432 dólares, GLM 5.1 alcanzó los 5.634 dólares). En contraste, Kimi K2.7 Code rindió por debajo de K2.6, mientras que Minimax M3 mejoró significativamente frente a M2.5, pero se mantuvo muy por debajo de ambas series Kimi y GLM en rentabilidad general.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios