Tencent lanza Chronicles-OCR, primer benchmark de reconocimiento de caracteres antiguos, GPT-5 y Gemini 2.5 obtienen puntuaciones cercanas a cero

Tencent Hunyuan y SSV Digital Culture Lab, en colaboración con el Instituto de Tecnología de la Computación de la Academia China de Ciencias, publicaron Chronicles-OCR el 18 de mayo, el primer benchmark de evaluación que cubre siete estilos de fuentes antiguas, desde la escritura de huesos de oráculo hasta la escritura cursiva. El benchmark contiene 2.800 imágenes anotadas por expertos.

Las pruebas a 28 modelos grandes de lenguaje multimodales de uso general mostraron un rendimiento deficiente en caracteres antiguos. GPT-5 y Gemini 2.5 Pro lograron puntuaciones casi nulas en la detección de caracteres entre distintas épocas, mientras que el modelo con mejor desempeño alcanzó solo 16,5. Incluso con cuadros delimitadores proporcionados para omitir la localización, la mayor precisión fue de 27,1%, con Gemini 3.1 Pro logrando apenas 14,0% en la escritura de huesos de oráculo.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios