Tencent Hunyuan y SSV Digital Culture Lab, en colaboración con el Instituto de Tecnología de la Computación de la Academia China de Ciencias, publicaron Chronicles-OCR el 18 de mayo, el primer benchmark de evaluación que cubre siete estilos de fuentes antiguas, desde la escritura de huesos de oráculo hasta la escritura cursiva. El benchmark contiene 2.800 imágenes anotadas por expertos.
Las pruebas a 28 modelos grandes de lenguaje multimodales de uso general mostraron un rendimiento deficiente en caracteres antiguos. GPT-5 y Gemini 2.5 Pro lograron puntuaciones casi nulas en la detección de caracteres entre distintas épocas, mientras que el modelo con mejor desempeño alcanzó solo 16,5. Incluso con cuadros delimitadores proporcionados para omitir la localización, la mayor precisión fue de 27,1%, con Gemini 3.1 Pro logrando apenas 14,0% en la escritura de huesos de oráculo.
Noticias relacionadas
Samsung y Intel se suman, ¡TSMC activa el mayor plan de expansión de la historia con 18 fábricas! Las acciones de materiales para plantas se beneficiarán
Charms.ai completa una financiación de 1,5 millones y lanza una economía de personajes con IA; Pennsylvania demanda a Character.ai por practicar medicina
Avance del Edge AI: TetraMem presenta los resultados de MLX200, una plataforma construida sobre chips de 22 nm de TSMC