Tencent Hunyuan e o SSV Digital Culture Lab, em colaboração com o Instituto de Tecnologia da Computação da Academia Chinesa de Ciências, lançaram Chronicles-OCR em 18 de maio, o primeiro benchmark de avaliação que cobre sete estilos de fontes antigas, do roteiro de ossos de oráculo até a escrita cursiva. O benchmark contém 2.800 imagens anotadas por especialistas.
Os testes com 28 modelos grandes multimodais de linguagem amplamente usados mostraram desempenho fraco em caracteres antigos. GPT-5 e Gemini 2.5 Pro obtiveram quase zero nas pontuações de detecção entre eras, enquanto o modelo com melhor desempenho alcançou apenas 16,5. Mesmo com caixas delimitadoras fornecidas para pular a localização, a maior acurácia foi de 27,1%, com Gemini 3.1 Pro atingindo apenas 14,0% no roteiro de ossos de oráculo.
Notícias relacionadas
Samsung e Intel se unem para pressionar; a TSMC inicia o maior plano de expansão da história, com 18 fábricas! As ações de materiais para operação de fábricas devem se beneficiar
Charms.ai conclui captação de US$ 1,5 milhão para lançar a economia de personagens de IA, e a Pensilvânia processa a Character.ai por praticar medicina
Avanço da Edge AI: TetraMem publica resultados do MLX200 com plataforma construída em chips de 22 nm da TSMC