Tencent выпускает Chronicles-OCR, первый бенчмарк распознавания древних иероглифов, а GPT-5 и Gemini 2.5 набирают почти ноль баллов

Tencent Hunyuan и SSV Digital Culture Lab в сотрудничестве с Институтом вычислительных технологий Китайской академии наук выпустили Chronicles-OCR 18 мая — первый оценочный бенчмарк, охватывающий семь древних стилей шрифта от надписей на костях до курсивного письма. Бенчмарк включает 2 800 экспертно размеченных изображений.

Тестирование 28 популярных мультимодальных больших языковых моделей показало низкую производительность на древних иероглифах. GPT-5 и Gemini 2.5 Pro набрали почти нулевые результаты при распознавании символов из разных эпох, тогда как лучшая модель достигла лишь 16,5. Даже при наличии ограничивающих рамок, чтобы пропустить локализацию, максимальная точность составила 27,1%, при этом Gemini 3.1 Pro показал лишь 14,0% на надписях на костях.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев