Tencent Hunyuan и SSV Digital Culture Lab в сотрудничестве с Институтом вычислительных технологий Китайской академии наук выпустили Chronicles-OCR 18 мая — первый оценочный бенчмарк, охватывающий семь древних стилей шрифта от надписей на костях до курсивного письма. Бенчмарк включает 2 800 экспертно размеченных изображений.
Тестирование 28 популярных мультимодальных больших языковых моделей показало низкую производительность на древних иероглифах. GPT-5 и Gemini 2.5 Pro набрали почти нулевые результаты при распознавании символов из разных эпох, тогда как лучшая модель достигла лишь 16,5. Даже при наличии ограничивающих рамок, чтобы пропустить локализацию, максимальная точность составила 27,1%, при этом Gemini 3.1 Pro показал лишь 14,0% на надписях на костях.
Связанные новости
Samsung и Intel выступают совместно с атакой, TSMC запускает 18 производственных площадок с крупнейшим в истории планом расширения! Акции, связанные с производственными материалами для заводов, выиграют
Charms.ai завершила раунд финансирования на 1,5 миллиона, запустив AI-экономику для персонажей, а в Пенсильвании подали в суд на Character.ai за ведение медицинской практики персонажами
Прорыв Edge AI в развитии: TetraMem представила результаты MLX200-платформы, построенной на чипе TSMC с техпроцессом 22 нм