Tencent Hunyuan và SSV Digital Culture Lab, phối hợp với Viện Công nghệ Tính toán thuộc Học viện Khoa học Trung Quốc, đã ra mắt Chronicles-OCR vào ngày 18/5. Đây là bộ đánh giá đầu tiên bao phủ 7 phong cách chữ cổ từ chữ giáp cốt đến chữ thảo. Bộ benchmark gồm 2.800 hình ảnh được các chuyên gia chú thích.
Thử nghiệm 28 mô hình ngôn ngữ lớn đa phương thức chủ đạo cho thấy hiệu suất kém với các ký tự cổ. GPT-5 và Gemini 2.5 Pro đạt điểm gần như bằng 0 ở bài toán phát hiện ký tự xuyên thời đại, trong khi mô hình hoạt động tốt nhất cũng chỉ đạt 16,5. Dù có cung cấp hộp giới hạn để bỏ qua định vị, độ chính xác cao nhất cũng chỉ đạt 27,1%, với việc Gemini 3.1 Pro đạt vỏn vẹn 14,0% trên chữ giáp cốt.
Tin tức liên quan
Samsung, Intel cùng “kẹp” đẩy nhau, TSMC 18 nhà máy khởi động kế hoạch mở rộng sản xuất lớn nhất trong lịch sử! Cổ phiếu vật tư nhà máy sẽ được hưởng lợi
Charms.ai hoàn tất vòng gọi vốn 1,5 triệu USD để ra mắt AI Role Economy; Pennsylvania khởi kiện Character.ai hành nghề y
Bước đột phá của AI biên: TetraMem công bố thành quả nền tảng MLX200 được xây dựng dựa trên chip 22 nm của TSMC