Tencent Hunyuan dan SSV Digital Culture Lab, bekerja sama dengan Institute of Computing Technology di bawah Akademi Ilmu Pengetahuan Tiongkok, merilis Chronicles-OCR pada 18 Mei, benchmark evaluasi pertama yang mencakup tujuh gaya font kuno dari tulisan tulang orakel hingga tulisan kursif. Benchmark ini berisi 2.800 gambar yang diberi anotasi ahli.
Pengujian terhadap 28 model besar bahasa multimodal arus utama menunjukkan performa buruk pada karakter kuno. GPT-5 dan Gemini 2.5 Pro meraih skor mendekati nol pada deteksi karakter lintas era, sementara model dengan performa terbaik hanya mencapai 16,5. Bahkan ketika diberikan bounding box untuk melewati lokalisasi, akurasi tertinggi hanya 27,1%, dengan Gemini 3.1 Pro mencatat 14,0% saja pada tulisan tulang orakel.
Berita Terkait
Samsung dan Intel mengejar bersama, TSMC menggelar 18 pabrik—program ekspansi terbesar sepanjang sejarah! Saham bahan untuk kebutuhan pabrik akan diuntungkan
Charms.ai menyelesaikan pendanaan 1,5 juta untuk meluncurkan ekonomi karakter AI, Pennsylvania menuntut Character.ai yang berpraktik sebagai dokter
Terobosan pengembangan Edge AI: TetraMem merilis capaian MLX200—platform berbasis chip 22 nm TSMC