騰訊 Hunyuan 與 SSV Digital Culture Lab 與中國科學院計算技術研究所合作,於 5 月 18 日發布 Chronicles-OCR,這是首個涵蓋從甲骨文到草書等七種古代字體風格的評測基準。該基準包含 2,800 張由專家標註的影像。
對 28 個主流多模態大型語言模型的測試顯示,古文字的表現不佳。GPT-5 與 Gemini 2.5 Pro 在跨時代字元辨識上取得接近零分的成績,而表現最佳的模型也僅達到 16.5。即使提供邊界框以跳過本地化,最高準確率也只有 27.1%,而 Gemini 3.1 Pro 在甲骨文上的成績僅為 14.0%。
相關新聞