智谱的 GLM-5.2 在 ARC-AGI-2 上达到 22.8% 准确率,与 GPT-5.5 Light Reasoning Version 匹敌

据 ARC Prize 消息,智谱 GLM-5.2 模型近期在 ARC-AGI 基准测试中通过官方验证。在 ARC-AGI-2 上,GLM-5.2 准确率达到 22.8%,每任务平均成本 0.25 美元;而在较简单的 ARC-AGI-1 基准上,其准确率为 77.0%,每次运行成本 0.19 美元。

GLM-5.2 的整体性能与 OpenAI 的 GPT-5.4 和 GPT-5.5(低推理努力模式)相当。ARC-AGI 旨在通过训练中从未见过的抽象模式识别任务来评估 AGI 级推理能力。

免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论