06:07中国模型上次SWE-rebench全落前十被嘲「刷分」,这次占了四席SWE-rebench 是实时软件工程任务基准测试,最新榜单更新取消了演示和操作限制,新增辅助评估任务。Claude Opus 4.6 以 65.3% 排名第一,GLM-5 以 62.8% 为第三,四个中国模型入围前十,显示出中国模型进步。展开
05:55SWE-rebench 最新榜单:中国 AI 模型占前十四席,GLM-5 排名第三排名榜单3月23日,SWE-rebench 基准测试发布最新榜单,Claude Opus 4.6 位居第一。此次更新取消示例演示和步数限制,新增辅助评估任务。GLM-5 在开源模型中排名第三,中国模型共占四席。展开
04:41GLM-5 在 AI 预测市场交易大赛中收益率达 42.99%,成唯一超越人类基准模型预测市场智谱 Z.ai 的全球负责人李子玄透露,GLM-5 在 Prediction Arena 预测市场中以 42.99% 的收益率领先于人类基准,成为唯一超越人类的 AI 模型。该模型执行了 98 笔交易,表现卓越。展开
01:27智谱负责人预告 GLM-5.1 将开源项目进展Gate News 消息,3 月 21 日,智谱 Z.ai 全球负责人李子玄在 X 平台发文表示:「Don't panic. GLM-5.1 will be open source.」(别慌,GLM-5.1 将会开源。)目前尚未透露该模型的发布时间及具体细节。
02:57智谱 AI 发布 GLM-5-Turbo 模型,速度提升 2-3 倍,API 价格上调 20%智谱 AI 于3月16日发布了 GLM-5-Turbo 模型,作为 GLM-5 的高速优化版,专为 OpenClaw agent 场景定制。该模型速度提升2至3倍,支持200K上下文和128K最大输出,优化了工具调用稳定性等方面。在评测中表现显著优于 GLM-5,并同步提高了 API 价格及推出个人用户套餐。展开
11:16腾讯云混元模型 3 月 13 日起大幅涨价,最高涨幅超 460%腾讯云宣布自3月13日起调整智能体开发平台部分模型的计费策略,HY2.0系列模型价格大幅上涨,同时GLM 5、MiniMax 2.5、Kimi 2.5模型将结束免费公测并转为收费。套餐用户可抵扣部分费用。展开