全球顶尖大模型,通关不了《宝可梦》:这些游戏都是AI的噩梦
作者:郭晓静,腾讯科技
编辑|徐青阳
世界顶尖的AI模型可以通过医学执照考试,可以编写复杂代码,甚至能在数学竞赛中击败人类专家,但是却在一款儿童游戏中《宝可梦》屡屡受挫。
这场引人瞩目的尝试始于2025年2月,当时Anthropic的一名研究人员推出了“Claude玩《宝可梦红》”的Twitch直播,以此配合Claude Sonnet 3.7的发布。
2000名观众涌入直播间。在公共聊天区,观众们为Claude出谋划策、加油打气,使这场直播逐渐演变为一场围绕AI能力展开的公开观察。
Sonet3.7只能说是“会玩”《宝可梦》了,但“会玩”不等于“能赢”。它会在关键节点卡住数十小时
PANews·01-27 00:31



