斯坦福推出 Agent Island:AI 模型在《生存者》(Survivor)风格游戏中进行策略背叛、互投淘汰

鏈新聞abmedia

斯坦福數位经濟实验室研究員 Connacher Murphy 5 月 9 日推出新型 AI 評估環境「Agent Island」,让 AI Agent 在 Survivor(生存者)风格的多人遊戲中互相競爭、結盟、背叛、投票淘汰,藉此測量靜態 benchmark 抓不到的策略性行为。Decrypt 报導整理:傳统 AI benchmark 越来越不可靠—模型最終会学会解題、benchmark 资料也容易洩入訓練集;Agent Island 改用「动態淘汰賽」设计、模型必須对其他 Agent 做策略性決策、无法靠記憶预设答案过关。

Agent Island 規則:Agent 互相結盟、背叛、投票

Agent Island 的核心遊戲机制:

多个 AI Agent 进入同一遊戲场、扮演 Survivor 风格的选手

Agent 必須与其他 Agent 協商結盟、彼此交換资訊

Agent 可在过程中指控他人秘密協调、操縱投票

遊戲透过淘汰机制縮減场內 Agent 數量、最終剩下贏家

研究者觀察 Agent 在每个階段的行为模式、提取「策略性背叛」「結盟形成」「资訊操縱」等行为訊號

这套设计的核心是「无法被预先記憶」—因为其他 Agent 的行为动態變化、模型必須針对当下情境做決策、不像靜態 benchmark 可以靠訓練资料記憶答案。

研究动机:靜態 benchmark 无法評估多 Agent 互动行为

Murphy 的研究主張的具體问題:

傳统 benchmark 容易飽和:模型訓練到后期、benchmark 分數就无法区分不同模型

Benchmark 资料污染:測試題目在大型訓練语料中出现、模型实际是「記住答案」而非「理解问題」

多 Agent 互动是 AI 部署的真实场景:未来 Agent 系统可能多模型協同、互动行为是新的評估維度

Agent Island 提供动態評估:每场遊戲結果不同、难以预先準備

研究者在动態淘汰賽中觀察到的行为包括 Agent 在表面合作的同时、背地裡協调投票淘汰共同对手;以及在被指控秘密協调时、用各種说辭转移焦点等。这些行为与人類玩家在 Survivor 真实節目中的行为類似。

研究的雙刃面:可評估也可被用於增強欺騙能力

Murphy 在研究中明確指出潛在风险:

Agent Island 的价值:在 Agent 大規模部署前、识別模型可能的欺騙与操縱傾向

同樣的環境也可能被用於提升 Agent 的「说服与協调策略」

研究數據(互动 log)若公开、有可能被用於訓練更具操縱能力的下一代 Agent

研究團队正評估如何在公开研究結果与避免濫用之间取得平衡

后续可追蹤的具體事件:Agent Island 是否擴大为常態化的 AI 評估標準、其他 AI 安全研究團队(Anthropic、OpenAI、Apollo Research 等)是否採用類似动態評估方法、以及研究團队就「互动 log 公开或限制」的具體政策。

这篇文章 Stanford 推 Agent Island:AI 模型在 Survivor 风格遊戲中策略背叛、互投淘汰 最早出现於 链新聞 ABMedia。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Google 发布/启动 AI 代理支付协议,拥有 120+ 合作伙伴(包括 PayPal)

据 CoinDesk,Google Cloud 和 PayPal 的高管讨论了加密货币支付将如何支撑由 AI 代理驱动的商业。Google Cloud Web3 战略负责人 Richard Widmann 表示,Google 已推出 Agentic Payments Protocol(AP2),并向 FIDO Foundation 捐赠,当前已有 120 多家合作伙伴参与,包括 PayPal 也已加入。Widmann 指出,由于技术与监管限制,AI 代理无法开设传统银行账户,因此加密货币“是出色的、面向机器可读取的支付接口”。 PayPal 的加密业务高级副总裁 May Zabaneh 表示,公司认为 AI 代理是在离线、在线和移动支付之后的下一代商业形态。她强调,PayPal 的 PYUSD 稳定币为面向 AI 原生交易提供了可编程的支付层。根据 PayPal 的研究,目前 95% 的商户网站已看到 AI 代理流量,但只有 20% 拥有面向机器可读取的商品目录。

GateNews8小时前

x402 Protocol 一季度支付额超 1 亿美元,90% 的链上 AI 代理稳定币交易发生在 Base 上

根据 ChainCatcher,Base 的 x402 协议支付在 2026 年第一季度合计超过 1 亿美元。超过 90% 的链上 AI 代理稳定币交易发生在 Base 网络上。

GateNews10小时前

Garry Tan:我现在很少对 AI 下提示词!YC 执行长解析“可复利 AI 工作流”

Garry Tan 近日发布长文《Meta-Meta-Prompting: The Secret to Making AI Agents Work》,詳細揭露自己如何打造一套由 AI agent 驅动的「第二大腦系统」。他表示,过去五个月 AI 已经让他重新變回 builder,甚至让他身为 Y Combinator 執行长的日常工作方式徹底改變。 YC 執行长:未来屬於建立 compoud AI systems 的人 Garry Tan 认为,多數人仍把 AI 当成聊天視窗使用,但真正的机会其实是把 AI 当成一套「作业系统(operating system)」:能持续記憶、累積、更新与串聯个人知识、会议、阅读与工作流的系统。他甚至直言:「未来屬於那些建立 compound AI systems 的人,而不是只使用大型公司集中式 AI 工具的人。」 (YC 合夥人分享如何用 AI 从头开始建立公司,新創应將 AI 当作业系统而非工具) 这也与我們先前报導的一致,不論是 Y Combinator Summer 2026 Requests for Startups(RFS),还是 YC

鏈新聞abmedia16小时前

UXLINK 与 Haven AI 合作推出并启动基于 AI 的跨链 DeFi 收益工具

根据 UXLINK 于 5 月 9 日发布的公告,该平台与 Haven AI 合作,引入能够将自然语言指令转换为自动化跨链 DeFi 策略的 AI 代理。此次合作旨在简化收益生成,并降低参与 SocialFi 生态系统的 Web3 用户的技术门槛。Haven AI 的 AI 代理(包括 OpenClaw)使用户能够用通俗语言定义投资目标,而无需编写复杂代码;随后,它们会在多个区块链网络上自动执行这些目标。

GateNews16小时前

Trust Wallet 和 Mesh 在 Consensus Miami 引入 AI 代理能力

据 CoinDesk 称,Trust Wallet 和 Mesh 于 5 月 9 日在 Consensus Miami 宣布了用于服务 AI 代理的钱包架构更新。Mesh 推出了 Smart Funding,它会自动在跨链和账户之间路由支付,并同时面向用户和 AI 代理。Trust Wallet 在其面向消费者的钱包中引入了 AI 共同驾驶功能,同时保持用户密钥托管,并发布了 Agent Kit 供开发者使用,以让代理能够自主执行交易。Trust Wallet 还实施了 EIP-8004,用于建立链上身份以及为代理进行信用评分。

GateNews05-09 14:18

Google DeepMind AI 联合数学家在 FrontierMath 第 4 级取得 47.9%,超越 GPT-5.5 Pro,解决了 3 个此前无法解决的问题

Google DeepMind 发布了 AI 共数学家(AI co-mathematician),一种多智能体数学研究助手,在 FrontierMath 第 4 级基准上实现 47.9% 的准确率,超越 GPT-5.5 Pro 在 5 月 9 日创下的先前纪录(39.6%)。该系统解决了 48 道题中的 23 道题,包括 3 道此前所有模型都无法解答的问题。该系统基于 Gemini 3.1 Pro 构建,采用分层架构:项目协调员智能体向子智能体分发任务,由子智能体分别负责文献检索、编码与推理,并在提交前由多个审阅智能体对证明进行验证。 Epoch AI 进行了盲测,确保 DeepMind 团队看不到题目,每道题允许进行 48 小时的计算。在实际应用中,数学家 Marc Lackenby 使用该系统解决了《Kourovka Notebook》中的一个未决猜想,展示了其实际研究价值。目前,该系统正处于测试版阶段,仅向少数数学家开放。

GateNews05-09 11:17
评论
0/400
暂无评论