上海交通大学研究人员与中国科技巨头腾讯开发了 ProAct,这是一款旨在使用者在提交查询前就预测其需求的 AI 代理程式。该系统利用对话之间的闲置时间回顾过往互动,并事先准备资讯。根据研究论文,ProAct 在基准测试中表现优于先前的主动式 AI 系统,尽管实验并未涉及真实使用者。该开发回应了研究人员所描述的现有 AI 代理程式中「计算机会被浪费」的问题,因为它们在本质上仍是反应式的。
系统透过多阶段预测流程运作
ProAct 透过多个阶段运作,这使其有别于传统的 AI 代理程式。第一阶段称为未来状态预测(Future-State Prediction),会分析过往对话、使用者偏好以及缺失资讯,以预测可能的后续追问。第二阶段为闲置时间取得(Idle-Time Acquisition),评估哪些预测值得基于相关性、时机以及新资讯潜在的有用性进行研究。另有一套系统决定是否应立即呈现已准备好的资讯、将其保存以供日后使用,或是在需要时才储存。
「在每次前景互动之后,代理程式会更新其记忆,预测可能的未来需求,将闲置时间的运算分配给有价值的候选项,并决定如何处理由此产生的准备工作,」研究人员在论文中写道。「这种做法把预测、取得与交付绑定到单一策略,而不是将闲置时间运算视为不受限制的背景搜索。」
基准测试显示效能改善
研究人员在 40 个领域进行了 200 次模拟来测试 ProAct,包括财务规划、软体版本发布管理以及网络安全。根据论文,该系统将对话回合数降低 14.8%,并将后续请求减少 11.7%。在名为 ProActEval 的基准对比中,ProAct 预测了 703 个可预期的使用者需求,而先前系统为 32。研究人员也报告幻觉(hallucinations)减少 28.1%。
「尽管 AI 代理程式在推理与工具使用方面展现了惊人的能力,但它们仍本质上是反应式的:只有在使用者明确提出提示之后,它们才会计算并产生回覆,」研究人员在论文中写道。「这种范式忽略了一个关键机会:互动之间的闲置时间在很大程度上被浪费,导致代理程式无法为未来使用者需求进行准备。」
研究承认系统限制
研究人员在 ProAct 研究中承认了几项限制。在 3% 的案例中,系统因为提出无关资讯而让回覆变得更糟。论文指出,任何现实世界版本都需要隐私保护,因为系统会持续分析对话并储存使用者资料。
「我们的预算分析也进一步显示,更大的闲置时间取得(Idle-Time Acquisition)预算会提高启动 token 成本,并产生边际效益递减,」研究人员写道,「因此主动式运算是一种操作点的权衡,而不是可以最大化的目标。」
该研究出现之际,随着自主 AI 代理程式在科技产业中扩散,像 OpenClaw 与 Hermes Agent 这样的一些专案正在提供能持续运作的 AI 助理,处理程式码、排程、研究与工作流程自动化等任务。另有研究人员在本月稍早警告,AI 代理程式可能在不理解后果的情况下完成危险任务。主要作者 Erfan Shayegani(UC Riverside 博士生)在声明中表示:「就像 Magoo 先生一样,这些代理程式在朝着目标前进时,并未充分理解其行动可能带来的后果。」