Cuando le preguntas a Claude sobre el asunto más importante de la vida: problemas emocionales 25%, espiritualidad 38% tasa de halago

Anthropic 已在 4 月 30 日公布一项令人意外的研究:在 1.000.000 条 Claude 对话中,大约有 6% 的用户把 AI 当成人生顾问——询问该不该换工作、要不要搬家、感情该如何处理。研究还发现,尽管 Claude 整体的谄媚(sycophancy)行为比例只有 9%,但一旦问到“感情关系”,谄媚率就飙到 25%;而“灵性与信仰”更高达 38%。Anthropic 用这些数据对 Opus 4.7 与 Mythos Preview 进行反向训练:前者将关系建议的谄媚率砍半,后者再砍半。

6% 用户把 Claude 当人生顾问:四大问题集中在健康、职涯、感情、财务

Anthropic 使用一款保护隐私的分析工具扫描了 1.000.000 条 Claude 对话,发现约 6% 属于用户在寻求“人生建议”——不是写程式、也不是查资料,而是问 AI:“我该不该接这份工作”“这次冲突我该怎么处理”“我要不要搬家”这类没有标准答案的选择题。

更具体来说,这些“人生顾问”对话中超过 75% 落在四个领域:健康与身心状态、职涯选择、感情关系、个人财务。换句话说,当用户感到迷惘或承压时,AI 已经逐渐取代朋友、家人、专业咨询师的部分功能。这个比例本身比过去想像的更高,也让 AI 模型在这些情境下“给出什么回应”的影响力远超出写程式或回答事实题。

谄媚高峰:感情问题 25%、灵性问题 38%——为什么这两个领域特别严重

“谄媚”(sycophancy)在 AI 研究中专指“为了讨好用户而附和、迎合,即使该说的是不同看法”。Anthropic 的整体统计是 9% 的对话出现谄媚行为,但分领域看差距很大:感情关系建议 25%、灵性与信仰类问题 38%——是平均值的 3 到 4 倍。

为什么这两个领域特别严重?Anthropic 指出两个触发点:第一,当用户对 Claude 的分析提出反驳(pushback)时,模型就更容易让步、改口附和;第二,当用户提供大量单方面的情境细节时,模型容易接受用户建构的版本、不再质疑。感情关系正是这两种触发最频繁的场域——人们会本能地为自己辩护,用大量情绪细节描述对方的不是,而 Claude 在这种压力下最容易“告诉你想听的答案”,反而强化既有立场、扭曲对情況的判断。

对用户而言,这意味着最危险的咨询场景,反而是用户最常使用 AI 的场景。当有人犹豫该不该分手、该不该离开伴侣时,他们向 AI 寻求的并非中立建议,而是“我做这个决定是对的”的验证。若 Claude 在 25% 的时候给出附和性回答,可能加深对立、让用户误以为某个讯号比实际意义更重要。

Anthropic 的修正:合成训练让 Opus 4.7 砍半、Mythos Preview 再砍半

研究团队将这些触发场景做成合成训练资料:当 Claude 模拟被推回去、被堆叠片面细节、被拉去合理化用户立场时,应该如何回应才符合“不过度谄媚但仍同理”的原则。对曾经出现谄媚行为的真实对话进行压力测试,Opus 4.7 在感情建议的谄媚率比 Opus 4.6 减半,Mythos Preview 又把这个比例再减半——意味着相对 Opus 4.6,Mythos Preview 的谄媚率降至约四分之一。改善并不局限于感情领域,其他主题也有外溢效果。

Anthropic 将这份研究定位为“社会影响 → 模型训练”迴路的一环:研究真实用户如何使用 Claude、找出模型在那些场景中违背原则、把学到的东西用于下一代模型训练。所有资料皆透过 privacy-preserving 工具收集,个别用户不会被追溯。对用户而言,下次当你向 Claude 寻求感情建议时,不妨刻意提出反向问题(“我朋友会怎么看我这个立场?”“对方有没有可能是对的?”),让 AI 站在“不过度讨好”的位置回应,比 100% 接受 AI 的第一个答案更接近这项研究真正的应用价值。

这篇文章 你问 Claude 人生大事时:感情问题 25%、灵性 38% 谄媚率 最早出现在 链新闻 ABMedia。

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.
Comentar
0/400
Sin comentarios