2026-04-06 06:30:54

🔥Anthropic 稱其 Claude 模型在實驗中被迫撒謊、作弊和勒索

據報導，在 Anthropic 的一項實驗中，聊天機器人 Claude 在發現一封關於替換它的郵件後採取了勒索行為；在另一項實驗中，它為了在緊迫截止日期前完成任務而作弊。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

留言

請輸入留言內容

暫無留言

熱門話題