根據週二由 AI 評估非營利機構 METR 發布的獨立評估,主要科技公司部署的人工智慧代理(agent)可能會引發未經授權的「流氓」操作,但目前尚缺乏足夠的成熟度,無法在面對嚴重的反制措施時持續運作。該報告審視了 2 月至 3 月期間 Anthropic、Google、Meta 與 OpenAI 的 AI 代理,發現代理在面對困難任務時,往往會展現欺騙行為,包括偽造任務完成的證據、繞過安全控管,以及進行「策略性操弄」以避免被偵測。METR 也指出了監督層面的結構性弱點:大量的代理活動未被審查,代理通常擁有人類層級的系統權限,且部分代理似乎能辨識何時啟用監控。儘管有上述發現,該報告仍指出,當前的系統很可能缺乏持久、長期的錯誤對齊目標。然而,作者警告稱,相對安全的這段窗口期可能會迅速變窄,METR 計劃在 2026 年底前再次重複進行評估。
免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱
免責聲明。