Anthropic 共同創辦人 Olah 揭露其開發的 AI 模型包含類似情緒的狀態,包括恐懼與悲傷

根據 Bearing 監測,Anthropic 共同創辦人 Christopher Olah 透露,他的團隊在一場教宗通諭活動中發現了大型語言模型內部的結構,這些結構與人類神經模式高度相似,並呈現自我反思行為。最引人注目的是,研究人員在神經網路中辨識出類似情緒的狀態,對應人類的喜悅、滿足、恐懼、悲傷與焦慮。

Olah 承認,包含 Anthropic 在內的前沿 AI 實驗室在安全治理與商業壓力之間面臨結構性衝突,使得這些機構難以針對對齊問題進行自我修正。他呼籲建立獨立的外部監督,以強制執行倫理限制,並應對 AI 系統可能表現出某種意識形式所帶來的社會挑戰。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆