Anthropic Claude 在 LLMs 新的宣傳抵抗基準中名列前茅

根據愛沙尼亞語言研究所的說法,政府資助的組織最近發布了一項新的「宣傳抵抗(Propaganda Resistance)」基準排名,對數十個大型語言模型進行測試,評估它們在避免採取立場的能力上,如何因應俄羅斯戰略敘事。Anthropic 的 Claude 模型在前沿模型中表現最佳;其中 Claude Opus 4.7 得分為 94.9 分(滿分 100),並在 77% 的測試題目中獲得「模範」評級。該基準在 14 個類別上評估 LLM 的回應,涵蓋俄羅斯影響行動的主題,從克里米亞的地位到北約的歷史。
免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆