美國政府週五發布一項緊急出口管制指令,要求 Anthropic 立即暫停其兩款最先進的 AI 模型 Claude Fable 5 和 Claude Mythos 5,供所有外國公民使用,並稱這與國家安全疑慮有關,原因是可能存在越獄(jailbreak)漏洞。該指令禁止存取,不論在美國境內或境外,迫使 Anthropic 必須針對其全部客戶群停用這兩款模型。政府認為其已找到一種繞過公開可用的 Fable 5 模型的方法,儘管 Anthropic 對其嚴重性提出爭議,並表示該漏洞很簡單,且已可使用其他公開可用的模型(如 GPT-5.5)加以重現。此命令發布之際,正值 Anthropic 與政府之間因 AI 安全以及監視協議而持續升溫的緊張關係。
政府指令暫停 Fable 5 與 Mythos 5 存取
該指令禁止任何外國公民存取這些模型,不論在美國境內或境外。該命令的涵蓋範圍十分廣泛,迫使 Anthropic 為確保遵循指令而針對其全部客戶群停用這兩款模型。該信函未提供其國家安全疑慮的具體細節,但政府相信其已知悉一種能繞過(或「越獄」)公開可用的 Fable 5 模型的方法。Mythos 5 的護欄更少,且在發掘資安漏洞方面特別強大,僅對特定合作夥伴開放。兩款模型均在數天前剛發布。
Anthropic 爭議越獄嚴重性
Anthropic 對該發現的嚴重性提出爭議。公司表示,其已審查該技術的示範,並得出結論:所辨識出的漏洞看起來相對簡單,且其他公開可用的模型也能在不需要任何繞過的情況下找出它們。公司表示,截至目前,政府僅提供了關於可能存在的、狹窄且非普遍性的越獄(本質上是要求模型讀取特定的程式碼庫並修復任何軟體缺陷)的口頭證據。Anthropic 進一步補充稱,其已驗證:所展示的能力程度,早已可在競爭模型中廣泛取得,包括 OpenAI 的 GPT-5.5。
在遵循該指令的同時,Anthropic 表示其認為此舉會帶來危險先例。「如果這種標準被套用到產業之中,」公司在文中寫道,「我們相信它將實質上終止所有先鋒模型供應商的任何新模型部署。其他所有 Anthropic 模型的存取不會受到影響。」公司表示,其正在努力盡快恢復存取。
David Sacks 在社群媒體上批評 Anthropic
週六,David Sacks(美國總統科學與技術顧問委員會聯席主席)在 X 發文表示:「一位高度可信、同時是 Anthropic 與美國政府的合作夥伴,在測試 Fable 時,提出了對那些護欄的越獄。管理方要求[Anthropic 執行長 Dario Amodei]修復該越獄或撤下該模型。Dario 拒絕。」
Sacks 也進一步指稱,Anthropic 對政府要求的反應,背離了公司自身在 AI 安全與監管需求方面的公開說法——而 Amodei 本週也在一篇部落格文章中再次分享了這種觀點。Sacks 寫道:「Anthropic 將持續提供消費者模型置於安全之上。作為反應,管理方發布了出口管制。管理方是勉強這麼做的。令人非常驚訝的是,Anthropic 不想配合一項合理的安全要求(也就是修復越獄問題)。Anthropic 的反應,與他們作為安全的 AI 研究社群的品牌與理念,實在大相逕庭。」
Sacks 還表示,政府希望 Anthropic 能修復該問題,並讓 Fable 5 能重返公開發布。「管理方重視 Anthropic 的技術能力,並認為,這個問題雖然嚴重,但應該很容易被解決,」他寫道。「球在 Anthropic 那一邊。」
先前關於監視協議的爭端
今年稍早,Anthropic 與美國政府之間曾就一項擴大協議產生正面衝突。當時,這家 AI 公司拒絕簽署允許對美國人進行大規模國內監視,以及完全自主的致命武器系統的擴大協議。當談判破裂後,總統 Donald Trump 對該公司進行抨擊,美國國防部則將 Anthropic 標記為「供應鏈風險」——這家企業已在法院對該認定提出挑戰。自那之後,有報導指出,隨著政府尋求使用 Claude Mythos 以及其他模型,雙方僵持的局面已有降溫。
常見問題
美國政府週五命令 Anthropic 要做什麼?
美國政府週五發布一項緊急出口管制指令,要求 Anthropic 立即暫停其兩款最先進的 AI 模型 Claude Fable 5 和 Claude Mythos 5,供所有外國公民使用,並稱這與國家安全疑慮有關,原因是可能存在越獄漏洞。
為什麼 Anthropic 對政府的指令提出爭議?
Anthropic 對該發現的嚴重性提出爭議,並表示所辨識出的漏洞看起來相對簡單,且包括 OpenAI 的 GPT-5.5 在內的其他公開可用模型也能在不需要任何繞過的情況下找出它們。公司表示,政府僅提供了關於可能存在的、狹窄且非普遍性的越獄的口頭證據。
David Sacks 對 Anthropic 對該指令的回應說了什麼?
週六,David Sacks 在 X 發文稱,當管理方提出要求時,Anthropic 執行長 Dario Amodei 拒絕修復該越獄或撤下該模型。Sacks 指稱,Anthropic 的反應背離了公司在 AI 安全與監管方面的公開說法,並表示:「Anthropic 將持續提供消費者模型置於安全之上。」