根據《WIRED》近期報導及前員工的說法,Anthropic 已轉向意識形態的一致性,儘管其聲稱致力於「高度信任、低自我」文化。內部批評大多僅限於私人管道,而全員會議被戲稱為「Dario 幻視之旅」,公開挑戰領導層決策的情況很少。
該公司致力於「透過主導來預防」的人工智慧安全哲學——將 OpenAI 的 Sam Altman 視為前車之鑑——導致了具爭議的決策。自 2024 年秋季起,Anthropic 與 Palantir 合作,向美國情報與國防機構提供 Claude 的存取權限。Claude 已被確認用於中東衝突的目標鎖定;執行長 Amodei 表示,只要由人類做出最終決定,此部署即屬合規。2026 年 6 月,開發人員在 Claude 3.5 中嵌入了隱藏的干擾程式碼,以秘密阻止未經授權的使用,之後在業界反彈下改為透明的安全限制。