北京智譜華章科技(z.AI)於 6 月 16 日發布其 GLM-5.2 人工智慧模型,吸引美國市場關注,包括來自 Microsoft 的潛在使用者。旗艦程式碼生成模型在 API 成本方面表現優於 GPT-5.5,約為其六分之一;基準測試顯示,SWE-bench Pro 上達到 62.1%,而 GPT-5.5 為 58.6%。該模型的市場進入正發生在美國指控中國 AI 公司使用「蒸餾(distillation)」技術,從美國模型中萃取專有資料的相關指控同時存在的背景之下。
z.AI 發布 GLM-5.2,基準測試表現更優
z.AI 於 6 月 16 日發布其旗艦程式碼生成模型 GLM-5.2,面向 GLM Coding Plan 用戶。根據 DataCamp 與獨立從業者測試,GLM-5.2 在 SWE-bench Pro 基準測試中達到 62.1%,超越 GPT-5.5 的 58.6%。在 Terminal-Bench 2.1 測試中,GLM-5.2 的效能達到 81.0%。該模型提供 100 萬 token 的上下文窗口選項,並可輸出最多 131,072 tokens。
GLM-5.2 的 API 成本約為 GPT-5.5 的六分之一
根據 Let's Data Science 的報告,GLM-5.2 模型的應用程式介面(API)成本約為 GPT-5.5 的六分之一。中國 AI 模型正透過低成本策略,逐漸受到美國客戶青睞。這項成本優勢出現的背景是 Anthropic 與 OpenAI 不再提供固定費率的定價模式。
美國公司指控:2 月中國 AI 企業涉嫌資料竊取
Anthropic 和 OpenAI 於 2 月公開指控 DeepSeek 及其他中國公司使用「蒸餾(distillation)」技術,竊取專有的 AI 資料。美國國務院在 4 月將這些指控提升至外交層級,並向全球各國政府提出。中國駐外機構回應稱,這些指控「沒有根據」。
Microsoft 考慮用 DeepSeek-V4 來打造 Copilot Cowork
據報導,Microsoft 正考慮在其企業級人工智慧工具 Copilot Cowork 中採用一個自託管的改良版 DeepSeek-V4,主要出於成本考量。Tesla 與 SpaceX 的共同創辦人 Elon Musk 預測,中國將在 2027 年第一季度實現前沿等級的人工智慧能力。
FAQ
z.AI 的 GLM-5.2 在基準測試中表現多少?
依據 DataCamp 與獨立從業者測試,GLM-5.2 在 SWE-bench Pro 基準測試中達到 62.1%,並在 Terminal-Bench 2.1 測試中達到 81.0%。
美國 AI 公司何時指控中國公司涉嫌資料竊取?
Anthropic 和 OpenAI 於 2 月公開指控 DeepSeek 及其他中國公司使用「蒸餾(distillation)」技術以竊取專有 AI 資料,美國國務院則在 4 月將相關指控提升。