Anthropic 透露,其 AI 系統 Claude 於 2026 年 5 月前,撰寫的程式碼佔已合併進入生產系統的 80% 以上,根據 Anthropic Institute 於 2026 年 6 月 4 日發布的報告。增幅是在 2025 年 2 月推出內部編碼代理之後出現的,此後 Claude 的貢獻比重從低個位數百分比上升。該公司近日提交了機密 IPO 註冊文件,並將品牌定位在 AI 安全。
Claude 於 2026 年 5 月撰寫了 80% 的已合併程式碼
報告指出,在 2025 年 2 月推出內部編碼代理之前,Claude 僅撰寫了已合併程式碼的低個位數百分比。該占比截至 2026 年 5 月已超過 80%。根據報告,第二季度 2026 年,Anthropic 的典型工程師一天合併的程式碼量比 2024 年多了 8 倍;在 Claude 負責撰寫的同時,人類工程師負責指導與審查。
Anthropic Institute 在披露中將內部資料與公開基準進行了配對。該公司表示,於 2025 年下半年在 Anthropic,Claude 撰寫的程式碼比人類撰寫的程式碼稍差;截至報告日期大致達到同等水平;公司預期在未來一年內會嚴格優於人類。
Mythos Preview 於 2026 年 4 月達到 52 倍加速
Anthropic 對每個模型都執行相同的測試:提供用於訓練小型模型的 AI 程式碼,並要求其跑得更快。Claude Opus 4 在 2025 年 5 月平均達到 3 倍加速。到 2026 年 4 月,其 Mythos Preview 模型達到 52 倍。報告指出,熟練的人類需要 4 到 8 小時才能達到 4 倍。
在研究人員走錯方向之前展示了一個作業情境後,Mythos Preview 有 64% 的時間選擇了更好的下一步;這高於 2025 年 11 月 Opus 4.5 的 51%。該公司表示,Claude 目前尚未展現出研究判斷能力,能夠選擇哪些問題最重要。
Anthropic 提交機密 IPO 註冊
Anthropic 近日提交了機密 IPO 註冊文件。該公司已將品牌建立在 AI 安全之上。報告將程式碼貢獻趨勢描述為可能通往遞迴式自我改進的路徑:也就是 AI 建立自己的繼任者;但同時提醒目前研究判斷仍有局限。
FAQ
截至 2026 年 5 月,Anthropic 的生產程式碼中 Claude 撰寫了多少比例?
根據 2026 年 6 月 4 日的 Anthropic Institute 報告,Claude 於 2026 年 5 月前撰寫了已合併進入 Anthropic 生產系統的程式碼 80% 以上。這代表在 2025 年 2 月推出內部編碼代理之前,該占比從低個位數百分比上升。
與 2024 年相比,2026 年第二季度 Anthropic 工程師合併程式碼快了多少?
根據報告中披露的公司內部資料,Anthropic 的典型工程師在 2026 年第二季度每天合併的程式碼量,比 2024 年多了 8 倍;在 Claude 負責撰寫的同時,人類工程師負責指導與審查。