
著名駭客 George Hotz(17 歲時首次破解 iPhone,在索尼起訴前已逆向工程 PlayStation 3,Tinygrad 開源深度學習框架作者)於 5 月 25 日發表部落格文章《The Eternal Sloptember》,宣稱「將 AI 代理應用於軟體開發將是該領域歷史上代價最慘重的錯誤之一。
核心論點:高低績效團隊的不對稱輸出問題
Hotz 的論點建立在組織結構差異上:高績效團隊擁有足夠緊密的回饋機制,能夠發現代理生成的問題;低績效團隊缺乏自我檢查機制,卻「利用代理實現了比以往高出十倍的產出」。在大型科技公司中,他預測結果是「程式碼品質平均水準的快速下降,而這種下降卻被龐大的程式碼量所掩蓋」,最終導致「大量劣質產品氾濫成災,優質產品黯然失色」。他舉例:報導稱蘋果正在其整個工程團隊中推廣 AI 編碼工具,他直接問道:「你認為未來兩年 macOS 會變得更好還是更糟?」
六個月測試的具體結論與 Hotz 的立場歸屬
Hotz 表示在測試中,代理「會預先完成所有工作,遞給你一個老虎機拉桿——你拉動它,然後祈禱剩下的工作能夠順利完成。它始終無法完全實現。」他嘗試了讓模型自動處理代碼、工程師審核輸出的模式,但表示「每次都必須手動修改」。他將自己歸入 Meta 首席 AI 科學家 Yann LeCun 和 AI 批評者 Gary Marcus 的陣營,認為語言模型本質上是複雜的模式匹配器,無法解決真正的新問題。
業界分歧:Karpathy 和 Amodei 的對立立場
Andrej Karpathy 曾在 2025 年初對代理持懷疑態度,但在新模型發布後改變立場,於 5 月 19 日加入 Anthropic 預訓練團隊,稱接下來幾年的工作為「意義非凡的成長經驗」。Dario Amodei 在達沃斯表示,部分 Anthropic 工程師已停止編寫代碼而讓模型處理。微軟 CEO Satya Nadella 也將 GitHub Copilot 向代理系統的轉型定義為平台層面的變革。
常見問題
Hotz 的論點是否針對所有工程師的 AI 工具使用?
否。Hotz 明確表示問題不在被取代感,而在於組織規模效應:高績效工程師能識別代理的問題輸出,低績效工程師卻不能。他的批評針對的是低績效團隊大量使用代理後對整體代碼品質的拉低效應。
Hotz 提到的「越來越難以察覺」的問題具體指什麼?
Hotz 表示「輸出結果存在問題,但這種問題越來越難以察覺,這正是我們對一個日益精確的統計模型所預期的」。問題不在於代理產生明顯的錯誤,而在於產生外表正確但內在存在缺陷的代碼,缺乏足夠能力的工程師無法識別這些問題。
Hotz 和 Karpathy 的分歧代表什麼?
這兩位擁有充分業界信譽的工程師持對立立場:Hotz 認為 AI 編碼代理是災難,Karpathy(已加入 Anthropic)認為代理已徹底改變軟體開發。他們的分歧反映了業界目前對 AI 編碼代理實際效益尚未形成定論。