Karpathy CLAUDE.md сталкивается с 126 тыс. звёзд: сводка 12 продвинутых правил для сообщества

4 月 13 日 abmedia 曾報導 Forrest Chang 把 Karpathy 1 月 Claude 寫程式抱怨整理成「4 條 CLAUDE.md 規則」、當時 GitHub 上累積 15 000 星;5 月 12 日該 repo 星數已突破 126k、不到 1 個月成長 8 倍。社群隨之出現許多「擴充版」嘗試、其中工程師 Mnilax(@Mnimiy)5 月 9 日發表的「在 4 條基礎上加 8 條、變成 12 條完整版」貼文獲得 5 968 次按讚、是近期 Claude Code 社群討論度最高的單篇內容之一。

4 條規則的回顧:Forrest Chang 把 Karpathy 抱怨變成可執行模板

Forrest Chang 原始 4 條規則(每條都對應 Karpathy 1 月在 X 上點名的失敗模式):

Think Before Coding(先想再寫):不要做隱性假設、要明說在假設什麼;面對 trade-off 攤開來討論;不確定時直接問、不要猜;存在更簡單做法時要反對複雜方案

Simplicity First(先求簡單):寫能解決問題的最小程式碼;不寫推測性功能、不為一次性程式碼建抽象層;資深工程師會說太複雜的設計就要簡化

Surgical Changes(外科式修改):只動該動的、不要「順手改善」相鄰程式碼、註解、格式;不重構沒壞的東西;要配合既有風格

Goal-Driven Execution(目標導向執行):定義成功標準、迭代到驗證為止;不告訴 Claude 步驟、告訴它「成功長什麼樣子」讓它自己 loop

Anthropic 官方文件其實寫得很明白:CLAUDE.md 是「建議性」(advisory)檔案、Claude 大約 80% 機率會遵守;超過 200 行後、合規率急遽下降、因為重要規則會被噪音淹沒。Forrest Chang 的方案是把規則壓縮到 65 行、4 條、達到「floor」(最低門檻)。

Mnilax 加的 8 條:補上 2026/5 月 agent 時代的新失敗模式

Mnilax 主張:Karpathy 1 月的抱怨集中在「Claude 寫程式碼」這個情境、但 5 月的 Claude Code 生態已演化到多 agent 協作、hook 串接、skill 載入衝突、多步驟工作流跨 session 等新場景—需要補規則。以下是他增加的 8 條(按原文順序整理):

Rule 5:只把 Claude 用於需要判斷的任務(分類、起草、摘要、抽取)、確定性決策(重試 503、路由、status code 處理、確定性轉換)用一般程式碼處理

Rule 6:Token budget 不是建議—單任務 4 000 tokens、單 session 30 000 tokens 為上限、接近 budget 時要主動摘要重啟、不要無聲突破

Rule 7:兩個衝突的程式碼模式要「點明選一個」(取較新、較有測試的)、解釋為什麼選、把另一個標記待清理;混合兩種模式是最差選擇

Rule 8:寫程式碼前要先讀懂—讀檔案 exports、直接 caller、共用 utility;「看起來無關(looks orthogonal)」是最危險的措辭、不確定就要問

Rule 9:測試要驗證「意圖」、不只驗證「行為」—能寫一個「業務邏輯改變時會失敗」的測試才算合格;否則只是讓 Claude 自信、實際保護力為零

Rule 10:多步驟任務要 checkpoint—每完成一步就要總結「做了什麼、驗證了什麼、剩什麼」;無法清楚描述狀態時不要繼續

Rule 11:配合既有 codebase 慣例、即使你不同意—snake_case 就 snake_case、class component 就 class component;不認同時把它當另一場討論、不要單方面分叉

Rule 12:失敗要大聲—「migration 完成」不對如果跳過 30 筆、「測試通過」不對如果跳過任何一個;預設「主動揭露不確定」、不要「藏起不確定」

Mnilax 自稱在 30 個 codebase、6 週內測試這 12 條規則、宣稱錯誤率從 41% 降至 3%、合規率僅小幅下滑(78% → 76%)。本媒體觀察:這些數字是作者自陳測試結果、未經獨立驗證;但 8 條規則本身的內容紮實、與當前 Claude Code 多代理使用情境(如Agent View 多 session 管理、六層架構中的 Multi-Agent Layer)對應到的痛點吻合。

適用情境與務實建議

Mnilax 也直白點出哪些做法不該嘗試:

超過 14 條規則:合規率掉到 52%(從 76% 急降)、200 行為實質上限

用範例代替規則:3 個範例的 token 成本等於 10 條規則、Claude 容易過擬合單一範例

「Be careful / think hard / really focus」等抽象指令:可驗證性低、合規率僅 30%

叫 Claude「當資深工程師」:identity prompt 對行為改變無效、規則型指令才有效

依賴特定工具:「永遠用 eslint」在 eslint 未安裝時會靜默失敗、改用「配合 codebase 既有風格」這類能力中性的措辭

本媒體建議的務實採用方式:CLAUDE.md 是「行為契約」、不是願望清單—每條規則都要回答「這條規則避免哪個具體錯誤」。如果你的工作不涉及多步驟 pipeline、Rule 10(checkpoint)就無關緊要;如果 codebase 已有 lint 強制單一風格、Rule 11(配合慣例)是多餘。讀 12 條後保留「對應到你實際踩過的坑」的版本、其餘可刪。

後續可追蹤的事件包括:Anthropic 官方是否把 CLAUDE.md 規則化(目前僅是「advisory」)、Forrest Chang repo 是否進入官方推薦範本、社群是否出現針對特定領域(前端/後端/資料工程)的客製版本、以及 Claude 模型版本更新後規則合規率是否變化。

這篇文章 Karpathy CLAUDE.md 衝 126K 星:社群版 12 條進階規則整理 最早出現於 鏈新聞 ABMedia。

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Вводимый метод Douban запускается на macOS с ИИ-голосом и двуязычным вводом

По данным Beating, официально запущена macOS-версия Input Method для Douban от ByteDance. Ранее он был доступен только на iOS и Android; настольное приложение интегрирует фирменную модель речи Douban, поддерживая распознавание диалектов, ввод с передачей тона и китайско-английскую смешанную транскрипцию с автоматической фильтрацией речевых повторов. Версия для macOS также включает исправление ошибок для длинных текстов и контекстно-зависимые интеллектуальные подсказки для ввода с клавиатуры.

GateNews2ч назад

Infini присоединяется к программе Circle Alliance

По данным Foresight News, управляемая ИИ финансовая операционная система Infini присоединилась к Circle Alliance Program. Инициатива объединяет финтех-компании, традиционные финансовые институты, потребительские приложения, провайдеров платежей, банки и Web3-протоколы, использующие стейблкоины Circle и Web3-сервисы. Программа нацелена на развитие интернет-финансовых систем, расширение принятия USDC, а также на улучшение трансграничных платежей и цифровых финансовых услуг.

GateNews6ч назад

Okratech и Delphi AI интегрируют прогнозирующий ИИ в экосистему $ORT Ecosystem 11 мая

11 мая в официальном объявлении говорится, что Okratech и Delphi AI заключили партнёрство для интеграции ИИ-предиктивной рыночной аналитики в экосистему Okratech. Прогнозные системы Delphi AI будут встроены в платформу $ORT , охватывая криптовалюты, акции и глобальную экономическую политику. Интеграция будет применяться к OrtJob — децентрализованному фриланс-рынку Okratech, а также к Web3 App Store, предоставляя пользователям основанные на данных инсайты для поддержки финансовых и карьерных реше

GateNews9ч назад

Основатель Telegram: Acton заменяет разрозненный набор инструментов, скорость разработки смарт-контрактов TON выросла в 10 раз

Основатель Telegram Павел Дуров 12 мая в X сообщил, что TON Core выпустила унифицированную инструментальную цепочку для смарт-контрактов под названием Acton, которая заработала 8 мая; Дуров отметил, что Acton ускоряет разработку смарт-контрактов в 10 раз, заменяя прежний разрозненный набор инструментов TON на единый процесс разработки, и поддерживает AI. Ключевые функции и техническая архитектура инструментальной цепочки Acton Согласно объявлению Дурова в X, Acton — это единый консольный инструм

MarketWhisper10ч назад

MoonPay приобретает Dawn Labs и запускает инструмент AI-агента для торговли на прогнозных рынках

По данным The Block, MoonPay приобрела Dawn Labs и запускает Dawn CLI — инструмент на базе ИИ, предназначенный для помощи неквалифицированным пользователям в создании торговых стратегий для прогнозных рынков. Пользователи могут описывать стратегии простым английским языком, а система автоматически выполняет исследование, генерацию кода, симуляцию и запуск в реальном времени. Торговая активность на прогнозных рынках на таких платформах, как Polymarket и Kalshi, в последние годы резко выросла: их

GateNews11ч назад
комментарий
0/400
Нет комментариев