Karpathy CLAUDE.md choca con 126K de estrellas: resumen de 12 reglas avanzadas para la comunidad

13 de abril, ABMedia informó que Forrest Chang convirtió las quejas de Karpathy sobre Claude al escribir código en un paquete de «4 reglas de CLAUDE.md», con 15.000 estrellas acumuladas en GitHub en ese momento; el 12 de mayo, el número de estrellas de ese repo ya superaba las 126.000, creciendo 8 veces en menos de 1 mes. A raíz de ello, la comunidad comenzó a aparecer con muchos intentos de «versiones ampliadas»; entre ellos, el post «Añadir 8 reglas sobre la base de las 4 para convertirlo en un conjunto completo de 12 reglas», publicado por el ingeniero Mnilax ( @Mnimiy ) el 9 de mayo, obtuvo 5.968 me gusta y es uno de los contenidos de una sola pieza con mayor conversación en la comunidad del Claude Code recientemente.

Repaso de las 4 reglas: Forrest Chang convirtió las quejas de Karpathy en una plantilla ejecutable

Las 4 reglas originales de Forrest Chang (cada una corresponde a un patrón de fallo señalado por Karpathy en enero en X) :

Think Before Coding (primero piensa antes de codificar): no hagas suposiciones implícitas; dilo explícitamente en qué estás asumiendo; abre el debate sobre los trade-off; si no estás seguro, pregunta directamente y no adivines; si hay una forma más simple, opónte a una solución compleja

Simplicity First (primero la simplicidad): escribe el código mínimo que resuelva el problema; no escribas funcionalidades especulativas; no crees capas de abstracción para código de una sola vez; los ingenieros senior dirán que un diseño demasiado complejo debe simplificarse

Surgical Changes (cambios quirúrgicos): cambia solo lo que deba cambiarse, no «mejorar de paso» código adyacente, comentarios ni formato; no refactorices cosas que no están rotas; sigue el estilo existente

Goal-Driven Execution (ejecución guiada por objetivos): define criterios de éxito e itera hasta verificar; no le digas a Claude los pasos, dile «cómo se ve el éxito» para que haga su propio loop

Los documentos oficiales de Anthropic en realidad lo dicen muy claro: CLAUDE.md es un archivo «advisory» (de recomendación), y Claude aproximadamente tiene una probabilidad del 80% de cumplirlo; después de superar las 200 líneas, la tasa de cumplimiento cae de forma drástica, porque las reglas importantes quedan ahogadas por el ruido. La propuesta de Forrest Chang comprime las reglas a 65 líneas, 4 reglas, logrando el «floor» (umbral mínimo).

Las 8 reglas añadidas por Mnilax: completar con nuevos patrones de fallo de la era del agente en 2026/5

La postura de Mnilax: las quejas de Karpathy de enero se centraban en el escenario de «Claude escribiendo código», pero el ecosistema de Claude Code en mayo ya evolucionó hacia escenarios nuevos como la colaboración entre múltiples agentes, encadenamiento de hooks, conflictos en la carga de skills y flujos de trabajo de varios pasos que cruzan sesiones; hace falta añadir reglas. Estas son las 8 reglas que añadió (ordenadas según el texto original) :

Regla 5: usa a Claude solo para tareas que requieran juicio (clasificación, redacción, resumen, extracción) y usa código normal para decisiones deterministas (reintentos de 503, routing, manejo de status code, conversiones deterministas)

Regla 6: el token budget no es una sugerencia—límite de 4.000 tokens por tarea y 30.000 tokens por sesión; cuando te estés acercando al budget, resume y reinicia de forma proactiva, no excedas en silencio

Regla 7: dos patrones de código en conflicto deben «indicar explícitamente cuál elegir» (el más nuevo o el que tenga más pruebas), explicar por qué se eligió, y marcar el otro para limpieza; mezclar ambos patrones es la peor opción

Regla 8: antes de escribir código, primero entiende—lee exports, el caller directo, utilidades compartidas; «aparentemente no relacionado (looks orthogonal)» es la redacción más peligrosa; si no estás seguro, pregunta

Regla 9: las pruebas deben validar «intención», no solo validar «comportamiento»—una prueba válida es la que puede fallar cuando cambia la lógica de negocio; de lo contrario, solo haces que Claude esté seguro, sin protección real

Regla 10: las tareas de varios pasos deben tener checkpoint—después de completar cada paso, resume «qué hiciste, qué verificaste y qué queda»; si no puedes describir el estado de forma clara, no continúes

Regla 11: sigue las convenciones del codebase existente, incluso si no estás de acuerdo—snake_case es snake_case, class component es class component; si no lo apruebas, trátalo como otra discusión y no te desvíes unilateralmente

Regla 12: los fallos deben ser ruidosos—«migration completada» no es válido si te saltaste 30 artículos; «pruebas pasaron» no es válido si saltaste cualquiera; asume exponer de forma proactiva la incertidumbre, no «esconder la incertidumbre»

Mnilax afirma que, probando estas 12 reglas en 30 codebase durante 6 semanas, redujo la tasa de errores del 41% al 3%, y que la tasa de cumplimiento solo bajó ligeramente (78% → 76%). Observación de este medio: estas cifras son resultados de pruebas autoinformados por el autor, no verificados de forma independiente; aun así, el contenido de las 8 reglas en sí es sólido y coincide de forma estrecha con los puntos dolorosos relacionados con los escenarios actuales de uso de múltiples agentes en Claude Code (por ejemplo, la gestión de múltiples sesiones en Agent View, y el Multi-Agent Layer dentro de una arquitectura de seis capas).

Situaciones de aplicación y recomendaciones prácticas

Mnilax también señala con franqueza cuáles enfoques no deberías intentar:

Más de 14 reglas: la tasa de cumplimiento cae al 52% (desde el 76% una caída brusca), y 200 líneas son un límite real

Usar ejemplos en lugar de reglas: el costo en tokens de 3 ejemplos equivale a 10 reglas; Claude tiende a sobreajustar un único ejemplo

Instrucciones abstractas como «Be careful / think hard / really focus»: baja verificabilidad, y la tasa de cumplimiento es solo del 30%

Decirle a Claude «como un ingeniero senior»: un identity prompt no es efectivo para cambios de comportamiento; las reglas basadas en patrones sí lo son

Depender de herramientas específicas: «usar siempre eslint» fallará de forma silenciosa si eslint no está instalado; cambiar a un lenguaje neutral como «alinearse con el estilo existente del codebase» es más apropiado

La forma práctica que recomienda este medio: CLAUDE.md es un «contrato de comportamiento», no una lista de deseos—cada regla debe responder «qué error concreto evita esta regla». Si tu trabajo no implica un pipeline de varios pasos, Rule 10 (checkpoint) no sirve; si tu codebase ya tiene lint para imponer un único estilo, Rule 11 (alinearse con convenciones) es redundante. Después de leer las 12 reglas, conserva la versión que se corresponde con los baches reales que ya has pisado; el resto, puedes eliminarlo.

Los eventos que se pueden seguir a continuación incluyen: si Anthropic oficializa (regulariza) las reglas de CLAUDE.md (por el momento solo es «advisory»), si el repo de Forrest Chang entra en la plantilla recomendada por la oficina, si la comunidad crea versiones personalizadas para dominios específicos (frontend / backend / ingeniería de datos), y si la tasa de cumplimiento cambia después de las actualizaciones de versión del modelo de Claude.

Este artículo: Karpathy CLAUDE.md alcanza 126K estrellas—organización de reglas avanzadas de 12 reglas de la comunidad. Apareció por primera vez en ABMedia de la cadena de noticias.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Douban Input Method se lanza en macOS con voz impulsada por IA y escritura bilingüe

Según Beating, el método de entrada de Douban de ByteDance se ha lanzado oficialmente en su versión para macOS. Anteriormente disponible solo en iOS y Android, la aplicación de escritorio integra el modelo de voz propietario de Douban, con reconocimiento de dialectos, entrada de tono y transcripción mixta chino-inglés con filtrado automático de redundancias verbales. La versión de macOS también incluye corrección de errores para textos largos y sugerencias inteligentes dependientes del contexto

GateNewshace3h

Infini se une al programa Circle Alliance

Según Foresight News, el sistema operativo financiero impulsado por IA Infini se ha unido al Circle Alliance Program. La iniciativa reúne a empresas fintech, instituciones financieras tradicionales, aplicaciones de consumo, proveedores de pagos, bancos y protocolos Web3 mediante stablecoins de Circle y servicios Web3. El programa busca impulsar los sistemas financieros de internet, ampliar la adopción de USDC y mejorar los pagos transfronterizos y los servicios financieros digitales.

GateNewshace7h

Okratech y Delphi AI integran IA predictiva en el ecosistema $ORT Ecosystem el 11 de mayo

De acuerdo con un anuncio oficial del 11 de mayo, Okratech y Delphi AI se han asociado para integrar la inteligencia predictiva de mercados impulsada por IA en el ecosistema de Okratech. Los sistemas de pronóstico de Delphi AI se integrarán en la plataforma $ORT , cubriendo criptomonedas, acciones y políticas económicas globales. La integración se aplicará a OrtJob, el mercado descentralizado de freelancers de Okratech, y a la Web3 App Store, brindando a los usuarios información basada en datos

GateNewshace9h

Fundador de Telegram: Acton reemplaza el conjunto de herramientas dispersas y acelera 10 veces el ritmo de desarrollo de contratos inteligentes en TON

De acuerdo con el anuncio en X del 12 de mayo de Pavel Durov, fundador de Telegram, TON Core ha lanzado una cadena unificada de herramientas de contratos inteligentes llamada Acton; la herramienta ya se puso en marcha el 8 de mayo. Durov afirma que Acton acelera 10 veces el desarrollo de contratos inteligentes en TON, al sustituir el anterior conjunto de herramientas fragmentado de TON por un flujo de desarrollo unificado, y además es compatible con IA. Funciones principales y arquitectura técni

MarketWhisperhace11h

MoonPay adquiere Dawn Labs y lanza una herramienta de agente de IA para operar en mercados de predicción

De acuerdo con The Block, MoonPay ha adquirido Dawn Labs y está lanzando Dawn CLI, una herramienta impulsada por IA diseñada para ayudar a usuarios no técnicos a crear estrategias de trading para mercados de predicción. Los usuarios pueden describir estrategias de trading en inglés sencillo, y el sistema automatiza la investigación, la generación de código, la simulación y la ejecución en vivo. La actividad de trading en mercados de predicción en plataformas como Polymarket y Kalshi se ha dispar

GateNewshace12h
Comentar
0/400
Sin comentarios