El ingeniero de IA Akshay Pachaar publicó el 10 de mayo en X un diagrama completo de la arquitectura de Claude Code, desglosando todo el sistema en 6 niveles y destacando que «el modelo solo es uno de los nodos dentro de un bucle». La publicación de Pachaar cita su ensayo largo del 6 de abril, «The Anatomy of an Agent Harness», y su punto central es que Claude Code se ve «como magia» no por el modelo en sí, sino por el diseño meticuloso del harness.
6 capas de arquitectura: el modelo es solo un nodo más
Las 6 capas de Claude Code que Pachaar resume:
Input Layer(capa de entrada):se encarga de la gestión de sesiones, el control de permisos y configurar niveles de confianza con YAML. Cualquier instrucción que entra al modelo primero pasa por esta capa.
Knowledge Layer(capa de conocimiento):incluye skill registry, context compressor (3 capas de compresión, umbral de 92% para activación), task graph y almacenamiento de memoria entre sesiones. Aquí es donde existe la «inteligencia» del harness, independiente de los pesos del modelo.
Execution Layer(capa de ejecución):despacha llamadas a herramientas mediante un typed registry; cada herramienta tiene un handler—bash, read, write, grep, glob, revert. El runtime de streaming admite ejecución en paralelo, y el prompt cache reutiliza prefijos estables, bajando el costo a 10%.
Integration Layer(capa de integración):el MCP runtime se conecta a servidores externos (filesystem, git, herramientas personalizadas). Las herramientas se registran hacia adentro y la memoria se escribe hacia afuera en agent_memory.md.
Multi-Agent Layer(capa de multiagentes):incluye subagent spawner, teammate mailboxes comunicándose mediante redis pub/sub, un protocolo de máquina de estados finitos (IDLE→REQUEST→WAIT→RESPOND), un autonomous board con candado atómico y aislamiento con worktree (cada tarea en su propio branch de git).
Observability Layer(capa de observabilidad):un bus de eventos y lifecycle hooks que envuelve todas las capas; un ejecutor en segundo plano corre en modo daemon thread sin bloquear.
En el centro está el «master agent loop» (bucle del agente maestro): percibir → actuar → observar. Anthropic ubica este bucle como un «dumb loop» (bucle tonto): toda la inteligencia está en la inferencia del modelo; el harness solo se encarga de la orquestación.
Diseño clave: context compressor y aislamiento con worktree
Detalles de diseño que vale la pena destacar:
Context compressor: compresión en 3 capas, umbral 92%: cuando el contexto se aproxima al 92% de la capacidad, se activa el resumen y la compresión, conservando decisiones de arquitectura y los bugs no resueltos, y descartando salidas repetidas de herramientas. Esto conecta con la «context engineering guía» publicada por Anthropic: encontrar el conjunto mínimo de tokens con alta señal y maximizar la probabilidad de lograr los objetivos.
Aislamiento con worktree: cada subagent trabaja en un git worktree independiente y en un branch independiente; al fusionar, se realiza detección de conflictos. Este diseño hace posible que múltiples agentes modifiquen en paralelo la misma base de código sin pisarse. Entre los tres modos de ejecución de subagentes de Claude Code—«Fork / Teammate / Worktree»—, Worktree es el nivel de aislamiento más fuerte.
Prompt cache con costo 10%: al usar un caché de prefijos estables (system prompt, definiciones de herramientas, CLAUDE.md), las llamadas repetidas con el mismo prefijo solo pagan el 10% del costo estándar de tokens. Esta es la clave para mantener costos controlables en tareas de sesiones largas.
Por qué esta descomposición resonó en la comunidad
La publicación de Pachaar obtuvo 522 me gusta y 115 retweets; en la sección de comentarios aparecieron respuestas como «Pensé que era solo una herramienta CLI», «Pensé que Claude Code era igual a model + acceso por terminal, no sabía que en la multi-agent layer había tantas cosas funcionando» y otras. Esto refleja que la comprensión de la mayoría de desarrolladores sobre Claude Code todavía se queda en «la capa CLI envuelve la Claude API», subestimando la complejidad del harness.
Pachaar cita una frase de Vivek Trivedy de LangChain como argumento central: «Si no eres el modelo, entonces eres el harness.» La prueba de LangChain en TerminalBench 2.0 demuestra que—con los mismos pesos del modelo y solo cambiando el harness periférico—el ranking pasó de 30 al puesto 5.
Para los lectores de abmedia, esta descomposición ofrece un punto de referencia concreto: cuando veas diferencias entre productos de agentes como Claude Code, Codex y Gemini Code Assist, en realidad la mayoría de las diferencias no están en el modelo en sí, sino en el diseño del harness—estrategias de gestión de contexto, alcance de herramientas, bucle de validación y modos de colaboración multiagente. Cuando una versión del modelo se actualiza, la elección del harness define hasta qué nivel será la experiencia del producto.
Este artículo con la descomposición de Akshay del Claude Code en 6 capas: el modelo es solo un nodo dentro del bucle apareció por primera vez en 鏈新聞 ABMedia.
Artículos relacionados
DAPPOS lanza xBubble, un agente universal de IA con más de 10 funciones principales para usuarios no técnicos
Nous Research lanza el agente Hermes para control informático en macOS, reduciendo el consumo de tokens en un 95%
SNS y PoH Network permiten la verificación de IA en Solana
MoonPay adquiere Dawn Labs y lanza una herramienta de agente de IA para operar en mercados de predicción
Circle lanza Agent Stack el 12 de mayo, permitiendo que los agentes de IA usen USDC de forma autónoma
MoonPay adquiere Dawn Labs y lanza una herramienta de agente de IA para el trading en mercados de predicción