Harness engineering¶
Esta es la tercera guía de una trilogía. En Fundamentals vimos cómo pilotar un agente de codificación; en Spec-Driven Development aprendimos a especificar la intención para que el agente la ejecute bien. Ahora toca lo que queda: diseñar el sistema que rodea al agente — guías, sensores, sandboxes, bucles, contexto estructurado — para que un equipo pueda depender de él de forma sostenible.
No es un tutorial paso a paso ni un manual de un producto concreto. Es un ensayo, organizado por capítulos, sobre los principios y patrones que están emergiendo en equipos que ya operan a esta escala (OpenAI, Stripe, Thoughtworks/Böckeler, Geoffrey Huntley) y que se repiten independientemente del stack o de la herramienta.
Premisas¶
- Trabajas en un equipo técnico con experiencia operando agentes y skills.
- Te interesa diseñar el sistema, no encontrar el prompt mágico.
- Estás dispuesto a invertir en infraestructura interna (linters, sandboxes, observabilidad, docs versionadas) si eso multiplica el rendimiento del agente.
- Te importa la sostenibilidad a meses vista, no solo el primer commit impresionante.
Tesis central (en una frase)¶
El modelo es el motor. El harness — guías, sensores, sandboxes, bucles, contexto estructurado — es lo que convierte a un LLM en un agente del que un equipo puede depender.
Cómo leer esta guía¶
Los capítulos están ordenados de mentalidad → pilares → práctica → mantenimiento → anti-patrones → diagnóstico, pero cada uno se sostiene por sí solo. Si ya tienes claro el "por qué", puedes saltar directamente al capítulo que te resuelva un problema concreto.
Índice¶
Capítulo 0 — Puerta de entrada¶
Parte 1 — Mentalidad¶
Parte 2 — Los dos pilares¶
Parte 3 — Práctica¶
- 5. Entornos aislados y reproducibles
- 6. El contexto como sistema de registro
- 7. Arquitectura para agentes
- 8. El flujo de PR agéntico
Parte 4 — Sostenibilidad¶
Parte 5 — Errores comunes¶
Parte 6 — Llevarlo a tu equipo¶
Qué no encontrarás en esta versión¶
- Plantillas listas para copiar (
AGENTS.mdde ejemplo, hooks, configuraciones de CI). Vendrán en una versión posterior. - Comparativas entre herramientas concretas. La guía es deliberadamente agnóstica.
- Promesas de productividad. Los números de Stripe o de OpenAI son referencias, no garantías.
Fuentes¶
Esta guía sintetiza ideas de:
- Birgitta Böckeler (Thoughtworks, publicado en martinfowler.com) — Harness Engineering. El término "harness" en este sentido emergió en torno a LangChain con la fórmula "Agent = Model + Harness".
- Kief Morris (en martinfowler.com) — Humans and Agents in Software Engineering Cycles
- Chad Fowler — Relocating Rigor — The Phoenix Architecture
- Geoffrey Huntley — everything is a ralph loop
- Ryan Lopopolo (OpenAI) — Harness Engineering: leveraging Codex in an agent-first world
- Alistair Gray (Stripe, equipo Leverage) — Minions: Stripe's one-shot, end-to-end coding agents — parte 1 · parte 2