Harness engineering¶

Esta es la tercera guía de una trilogía. En Fundamentals vimos cómo pilotar un agente de codificación; en Spec-Driven Development aprendimos a especificar la intención para que el agente la ejecute bien. Ahora toca lo que queda: diseñar el sistema que rodea al agente — guías, sensores, sandboxes, bucles, contexto estructurado — para que un equipo pueda depender de él de forma sostenible.

No es un tutorial paso a paso ni un manual de un producto concreto. Es un ensayo, organizado por capítulos, sobre los principios y patrones que están emergiendo en equipos que ya operan a esta escala (OpenAI, Stripe, Thoughtworks/Böckeler, Geoffrey Huntley) y que se repiten independientemente del stack o de la herramienta.

Premisas¶

Trabajas en un equipo técnico con experiencia operando agentes y skills.
Te interesa diseñar el sistema, no encontrar el prompt mágico.
Estás dispuesto a invertir en infraestructura interna (linters, sandboxes, observabilidad, docs versionadas) si eso multiplica el rendimiento del agente.
Te importa la sostenibilidad a meses vista, no solo el primer commit impresionante.

Tesis central (en una frase)¶

El modelo es el motor. El harness — guías, sensores, sandboxes, bucles, contexto estructurado — es lo que convierte a un LLM en un agente del que un equipo puede depender.

Cómo leer esta guía¶

Los capítulos están ordenados de mentalidad → pilares → práctica → mantenimiento → anti-patrones → diagnóstico, pero cada uno se sostiene por sí solo. Si ya tienes claro el "por qué", puedes saltar directamente al capítulo que te resuelva un problema concreto.

Índice¶

Capítulo 0 — Puerta de entrada¶

Harness engineering: producir software a escala con agentes

Parte 1 — Mentalidad¶

Parte 2 — Los dos pilares¶

Parte 3 — Práctica¶

Parte 4 — Sostenibilidad¶

Parte 5 — Errores comunes¶

11. Anti-patrones

Parte 6 — Llevarlo a tu equipo¶

12. Diagnóstico y madurez: dónde estás y qué tocar primero

Qué no encontrarás en esta versión¶

Plantillas listas para copiar (AGENTS.md de ejemplo, hooks, configuraciones de CI). Vendrán en una versión posterior.
Comparativas entre herramientas concretas. La guía es deliberadamente agnóstica.
Promesas de productividad. Los números de Stripe o de OpenAI son referencias, no garantías.

Fuentes¶

Esta guía sintetiza ideas de:

Birgitta Böckeler (Thoughtworks, publicado en martinfowler.com) — Harness Engineering. El término "harness" en este sentido emergió en torno a LangChain con la fórmula "Agent = Model + Harness".
Kief Morris (en martinfowler.com) — Humans and Agents in Software Engineering Cycles
Chad Fowler — Relocating Rigor — The Phoenix Architecture
Geoffrey Huntley — everything is a ralph loop
Ryan Lopopolo (OpenAI) — Harness Engineering: leveraging Codex in an agent-first world
Alistair Gray (Stripe, equipo Leverage) — Minions: Stripe's one-shot, end-to-end coding agents — parte 1 · parte 2