Hay una simetría incómoda en lo que hacemos. Centro de Verdad existe para verificar el output de IA antes de que alguien decida sobre él. Y lo construimos… con IA. Si no nos aplicáramos la misma vara puertas adentro, seríamos el chiste.
El default del agente es el mínimo esfuerzo
Un agente, dejado a sus defaults, elige la opción con menos código que pasa los tests — no la arquitectónicamente correcta. Lo contamos en detalle en "Menos código no es mejor diseño": los tests en verde no evidencian buen diseño, porque la opción pobre también los pasa. El hueco no está en el código; está aguas arriba, en la decisión de diseño, antes de la spec.
Un guardrail que se auditó a sí mismo
Nuestra defensa fue un Gate de Altitud: una revisión adversarial del diseño, hecha por un agente fresco, aguas arriba de la spec, con un mandato único — cazar la pobreza de mínimo esfuerzo, no la incorrectitud.
Lo revelador vino después. La primera versión del gate dejaba que el agente principal —el sesgado— decidiera cuándo debía dispararse. La revisión del propio diseño del gate lo marcó como crítico: si la parte sesgada controla su propia válvula, el guardrail es teatro. La mejor prueba de que el mecanismo funcionaba fue aplicárselo a sí mismo y que encontrara su propio defecto.
Un motor de verdad que no se aplica su propia vara no es un motor de verdad. Es marketing.
La misma tesis, en las dos capas
Las garantías del producto tienen un espejo exacto en cómo lo fabricamos: evals como compuertas (nada avanza sin pasar su eval ≥ 0.90), verificación independiente (quien revisa no es quien construye), y memoria auditable en git. Los principios de la fábrica (F1–F9) reflejan los del producto (P1–P15) — una frontera explícita entre cómo se construye y qué se entrega.
Verificado · frontera fábrica/producto, FAB-00
Separar lo que parece correcto de lo que está verificado — antes del merge, igual que antes de la decisión. La coherencia no es solo el producto. Es cómo lo hacemos.