Fábrica AI · ~5 min

La fábrica se verifica a sí misma

Construimos un motor de verdad con agentes de IA. Eso nos obligó a aplicarnos, puertas adentro, la misma disciplina que el producto le exige al output de IA de nuestros clientes.

Por Juan Urrea2026-06~5 min
Circuito cerrado de verificación: spec, código, eval ≥ 0.90 y gate girando alrededor de un check central

Hay una simetría incómoda en lo que hacemos. Centro de Verdad existe para verificar el output de IA antes de que alguien decida sobre él. Y lo construimos… con IA. Si no nos aplicáramos la misma vara puertas adentro, seríamos el chiste.

El default del agente es el mínimo esfuerzo

Un agente, dejado a sus defaults, elige la opción con menos código que pasa los tests — no la arquitectónicamente correcta. Lo contamos en detalle en "Menos código no es mejor diseño": los tests en verde no evidencian buen diseño, porque la opción pobre también los pasa. El hueco no está en el código; está aguas arriba, en la decisión de diseño, antes de la spec.

Un guardrail que se auditó a sí mismo

Nuestra defensa fue un Gate de Altitud: una revisión adversarial del diseño, hecha por un agente fresco, aguas arriba de la spec, con un mandato único — cazar la pobreza de mínimo esfuerzo, no la incorrectitud.

Lo revelador vino después. La primera versión del gate dejaba que el agente principal —el sesgado— decidiera cuándo debía dispararse. La revisión del propio diseño del gate lo marcó como crítico: si la parte sesgada controla su propia válvula, el guardrail es teatro. La mejor prueba de que el mecanismo funcionaba fue aplicárselo a sí mismo y que encontrara su propio defecto.

Un motor de verdad que no se aplica su propia vara no es un motor de verdad. Es marketing.

La misma tesis, en las dos capas

Las garantías del producto tienen un espejo exacto en cómo lo fabricamos: evals como compuertas (nada avanza sin pasar su eval ≥ 0.90), verificación independiente (quien revisa no es quien construye), y memoria auditable en git. Los principios de la fábrica (F1–F9) reflejan los del producto (P1–P15) — una frontera explícita entre cómo se construye y qué se entrega.

Claim verificadola disciplina de build-time es el espejo de las garantías de runtime — verificamos cómo construimos con el mismo rigor con que verificamos lo que el producto afirma.
Verificado · frontera fábrica/producto, FAB-00

Separar lo que parece correcto de lo que está verificado — antes del merge, igual que antes de la decisión. La coherencia no es solo el producto. Es cómo lo hacemos.

Así construimos Centro de Verdad. Más en ver-4.comver-4.com
← Todos los posts