Notas de ingeniería sobre construir IA en la que se puede confiar — y la fábrica que la produce.
Por qué los agentes de IA eligen, por defecto, la opción que pasa los tests — no la que sobrevive a producción. Y el mecanismo con el que la atrapamos antes del merge.
Leer el postRecuperar el pasaje correcto no es verificar el dato. La unidad de la verdad es el claim atómico atado a su fuente literal.
Un número de confianza esconde lo que más importa: cuánta evidencia hay a favor, cuánta en contra, y cuánto no sabemos.
Un 73% de confianza no le dice a nadie qué hacer. Un veredicto claro, con la evidencia a un clic, sí.
Un export del ERP, un Slack y una respuesta de un LLM no merecen la misma confianza de entrada. Cómo asignamos priors por fuente.
Construimos un motor de verdad con agentes de IA. Eso nos obligó a aplicarnos la misma disciplina que le exigimos al output de IA.
Jira dice el 10; Slack dice el 12. La mayoría elige uno en silencio. Nosotros lo marcamos — antes de que decidas sobre el dato equivocado.
Notas de ingeniería sobre IA confiable. Sin ruido.