Ingeniería de confianza · ~5 min

Un claim no es un chunk

Recuperar el pasaje correcto no es verificar el dato. La unidad de la verdad no es el fragmento que devuelve tu RAG — es el claim atómico atado a su fuente literal.

Por Juan Urrea2026-06~5 min
Un chunk de 512 tokens difuso frente a un claim atómico brillante, anclado a su fuente literal (raw_signal)

La mayoría de los sistemas de IA "con fuentes" hacen lo mismo: parten los documentos en chunks, recuperan los más parecidos a la pregunta, y el modelo redacta una respuesta apoyada en ellos. Se ve fundamentado. Se siente verificado. No lo es.

Un chunk es un pedazo de texto recuperado por similitud semántica con la pregunta. Que un pasaje sea relevante no significa que respalde la afirmación específica que el modelo terminó escribiendo. El modelo puede recuperar el fragmento correcto y aun así afirmar algo que el fragmento no dice — o parafrasearlo hasta cambiarle el sentido. La cita existe; el respaldo, no.

La unidad correcta no es el pasaje

La verdad no se verifica a nivel de documento ni de chunk. Se verifica a nivel de claim: una afirmación atómica y comprobable — "el margen del producto es 34%" — atada a su cita literal, el span exacto de la fuente del que salió.

En Centro de Verdad el flujo es: fuentes → señales → claims, cada uno con binding a su fuente. Cada claim conserva su raw_signal, la evidencia cruda de donde nació. Verificar no es "encontrar un pasaje parecido"; es comprobar que el span citado dice, palabra por palabra, lo que el claim afirma.

Un pasaje relevante no es una prueba. La prueba es el span exacto que dice, textualmente, lo que estás afirmando.

RAG te da grounding aparente; el claim-binding, procedencia real

La diferencia no es cosmética. El grounding de un RAG tranquiliza: hay citas, se ve serio. La procedencia a nivel de claim se puede auditar: cualquiera puede tomar la afirmación, ir al span citado y comprobar si lo respalda o no. Uno te hace sentir seguro; el otro te deja verificar.

Y hay un segundo beneficio: si la unidad es el claim, puedes decir cosas que a nivel de chunk son imposibles — cuánto respaldo independiente tiene ese dato, si otra fuente lo contradice, o si simplemente nadie lo confirma todavía.

Claim verificadouna cita debe respaldar el claim, no solo ser relevante a la pregunta.
Verificado · principio P1 — Provenance-First

Separar el claim del chunk es el primer paso para que una respuesta de IA sea auditable, no solo plausible. Todo lo demás — la opinión graduada, el semáforo, la detección de contradicciones — se construye encima de esa unidad.

Este es el tipo de decisión de diseño que hay detrás de cada dato en Centro de Verdad. Si construyes con IA sobre decisiones reales, hablemos → ver-4.comver-4.com
← Todos los posts