Organizational Intelligence Engine

La capa de verificación entre los LLMs y las decisiones

Provenance-first. Cada dato es un claim atado a su cita literal, con una opinión graduada — creencia, descreencia e incertidumbre explícita. El sistema no afirma: calibra.

Python · FastAPI · LangGraph · PostgreSQL+pgvector · Temporal · evals
01 El problema

Sin un punto único de verdad, las alucinaciones se propagan como hechos

Los LLMs producen output con alta confianza superficial. Sin provenance estructural, cada capa que consume ese output amplifica el error. El costo no es teórico.

1 de cada 3
Daños atribuidos a inexactitud
daños empresariales por IA atribuidos a datos inexactos — McKinsey, 2025
~37%
Ahorro reabsorbido
del ahorro proyectado de IA se reabsorbe en verificación y rehacer output
82%
Fallos en producción
de los fallos en pipelines GenAI de producción son alucinaciones — Testlio
AU$440K
Reembolso por referencias fabricadas
reembolsó Deloitte por un informe con referencias fabricadas por IA
02 Arquitectura

Una Knowledge Base de claims, no de documentos

La unidad atómica no es el chunk ni el documento: es el claim — proposición extraída, atada a su cita literal en la fuente y evaluada de forma independiente. Esto hace la verificación composable y el audit trail preciso.

Provenance

Claim vinculado a cita literal

Cada claim lleva referencia a su fragmento fuente exacto. No summaries, no paraphrasing — la cita raw. Trazabilidad determinista.

Opinión graduada

Creencia, descreencia, incertidumbre

Tres valores explícitos por claim: b (belief), d (disbelief), u (uncertainty). La distribución debe sumar 1. El sistema no colapsa en booleano.

Entity resolution

Normalización semántica de entidades

'ira', 'JIRA', 'Jira issue' → misma entidad. Previene fragmentación del grafo de claims y falsos negativos en detección de contradicciones.

Detección de contradicciones

Conflictos entre claims de misma entidad

Cuando dos claims sobre la misma entidad son lógicamente incompatibles, el sistema los marca y propaga incertidumbre. No silencia el conflicto.

Audit compliance

Reportes 100% trazables, audit log inmutable

Cada reporte o acción lleva el grafo de evidencia que lo sustenta. El audit log es append-only. Nada se edita en retroactivo.

Capa de acción

Durable execution con Temporal

Acciones orquestadas por Temporal con mayor umbral de confianza que lecturas. El sistema actúa solo cuando la evidencia supera el threshold.

Pilares
Provenance Opinión por claim Detección de contradicciones Audit compliance Capa de acción
Distribución de opinión — ejemplo de claim con respaldo fuerte
Creencia (b)
Descreencia (d)
Incertidumbre (u)
03 Modelo de confianza

Dos ejes, no una caja negra

Fiabilidad de la fuente y credibilidad del dato son conceptos distintos y se modelan por separado. Colapsarlos produce scores opacos que nadie puede auditar.

Eje 1 — Source prior

Fiabilidad estructural de la fuente

Prior asignado por tipo de fuente: refleja su naturaleza epistémica —autoritatividad, latencia de actualización, nivel de verificación editorial— no el contenido del dato. Es el prior bayesiano antes de ver evidencia.

Jira
0.85
Email
0.75
Slack
0.60
Doc
0.50
Solo-IA
0.40
Eje 2 — Claim credibility

Credibilidad del dato concreto

Función de cuatro señales independientes: corroboración (descontada por dependencia entre fuentes), consistencia interna del corpus, frescura temporal, y registro autoritativo existente. Cuando la evidencia cambia, la confianza se recalcula y la corrección viaja a reportes y acciones ya emitidos.

Corroboración independiente Consistencia Frescura Registro autoritativo
04 Diferenciación

Ningún competidor integra los 5 pilares

El mercado resuelve partes del problema. Ningún jugador ha construido la integración vertical de provenance, opinión graduada, detección de contradicciones, audit compliance y capa de acción durable.

Jugador Qué resuelve hoy
Glean $7.2B Recuperación semántica de documentos internos — no verificación de claims ni provenance estructural
Arize · Galileo Observabilidad de LLM en producción — métricas de latencia, drift, calidad de respuesta; sin model de confianza por claim
Patronus · Vectara Detección técnica de alucinaciones y RAG evaluation — sin audit trail ni capa de acción durable
Credo AI Governance de sistemas de IA a nivel organizacional — compliance de proceso, no verificación de claims en runtime
Centro de Verdad Los 5 pilares integrados: provenance · opinión graduada · detección de contradicciones · audit compliance · capa de acción
LATAM es white space: sin rondas públicas dedicadas a verificación/gobernanza de IA en la región. El segmento enterprise LATAM carece de solución vertical con los 5 pilares.
Moat 1

Provenance-by-design

Arquitectura provenance-first desde el esquema de datos, no como post-procesamiento. Ventana de ~18 meses antes de que incumbentes retrofiten su arquitectura de chunks.

Moat 2

Data flywheel

Cada claim verificado mejora el modelo de priors y el grafo de entidades. El corpus propio de contradicciones resueltas es un activo no replicable por entrantes sin historial.

Moat 3

Economía que compone

Una KB densa reduce tokens consumidos por queries futuras. Más knowledge base significa menos costo marginal de inferencia, no más. El unit economics mejora con escala.

Moat 4

Fábrica IA

El mismo sistema que verifica claims externos verifica el output de agentes internos. Centro de Verdad es la infraestructura de confianza de la propia fábrica de software.

05 Por qué ahora

La web agéntica y la regulación con fechas

Los agentes que actúan — no solo responden — son el siguiente vector de riesgo. MCP y A2A estandarizan la conectividad entre agentes, no la verdad de los datos que transportan. La pregunta no es si los agentes adoptarán estos protocolos: es si el substrate de claims que consumen puede ser auditado.

Centro de Verdad se alinea con C2PA y W3C Verifiable Credentials para provenance interoperable, y aporta la capa de evidencia que el EU AI Act Art. 26 exige al deployer: trazabilidad de las decisiones tomadas con apoyo de sistemas de IA de alto riesgo. La ventana regulatoria tiene fechas de cumplimiento, no indicativas.

US$2.3B → 7.4B
AI TRiSM · ~22% CAGR
AI Trust, Risk and Security Management
US$2.7B → 9.3B
Observabilidad de LLM · ~36% CAGR
segmento de verificación y monitoreo
15% → 50%
Despliegues GenAI con capa de verificación para 2028
Gartner

El sistema no afirma: calibra.