¿Qué marcos regulatorios de LATAM cubre el RAG?

El corpus se construye sobre la regulación de la jurisdicción del cliente. Vorantis tiene expertise directo en CNBV y CNSF (México), SFC (Colombia) y LGPD (Brasil). El modelo razona solo sobre los fragmentos recuperados de esos documentos oficiales.

¿Cómo se explica el razonamiento del modelo ante un auditor?

La explicabilidad nace de dos capas: Claude se entrena con Constitutional AI, que hace explícitos los principios que guían sus respuestas, y la arquitectura RAG deja un rastro de citaciones que muestra qué fuente sustentó cada salida. Juntas responden de dónde salió la respuesta y por qué.

Compliance · Junio 2026

Claude para servicios financieros en LATAM: compliance auditable

Un asistente de compliance es auditable cuando cada respuesta se puede rastrear a su fuente regulatoria. Con Claude eso se logra combinando RAG sobre marcos como CNBV, CNSF, SFC y LGPD, citaciones trazables a nivel de span, Zero Data Retention y residencia en AWS Bedrock São Paulo. Aquí explicamos la mecánica.

¿Qué hace “auditable” a un asistente de compliance con Claude?

Auditable significa que un examinador puede reconstruir el porqué de cada respuesta: qué documento la sustenta, qué versión, qué fecha y quién la consultó. No basta con que el modelo sea bueno. La arquitectura tiene que producir una cadena verificable que va de la pregunta a la fuente oficial, sin pasos opacos en el medio.

Eso descarta el patrón de consulta abierta a un modelo general. Un LLM sin recuperación sobre regulación oficial puede generar referencias plausibles pero inexistentes a circulares o artículos. En servicios financieros eso no es un detalle de calidad: es exposición legal. La diferencia entre un sistema auditable y uno que no lo es está en cuatro capas que describimos a continuación.

¿Cómo funciona el RAG sobre marcos regulatorios?

RAG (Retrieval-Augmented Generation) hace que el corpus sea la regulación y el modelo sea el motor de razonamiento sobre ese corpus. En lugar de preguntarle a Claude lo que “recuerda”, el sistema vectoriza los documentos oficiales, recupera los fragmentos relevantes para cada consulta y obliga a que la respuesta se construya solo sobre ese material recuperado.

En la práctica para LATAM, el corpus cubre la jurisdicción del cliente. Algunos de los marcos que el equipo de Vorantis maneja con expertise regulatorio directo:

CNBV (México): disposiciones aplicables a instituciones de crédito, contratación con terceros y servicios en la nube.
CNSF (México): normativa del sector asegurador y de fianzas.
SFC (Colombia): circulares y normatividad de la Superintendencia Financiera.
LGPD (Brasil): Lei Geral de Proteção de Dados para el tratamiento de datos personales.

Cuando el sistema no puede recuperar un fragmento de fuente oficial que respalde la pregunta, la respuesta se rechaza al nivel de recuperación, no al nivel de salida. Es la diferencia entre un asistente que “siempre responde” y uno que sabe cuándo no tiene base para hacerlo.

¿Por qué importan las citaciones trazables a la fuente?

Porque sin trazabilidad no hay defensa ante un auditor. Una citación útil no apunta a un bloque de prompt más respuesta: apunta al span exacto de la fuente (artículo, sección, fecha, documento original). Esa es la unidad que un oficial de cumplimiento puede llevar a un procedimiento administrativo y sostener.

Esto cambia el flujo de trabajo del analista. En lugar de copiar una respuesta a un dictamen interno y esperar que sea correcta, el analista verifica la citación contra la fuente vinculada en segundos. En implementaciones de compliance hemos visto reducciones del 60 al 70% en revisión manual precisamente porque la verificación deja de ser una búsqueda a ciegas y pasa a ser una confirmación contra fuente. Con la ventana de 1M tokens, el sistema puede mantener marcos regulatorios completos en contexto sin fragmentar el razonamiento.

¿Dónde se procesan y residen los datos: Zero Data Retention y São Paulo?

Los despliegues a la medida de Vorantis corren sobre AWS Bedrock con opción de región São Paulo y Zero Data Retention (ZDR). Bajo ZDR, los datos del cliente no se almacenan en reposo después de que la respuesta del API se devuelve, salvo donde la ley o el combate al abuso lo requieran. Eso elimina la pregunta incómoda de “qué pasa con el documento sensible después de la consulta”.

La residencia en São Paulo (sa-east-1) acerca el procesamiento a la región y simplifica la conversación de jurisdicción para instituciones de Brasil y del cono sur. La capa que une todo esto con los sistemas core (core bancario, SAP, Salesforce, bases de datos) es MCP (Model Context Protocol), el estándar abierto de Anthropic que conecta Claude con sistemas externos sin construir un conector custom para cada uno.

¿Cómo se explica el razonamiento del modelo?

La explicabilidad nace de dos partes: el razonamiento del modelo y la trazabilidad del sistema. Claude se entrena con Constitutional AI, un método que hace explícitos los principios que guían sus respuestas, lo que produce comportamiento más predecible y revisable que un modelo de caja negra. Encima de eso, la arquitectura RAG con citación deja un rastro auditable de qué fuente sustentó cada salida.

Combinadas, esas dos capas responden las dos preguntas que un examinador hace: “¿de dónde salió esta respuesta?” (la citación al span) y “¿por qué el modelo concluyó esto?” (el razonamiento explícito sobre el material recuperado). Cada llamada queda registrada, lo que permite reconstruir el historial completo de una consulta meses después.

El siguiente paso

El compliance auditable con Claude no es una sola feature: es la suma de RAG sobre regulación oficial, citaciones a nivel de span, Zero Data Retention, residencia en São Paulo y razonamiento explicable. Cada capa cierra una pregunta que un auditor financiero hará tarde o temprano. Si quieres ver cómo se aplica a tu institución, revisa el cluster de Claude para servicios financieros, donde detallamos casos de uso y arquitectura de la vertical, y el pilar Claude y Microsoft para entender cómo encaja con tu entorno actual.