3. Visión General de RAG y CAG

Hemos establecido que el método manual de «copiar y pegar» no es viable para un negocio. La solución inteligente implica preparar los datos de antemano para que el LLM pueda consultarlos. Existen dos arquitecturas principales para lograr esto: RAG y CAG.

Para entender la diferencia, usemos una analogía con una biblioteca:

RAG (Generación Aumentada por Recuperación): El Bibliotecario Preciso 🔎 Usted le hace una pregunta específica al bibliotecario. Él busca en toda la biblioteca, encuentra el libro exacto y la página concreta que contiene la respuesta, y le entrega solo ese pequeño fragmento relevante (la página concreta con la respuesta). Es un sistema de «poco en poco», increíblemente eficiente y preciso.
CAG (Generación Aumentada por Contexto): La Pila de Libros Relevantes 📚 Usted le dice al bibliotecario que está interesado en un tema. Él reúne una pila de todos los libros que podrían ser relevantes para ese tema y se los entrega todos a la vez. Usted tiene un contexto más amplio para explorar, pero es menos directo y puede ser abrumador.

Aunque ambos métodos son válidos, RAG es la arquitectura más extendida, escalable y eficiente, y por lo tanto, será el foco principal de nuestro estudio.

Las Dos Etapas Clave de RAG

El proceso de RAG se divide en dos fases fundamentales:

Etapa de Ingesta (Ingestion): Este es un proceso que se realiza una sola vez (o cada vez que se actualizan los datos). Consiste en tomar todos los documentos de su empresa y prepararlos para que puedan ser consultados. Es el equivalente a organizar y catalogar todos los libros de su biblioteca.
Etapa de Recuperación (Retrieval): Esto ocurre cada vez que un usuario hace una pregunta. El sistema busca en la base de conocimiento ya preparada, recupera la información más relevante y la usa para generar una respuesta precisa.

Profundizando en la Etapa de Ingesta: El «Chunking»

El primer paso dentro de la etapa de ingesta es el chunking (o troceado).

Nuestros documentos empresariales (PDFs, Word, etc.) pueden ser muy largos, con decenas o cientos de páginas. Si almacenamos cada documento como una sola unidad, sería muy ineficiente. Cuando un usuario pregunte algo específico, el sistema tendría que devolverle el documento entero, obligando al LLM a leerlo todo para encontrar una simple frase.

El chunking soluciona esto. Es el proceso de dividir estos grandes documentos en fragmentos más pequeños y lógicos (chunks). Estos fragmentos pueden ser párrafos, secciones de 1000 caracteres, o cualquier otra unidad que definamos.

Al dividir los documentos en «chunks», permitimos que el sistema de recuperación encuentre y entregue piezas de información mucho más precisas y relevantes, haciendo todo el proceso más rápido y exacto.

Aprende RAG y Bases de Datos Vectoriales a Fondo

3. Visión General de RAG y CAG

Las Dos Etapas Clave de RAG

Profundizando en la Etapa de Ingesta: El «Chunking»