5. Sistemas RAG con n8n

0 de 7 lecciones completas (0%)

2. Configura un Agente de IA para Consultar tu RAG

Descarga el workflow de n8n de esta lección:

¡Bienvenido/a de nuevo! En la lección anterior, construimos el sistema de ingestión, «alimentando» a nuestra base de datos vectorial con el contenido de un documento PDF. Ya tenemos el conocimiento almacenado; ahora es el momento de darle vida.

En esta lección, construiremos la segunda y más emocionante parte de nuestro sistema RAG: el workflow de consulta. Aprenderás a configurar un Agente de IA que puede «chatear» con esa base de datos para responder a tus preguntas utilizando la información que le proporcionamos.

1. El Punto de Partida: El Disparador de Chat

Para interactuar con nuestro sistema, necesitamos un canal de comunicación. La forma más sencilla de empezar es con un disparador de chat integrado en n8n.

  1. Añade un nodo Trigger: Haz clic en el + y busca el nodo Chat Trigger.
  2. Colócalo en tu lienzo. Este nodo abrirá una simple interfaz de chat para que podamos probar nuestro agente directamente en n8n.

Nota: Este disparador es intercambiable. Podrías conectar tu agente a Telegram, WhatsApp, Slack o cualquier otro canal de mensajería siguiendo una lógica muy similar.

2. El Cerebro de la Operación: El Nodo AI Agent

El Agente de IA es el orquestador. No solo genera respuestas, sino que también decide qué herramientas usar para encontrar la información correcta.

  1. Añade el nodo AI Agent y conéctalo después del Chat Trigger.
  2. Configura los componentes básicos del agente:
    • Input Node: Asegúrate de que está conectado al Chat Trigger.
    • System Message (Mensaje de Sistema): Aquí le damos al agente su identidad y su propósito principal. Por ahora, usaremos un prompt muy simple:
      Eres un asistente diseñado para dar información consultando una base de datos vectorial con nuestra propia información.
    • LLM (Modelo de Lenguaje): Este es el «motor» de pensamiento del agente.
      • Selecciona OpenAI.
      • Elige un modelo rápido y económico como gpt-4o-mini. Para esta tarea, no necesitamos un modelo grande y costoso, ya que su principal trabajo es buscar en la base de datos y formular una respuesta, no razonar sobre temas complejos.
    • Memory (Memoria): Para que el agente pueda recordar el historial de la conversación, añadiremos una memoria.
      • Selecciona N8N Simple Memory.
      • Puedes dejar el Context Window en 10, lo que significa que recordará las últimas 10 interacciones.

3. La Herramienta Clave: Conectando con la Base de Datos Vectorial

Aquí es donde conectamos al agente con el «superpoder» que creamos en la lección anterior. Lo haremos a través de una herramienta (Tool).

  1. Dentro del nodo AI Agent, haz clic en + Add Tool.
  2. Busca y selecciona Simple Vector Store.
  3. Ahora, configura la herramienta con los siguientes parámetros críticos:
    • Action (Acción): Elige la última opción: Return documents from a vector store for use in an AI Agent node.
    • Description (Descripción): Esta es la instrucción que el agente lee para saber cuándo debe usar esta herramienta. Sé claro y descriptivo. Ejemplo:
      Usa esta herramienta cuando necesites responder preguntas sobre documentos legales. Tienes información propia en una base de datos vectorial.
    • Vector Store Name (Nombre del Almacén): ¡ATENCIÓN! Este es el paso más importante. Debes escribir exactamente el mismo nombre que le diste a tu base de datos en el workflow de ingestión de la lección anterior (en nuestro caso, mi_base_rag). Si los nombres no coinciden, el agente no encontrará la información.
    • Limit (Límite): Este número define cuántos fragmentos de texto (chunks) relevantes recuperará de la base de datos para cada pregunta. Un valor de 4 es un buen punto de partida.
    • Embedding Model (Modelo de Embedding): ¡IMPORTANTE! Debes seleccionar exactamente el mismo modelo de embedding que usaste para subir los documentos (en nuestro caso, el modelo large de OpenAI). El modelo que convierte la pregunta en vector debe ser el mismo que convirtió los documentos en vectores.

4. ¡A Probarlo! La Conversación con tus Datos

¡Tu sistema RAG estándar está completo! Ahora, vamos a probarlo.

  1. Activa y ejecuta el workflow.
  2. Abre la interfaz del Chat Trigger.
  3. Haz una pregunta específica sobre el contenido del PDF que subiste en la lección anterior. Por ejemplo:
    • «¿Cuál es el teléfono de la empresa Energía Verde Honduras?»
    • «Resume las obligaciones del empleador.»
    • «¿Cuál es el salario base para un ejecutivo de ventas?»

Observarás cómo el agente recibe la pregunta, entiende que debe usar la herramienta de base de datos vectorial, recupera los fragmentos de texto más relevantes y genera una respuesta precisa basada exclusivamente en esa información.

5. Cómo Mejorar tus Resultados: El Poder de un Prompt Detallado

Nuestro agente funciona con un prompt de sistema muy simple. Sin embargo, para obtener respuestas de mayor calidad, más profesionales y con un tono específico, podemos mejorar enormemente el System Message.

Observa la diferencia:

  • Prompt Simple (el nuestro): Eres un asistente para dar información...
  • Prompt Avanzado (Ejemplo):
    # Rol: Asistente Legal

    ## Descripción
    Eres un asistente legal diseñado para ayudar a un abogado a consultar información contenida en documentos legales internos. Debes recuperar, analizar y entregar respuestas precisas, claras y fundamentadas basadas únicamente en los documentos disponibles. Mantén siempre un tono profesional y formal, y prioriza la exactitud legal en todas tus respuestas.
    Tus respuestas deben de ser cortas y puntuales.
    Si no conoces la respuesta, responde que no dispones de la información.

    ## Capacidades
    – Búsqueda y recuperación de información legal relevante.
    – Respuestas concisas y con fundamento en los documentos disponibles.
    – Inclusión de referencia del documento utilizado para responder.
    – Identificación de ausencia de información en los documentos.
    – Mantener confidencialidad y precisión en todas las respuestas.

    ## Comportamiento
    1. Recepción de la consulta: Recibe la pregunta o solicitud del abogado.
    2. Búsqueda de información en la base de conocimiento para encontrar información relevante en los documentos.
    3. Generación de la respuesta:
    – Si encuentras la información:
    – Proporciona un resumen conciso, claro y preciso.
    – Incluye la referencia del documento donde encontraste la información (nombre o identificación del documento y sección/cláusula si aplica).
    – Si no encuentras la información:
    – Responde únicamente con: `No puedo encontrar la respuesta en los recursos disponibles.`
    4. Confidencialidad: No reveles información fuera de lo que esté contenido en los documentos.
    5. Tono: Profesional, formal, claro y directo.

    ## Ejemplo Pregunta del abogado:
    > ¿Cuál es el procedimiento de terminación anticipada del contrato de arrendamiento?
    Respuesta del asistente (ejemplo):
    > Según el Contrato de Arrendamiento – Cláusula 12, el contrato puede ser terminado anticipadamente por cualquiera de las partes notificando con al menos 30 días de antelación y cumpliendo con el pago proporcional de las obligaciones pendientes.
    > Referencia: Contrato_Arrendamiento_2025.pdf, Cláusula 12.

Un prompt más «currado» como este transforma por completo el comportamiento del agente, haciéndolo mucho más robusto y profesional.


Resumen de la Lección

¡Felicidades! Has construido un sistema RAG completo y funcional. Ahora no solo sabes cómo alimentar una base de datos con tu propio conocimiento, sino también cómo crear un agente de IA capaz de consultar esa información para mantener conversaciones inteligentes y contextualizadas.

En las próximas lecciones, exploraremos formas más avanzadas de RAG, mejorando cada una de las piezas que hemos montado hoy. ¡Nos vemos en el próximo video!

Resumen de privacidad
Logo JeroCuevas.com

Esta web utiliza cookies para que podamos ofrecerte la mejor experiencia de usuario posible. La información de las cookies se almacena en tu navegador y realiza funciones tales como reconocerte cuando vuelves a nuestra web o ayudar a nuestro equipo a comprender qué secciones de la web encuentras más interesantes y útiles.

Cookies estrictamente necesarias

Las cookies estrictamente necesarias tiene que activarse siempre para que podamos guardar tus preferencias de ajustes de cookies.

Analítica

Esta web utiliza Google Analytics para recopilar información anónima tal como el número de visitantes del sitio, o las páginas más populares.

Dejar esta cookie activa nos permite mejorar nuestra web.