Introducción
En esta lección aprenderás a crear un bot RAG (Recuperación y Generación Aumentada) completamente funcional que no solo brinda soporte al cliente, sino que también captura automáticamente información de leads potenciales. Este bot será capaz de:
- Responder preguntas sobre tu negocio usando información almacenada en Pinecone
- Capturar automáticamente datos de contacto (nombre, email, teléfono, intereses)
- Almacenar los leads en Google Sheets para seguimiento posterior
- Actualizarse automáticamente cuando agregues nuevos documentos a Google Drive
Configuración Inicial del Proyecto
Paso 1: Limpieza del Workspace
Comenzaremos eliminando cualquier workflow existente y creando uno nuevo desde cero. Esto nos permitirá construir un sistema limpio y organizado.
Paso 2: Configuración de Google Drive como Trigger
Conexión con Google Drive
- Crear nuevo workflow y presionar el botón «+»
- Seleccionar Google Drive como nodo trigger
- Elegir «On changes involving a specific folder» – esto monitoreará una carpeta específica cada minuto
Configuración de Credenciales Google Cloud
Si usas n8n en la nube, puedes conectarte directamente con Google. Para instalaciones locales, necesitarás configurar Google Cloud Console:
Configuración en Google Cloud Console:
- Ir a Google Cloud Console
- Crear nuevo proyecto (ej: «N8N drive test»)
- Navegar a «APIs and Services» → «Library»
- Buscar y activar «Google Drive API»
- Configurar «OAuth consent screen»:
- Tipo: Externo
- Nombre: «N8N drive»
- Email: tu email
- Agregar usuarios de prueba (tu email)
- Crear credenciales OAuth 2.0:
- Tipo: Aplicación web
- Agregar URL de redirección de n8n
- Copiar Client ID y Client Secret a n8n
Configuración del Folder
- Crear carpeta en Google Drive llamada «RagApplication»
- Seleccionar la carpeta en el configurador de n8n
- Configurar «Watch for file created» para detectar nuevos archivos
Paso 3: Preparación de Datos de Ejemplo
Para este tutorial, crearemos datos de ejemplo para una joyería ficticia llamada «Gold Digger Company»:
Contenido del archivo Q&A:
PREGUNTAS FRECUENTES - GOLD DIGGER COMPANY
Información General:
- Teléfono: +1-555-GOLD-123
- Email: info@golddigger.com
- Sitio web: www.golddigger.com
- Ubicación: 123 Goldsmith Avenue, Gold City
Productos:
- Trabajamos con oro 14K y 18K
- Especialidad en anillos personalizados
- Creamos piezas únicas para bodas
Política de Devoluciones:
- Las piezas personalizadas no son reembolsables
- Productos estándar: reembolso en 14 días si están sin usar
Pedidos Online:
- Sí, ofrecemos tienda online en www.golddigger.com/store
Guarda este contenido en un archivo de texto llamado «Q&A Gold Digger.txt» y súbelo a tu carpeta de Google Drive.
Construcción del Workflow de Pinecone
Paso 4: Descarga de Archivos
- Agregar nodo Google Drive → «Download file»
- Configurar por ID usando el ID del archivo del trigger anterior
- Usar expresión
{{$node["Google Drive Trigger"].json["id"]}}
para obtener el ID dinámicamente
Paso 5: Configuración de Pinecone
Crear Índice en Pinecone
- Ir a Pinecone y crear cuenta
- Crear nuevo índice:
- Nombre: «goldsmith» (en minúsculas)
- Dimensiones: 1536 (para embeddings de OpenAI)
- Métrica: cosine
- Obtener API Key desde el dashboard
Configuración del Nodo Pinecone
- Agregar nodo Pinecone Vector Store
- Operación: «Insert documents»
- Índice: seleccionar «goldsmith»
- Namespace: «qa» (para organizar los datos)
- Configurar embeddings OpenAI:
- Modelo: «text-embedding-3-small»
- API Key de OpenAI
Paso 6: Procesamiento de Documentos
- Document Loader: configurar para «Load all input data»
- Text Splitter: usar «Recursive Character Text Splitter»
- Chunk size: 500
- Overlap: 20
Paso 7: Prueba del Workflow
- Guardar workflow con nombre «Goldsmith to Pinecone»
- Activar workflow para que funcione automáticamente
- Probar subiendo el archivo Q&A a Google Drive
- Verificar en Pinecone que se crearon los vectores (deberías ver ~7 registros)
Construcción del Bot de Chat RAG
Paso 8: Configuración del Agente AI
- Crear nuevo workflow
- Agregar nodo AI Agent con «Chat Trigger»
- Configurar modelo de chat:
- Proveedor: OpenAI
- Modelo: GPT-4 Omni (balance entre rendimiento y costo)
- Agregar memoria:
- Tipo: Window Buffer Memory
- Tamaño: 12 mensajes
Paso 9: Herramienta de Vector Store
- Agregar herramienta Vector Store Q&A:
- Nombre: «goldsmith_qa»
- Descripción: «Proporciona respuestas relacionadas con la empresa Gold Digger»
- Configurar Pinecone Vector Store:
- Operación: «Retrieve documents»
- Índice: «goldsmith»
- Namespace: «qa»
- Embeddings: OpenAI text-embedding-3-small
Paso 10: Prompt del Sistema
PAPEL: Eres un asistente amigable para una joyería llamada Gold Digger.
TAREA: Respondes preguntas sobre el negocio y capturas información de leads.
HERRAMIENTAS:
- goldsmith_qa: Usa esta herramienta para responder preguntas con conocimiento sobre la empresa
- sheets: Usa esta herramienta para almacenar información de contacto como nombre, email, intereses y teléfono
COMPORTAMIENTO:
Después de que un cliente pregunte sobre horarios, productos o información del negocio, solicita su nombre, email, intereses específicos y número de teléfono de manera natural y amigable.
Integración con Google Sheets para Captura de Leads
Paso 11: Configuración de Google Sheets
- Crear nueva hoja en Google Sheets llamada «Gold Digger Leads»
- Agregar columnas: Nombre | Teléfono | Email | Interesado en
- Configurar herramienta Google Sheets en n8n:
- Operación: «Append row»
- Documento: «Gold Digger Leads»
- Mapeo manual de campos
Paso 12: Pruebas del Sistema Completo
Prueba 1: Funcionalidad Básica
Usuario: "Hola"
Bot: "¡Hola! ¿Cómo puedo ayudarte hoy? ¿Buscas información sobre productos, servicios o algo más de Gold Digger?"
Usuario: "¿Ofrecen pedidos online?"
Bot: [Busca en vector store] "Sí, puedes navegar y comprar piezas seleccionadas en nuestra tienda online..."
Usuario: "Creo que visitaré la tienda. ¿Cuál es la ubicación?"
Bot: [Proporciona ubicación] "¿Podrías proporcionarme tu nombre, email, intereses específicos y número de teléfono?"
Usuario: "Mi nombre es Arnold, teléfono 555-1234, email arnie@email.com, estoy interesado en anillos de oro"
Bot: [Guarda en Google Sheets] "¡Gracias Arnold! Hemos guardado tu información..."
Prueba 2: Extracción Compleja
Usuario: "Me encanta la experiencia. Mi nombre es Igor Small, quiero un anillo grande con mi nombre grabado en letras gruesas. Mi email es igor@email.com y la gente me llama al 555-9876"
Bot: [Extrae automáticamente] Nombre: Igor Small, Teléfono: 555-9876, Email: igor@email.com, Interés: Anillo grande con nombre grabado en letras gruesas
Actualización Automática del Conocimiento
Paso 13: Agregar Nuevos Datos
- Crear archivo «Product Line.txt» con información adicional sobre productos para bodas
- Subir a Google Drive – el sistema detectará automáticamente el nuevo archivo
- Verificar en Pinecone que se agregaron nuevos vectores
- Probar el bot con preguntas sobre productos para bodas
Ejemplo de datos de productos:
LÍNEA DE PRODUCTOS - GOLD DIGGER
Colección de Bodas:
- Anillos de compromiso personalizados
- Bandas de matrimonio con grabado
- Anillos de oro clásicos 14K
- Collares con dije de diamante
- Pulseras de oro para parejas
Servicios Especiales:
- Grabado personalizado gratuito
- Diseño de piezas únicas
- Consultas de diseño
Beneficios del Sistema
Para el Negocio:
- Captura automática de leads sin intervención manual
- Base de conocimiento actualizable en tiempo real
- Respuestas consistentes 24/7
- Seguimiento organizado de clientes potenciales
Para los Clientes:
- Respuestas inmediatas a preguntas frecuentes
- Información actualizada sobre productos y servicios
- Experiencia personalizada con memoria de conversación
Mejores Prácticas
Optimización de Embeddings:
- Usa chunks de 500-1000 caracteres para mejor precisión
- Mantén overlap de 20-50 caracteres entre chunks
- Organiza el contenido en namespaces lógicos
Gestión de Leads:
- Solicita información de contacto después de mostrar interés genuino
- Usa lenguaje natural para la extracción de datos
- Valida que la información capturada sea precisa
Mantenimiento:
- Revisa regularmente la base de datos de vectores
- Actualiza el prompt del sistema según feedback de usuarios
- Monitorea las métricas de conversión de leads
Conclusión
Has creado exitosamente un bot RAG completo que combina:
- Búsqueda inteligente en base de conocimiento vectorizada
- Captura automática de leads con IA
- Actualización dinámica de contenido
- Integración perfecta entre múltiples servicios
Este sistema puede escalarse fácilmente agregando más fuentes de datos, herramientas adicionales, o integrándose con CRM y sistemas de marketing automation.
En la próxima lección exploraremos cómo expandir las capacidades del bot agregando más herramientas y funcionalidades avanzadas.