6.6- Bot RAG para Generación de Leads con n8n, Pinecone y Google Sheets

Introducción

En esta lección aprenderás a crear un bot RAG (Recuperación y Generación Aumentada) completamente funcional que no solo brinda soporte al cliente, sino que también captura automáticamente información de leads potenciales. Este bot será capaz de:

Responder preguntas sobre tu negocio usando información almacenada en Pinecone
Capturar automáticamente datos de contacto (nombre, email, teléfono, intereses)
Almacenar los leads en Google Sheets para seguimiento posterior
Actualizarse automáticamente cuando agregues nuevos documentos a Google Drive

Configuración Inicial del Proyecto

Paso 1: Limpieza del Workspace

Comenzaremos eliminando cualquier workflow existente y creando uno nuevo desde cero. Esto nos permitirá construir un sistema limpio y organizado.

Paso 2: Configuración de Google Drive como Trigger

Conexión con Google Drive

Crear nuevo workflow y presionar el botón «+»
Seleccionar Google Drive como nodo trigger
Elegir «On changes involving a specific folder» – esto monitoreará una carpeta específica cada minuto

Configuración de Credenciales Google Cloud

Si usas n8n en la nube, puedes conectarte directamente con Google. Para instalaciones locales, necesitarás configurar Google Cloud Console:

Configuración en Google Cloud Console:

Ir a Google Cloud Console
Crear nuevo proyecto (ej: «N8N drive test»)
Navegar a «APIs and Services» → «Library»
Buscar y activar «Google Drive API»
Configurar «OAuth consent screen»:
- Tipo: Externo
- Nombre: «N8N drive»
- Email: tu email
- Agregar usuarios de prueba (tu email)
Crear credenciales OAuth 2.0:
- Tipo: Aplicación web
- Agregar URL de redirección de n8n
- Copiar Client ID y Client Secret a n8n

Configuración del Folder

Crear carpeta en Google Drive llamada «RagApplication»
Seleccionar la carpeta en el configurador de n8n
Configurar «Watch for file created» para detectar nuevos archivos

Paso 3: Preparación de Datos de Ejemplo

Para este tutorial, crearemos datos de ejemplo para una joyería ficticia llamada «Gold Digger Company»:

Contenido del archivo Q&A:

PREGUNTAS FRECUENTES - GOLD DIGGER COMPANY

Información General:
- Teléfono: +1-555-GOLD-123
- Email: info@golddigger.com
- Sitio web: www.golddigger.com
- Ubicación: 123 Goldsmith Avenue, Gold City

Productos:
- Trabajamos con oro 14K y 18K
- Especialidad en anillos personalizados
- Creamos piezas únicas para bodas

Política de Devoluciones:
- Las piezas personalizadas no son reembolsables
- Productos estándar: reembolso en 14 días si están sin usar

Pedidos Online:
- Sí, ofrecemos tienda online en www.golddigger.com/store

Guarda este contenido en un archivo de texto llamado «Q&A Gold Digger.txt» y súbelo a tu carpeta de Google Drive.

Construcción del Workflow de Pinecone

Paso 4: Descarga de Archivos

Agregar nodo Google Drive → «Download file»
Configurar por ID usando el ID del archivo del trigger anterior
Usar expresión {{$node["Google Drive Trigger"].json["id"]}} para obtener el ID dinámicamente

Paso 5: Configuración de Pinecone

Crear Índice en Pinecone

Ir a Pinecone y crear cuenta
Crear nuevo índice:
- Nombre: «goldsmith» (en minúsculas)
- Dimensiones: 1536 (para embeddings de OpenAI)
- Métrica: cosine
Obtener API Key desde el dashboard

Configuración del Nodo Pinecone

Agregar nodo Pinecone Vector Store
Operación: «Insert documents»
Índice: seleccionar «goldsmith»
Namespace: «qa» (para organizar los datos)
Configurar embeddings OpenAI:
- Modelo: «text-embedding-3-small»
- API Key de OpenAI

Paso 6: Procesamiento de Documentos

Document Loader: configurar para «Load all input data»
Text Splitter: usar «Recursive Character Text Splitter»
- Chunk size: 500
- Overlap: 20

Paso 7: Prueba del Workflow

Guardar workflow con nombre «Goldsmith to Pinecone»
Activar workflow para que funcione automáticamente
Probar subiendo el archivo Q&A a Google Drive
Verificar en Pinecone que se crearon los vectores (deberías ver ~7 registros)

Construcción del Bot de Chat RAG

Paso 8: Configuración del Agente AI

Crear nuevo workflow
Agregar nodo AI Agent con «Chat Trigger»
Configurar modelo de chat:
- Proveedor: OpenAI
- Modelo: GPT-4 Omni (balance entre rendimiento y costo)
Agregar memoria:
- Tipo: Window Buffer Memory
- Tamaño: 12 mensajes

Paso 9: Herramienta de Vector Store

Agregar herramienta Vector Store Q&A:
- Nombre: «goldsmith_qa»
- Descripción: «Proporciona respuestas relacionadas con la empresa Gold Digger»
Configurar Pinecone Vector Store:
- Operación: «Retrieve documents»
- Índice: «goldsmith»
- Namespace: «qa»
- Embeddings: OpenAI text-embedding-3-small

Paso 10: Prompt del Sistema

PAPEL: Eres un asistente amigable para una joyería llamada Gold Digger.

TAREA: Respondes preguntas sobre el negocio y capturas información de leads.

HERRAMIENTAS:
- goldsmith_qa: Usa esta herramienta para responder preguntas con conocimiento sobre la empresa
- sheets: Usa esta herramienta para almacenar información de contacto como nombre, email, intereses y teléfono

COMPORTAMIENTO:
Después de que un cliente pregunte sobre horarios, productos o información del negocio, solicita su nombre, email, intereses específicos y número de teléfono de manera natural y amigable.

Integración con Google Sheets para Captura de Leads

Paso 11: Configuración de Google Sheets

Crear nueva hoja en Google Sheets llamada «Gold Digger Leads»
Agregar columnas: Nombre | Teléfono | Email | Interesado en
Configurar herramienta Google Sheets en n8n:
- Operación: «Append row»
- Documento: «Gold Digger Leads»
- Mapeo manual de campos

Paso 12: Pruebas del Sistema Completo

Prueba 1: Funcionalidad Básica

Usuario: "Hola"
Bot: "¡Hola! ¿Cómo puedo ayudarte hoy? ¿Buscas información sobre productos, servicios o algo más de Gold Digger?"

Usuario: "¿Ofrecen pedidos online?"
Bot: [Busca en vector store] "Sí, puedes navegar y comprar piezas seleccionadas en nuestra tienda online..."

Usuario: "Creo que visitaré la tienda. ¿Cuál es la ubicación?"
Bot: [Proporciona ubicación] "¿Podrías proporcionarme tu nombre, email, intereses específicos y número de teléfono?"

Usuario: "Mi nombre es Arnold, teléfono 555-1234, email arnie@email.com, estoy interesado en anillos de oro"
Bot: [Guarda en Google Sheets] "¡Gracias Arnold! Hemos guardado tu información..."

Prueba 2: Extracción Compleja

Usuario: "Me encanta la experiencia. Mi nombre es Igor Small, quiero un anillo grande con mi nombre grabado en letras gruesas. Mi email es igor@email.com y la gente me llama al 555-9876"
Bot: [Extrae automáticamente] Nombre: Igor Small, Teléfono: 555-9876, Email: igor@email.com, Interés: Anillo grande con nombre grabado en letras gruesas

Actualización Automática del Conocimiento

Paso 13: Agregar Nuevos Datos

Crear archivo «Product Line.txt» con información adicional sobre productos para bodas
Subir a Google Drive – el sistema detectará automáticamente el nuevo archivo
Verificar en Pinecone que se agregaron nuevos vectores
Probar el bot con preguntas sobre productos para bodas

Ejemplo de datos de productos:

LÍNEA DE PRODUCTOS - GOLD DIGGER

Colección de Bodas:
- Anillos de compromiso personalizados
- Bandas de matrimonio con grabado
- Anillos de oro clásicos 14K
- Collares con dije de diamante
- Pulseras de oro para parejas

Servicios Especiales:
- Grabado personalizado gratuito
- Diseño de piezas únicas
- Consultas de diseño

Beneficios del Sistema

Para el Negocio:

Captura automática de leads sin intervención manual
Base de conocimiento actualizable en tiempo real
Respuestas consistentes 24/7
Seguimiento organizado de clientes potenciales

Para los Clientes:

Respuestas inmediatas a preguntas frecuentes
Información actualizada sobre productos y servicios
Experiencia personalizada con memoria de conversación

Mejores Prácticas

Optimización de Embeddings:

Usa chunks de 500-1000 caracteres para mejor precisión
Mantén overlap de 20-50 caracteres entre chunks
Organiza el contenido en namespaces lógicos

Gestión de Leads:

Solicita información de contacto después de mostrar interés genuino
Usa lenguaje natural para la extracción de datos
Valida que la información capturada sea precisa

Mantenimiento:

Revisa regularmente la base de datos de vectores
Actualiza el prompt del sistema según feedback de usuarios
Monitorea las métricas de conversión de leads

Conclusión

Has creado exitosamente un bot RAG completo que combina:

Búsqueda inteligente en base de conocimiento vectorizada
Captura automática de leads con IA
Actualización dinámica de contenido
Integración perfecta entre múltiples servicios

Este sistema puede escalarse fácilmente agregando más fuentes de datos, herramientas adicionales, o integrándose con CRM y sistemas de marketing automation.

En la próxima lección exploraremos cómo expandir las capacidades del bot agregando más herramientas y funcionalidades avanzadas.

Curso RAG Agents: Construye Aplicaciones y GPTs con APIs, MCP, LangChain y n8n

6- Construyendo Chatbots y Agentes RAG con n8n

6.6- Bot RAG para Generación de Leads con n8n, Pinecone y Google Sheets

Introducción

Configuración Inicial del Proyecto

Paso 1: Limpieza del Workspace

Paso 2: Configuración de Google Drive como Trigger

Conexión con Google Drive

Configuración de Credenciales Google Cloud

Configuración del Folder

Paso 3: Preparación de Datos de Ejemplo

Construcción del Workflow de Pinecone

Paso 4: Descarga de Archivos

Paso 5: Configuración de Pinecone

Crear Índice en Pinecone

Configuración del Nodo Pinecone

Paso 6: Procesamiento de Documentos

Paso 7: Prueba del Workflow

Construcción del Bot de Chat RAG

Paso 8: Configuración del Agente AI

Paso 9: Herramienta de Vector Store

Paso 10: Prompt del Sistema

Integración con Google Sheets para Captura de Leads

Paso 11: Configuración de Google Sheets

Paso 12: Pruebas del Sistema Completo

Prueba 1: Funcionalidad Básica

Prueba 2: Extracción Compleja

Actualización Automática del Conocimiento

Paso 13: Agregar Nuevos Datos

Beneficios del Sistema

Para el Negocio:

Para los Clientes:

Mejores Prácticas

Optimización de Embeddings:

Gestión de Leads:

Mantenimiento:

Conclusión