Curso RAG Agents: Construye Aplicaciones y GPTs con APIs, MCP, LangChain y n8n

0 de 63 lecciones completas (0%)

3- Práctica con RAG usando ChatGPT y GPTs Personalizados

3.6- Usando un Archivo CSV como Fuente de Datos para un Bot RAG

No tienes acceso a esta lección

Por favor, inscríbete o accede para acceder al contenido del curso.

En esta lección aprenderemos a crear una aplicación RAG (Retrieval-Augmented Generation) utilizando archivos CSV como fuente de datos. Esta técnica es extremadamente útil para:

  • Empresas de e-commerce que manejan miles de productos
  • Negocios que quieren entrenar un GPT personalizado para sus clientes
  • Integración en páginas web para que los usuarios puedan consultar información de productos

¿Por qué es importante esta técnica?

Imagina que tienes una empresa de comercio electrónico con miles de productos diferentes. Sería increíblemente útil tener un chatbot que pueda responder preguntas específicas sobre tu inventario. Más adelante, cuando trabajemos con APIs, podremos integrar este tipo de chatbot directamente en páginas web para que los clientes puedan hacer consultas en tiempo real.

Preparando los Datos CSV

1. Estructura del archivo CSV

Para este ejemplo, utilizaremos un archivo CSV con la siguiente estructura:

  • ID del producto
  • Nombre del producto
  • Categoría
  • Descripción
  • Precio

Ejemplo de datos:

ID, Producto, Categoría, Descripción, Precio
1, Licuadora, Electrónicos, Licuadora de alta calidad para uso diario, 212.98
2, Champú, Cuidado Personal, Champú de alta calidad para uso diario, 15.50

2. Convertir CSV a Markdown

¿Por qué convertir a Markdown? Aunque es posible subir archivos CSV directamente, los modelos de lenguaje (LLM) a veces tienen dificultades para leer cada línea perfectamente. El formato Markdown es mucho más claro y estructurado para los LLMs.

Pasos para la conversión:

  1. Busca en Google: «CSV to Markdown converter»
  2. Utiliza herramientas online: La mayoría de conversores gratuitos funcionan perfectamente
  3. Proceso simple:
    • Selecciona «Choose file» o «Subir archivo»
    • Carga tu archivo CSV
    • Mantén la codificación por defecto
    • Copia el resultado en formato Markdown

El resultado será una tabla perfectamente estructurada que el LLM puede interpretar sin problemas.

Creando el GPT Personalizado

1. Configuración inicial

  1. Accede a ChatGPT y ve a «My GPTs»
  2. Crea un nuevo GPT haciendo clic en «Create»
  3. Configura los parámetros básicos:
    • Nombre: «Asistente de Productos»
    • Descripción: «Ayuda con información de productos»

2. Prompt del sistema

Utiliza este prompt simple pero efectivo:

Tienes productos con descripción, precio e ID en tu base de conocimientos. 
Ayúdame a encontrar la información correcta sobre los productos.

3. Configuración de capacidades

Activar:

  • Subida de archivos (para cargar los datos)
  • Code Interpreter (opcional, pero recomendado)

Desactivar:

  • Búsqueda web
  • Canvas
  • DALL-E

4. Subir los datos

  1. Carga el archivo: Sube tu archivo de texto con los datos en Markdown
  2. Configuración de privacidad: Desactiva «Use conversation data to improve our models» si no quieres que ChatGPT entrene con tus datos comerciales
  3. Guarda y publica: Puedes mantenerlo privado o compartirlo con un enlace

Probando el Sistema

Ejemplos de consultas

Una vez configurado, puedes hacer preguntas como:

Consulta de precios:

  • «¿Cuánto cuesta la licuadora?»
  • Respuesta esperada: «La licuadora cuesta $212.98»

Búsqueda por ID:

  • «¿Qué es el producto número 44?»
  • El sistema buscará en la base de datos y te dará la información completa

Consultas por categoría:

  • «¿Qué libros tienes disponibles?»
  • El sistema identificará todos los productos de la categoría «libros»

Descripción detallada:

  • «¿Cuál es la descripción del producto número 9?»
  • Obtendrás la descripción completa del producto específico

Ventajas de este Método

1. Precisión en los datos

El LLM está obligado a usar únicamente los datos que has subido, garantizando respuestas precisas y actualizadas.

2. Flexibilidad

Funciona incluso con datos que pueden parecer inconsistentes. Por ejemplo, si tienes productos con nombres poco convencionales, el sistema los manejará correctamente.

3. Escalabilidad

Puedes manejar desde pequeños inventarios hasta catálogos con miles de productos.

4. Facilidad de actualización

Simplemente actualiza tu archivo CSV, conviértelo a Markdown y reemplaza los datos en tu GPT.

Casos de Uso Prácticos

Para E-commerce

  • Atención al cliente automatizada
  • Búsqueda de productos por características
  • Comparación de precios y especificaciones

Para Empresas B2B

  • Catálogos de servicios
  • Información técnica de productos
  • Consultas de disponibilidad y precios

Para Sitios Web

  • Chatbots integrados
  • Asistentes de compra
  • Soporte técnico automatizado

Próximos Pasos

En las siguientes lecciones aprenderemos:

  1. Integración por API: Cómo conectar este sistema a páginas web
  2. Automatización con n8n: Workflows para actualizar datos automáticamente
  3. Mejoras avanzadas: Técnicas para optimizar las respuestas del chatbot

Consejos Importantes

✅ Mejores Prácticas

  • Siempre convierte CSV a Markdown para mejores resultados
  • Mantén los datos estructurados y consistentes
  • Usa descripciones claras en tu prompt del sistema
  • Prueba diferentes tipos de consultas antes de publicar

⚠️ Consideraciones de Privacidad

  • Desactiva el entrenamiento si manejas datos comerciales sensibles
  • Controla el acceso decidiendo si el GPT es privado o público
  • Revisa los datos antes de subirlos para evitar información confidencial

Resumen

Esta técnica te permite crear rápidamente un asistente inteligente basado en tus propios datos comerciales. Es una solución potente, escalable y relativamente simple de implementar, perfecta para empresas que quieren aprovechar la IA para mejorar la experiencia de sus clientes.

La clave del éxito está en la preparación adecuada de los datos y en escribir prompts claros que guíen al sistema hacia las respuestas que necesitas.

Resumen de privacidad
Logo JeroCuevas.com

Esta web utiliza cookies para que podamos ofrecerte la mejor experiencia de usuario posible. La información de las cookies se almacena en tu navegador y realiza funciones tales como reconocerte cuando vuelves a nuestra web o ayudar a nuestro equipo a comprender qué secciones de la web encuentras más interesantes y útiles.

Cookies de terceros

Esta web utiliza Google Analytics para recopilar información anónima tal como el número de visitantes del sitio, o las páginas más populares.

Dejar esta cookie activa nos permite mejorar nuestra web.