En esta lección aprenderemos a crear una aplicación RAG (Retrieval-Augmented Generation) utilizando archivos CSV como fuente de datos. Esta técnica es extremadamente útil para:
- Empresas de e-commerce que manejan miles de productos
- Negocios que quieren entrenar un GPT personalizado para sus clientes
- Integración en páginas web para que los usuarios puedan consultar información de productos
¿Por qué es importante esta técnica?
Imagina que tienes una empresa de comercio electrónico con miles de productos diferentes. Sería increíblemente útil tener un chatbot que pueda responder preguntas específicas sobre tu inventario. Más adelante, cuando trabajemos con APIs, podremos integrar este tipo de chatbot directamente en páginas web para que los clientes puedan hacer consultas en tiempo real.
Preparando los Datos CSV
1. Estructura del archivo CSV
Para este ejemplo, utilizaremos un archivo CSV con la siguiente estructura:
- ID del producto
- Nombre del producto
- Categoría
- Descripción
- Precio
Ejemplo de datos:
ID, Producto, Categoría, Descripción, Precio
1, Licuadora, Electrónicos, Licuadora de alta calidad para uso diario, 212.98
2, Champú, Cuidado Personal, Champú de alta calidad para uso diario, 15.50
2. Convertir CSV a Markdown
¿Por qué convertir a Markdown? Aunque es posible subir archivos CSV directamente, los modelos de lenguaje (LLM) a veces tienen dificultades para leer cada línea perfectamente. El formato Markdown es mucho más claro y estructurado para los LLMs.
Pasos para la conversión:
- Busca en Google: «CSV to Markdown converter»
- Utiliza herramientas online: La mayoría de conversores gratuitos funcionan perfectamente
- Proceso simple:
- Selecciona «Choose file» o «Subir archivo»
- Carga tu archivo CSV
- Mantén la codificación por defecto
- Copia el resultado en formato Markdown
El resultado será una tabla perfectamente estructurada que el LLM puede interpretar sin problemas.
Creando el GPT Personalizado
1. Configuración inicial
- Accede a ChatGPT y ve a «My GPTs»
- Crea un nuevo GPT haciendo clic en «Create»
- Configura los parámetros básicos:
- Nombre: «Asistente de Productos»
- Descripción: «Ayuda con información de productos»
2. Prompt del sistema
Utiliza este prompt simple pero efectivo:
Tienes productos con descripción, precio e ID en tu base de conocimientos.
Ayúdame a encontrar la información correcta sobre los productos.
3. Configuración de capacidades
Activar:
- Subida de archivos (para cargar los datos)
- Code Interpreter (opcional, pero recomendado)
Desactivar:
- Búsqueda web
- Canvas
- DALL-E
4. Subir los datos
- Carga el archivo: Sube tu archivo de texto con los datos en Markdown
- Configuración de privacidad: Desactiva «Use conversation data to improve our models» si no quieres que ChatGPT entrene con tus datos comerciales
- Guarda y publica: Puedes mantenerlo privado o compartirlo con un enlace
Probando el Sistema
Ejemplos de consultas
Una vez configurado, puedes hacer preguntas como:
Consulta de precios:
- «¿Cuánto cuesta la licuadora?»
- Respuesta esperada: «La licuadora cuesta $212.98»
Búsqueda por ID:
- «¿Qué es el producto número 44?»
- El sistema buscará en la base de datos y te dará la información completa
Consultas por categoría:
- «¿Qué libros tienes disponibles?»
- El sistema identificará todos los productos de la categoría «libros»
Descripción detallada:
- «¿Cuál es la descripción del producto número 9?»
- Obtendrás la descripción completa del producto específico
Ventajas de este Método
1. Precisión en los datos
El LLM está obligado a usar únicamente los datos que has subido, garantizando respuestas precisas y actualizadas.
2. Flexibilidad
Funciona incluso con datos que pueden parecer inconsistentes. Por ejemplo, si tienes productos con nombres poco convencionales, el sistema los manejará correctamente.
3. Escalabilidad
Puedes manejar desde pequeños inventarios hasta catálogos con miles de productos.
4. Facilidad de actualización
Simplemente actualiza tu archivo CSV, conviértelo a Markdown y reemplaza los datos en tu GPT.
Casos de Uso Prácticos
Para E-commerce
- Atención al cliente automatizada
- Búsqueda de productos por características
- Comparación de precios y especificaciones
Para Empresas B2B
- Catálogos de servicios
- Información técnica de productos
- Consultas de disponibilidad y precios
Para Sitios Web
- Chatbots integrados
- Asistentes de compra
- Soporte técnico automatizado
Próximos Pasos
En las siguientes lecciones aprenderemos:
- Integración por API: Cómo conectar este sistema a páginas web
- Automatización con n8n: Workflows para actualizar datos automáticamente
- Mejoras avanzadas: Técnicas para optimizar las respuestas del chatbot
Consejos Importantes
✅ Mejores Prácticas
- Siempre convierte CSV a Markdown para mejores resultados
- Mantén los datos estructurados y consistentes
- Usa descripciones claras en tu prompt del sistema
- Prueba diferentes tipos de consultas antes de publicar
⚠️ Consideraciones de Privacidad
- Desactiva el entrenamiento si manejas datos comerciales sensibles
- Controla el acceso decidiendo si el GPT es privado o público
- Revisa los datos antes de subirlos para evitar información confidencial
Resumen
Esta técnica te permite crear rápidamente un asistente inteligente basado en tus propios datos comerciales. Es una solución potente, escalable y relativamente simple de implementar, perfecta para empresas que quieren aprovechar la IA para mejorar la experiencia de sus clientes.
La clave del éxito está en la preparación adecuada de los datos y en escribir prompts claros que guíen al sistema hacia las respuestas que necesitas.