En esta sección necesitamos cubrir algunos conceptos fundamentales. Esto es realmente muy importante. Si ya entiendes todos estos fundamentos, por supuesto puedes saltar una lección o incluso toda la sección. Pero escúchame bien: si no entiendes algo de lo que veremos aquí, tendría sentido que veas esta lección, tal vez una vez más, o simplemente para refrescarlo, porque necesitaremos estos conocimientos más adelante.
Lo que aprenderemos paso a paso:
Primero hablamos sobre los LLMs (Grandes Modelos de Lenguaje). Básicamente, qué es un LLM, cómo se entrenan y cómo funcionan.
Luego necesitamos hablar sobre el «function calling» (llamado de funciones): cómo pueden los LLMs usar herramientas externas como bases de datos vectoriales y darles estos superpoderes.
Después profundizamos en mayor detalle sobre cómo funciona una base de datos vectorial, qué son los modelos de embeddings, los chunks (fragmentos) y los resultados top k. Necesitas entender todo esto para tener una visión completa del panorama.
Por supuesto, necesitas entender qué es una API.
Luego hablamos sobre algunos conceptos básicos de ChatGPT: la interfaz estándar, la tienda de GPTs, cómo construir tus propios GPTs, la búsqueda web, investigación profunda, canvas, system prompts (instrucciones del sistema) y más.
Y por supuesto necesitamos hablar sobre todos los diferentes modelos: modelos con y sin «test time compute» (computación en tiempo de prueba), como por ejemplo la serie O3 o O4 de ChatGPT. También hablaremos brevemente sobre el playground de OpenAI.
¿Por qué son tan importantes estos fundamentos?
Estos son conceptos completamente básicos, pero escúchame: estos fundamentos necesitan estar bien dominados. Si ya entiendes todo esto – si sabes cómo funcionan las bases de datos vectoriales, qué son los chunks, cómo funcionan los modelos de embeddings, qué son los resultados top k, cómo funcionan los LLMs y conoces todos los conceptos básicos de ChatGPT – puedes saltarte esta sección.
Pero si no es así, por favor simplemente mírala, porque será importante. Más adelante, tan pronto como hablemos sobre APIs, resultados top k, chunking, longitud y demás, necesitarás esta información como base sólida.
En resumen: Esta sección construye los cimientos sobre los que se apoyará todo el curso. No subestimes la importancia de dominar estos conceptos básicos.