Generar credenciales

0 de 5 lecciones completas (0%)

Cómo crear credenciales de ElevenLabs: Convierte tu Agente de IA en un Asistente de Voz con n8n y ElevenLabs

¡Hola! Hoy vamos a darle voz a nuestros agentes de IA. Veremos dos formas de hacerlo con n8n y ElevenLabs para que la experiencia sea mucho más chula y natural. Una será para enviar y recibir audios, y la otra para tener una conversación en tiempo real. ¡Es súper fácil, vamos a ello! 🎤


Método 1: Enviar y Recibir Audios (Asíncrono)

En este primer caso, le enviaremos un archivo de voz a nuestro agente, él lo procesará y nos devolverá otro archivo de voz como respuesta. No es una conversación en directo, sino un intercambio de audios. Usaremos Telegram para este ejemplo.

  1. Recibir el Mensaje de Voz:
    • Empezamos con un nodo Telegram Trigger. Lo configuramos para que se active On message received. Enlace a la lección donde explico como generar las credenciales de Telegram.
    • Ejecutamos el nodo para que se quede «escuchando» y, desde Telegram, enviamos una nota de voz al bot.
    • Al recibirlo, n8n nos mostrará en la salida del nodo un archivo de voz (normalmente en formato audio/ogg).
  2. Descargar y Transcribir el Audio:
    • Necesitamos convertir esa voz a texto. Primero, añadimos otro nodo de Telegram y usamos la acción Get a File para descargar el audio. Solo tenemos que arrastrar el file_id del primer nodo a este.
    • Ahora, usamos el nodo de ElevenLabs. Si no lo ves, asegúrate de tener una versión de n8n actualizada y busca e instala el nodo desde la sección de «Community Nodes».
    • Dentro de ElevenLabs, elegimos la acción Transcribe audio or video.
  3. Configurar ElevenLabs (API Key):
    • El nodo te pedirá una API Key. Para conseguirla:
      • Ve a la web de ElevenLabs y crea una cuenta (puedes empezar gratis).
      • En tu perfil, busca la sección de API Keys y crea una nueva.
      • Dale los permisos que necesites (para este caso, text-to-speech y speech-to-speech).
      • Copia la clave y guárdala bien, porque solo se muestra una vez.
      • Pégala en la credencial de n8n y guarda. ¡Ya está conectado!
    • Ahora, ejecuta el nodo de transcripción. Verás cómo convierte tu audio en texto plano.
  4. Procesar el Texto con un Agente de IA:
    • Añadimos un nodo AI Agent.
    • En User Message, seleccionamos Define below y arrastramos el texto transcrito del nodo de ElevenLabs.
    • Le damos una personalidad con un System Prompt (ej: «Eres un asistente muy gracioso»).
    • Conectamos un modelo de lenguaje (como OpenRouter, OpenAI, etc.) para que el agente tenga «cerebro».
    • Ejecutamos el agente. Verás que genera una respuesta en texto basada en tu audio.
  5. Convertir la Respuesta a Voz y Enviarla de Vuelta:
    • Añadimos otro nodo de ElevenLabs, pero esta vez con la acción Convert text to speech.
    • Arrastramos la respuesta de texto del agente de IA al campo Text.
    • Elegimos una voz. Puedes seleccionarla de una lista o, si tienes una voz específica de ElevenLabs que te gusta, puedes copiar su Voice ID desde la web y pegarla directamente.
    • Ejecutamos el nodo y ¡magia! Ya tenemos un archivo de audio con la respuesta.
    • Finalmente, añadimos un nodo de Telegram con la acción Send an Audio File.
      • Necesitamos decirle a quién enviarlo. Arrastramos el Chat ID del primer nodo (el trigger).
      • Le indicamos que vamos a enviar datos binarios (Binary Data). Automáticamente buscará el archivo de audio del paso anterior.
    • Ejecutamos este último paso y recibirás el audio en tu chat de Telegram.

¡Y ya está! Ahora solo tienes que activar el workflow para que funcione de forma autónoma.


Método 2: Conversación en Tiempo Real con un Agente de Voz de ElevenLabs

Ahora vamos a lo más emocionante: una conversación fluida y en tiempo real. Esto lo configuraremos principalmente desde la web de ElevenLabs.

  1. Crear un Agente de Voz en ElevenLabs:
    • En ElevenLabs, ve a la sección de Agentes (Conversational AI).
    • Crea un nuevo agente desde cero. Ponle un nombre, como Agente de Prueba.
    • Aquí puedes configurar su voz, el primer mensaje que dirá, etc.
  2. Conectar n8n como una Herramienta (Tool Calling):
    • La clave está en la sección de «Tools». Queremos que nuestro agente de voz pueda «llamar» a n8n para hacer cosas, como buscar información.
    • Añadimos una Custom Tool de tipo Add Webhook Tool.
      • Le damos un nombre (ej: n8n) y una descripción (ej: «Usa esta herramienta para buscar en la web»).
      • El método será POST, porque enviaremos datos.
      • Ahora necesitamos una URL de n8n.
  3. Configurar el Webhook en n8n:
    • En un nuevo workflow de n8n, añade un nodo Webhook.
    • Cambia su método a POST.
    • Copia la URL de prueba (Test URL) que te proporciona.
    • Pega esa URL en la configuración de la herramienta en ElevenLabs.
    • En ElevenLabs, dentro de la herramienta, añade un Body Parameter. Este será el dato que enviaremos a n8n. Por ejemplo, llámalo searchQuery y descríbelo como «lo que el usuario quiere buscar online».
  4. Darle «Inteligencia» al Agente de Voz:
    • Vuelve a la configuración del agente en ElevenLabs y edita su System Prompt.
    • Puedes usar la función de «Describir con IA» o escribirlo tú mismo. Dile al agente cómo debe comportarse y, muy importante, que use la herramienta n8n cuando necesite buscar información.
    • Guarda los cambios.
  5. Probar la Conversación:
    • En n8n, pon a «escuchar» tu webhook (Execute Node).
    • En ElevenLabs, usa la función de «Test AI Agent». Se abrirá una ventana para que puedas hablar con él.
    • Inicia una conversación y pídele que busque algo. Por ejemplo: «Busca la diferencia entre perros y gatos».
    • Verás cómo el agente de voz identifica la petición, llama al webhook de n8n y le pasa la consulta (searchQuery).
  6. Procesar la Petición en n8n y Devolver la Respuesta:
    • El webhook en n8n habrá recibido la consulta.
    • Ahora, en lugar de usar otro agente de IA completo (sería redundante), usamos un nodo que vaya directo al grano. Por ejemplo, el nodo de Perplexity para hacer una búsqueda online. Le pasamos el searchQuery.
    • La respuesta de Perplexity puede ser larga. Para hacerla más natural, podemos pasarla por un nodo AI Agent con un simple prompt: «Resume esta información en tres frases».
    • Finalmente, añadimos un nodo Respond to Webhook. Este nodo enviará la respuesta resumida de vuelta al agente de voz de ElevenLabs.
    • ¡Importante! En el nodo Webhook inicial de n8n, asegúrate de cambiar la opción Respond a Using 'Respond to Webhook' node.
  7. Puesta en Producción:
    • Una vez que todo funcione, activa tu workflow en n8n.
    • Copia la URL de producción (Production URL) del webhook.
    • Vuelve a la configuración de la herramienta en ElevenLabs y sustituye la URL de prueba por la de producción.

¡Y eso es todo! Ahora tienes un asistente de voz súper potente con el que puedes mantener conversaciones fluidas. ¡A disfrutar! 🎉

Resumen de privacidad
Logo JeroCuevas.com

Esta web utiliza cookies para que podamos ofrecerte la mejor experiencia de usuario posible. La información de las cookies se almacena en tu navegador y realiza funciones tales como reconocerte cuando vuelves a nuestra web o ayudar a nuestro equipo a comprender qué secciones de la web encuentras más interesantes y útiles.

Cookies estrictamente necesarias

Las cookies estrictamente necesarias tiene que activarse siempre para que podamos guardar tus preferencias de ajustes de cookies.

Analítica

Esta web utiliza Google Analytics para recopilar información anónima tal como el número de visitantes del sitio, o las páginas más populares.

Dejar esta cookie activa nos permite mejorar nuestra web.