Bienvenidos de nuevo. Hoy vamos a desbloquear una de las capacidades más impresionantes de VEO 3.1: la capacidad de generar personajes que hablan, cuentan chistes e interactúan, con audio y movimiento de labios sincronizado, partiendo únicamente de un texto.
Lo sorprendente es que no necesitas grabar tu voz ni escribir el guion exacto si no quieres; la IA puede improvisar por ti.
1. La Estructura del Prompt para Diálogo
Para lograr esto, volvemos a usar a nuestro asistente Gemini para redactar el prompt perfecto antes de llevarlo al generador de video. La fórmula mágica requiere separar las instrucciones con comas y ser muy claro con lo que queremos que diga (o el tema del que hable).
Estructura básica:
[Descripción del Personaje] + [Acción/Contexto] + [Instrucción de Diálogo] + «Enhance prompt»
Ejemplo práctico (El Dinosaurio Comediante): En Gemini escribimos:
«Dinosaurio con rastas haciendo un monólogo de stand-up, su audiencia son otros dinosaurios, escribe un chiste simple y fácil de entender, Enhance prompt.»
Al llevar el resultado a VEO, la IA generará el video del dinosaurio moviéndose, con el micrófono, y lo más importante: se escuchará su voz contando el chiste y sus labios se moverán acorde a las palabras.
2. Controlando el Acento y el Idioma
No tienes por qué conformarte con la voz estándar. Puedes especificar el acento o el tono en el mismo prompt.
- Si añades la instrucción «Make it in British accent» (Hazlo con acento británico), el audio generado cambiará completamente la personalidad del personaje.
- Esto funciona para definir estilos (americano, australiano, etc.) y le da una capa extra de realismo a tu creación.
3. Escenas Complejas: El formato «Youtuber»
VEO 3.1 entiende formatos de video modernos. Podemos crear una escena de gameplay con una cámara de reacción (facecam).
El Prompt Avanzado:
«Dino jugando a Minecraft, se está enojando porque no puede completar el nivel, empieza a llorar, coloca una facecam en un recuadro pequeño en la esquina superior derecha sobre el gameplay.»
Análisis del resultado: La IA es capaz de componer la imagen con el videojuego de fondo y el recuadro del personaje encima. Además, interpreta la transición de emociones: empieza feliz, se enoja y termina llorando, todo fluido en el mismo clip.
4. Interacción entre dos personajes
Finalmente, podemos hacer que dos personajes hablen entre ellos.
El Prompt de Interacción:
«Dos monstruos de Pixar bromeando entre ellos, haz un chiste simple de ‘roasting’ (burlas amistosas), Enhance prompt.»
Lo que sucede: La IA genera dos personajes distintos y gestiona los turnos de palabra.
- El Monstruo A dice una línea.
- El Monstruo B responde.
- Ambos mueven los labios solo cuando les toca hablar.
Nota importante sobre el contenido: A veces, el chiste específico que aparece en el texto del prompt de Gemini puede variar ligeramente respecto a lo que la IA finalmente «decide» decir en el video, pero el contexto (burlarse el uno del otro) se mantendrá intacto.
Con esta técnica, ya no estás limitado a crear videos mudos o paisajes. Ahora puedes crear storytelling con personajes vivos.