Bienvenido de nuevo. En esta lección vamos a abordar uno de los mayores desafíos al generar imágenes con IA: la consistencia.
Seguramente te ha pasado: generas un personaje increíble, pero cuando intentas crear una segunda imagen con él, la IA te devuelve a alguien totalmente diferente. Para solucionar esto, no usaremos ImageFX, sino la herramienta Whisk (dentro de Google Labs).
¿La diferencia? Mientras que ImageFX genera imágenes sueltas, Whisk te permite construir escenas separando los elementos: Sujeto, Escena y Estilo.
1. El concepto de la «Semilla» (Seed)
Antes de entrar en materia, repasemos brevemente el concepto de «Seed» o semilla, que verás representado con un icono de candado.
- Candado Abierto: La IA tiene libertad total. Si generas dos veces con el mismo texto, obtendrás resultados muy diferentes (distintos fondos, distintas posturas).
- Candado Cerrado (Seed Lock): La IA intenta mantener la estructura base. Si te gusta una composición, ciérralo para obtener variaciones que se sientan parte de la misma «familia» visual.
2. La fórmula de Whisk: Sujeto + Escena + Estilo
La magia de Whisk radica en que no dependes de un solo párrafo de texto gigante. Puedes definir tres bloques por separado:
- Sujeto (Subject): Aquí defines a tu protagonista.
- Puedes generarlo desde cero (ej. «Robot con un monitor por cabeza»).
- Una vez que tengas el diseño del personaje que te gusta, lo seleccionas como tu «Sujeto».
- Escena (Scene): Aquí defines el entorno.
- Ejemplo: «Taller de carreras NASCAR».
- Al igual que con el sujeto, generas el fondo y lo seleccionas.
- Estilo (Style): Aquí defines la estética artística.
- Ejemplo: «Estilo Anime».
El resultado: Al combinar estos tres bloques seleccionados, Whisk generará imágenes donde tu robot específico (Sujeto) está dentro del taller (Escena) con el look anime (Estilo). ¡Incluso puedes generar imágenes sin escribir nada en la barra de texto, solo combinando estos bloques!
3. Dando vida al personaje con Prompts
Una vez que tienes la consistencia base, es hora de narrar la historia. En la barra de prompt principal, describe la acción:
- «El robot está arreglando el coche, expresión nerviosa, humo saliendo del motor».
Como ya tienes el sujeto fijado, la IA no cambiará el diseño del robot, solo modificará su postura y acción para adaptarse a tu texto. Puedes probar cambiando emociones (de nervioso a feliz, o enojado) o acciones (de arreglar el coche a conducirlo).
4. Refinando detalles con Nano Banana
A veces, el prompt general no consigue captar un detalle específico (por ejemplo, si el robot no parece lo suficientemente enojado). Aquí es donde usamos la herramienta Refine (Refinar):
- Selecciona la imagen que más te guste.
- Haz clic en Refine.
- Escribe el cambio puntual: «Hacer al robot muy enojado» o «Cambiar de día a noche».
- Esto generará una nueva imagen independiente con esa corrección específica, sin alterar el resto de la composición.
5. Cambiando el ángulo de cámara
Cambiar el ángulo (ej. «plano gran angular») puede ser difícil si tienes el Sujeto y la Escena bloqueados, ya que la IA tiende a dejar al personaje «pegado» en la misma posición.
El truco para lograrlo: Si intentas pedir un «plano abierto» y la IA te ignora, haz lo siguiente:
- Genera la imagen normal.
- Entra en la opción Refine de esa imagen.
- Pide el cambio de ángulo ahí: «Make this a left side angle scene» (Haz una toma desde el ángulo izquierdo).
- Al refinar una imagen existente en lugar de generar desde cero con los bloques fijos, es más probable que la IA entienda la nueva perspectiva.
Con Whisk, las posibilidades son infinitas. Al separar los elementos, tienes el control para crear toda una historia visual sin que tu protagonista cambie de cara en cada toma.