Saltar al contenido

¿Cómo usar Stable Diffusion como un profesional?

Hola soy Leandro Tomassini y hoy repasaremos una variedad de temas diferentes. Empezando, por supuesto, por lo básico. De esta manera, vas a comprender el proceso un poco mejor, si eres completamente nuevo en la generación de arte con Stable Diffusion a través de Dream Studio. Más adelante veremos algunos ejemplos de diferentes tamaños de imagen, escalas CFG, indicaciones y más para que tengas una pequeña idea de lo que puedes esperar.

Algunas de las imágenes de esta guía se crearon cuando Stable Diffusion aún funcionaba a través de Discord en la versión beta 1, y otras se crearon a través del sitio web Dream Studio. Esto no tiene diferencia, ya que ambos funcionan con el mismo modelo. Dream Studio es simplemente una nueva forma de interactuar con Stable Diffusion.

Ten en cuenta que, aunque repasaremos la configuración y las indicaciones en esta guía, no hay una respuesta que sirva para todos. Muchas veces crees que has encontrado la configuración perfecta, por ejemplo, la escala CFG, los pasos, el tamaño de la imagen… Pero luego escribes un promp diferente y, de repente, esa configuración crea resultados muy malos. Aunque esta guía pretende darte una idea de las posibilidades con Stable Diffusion y, hasta cierto punto, algunos consejos y trucos. Debes tener en cuenta que todavía estamos aprendiendo, y es en gran medida un caso de experimentación para ver qué funciona mejor para ciertos estilos/indicaciones/resultados.

(No estoy afiliado a Stable Diffusion / Stability.ai, sino simplemente un nerd curioso que quería compartir su experiencia y posiblemente brindar información útil. Espero que lo disfruten. 

¿Por qué utilizar la Inteligencia Artificial?

Estas herramientas aún son bastante nuevas e incluso pueden dar un poco de miedo a veces. ¿Los artistas tradicionales perderán sus trabajos? ¿Es el arte incluso arte cuando lo hace una computadora? ¿Cuál es el punto? Escribe algunas palabras y la máquina escupe una imagen…

Bueno, no tengo todas las respuestas. Pero sí, puede dar miedo. No, no creo que los artistas pierdan sus trabajos; en todo caso, estas nuevas herramientas brindarán la capacidad de adaptarse a nuevas formas de creatividad en las que ni siquiera se había pensado antes. ¿Y cuál es el punto de todo esto? ¿Crear con la máquina? Bueno, es mucho más divertido hacerlo de lo que parece cuando escuchas estas cosas. Principalmente vemos herramientas de texto a imagen como Stable Diffusion, DALL-E 2 y MidJourney. Pero esto es mucho más que hacer imágenes.

Estamos en un estado de la vida en el que la capacidad de crear está a punto de cambiar masivamente. Y eso es sólo el comienzo. Estos sistemas de IA son capaces de mucho más de lo que todos imaginamos muy pronto. Pero no nos adelantemos.

No todo el mundo es capaz de crear de la manera tradicional
. Ya sea dibujar o pintar, hacer cerámica o cualquier otra cosa. Estas nuevas herramientas harán que millones y millones de personas de repente tengan la capacidad de crear lo que tienen en mente, sin una gran barrera de entrada. O tal vez simplemente no pudieron debido a una condición física, y ahora existe esta nueva herramienta que brinda la oportunidad de convertir sus increíbles pensamientos en alguna forma de creatividad.

No estoy aquí para predicar, pero quería escribir esta pequeña parte en esta guía. Porque siento firmemente que no hay necesidad de competir. No es necesario ni uno ni otro, ya que solo puede prevalecer el arte tradicional o solo el arte ai. Como soy alguien que trató de aprender el arte tradicional, pero no puede debido a las condiciones físicas, puedo ver de alguna manera ambos lados de los argumentos que se hacen en línea. Y creo que todos podemos llevarnos bien y crear cosas hermosas juntos. 

Lo básico

Generar imágenes en Dream Studio puede parecer complicado, con todos los controles deslizantes ajustables. Pero en realidad no es tan difícil.

Impulsando tus imágenes


En la parte inferior de la pantalla, puede completar su solicitud , luego de lo cual presiona el botón » Sueño «, y Stable Diffusion comenzará a generar su imagen.


La generación de imágenes a través de Dream Studio funciona con un sistema de créditos.

La configuración predeterminada le costará 1 crédito por imagen generada.

Configuración por defecto:


Cambiar la cantidad de pasos y/o el Ancho/Alto de tu imagen te costará más créditos. Puede ajustar el CFG, el Sampler y la semilla sin costos adicionales.

Consulte el siguiente gráfico para obtener más información:


¿Cuáles son los diferentes ajustes?

Repasemos la configuración brevemente. Más adelante veremos algunas imágenes generadas con diferentes configuraciones para ver cómo afectan las imágenes con más detalle.

Ancho y alto:

Este se explica por sí mismo, por lo que pasaremos a la siguiente configuración.


Escala CFG:

La escala CFG básicamente le dice a Stable Diffusion qué tan cerca tiene que seguir su entrada rápida. Puedes ver algunos ejemplos de esto más adelante. De forma predeterminada, está configurado en siete (7) , lo que está bien para la mayoría de las indicaciones. Puede experimentar con esto, porque con algunas indicaciones puede generar un resultado mucho mejor cuando coloca la escala un poco más alta. Sin embargo, tenga en cuenta que aumentar la escala de CFG puede causar artefactos en sus imágenes. Esto, nuevamente, depende de su aviso. Puedes ver ejemplos de esto más adelante.


Pasos:

Aumentar la cantidad de pasos le dice a Stable Diffusion que debe tomar más pasos para generar su resultado final, lo que puede aumentar la cantidad de detalles en su imagen. Los pasos más altos no siempre equivalen a un mejor resultado. Especialmente cuando se usa una gran cantidad, como 100-150 o incluso más. Al igual que la escala CFG, esto depende de su solicitud, pero subir demasiado con los pasos puede causar artefactos en su resultado final.

Tenga en cuenta que aumentar la cantidad de pasos le costará más créditos por imagen. (vea el gráfico en la parte inferior de la página cuatro (4). )


Número de imágenes:

Aumentar el número de imágenes creará más imágenes con el mismo aviso que ha escrito.


Dechado:

La muestra es lo que utiliza Stable Diffusion para decidir cómo generar el resultado final. Puede cambiar esto, pero las diferencias entre los muestreadores suelen ser muy pequeñas. Pero de nuevo, depende un poco de su promp. 


Semilla:

La semilla determina el punto de partida de la generación de su imagen. Normalmente, una semilla se elige al azar cuando presiona el botón «Sueño». Pero si encuentra algo que le gusta, puede usar la misma semilla para obtener la misma imagen nuevamente. ¡Tenga en cuenta que para obtener exactamente el mismo resultado que antes, no solo necesita usar la misma semilla, sino también la misma configuración y aviso!

Algo que es divertido acerca de este sistema de semillas es que puede cambiar algunas cosas pequeñas sobre su solicitud mientras mantiene la misma semilla y, por lo tanto, genera imágenes de aspecto muy similar. Verás algunos ejemplos de esto más adelante.

Ejemplos de ancho y alto

Puedes experimentar con el ancho/alto tanto como quieras.

Solo tenga en cuenta que cambiar esto cambiará su composición y costará créditos adicionales.

Otra nota sobre el tamaño de la imagen:

La IA ha sido entrenada en innumerables imágenes de 512×512. Causando que a veces cree dobles cuando intenta generar una imagen que tiene un tamaño diferente. Como un cuello encima de una cabeza, como la imagen aquí:

 

La explicación de los desarrolladores ha sido que, debido a que la IA ha sido entrenada en imágenes de 512 × 512, intentará generar su mensaje en cada área de 512 × 512. Es decir, si solicita un retrato, intentará crear un retrato en cada cuadrado con las dimensiones mencionadas anteriormente. Cualquiera que sea su mensaje, es posible que se encuentre con imágenes duplicadas o extrañas como la de arriba cuando supere el tamaño de imagen predeterminado.

Esto no siempre sucede, pero es algo a tener en cuenta. Especialmente porque las imágenes más grandes cuestan más créditos. (vea el gráfico en la parte inferior de la página cuatro (4). 

La composición cambia según el tamaño de la imagen, por lo que si tiene otra composición en mente, podría ser bueno experimentar con otros tamaños además del predeterminado 512 × 512.

Si simplemente desea generar imágenes más grandes con fines de calidad, le desaconsejaría dado el costo adicional. En ese caso, es mejor simplemente crear con la configuración de 512 × 512 y ampliar la imagen con un servicio como BigJPG, o un cuaderno de Google Colab o cualquier servicio exclusivo que prefiera. Muchos de estos servicios exclusivos usan IA y apenas tienen pérdida de calidad, si es que la tienen.

Ejemplos de muestras y escalas CFG.

Como se dijo antes, la escala CFG básicamente le dice a la IA qué tan cerca tiene que seguir su indicación.

A continuación, puede ver el mismo indicador con ocho (8) escalas CFG diferentes a través de los ocho (8) muestreadores. También puede encontrar las imágenes de comparación aquí .

Algo a tener en cuenta : todas estas imágenes de ardillas, bodegones y botellas se crearon con el bot de discord cuando aún estaba operativo. El límite de paso era 50 en ese momento. Lo cual es un poco injusto para algunos samplers, porque, según los desarrolladores, funcionan mejor con cantidades de pasos mucho más altas. (Especialmente ddim y plms, por eso esos resultados se ven tan mal en estoscomparaciones Aparentemente funcionan mejor con alrededor de 1500 y 200 pasos respectivamente)

Ejemplos de pasos de generación

Puede parecer lógico ejecutar siempre la cantidad máxima de pasos, pero no siempre es una buena idea. A menudo, no ve tanta diferencia cuando ejecuta sus pasos más de 70-100, dependiendo de sus indicaciones. Y en la mayoría de los casos, para imágenes simples, 50 es suficiente. Enlace a la imagen. (La escala CFG se fijó en 15)

Ejemplos aleatorios vs de la misma semilla

Cuando mantiene la semilla aleatoria, obtendrá un ruido de inicio aleatorio, lo que dará como resultado diferentes imágenes. Pero si desea ajustar una imagen que le guste, puede mantener la misma semilla . 

Solo he cambiado dos cosas, pero las imágenes son bastante diferentes. (Se eliminó «vibrante» del indicador y se redujo la escala CFG de 35 a 25).

Experimente un poco con las semillas y sus indicaciones. Puede obtener resultados sorprendentes cuando cambia un poco las cosas. Un consejo, no cambies demasiado de golpe. Cuantas más variables agregue, más difícil será descubrir qué creó la imagen que tanto disfruta.

Cambia una cosa, presiona Soñar , reflexiona sobre los cambios y repite. ¡Así se aprende!

Espero que esta guía te haya ayudado a crear un mejor arte, o al menos a comprender un poco más la herramienta. ¡A continuación hay otros recursos que puede consultar! Si tiene alguna pregunta, sugerencia o desea que agregue algo a esta guía, hágamelo saber.