paint-brush
Una guía simple sobre mensajes de texto de IA: dígale a la IA exactamente lo que quiere verpor@claidai
17,864 lecturas
17,864 lecturas

Una guía simple sobre mensajes de texto de IA: dígale a la IA exactamente lo que quiere ver

por Sofiia Shvets6m2023/02/06
Read on Terminal Reader

Demasiado Largo; Para Leer

Las indicaciones para la generación de imágenes de IA son comandos, ya sean textuales o visuales, que dictan qué imagen crea la plataforma de IA. Encontrará dos tipos diferentes de mensajes de generación de imágenes: texto e imagen. La mayoría de los generadores de imágenes de IA que encuentra en el mercado hoy en día estarán basados en texto con algunas opciones para indicaciones de imágenes.
featured image - Una guía simple sobre mensajes de texto de IA: dígale a la IA exactamente lo que quiere ver
Sofiia Shvets HackerNoon profile picture

Esta guía cubrirá los aspectos básicos del trabajo con mensajes de texto y cómo puede utilizarlos de manera efectiva para representar las imágenes que imaginó.

comida para llevar

  • Las indicaciones para los generadores de imágenes de IA pueden basarse tanto en texto como en imágenes y, en algunos casos, una combinación de ambos.


  • La estructura general de las indicaciones de texto para los generadores de imágenes de IA es similar en todos los ámbitos, al igual que el recuento de palabras y el orden de los descriptores.


  • Los diferentes elementos de un indicador de texto tienen efectos únicos en la representación y agregan complejidad a la imagen.

¿Qué son las indicaciones?

Las indicaciones para la generación de imágenes de IA son comandos, ya sean textuales o visuales, que dictan qué imagen crea la plataforma de IA. Por lo general, encontrará dos tipos diferentes de mensajes de generación de imágenes: texto e imagen.

Indicaciones de texto

Para decirle a la IA qué tipo de imagen renderizar, primero debe describir esa imagen. Esto se hace con un mensaje de texto, que es una lista de palabras, a veces incluso una oración gramaticalmente correcta, que describe lo que la IA debe representar.

El generador de imágenes Let's Enhance utiliza indicaciones de texto para representar imágenes


El cuadro de texto resaltado es un mensaje de texto de ejemplo utilizado para renderice imágenes con IA utilizando el generador de imágenes Let's Enhance . Dependiendo de la plataforma de representación que esté utilizando, los mensajes de texto idénticos tendrán resultados diferentes.

Indicación de imagen

En algunos casos, cuando el texto no es suficiente, puede cargar imágenes en un generador de imágenes de IA y utilizarlo como referencia para crear otras imágenes. Según el tipo de plataforma de IA que utilice y el tipo de resultados que necesite, el uso de mensajes de imagen puede ser incluso más eficaz que el texto.

Original: La joven de la perla, de Johannes VermeerExterior: August Kamp


Por ejemplo, Outpainting AI de DALL.E puede tomar una imagen existente y renderizar su continuación. La imagen de arriba demuestra lo que la IA cree que es la continuación de la famosa pintura de Johannes Vermeer de La joven de la perla.


La imagen original del cuadro se encuentra dentro de la plaza y todo lo que la rodea fue realizado por DALL.E.

Una mezcla de ambos

Si bien la mayoría de los generadores de imágenes de IA que encuentra en el mercado hoy en día estarán basados en texto con algunas opciones para indicaciones de imágenes, hay formas de utilizar una combinación de ambas indicaciones para representar las imágenes deseadas.

Escribir un mensaje de generación de imágenes

Un detalle muy importante que debe tener en cuenta es comprender en qué se especializa un generador de imágenes de IA en particular y cómo usarlo de manera efectiva. Algunos generadores de imágenes de IA, como la serie Dall-E, son muy buenos para representar imágenes que imitan el fotorrealismo.


Por otro lado, está Midjourney, que es muy conocido por ser muy efectivo en formatos de arte digital o ilustración.


Nuestro propio generador de imágenes Let's Enhance es excelente para simular la estética visual de las imágenes de productos, además de representar imágenes, ilustraciones y modelos 3D fotorrealistas.


Recuento de palabras: use al menos 3-7 palabras

Si bien la mayoría de los generadores de imágenes de IA tendrán un límite de caracteres en las indicaciones de texto, no hay límite de palabras. Esto significa que tiene la libertad de estructurar su mensaje de texto de la forma que desee.


Sin embargo, el consenso, por ahora, parece ser que necesita de 3 a 7 palabras para escribir un mensaje de texto exitoso para que la IA lo procese.


Renderizado usando el generador de imágenes Let's Enhance

Aquí están las imágenes renderizadas del indicador de texto en el ejemplo anterior. El indicador de "toma amplia" impactó significativamente las imágenes en la columna izquierda.


No tienes que seguir estrictamente esta regla y puedes usar menos de 3 o más de 7 palabras. Pero como verá en los ejemplos a continuación, no es tanto la cantidad de palabras lo que importa, sino las palabras que usa.

Asunto: Quién y Qué

Cualquier representación de imagen AI requiere algún tipo de tema. Esto debería ser lo primero que escriba en el mensaje de texto (en la mayoría de los casos). Es posible dejar un solo asunto en el mensaje de texto y hacer que la IA genere algo un poco más general.


Sin embargo, en la mayoría de los casos, necesitará un mensaje de texto más descriptivo para generar una imagen que se acerque lo más posible a lo que buscaba representar.


Los sujetos suelen ser sustantivos, por lo que el mejor lugar para comenzar con su mensaje de texto, independientemente de la IA que esté utilizando, es comenzar con uno.

Descripción: Qué están haciendo, dónde y cómo

Para agregar un poco más de matiz a su imagen renderizada y ayudar a la IA a reducir qué imágenes usar como referencias, debe utilizar descripciones. Estos son sus adjetivos, y al igual que los usaría en cualquier oración ordinaria, describen el sujeto.


El truco con el uso de adjetivos en la generación de imágenes de IA es que puede combinar varios de estos para agregar más profundidad y complejidad a la imagen.


Además de los adjetivos que describen al sujeto, otro elemento de la descripción son los detalles que responden a preguntas como:


  • ¿Lo que está sucediendo?
  • ¿Qué está haciendo el sujeto?
  • ¿Cómo está el sujeto haciendo esto?
  • ¿Qué está pasando alrededor del tema?


Esa última pregunta es bastante importante, ya que los fondos juegan un papel clave en las descripciones efectivas. Aquí hay un ejemplo de dos indicaciones de texto similares que arrojan resultados bastante diferentes. El mensaje de texto para la imagen de la izquierda era la lectura de Raccoon .


Sin embargo, el mensaje de texto para la imagen de la derecha era un poco más detallado; por eso la imagen salió más clara y compleja: Mapache leyendo un libro en una foto de biblioteca de cerca.

Renderizado usando el generador de imágenes Let's Enhance


Como puede ver en los resultados, respondimos varias preguntas y la IA pudo reducir lo que buscábamos y presentar algo lo más parecido posible a lo que buscábamos. La IA pudo generar una imagen con mayores detalles y menos anomalías.


Aquí hay otro gran ejemplo de cómo los generadores de imágenes de IA funcionan mejor con indicaciones de imágenes más detalladas.


Renderizado usando difusión estable

Esta imagen generada de un pinzón demuestra cómo la IA puede generar una imagen genérica pero muy precisa, incluso sin descriptores adicionales.


Sin embargo, la representación de la derecha demuestra cómo los generadores de imágenes de IA, en este caso, Stable Diffusion, pueden trabajar con más elementos para representar una imagen significativamente más compleja.

Estética y estilo: cómo se ve

Para completar el mensaje de texto, hay algunos mensajes de texto más que debe agregar y que le darán los toques finales a su imagen renderizada. Observe cómo, al final del mensaje de texto anterior, teníamos palabras como "foto" y "primer plano".


Las últimas palabras en su aviso serán las que dicten la estética general y el estilo de su imagen.


En lugar de "foto", podría haber tenido "pintura al óleo", "fresco" o "representación 3D". Para dictar el estilo de su imagen, también puede utilizar movimientos artísticos como el impresionista, el gótico, el steampunk, etc.


Además, si está buscando replicar las obras de un artista famoso, también puede poner uno o más nombres famosos en el mensaje de texto. La IA combinará influencias de varios artistas famosos para crear algo que combine elementos de todos ellos.


Finalmente, también puede dictar el encuadre de la imagen. Indicaciones como "primer plano" o "plano medio", muy parecido a lo que haría en fotografía, pueden ayudar a la IA a comprender desde qué ángulo desea que se presente la imagen y desde qué distancia.


Renderizado usando Lexica

Aquí hay un ejemplo de dos imágenes generadas por Lexica de un dispositivo de computadora de mano. El indicador de la izquierda, aunque simple, pudo generar un dispositivo antiguo que incluso replica la pantalla LCD de la vieja escuela.


Sin embargo, la representación de la derecha, gracias a mensajes como "estética de onda de vapor" y "fotografía de producto", tiene una estética y un estilo visual más definidos, como se puede ver en los colores de neón.

La experiencia es el mejor maestro

Ninguna cantidad de consejos y trucos le enseñará cómo escribir indicaciones de IA efectivas que la experiencia. La mejor parte de los generadores de imágenes de IA es que son muy accesibles. Todo lo que necesita es una conexión a Internet y puede elegir entre las muchas plataformas gratuitas disponibles.


Así que salga y experimente con las indicaciones de imágenes de IA para ver qué cosas nuevas y fascinantes puede descubrir en el creciente campo de la generación de imágenes.