Un juego para entender a la inteligencia artificial DALL-E

dibujo mano

En los últimos meses han proliferado las inteligencias artificiales (IA) como DALL-E capaces de generar imágenes a partir de unas sencillas instrucciones de texto (prompts) que indican qué sujetos u objetos deben aparecer en la imagen resultante.

Averiguar cómo una IA convierte instrucciones en imágenes puede ayudar a conseguir una mejor generación de este tipo de imágenes

Los resultados suelen ser sorprendentes y en función de la descripción incluso dan como fruto asombrosas “creaciones”. La base del funcionamiento de este tipo de IA es el manejo de grandes cantidades de imágenes de las que se cuenta con una descripción de lo que aparece en las mismas. Al recibir la IA la descripción en forma de texto natural contrasta las palabras introducidas con las imágenes con las que se corresponden las que tenga en su base de datos, lo contrasta y crea una nueva imagen a partir de los elementos reconocidos.

A la hora de obtener los mejores resultados no sólo es necesaria la redacción de unos prompts adecuados sino también conocer con detalle el funcionamiento del proceso por el que la IA convierte palabras en imágenes. O, en puridad, conocer cómo funciona el proceso previo, cómo a partir de unas imágenes previas de las que se dispone de una descripción, esta permite a la IA aprender a relacionar unas con otras para cuando se le pide trasladar palabras a imágenes.

Juego DALL-Edle

A modo de juego pero también como forma para conocer este proceso ha aparecido DALL-Edle, una página web que muestra distintas imágenes añadiendo cuatro opciones de texto entre las que hay que seleccionar la que se considera que sirvió como prompt para crear dichas imágenes.

Se proponen cinco conjuntos de imágenes con cuatro posibles textos que se corresponderían con los prompts que las habrían generado, de los cuales habrá que seleccionar uno. Tras marcar la opción correspondiente DALL-Edle informa de cuántos aciertos se ha tenido en este peculiar prueba de reconocimiento.

capturas DALL-Edle

DALL-E es uno de los modelos de generación de imágenes mediante IA más populares y es el que toma como base DALL-Edle para intentar que los usuarios comprendan el funcionamiento de su modelo. Para mostrar la parte lúdica han tomado como parte de la estructura del nombre de la web no solo el de DALL-E sino también el del popular juego Wordle en el que hay que averiguar una palabra en un máximo de 6 intentos.

La mecánica de este juego que propone DALL-Edle intenta que el jugador sea capaz de comprender cómo funciona el proceso por el que la IA transforma las instrucciones o descripciones en imágenes. En cierto modo se trata de confrontar la creatividad humana con la “creatividad” artificial y demostrar si el hombre es capaz de comprender a la máquina y viceversa.

Antonio Rentero

Comunicador especializado en tecnología y cine. Jurista especializado en protección de datos. Curioso especializado en prácticamente todo.

Deja un comentario

INFORMACIÓN BÁSICA SOBRE PROTECCIÓN DE DATOS

Responsable: TreceBits S.L. (TreceBits)
Finalidad: Que puedan comentar las noticias publicadas
Legitimación: Consentimiento del interesado. Satisfacción del interés legítimo del Responsable.
Destinatarios: No se cederán a terceros salvo obligación legal.
Derechos: Puedes ejercitar en cualquier momento tus derechos de acceso, rectificación, supresión, limitación, oposición y demás derechos legalmente establecidos a través del siguiente e-mail: [email protected].
Información adicional: Puedes consultar la información adicional y detallada sobre protección de datos aquí.