IA generativa y reconstrucción virtual histórica: problemas, limitaciones y posibilidades

En la actualidad, vivimos inmersos en una catarata de novedades relacionadas con las tecnologías de Inteligencia Artificial generativas, es decir, tecnología que es capaz de crear contenido aparentemente nuevo, «original» y único, gracias a un aprendizaje llevado a cabo a partir del análisis de una gran cantidad de datos (ya sea imágenes, textos, sonidos, o una combinación de todos estos).

En concreto, tecnologías de IA generativa como Midjourney, Stable Diffusion o Dall-E, nos permiten obtener imágenes introduciendo un prompt o texto en el que pedimos lo que deseamos conseguir y, a partir de él, nos ofrecen diferentes alternativas que se intentan ajustar a lo que hemos solicitado. Durante todo el año 2022 asistimos a una verdadera carrera tecnológica en la que estas herramientas de IA (junto con otras como Chat GPT o Whisper) han ido evolucionando tanto en precisión como en veracidad visual, llegando a ofrecer resultados que pueden parecer fotografías ilustraciones o, incluso, escenas 3D reales, y este proceso está lejos de haber terminado.

Como no puede ser de otro modo, estas herramientas de creación visual se están comenzando a aplicar a la creación de imágenes de nuestro pasado, reconstrucciones históricas y supuestas representaciones de cómo fueron determinados momentos históricos. ¿Cómo fue la Revolución Francesa según la IA? ¿Qué pasaría si nos hiciéramos selfies en determinados momentos históricos? Estas y otras preguntas similares han sido formuladas obteniendo sorprendentes imágenes que corren como la pólvora pero, ¿es oro todo lo que reluce?

PROBLEMAs

Fantasía histórica y repetición de estereotipos

Las IA como Midjourney están entrenadas en base a un inmenso banco de imágenes de origen desconocido que incorpora miles -y millones- de referencias visuales sin ningún tipo de control. Así pues, cuando solicitas que la IA te genere una imagen histórica va a seguir el único criterio de la opción más repetida a la hora de elegir cómo representar determinado elemento. Por ejemplo, cuando solicitamos a una IA recrear el momento del asesinato de Julio César, ésta va siempre a intentar recurrir a imágenes que se encuentran en la memoria estética contemporánea y que han aparecido en pintura histórica, cine, televisión o videojuegos y que son las que más fácilmente se encuentran por internet, tal y como ha apuntado Alberto Venegas.

Estos referentes visuales de la IA no son imágenes consensuadas históricamente, ni referencias texturas histórico-arqueológicas, planimetrías u otras fuentes documentales que utilizamos cuando llevamos a cabo reconstrucciones histórico-arqueológicas sino imágenes mediatizadas, con poco rigor y que se mueven -con todo el derecho del mundo- en el terreno de la ficción. Además, potencian también estereotipos de tipo racial, de género, etc., contribuyendo, por ejemplo, a infrarrepresentar a colectivos como las mujeres (el 50% de la población), personas racializadas, enfermos, ancianos, etc., y actividades de todo tipo que, tradicionalmente, se han alejado del discurso más repetido dentro de la representación histórica (y donde lo bélico y lo aristocrático aparece sobrerrepresentado).

De este modo el mayor problema de las imágenes con pretensiones históricas generadas con IA es que, normalmente, están construidas sobre fuentes totalmente incorrectas que conducen, únicamente, a fakes históricos. Así lo ha explicado también con mucho acierto PutoMikel en el vídeo «No, las IA no van a quitarte el trabajo» -concepto que, por otra parte, luego matizaré-.

Bajo estas líneas, recreación el emperador romano Constatino I llevada a cabo con Midjourney (figs. 1 y 2) frente a una recreación virtual científica del mismo emperador.

Veracidad y espectacularidad visual

Estos fakes históricos no serían tales si no fuera sencillo confundir ficción y realidad. Desde este punto de vista, lo que sin duda es un punto fuerte de estas herramientas en otros contextos, se convierte en algo muy peligroso a la hora de representar y difundir imágenes del pasado -que, como hemos expuesto, están construidas sobre bases fantasiosas- porque ofrecen una alta veracidad u apariencia de verdad. Es decir, al parecerse estéticamente a fotografías, ilustraciones o fotogramas de películas y resultar muy espectaculares en cuanto a la elección de colores e iluminación dramática, la posibilidad de que, con un primer vistazo, el ojo humano se sienta atraído por ellas y las confunda con trabajos rigurosos o, incluso, con fotografías reales, es muy alta.

Esta es la base de los bulos y los fakes de cualquier tipo: para funcionar deben ser veraces porque sino resultan increíbles. El atractivo que generan, en especial con el primer vistazo, las imágenes creadas por IA, contribuye a potenciar todavía más la repetición de bulos históricos y a hacer virales, por ejemplo, reconstrucciones faciales de personajes históricos que carecen de cualquier rigor y que solo repiten estereotipos.

Derechos de autor/a

Un problema paralelo a los propios dilemas internos que puede tener la creación de imágenes históricas con estos medios es el de las imágenes originales que están siendo utilizadas para entrenar a las IA generativas. Aunque ha existido mucho debate en torno a este particular, que ha llevado incluso a movilizaciones digitales por parte de artistas y creadores -como la de #NoAI, que condujo a plataformas como Artstation o Sketchfab a introducir etiquetas que, en teoría, bloquean el uso de imágenes como fuente visual de aplicaciones de IA-, lo que está claro es que todavía es muy complejo saber qué imágenes están siendo usadas sin el consentimiento de sus creadores y creadoras y que esto podría estar vulnerando los derechos de los artistas.

Así mismo, las obras generadas por IA no pueden considerarse obras originales de quienes introducen el prompt, o al menos así se está comenzando a determinar en algunas legislaciones, lo que también conduce a la imposibilidad de registrar obras realizadas directamente por al IA e, incluso, a comercializarlas. Pese a todo, ya se están dando casos del uso de IA para la creación de imágenes para carteles públicos u otros recursos de administraciones y ayuntamientos, lo que demuestra que esto va a afectar a los ilustradores e ilustradoras y, a corto, medio o largo plazo, va a suponer la pérdida de encargos con, posiblemente, un empobrecimiento de la riqueza gráfica (no olvidemos que la IA también se retroalimenta a sí misma) y con, quizás, una transformación profunda del mercado de arte.

LIMITACIONES

Más allá de los problemas que pueden presentar las IA generativas de imágenes, esta tecnología presenta, al menos por el momento, a inicios de 2023, ciertas limitaciones que, si bien se irán superando con el tiempo, deben tenerse en cuenta porque constituyen handicaps importantes a la hora de crear con estas herramientas imágenes históricas.

Imprecisión

Los resultados creados con IA son, en líneas generales, tremendamente imprecisos y cuando trabajamos con reconstrucción virtual histórica prácticamente nada puede quedar al azar: planimetrías, decoración, alturas de edificios, tipos de cubiertas, ventanas, vanos, puertas, columnas, tipos de vestimenta y otros objetos, incluso posición de caminos y masas de vegetación, todo está, normalmente, muy controlado para ajustarse a la realidad histórica de determinado enclave. Es por ello por lo que obtener una imagen históricamente correcta mediante la introducción de un prompt o descripción y la obtención de varios resultados aleatorios resulta prácticamente imposible.

Así mismo, por el momento los resultados son tremendamente oníricos, desdibujados en muchos casos y cuando revisamos una imagen con cuidado podemos observar errores de bulto: incoherencias arquitectónicas flagrantes, manos con más de cuatro dedos o con posiciones imposibles, vestimentas que parecen tener sentido pero que no aguantan un análisis de más de dos minutos… La veracidad de la que ya hemos hablado más arriba generalmente se rompe al revisar algo más detenidamente la imagen pero es carne de retuit en el primer vistazo y los fakes históricos son, de este modo, productos absurdos en cuanto a su flagrante falta de rigor pero con un potencial viral impresionante.

Inconsistencia

Ya hemos hablado de lo aleatorio de este tipo de tecnología pero es importante recalcarlo. El mismo prompt va a dar resultados diferentes al introducirlo en la misma herramienta de IA generativa en varias ocasiones. De hecho, por defecto herramientas como Midjourney entregan 4 posibles imágenes a partir del mismo prompt y, lo más importante, es prácticamente imposible conseguir la misma imagen en momentos sucesivos aunque se use una descripción idéntica o similar. Es decir, si deseas obtener la imagen de una ciudad Egipcia va a ser muy complicado que la IA replique esa misma ciudad en ningún otro momento. Esto, desde el punto de vista de la reconstrucción virtual es incongruente: los trabajos que llevamos a cabo de forma científica no deben estar sujetos a variaciones aleatorias sino solo a aquellas que se lleven a cabo a raíz de nuevas investigaciones que modifiquen de forma consciente la hipótesis original.

Bajo estas líneas, recreación de la ciudad egipcia de Elefantina llevada a cabo con Midjourney (figs. 1 y 2) frente a una recreación virtual científica de la misma ciudad.

Esto progresivamente está mejorando en especial en lo que tiene que ver con la representación de personas, siendo capaz la IA de mostrar, con entrenamiento, distintas imágenes en las que un mismo personaje sea consistente y tenga variaciones mínimas. Aún así, estamos lejos de que esto sea posible con una estructura, enclave o ciudad histórica.

Entrenamiento

En este sentido, el entrenamiento es algo a lo que se alude siempre cuando comentamos los problemas derivados del uso de IA generativas para la creación de representaciones históricas. Se replica que no es que las IA no puedan crear imágenes históricas sino que no se las ha entrenado convenientemente. En este sentido, existen dos problemas: por un lado, (1) por el momento no es posible llevar a cabo un entrenamiento tan complejo como para que la IA pueda entregar imágenes de reconstrucciones virtuales históricas tan precisas, consistentes y poco aleatorias como las que necesitamos desarrollar de forma científica; y, por otro lado, (2) el desarrollo de un entrenamiento complejo solo estará al alcance, incluso en un futuro, de personal especializado, mientras que el gran público podrá seguir desarrollando supuestas imágenes que serán verdaderos fakes históricos y que se viralizarán probablemente mucho más que las imágenes rigurosas y científicas sin, por supuesto, poder ni querer entrenar a una IA para ello.

POSIBILIDADES

Incorporación a herramientas de diseño 3D y 2D

Por supuesto, los que criticamos los problemas de uso de IA generativa para la creación directa de supuestas imágenes históricas no estamos en contra de esta tecnología sino del uso incorrecto y pernicioso de la misma a la hora de configurar la imagen que tenemos del pasado. En este sentido, existen usos que, sin duda, son los que creemos que resultarán más interesantes en un futuro también en combinación con nuestro trabajo de reconstrucción virtual.

Por ejemplo, las herramientas de IA generativa se incorporarán sin duda a los software de diseño 2D y 3D ayudando a agilizar trabajos que actualmente son tediosos y complicados: diseño de mapeados UV, creación realista de roturas o suciedad en estructuras arquitectónicas, creación de cabello, etc. Estas herramientas se sumarán a otras en las que la IA también tendrá un papel principal y que permitirán, probablemente, agilizar procesos complejos como el diseño y animación de personajes.

Creación de texturas

Una aplicación concreta de la que ya se están viendo algunos resultados y que, probablemente, en el futuro se desarrolle mucho más y resulte muy interesante será la creación de mapas de texturas PBR con IA generativa. Esto nos permitirá, probablemente, obtener texturas de forma más cercana a lo que necesitamos ya que, en la actualidad, los bancos de texturas pueden resultar algo limitados para trabajos tan precisos como los que llevamos a cabo. Así pues, podremos pedir texturas de tablones de determinado tipo de madera o de paramentos de ladrillos concretos y editables a golpe de click.

El artista Martins Jakobsons utiliza la IA para generar texturas y destaca como puntos fuertes: no necesitar imágenes de stock, la posibilidad de generar cualquier textura, la velocidad y eficiencia de la generación y la obtención de resultados fotorrealistas; pero pone sobre la mesa también sus desventajas: la resolución máxima de 2K, los resultados impredecibles, la dificultad de crear texturas tileables, y la existencia de un postproceso posterior para conseguir resultados aceptables.

En definitiva, espero que estas reflexiones hayan servido para entender los riesgos a los que nos enfrentamos con la creación acrítica de supuestas imágenes históricas mediante herramientas de IA generativa, caminando hacia un futuro en el que la imagen que tenemos de nuestro pasado sea todavía más líquida, inconsistente y alejada de la realidad histórica. Como recomendación final, no os perdáis el libro de Alberto Venegas «Pantallas de la memoria: Cómo y por qué las imágenes digitales transforman nuestra idea de la historia«, en el que se tratan éste y otros muchos temas de interés para entender las imágenes de nuestro pasado.

2 comentarios en “IA generativa y reconstrucción virtual histórica: problemas, limitaciones y posibilidades

Deja un comentario