e-ISSN: 1131-5598
ARTÍCULOS
Resumen: Este artículo recoge una investigación realizada durante el aprendizaje de contenidos relacionados con el lenguaje visual y plástico, introduciendo la variante metodológica de dos tecnologías emergentes basadas en IA Generativa. El objetivo principal es el de analizar los procesos realizados, para comprobar si la IA generativa es consistente como para integrarse en los procesos de aprendizaje. La investigación se ha realizado desde el paradigma del análisis cualitativo de 22 muestras y 97 participantes, organizados grupalmente, abordado mediante un análisis de caso resultante de la recopilación de datos mientras se realizan acciones estructuradas. La codificación y el análisis de la verbalización se ha realizado con ATLAS.ti y el análisis cuantitativo con Jamovi. Como resultado principal se ha observado un progreso significativo al adoptar una posición crítica, tanto en el proceso de elaboración de textos como en el de elaboración de imágenes, aunque se interpreta que las IA Generativas utilizadas no siempre generan resultados aceptables, lo que refuerza las intervenciones desde premisas de elaboración creativa basadas en el razonamiento, la planificación, la flexibilidad y la toma de decisiones. Como conclusión principal se estima que el uso de las IA Generativas, integradas en un ecosistema de proceso, son muy positivas, dado que, a nivel pedagógico, han propiciado el análisis y la reflexión profunda para la resolución de problemas de forma creativa. También se ha evidenciado la importancia de documentar los procesos de aprendizaje llevados a cabo.
Palabras clave: Creatividad; Inteligencia Artificial; pensamiento crítico; formación del profesorado; Educación Artística
Abstract: This paper presents an investigation conducted during the learning of content related to visual and plastic language, introducing the methodological variant of two emerging technologies based on AI Generative. The main objective is to analyze the processes carried out, to check whether generative AI is consistent enough to be integrated into learning processes. The research has been carried out from the paradigm of qualitative analysis of 22 samples and 97 participants, organized in groups, approached through a case analysis resulting from data collection while structured actions are performed. Coding and analysis of verbalization were performed using ATLAS.ti and quantitative analysis using Jamovi. The main result has been significant progress in taking a critical stance, both in the process of writing and image-making, although it is understood that the Generative AI used does not always produce acceptable results, which reinforces the interventions from premises of creative elaboration based on reasoning, planning, flexibility and decision making. The main conclusion is that the use of Generative AI, integrated into a process ecosystem, is very positive, given that, at the pedagogical level, it has fostered deep analysis and reflection for creative problem-solving. The importance of documenting the learning processes carried out has also been highlighted.
Keywords: Creativity; Artificial Intelligence; critical thinking; teacher training; art education
Index: 1. Introducción • 1.1. La IA en la experiencia de la expresión plástica • 2. Metodología • 2.1. Contexto y participantes • 2.2. Construcción de la secuencia de actuación y su contexto • 2.3. Proceso de creación de texto mediante IA • 2.4. Proceso de creación de imágenes mediante IA • 3. Análisis de resultados • 3.1. Análisis del proceso de creación de texto mediante IA • 3.2. Análisis del proceso de creación de imágenes mediante IA • 4. Conclusiones • Referencias
Cómo citar: Ramón-Verdú, A. J., Villalba-Gómez, J. V. & Castejón-Ibañez, M. M. (2025). Análisis de la integración de la Inteligencia Artificial generativa en el proceso de creación de narrativas textuales y visuales. Un estudio de caso. Arte, Individuo y Sociedad, 37(3), 625-636. https://dx.doi.org/10.5209/aris.101361
La extensión de la Inteligencia Artificial a todo tipo de sectores profesionales puede provocar una serie de conflictos en la sociedad, que pueden gravitar desde la oportunidad hasta la amenaza. En el terreno concreto de la docencia, esta preocupación está justificada entre otros aspectos, ante el temor de que los estudiantes puedan recurrir a diversas aplicaciones que les permitan realizar las tareas asignadas repercutiendo a priori en un aprendizaje pobre. A pesar de que en algunos contextos se ha llegado a prohibir el uso de estas tecnologías (Peirón, 2023), si se intenta plantearlo desde una visión positiva, tanto de docentes como de estudiantes, la IA puede llegar a considerarse como una aliada (Flores-Vivar y García-Peñalvo, 2023).
No obstante, el avance de esta tecnología, y las diversas experiencias experimentales que van surgiendo en el ámbito académico (Marín, 2023) hace pensar que esta idea pueda modificarse, lo que conllevaría ciertos cambios en el estudio y el trabajo de la didáctica de las artes. En ese caso, la clave será, convertir esa circunstancia en una ventaja: nuevas formas de aprender, enseñar y crear.
En la expresión plástica, el uso de la IA puede suponer una alternativa de gran interés para trabajar y reflexionar en torno a aspectos como la generación de imágenes a partir de palabras (órdenes o prompts que se indican a la IA), el análisis de imágenes o la mediación didáctica para explicar obras de arte ya existentes. De hecho, la creatividad, uno de los aspectos que más intensamente se trabaja en el terreno de la educación artística, es altamente cuestionada en la IA (López de Mantarás, 2016), ya que se impone el criterio de que lo que distingue al ser humano de la máquina.
En torno a este principio, surge el concepto de “creatividad computacional”, cuyo objetivo, según López de Mántaras (2016, p. 102) es “el estudio del desarrollo de software que presenta un comportamiento que sería considerado creativo en seres humanos”. Bajo esta definición, se permite estudiar la creatividad humana para ser aplicada a estas herramientas y que sirvan a los propios creadores como aliadas en sus procesos de desarrollo, clave para concebir nuevas formas de enseñar y aprender en el contexto de la creación artística y visual. Este punto es especialmente relevante dentro de la educación, ya que, ante el nivel de desarrollo tecnológico actual, uno de los principales desafíos es saber cómo se pueden emplear estas herramientas en beneficio de potenciar la creatividad, tan importante para los docentes, sin que el manejo de la IA sea un agravio (Vicente-Yagüe-Jara et. al, 2023).
Uno de los desafíos actuales en Educación es conseguir que la IA se abra como oportunidad didáctica, ofreciendo nuevas posibilidades e incorporarlas en las metodologías docentes, dejando de ser un riesgo o amenaza. Sin embargo, para tal fin es importante concienciar en torno a que “la IA no puede ser una fuente de inspiración para el aprendizaje, ya que, a diferencia de un profesor humano, esta no juega con la empatía en el proceso de enseñanza aprendizaje, donde la inspiración es fundamental” (Flores-Vivar, García-Peñalvo, 2023, p.44).
La creación de imágenes a partir de la IA se ha visto incrementada con la aparición de herramientas y programas especializados como Craiyon, DALL·E, Midjourney, Stable Diffusion, Jasper, NightCafe y DeepAI, que permiten generar recursos aplicables a ámbitos profesionales como el arte o diseño gráfico. De hecho, los principales cuestionamientos sobre el empleo de esta tecnología en la difusión de información son la causa, por un lado, de la ética en cuanto a la veracidad y, por otra parte, en relación a la amenaza que supone para ciertos profesionales como los fotógrafos y creativos visuales (Franganillo, 2023).
La puesta en práctica de nuevas metodologías a partir del manejo de la IA, ofrece resultados que permiten observar cómo enfocar de forma eficaz y productiva estos recursos. Tal es el caso de la investigación realizada por varios docentes sobre el uso de la inteligencia artificial (IA) para aprender a dibujar a partir de dibujos y grabados de Goya, usando la plataforma Stable Diffusion (Marín-Viadel et al., 2024). El estudio concluye que las instrucciones que los docentes iban generando permitieron que la IA aprendiera a dibujar inspirándose en la obra Goya, planteando posibilidades didácticas y creativas.
Respecto a la línea de investigación que planteamos, uno de los trabajos de gran interés para esta investigación es el llevado a cabo por Bansal et al. (2024), en el que se evalúa el desempeño de IA de imagen en parámetros como la calidad, la diversidad y la eficiencia. También aborda las limitaciones y los desafíos éticos. Otro de los trabajos de especial interés es el de Pise et al. (2024, p.776), que, tras su investigación, concluyen que “el generador de imágenes que utiliza tecnologías de IA permite a los artistas crear arte visualmente cautivador basado en indicaciones textuales, democratizando el proceso creativo y mejorando la creatividad y la innovación humanas”. En una línea similar, enfocado al diseño, se sitúa el trabajo de Brisco et al. (2023, p.1838), donde identifican “si la IA moderna de texto a imagen podría usarse para reemplazar al diseñador en la etapa de generación de conceptos del proceso de diseño”. Con semejantes objetivos, relacionados con la generación de ideas en el diseño, se sitúa el trabajo de Ranscombe et al. (2024). Respecto a la generación de diseño de entornos virtuales, también es de interés el trabajo de Srivastava (2024).
Por tanto, desde la educación plástica y visual, la labor de los investigadores debe focalizarse en transmitir la necesaria capacidad crítica y reflexiva que se debe adoptar ante la IA, tanto como usuario, como espectador y receptor de este tipo de productos. Como nos recuerdan Huerta y Domínguez (2023), la IA puede favorecer una forma de entender la educación más eficaz, entendiendo el papel de las imágenes para comprender a la sociedad, de hecho “este avance tecnológico puede mejorar la calidad de la educación y la creatividad en la producción visual, enriqueciendo así la experiencia de aprendizaje y la expresión artística” (Huerta y Domínguez, 2023, p. 20).
Como se ha comentado, la utilización de la IA en todos los sectores productivos ha inducido a la modificación de la percepción de la información; sobre cómo se obtiene y cómo se utiliza, además de haber propiciado todo un aprendizaje sobre el cuestionamiento de lo que se lee y se ve. Esto ha ocasionado grandes cambios en la manera de manejar la información. Aquí destaca el sector educativo y el reto que se le presenta para integrar la IA de forma coherente y ética. El cómo se haga determinará la capacidad de la IA para aportar valor o perjudicar el aprendizaje. Las metodologías educativas están compuestas por las formas de ejercer la docencia para conseguir un fin educativo dentro de una disciplina y de una temática concreta. Esto las convierte en un vasto campo de acción sobre el que aplicar cambios metodológicos adaptados a estas nuevas maneras de manejar la información, obligando a diseñar estrategias para gestionar las intervenciones y los resultados que se obtienen, es decir, obliga a modificar las circunstancias en donde se aplicarán estos artefactos educativos emergentes.
Para llevar a cabo la investigación se plantearon dos preguntas desde las que orientar las acciones: ¿el uso de la IA generativa, dentro de una metodología activa de enseñanza, propicia la estructuración del pensamiento y la toma de decisiones?, ¿aporta la IA generativa suficiente consistencia para utilizarla como instrumento tecnológico para la creación de imágenes en un trasfondo educativo?
Desde estas premisas, el objetivo general que se planteó fue el de utilizar la IA generativa de texto y de imágenes dentro de un ecosistema educativo universitario controlado, integrándolas en las metodologías de enseñanza con la intención de averiguar si su uso para la creación favorecía o no el aprendizaje de los conceptos del lenguaje visual. Para esto se establecieron una serie de pautas que guiaron la investigación, pautas enmarcadas dentro de una asignatura relacionada con el lenguaje visual y plástico, y que definimos de la siguiente forma:
Crear un ecosistema creativo basado en un corpus de intervención estructurado que aporte un problema inicial desde el que trabajar.
Establecer un punto de partida educativo que integre la lectura y la producción de textos e imágenes utilizando sus componentes a nivel interpretativo y de creación del mensaje visual.
Guiar y estructurar las intervenciones de los participantes utilizando la IA generativa para la creación de un cartel de cine, aplicando los conocimientos adquiridos durante el estudio de la materia.
Analizar el proceso llevado a cabo por los participantes para comprobar si la IA generativa proporciona la consistencia fundamental para ser utilizada de forma crítica en la metodología docente expresada, reflexionando, además, sobre la propia propuesta educativa como acción metodológica válida.
Definimos la investigación realizada como un estudio de caso enmarcado dentro del paradigma del análisis cualitativo. Se centra en una exploración fenomenológica sobre cómo los sujetos participantes, utilizando dos IA generativas distintas, le dan sentido y elaboran soluciones de texto y gráficas a una historia narrativa creada con anterioridad. Para ello, se construye una acción educativa desde la que se induce a los participantes a trabajar creativamente construyendo estas narrativas, de forma que las acciones vayan dirigidas al modelado del texto y de las imágenes a través de la IA. Se motiva que la intervención de los participantes sea con una actitud crítica, desde el conocimiento de la materia, que cuestione las respuestas obtenidas a través de las IA generativas ChatGPT2 y Bing Image Creator3, de forma que, realizando acciones de análisis, reflexión y modificación reiterativa de las condiciones que se le piden a la IA, se obtenga un resultado textual y plástico acorde a lo buscado, mientras se ejercitan una serie de procesos cognitivos implicados en las dinámicas de la construcción lingüística y plástica.
Desde esta premisa, partiendo de las preguntas de investigación y de los objetivos antes planteados, en el estudio se realiza el análisis de la verbalización que los participantes han realizado mediante texto e imagen, así como el análisis de las acciones ejecutadas para modelar la respuesta de la IA a las premisas iniciales. Se analizan las narrativas de texto y los resultados gráficos mediante el programa para análisis cualitativo ATLAS.ti (v. 8.4), con el fin de obtener una serie de codificaciones detalladas del proceso de elaboración creativa. Tanto para lo que se considerasen resultados erróneos, como para las modificaciones de las condiciones nuevas, se hicieron agrupamientos en función de las fases en las que se realizaron. Los datos cuantitativos resultantes de este proceso se analizaron mediante el programa de análisis de datos Jamovi (v. 2.6.24).
Este estudio, al haber sido realizado en el contexto real de trabajo de los participantes, ha ofrecido a los investigadores una visión particular de los fenómenos sucedidos y de los procesos, al observar de forma directa las dinámicas e interacciones producidas durante el estudio, permitiendo obtener los documentos recopilatorios, los artefactos utilizados y las soluciones finales creadas, lo que ha facilitado la comprensión global del fenómeno.
La investigación se realizó en un contexto universitario con estudiantes del Grado en Educación Primaria de la Facultad de Educación de la Universidad de Murcia. Se realizó en el seno de una asignatura relacionada con el desarrollo del lenguaje visual, en cuyos contenidos educativos figuran conocimientos sobre el acto perceptivo, los elementos del lenguaje visual y plástico, sus relaciones espacio-temporales, de temporalidad y de composición, así como conocimientos sobre el mensaje visual. Cuando se llevó a cabo la investigación, los participantes ya disponían de conocimientos suficientes relacionados con la creación y la forma de estructurar el mensaje con códigos, signos y símbolos, desde los fundamentos de la semiología de la imagen. Para la investigación, hubo un total de 97 participantes, que fueron organizados en 22 grupos de entre cuatro y cinco componentes, para facilitar la capacidad de trabajo y de análisis reflexivo, generando finalmente un total de 22 muestras de trabajos distintos.
Tomando como base metodológica la propuesta realizada por Ramón-Verdú (2023), se parte del azar para inducir a un proceso creativo, con el objetivo de fomentar “la autonomía creadora frente a la imposición formal; el lenguaje como instrumento creativo; la idea como precursora de la estructuración imaginativa; la metáfora, el símbolo y el signo como artefactos portadores de conceptos e ideas comunicativas” (Ramón- Verdú, 2023, p. 5).
Como variante, dentro de esta dinámica de actuación, se introduce la IA para tratarla como un elemento diferenciador por poseer una gran potencialidad para utilizarse dentro de las metodologías creativas de enseñanza tradicionales. De esta forma se le atribuye gran parte del peso final de la propuesta, mientras se desliza el interés hacia otros procesos cognitivos distintos al de la creatividad, como son el razonamiento, la planificación, la flexibilidad y la toma de decisiones. En la Figura 1 se muestra un esquema básico que representaría la secuencia de actuación. Como se puede observar, el inicio de la dinámica reside en una acción docente en donde se muestran y se analizan ejemplos de carteles seleccionados por su pertinencia, en relación con las temáticas que se han tratado en la enseñanza del lenguaje visual y plástico. También se asignan palabras creadas al azar a cada uno de los grupos intervinientes. A continuación, se elabora una sinopsis integrando estas tres palabras asignadas en un texto breve, para después, comenzar con la elaboración de texto y de imágenes a través de las distintas IA mencionadas, registrando las acciones que se han llevado a cabo.
Esta secuencia de actuación anterior, los elementos destacados con color rojizo siguen las fases establecidas en Ramón-Verdú (2023), en donde se construye una secuenciación del aprendizaje de la materia, previa a la intervención que se plantea a través de la IA. Estas fases se detallan en la Tabla 1.
| Fases de elaboración | Denominación | Acción |
|---|---|---|
| Fase 1 | Ejemplos gráficos | Se expone, comenta y debate una selección de carteles, incidiendo en su relación con aspectos del lenguaje visual. |
| Fase 2 | Selección de palabras | Mediante una web para generar palabras al azar, se seleccionan tres palabras que servirán de hilo conceptual del ejercicio. |
| Fase 3 | Elaboración de la idea | Partiendo de las tres palabras al azar, se elabora un pequeño párrafo, a modo de sinopsis, para su posterior desarrollo. Las palabras pueden utilizarse de forma literal o figurada según al concepto o significado al que haga referencia. |
Fuente: elaborado a partir de la secuenciación realizada en Ramón-Verdú (2023)
Una vez realizado lo descrito en la Tabla 1, se aborda lo expresado en la Tabla 2, de manera que se elabora una historia mediante ChatGPT (Fase 4), para pasar posteriormente a la fase de creación plástica mediante Bing Image Creator (Fase 5).
| Fases de elaboración | Denominación | Acción |
|---|---|---|
| Fase 4 | Desarrollo de una historia | Desarrollo extenso del texto partiendo de la Fase 3 anterior. Introducción de la sinopsis, escenarios y personajes en ChatGPT. Detección de errores e introducción de nuevas condiciones y variables. Repetir hasta que la solución sea aceptable según lo esperado. |
| Fase 5 | Elaboración plástica | Partiendo de la narración elaborada mediante ChatGPT, extracción de elementos principales que definan la historia (escenarios, personajes y situaciones). Definición de los elementos gráficos y expresivos como color, tamaños, pesos visuales, equilibrios, puntos de atención, disposición de los elementos, etc. Introducción de condiciones en Bing Image Creator para la creación plástica. Detección de errores e introducción de nuevas condiciones y variables. Repetir hasta que la solución sea aceptable según lo esperado. |
Fuente: elaboración propia.
Debemos enfatizar la importancia que tiene en estas fases la idea de “proceso”. Tanto en la Fase 4 como en la Fase 5, todas las acciones se deben documentar de forma precisa, ya que esta recogida de datos será la fuente que permitirá analizar posteriormente lo sucedido. Para ello, se estableció un protocolo en el que se recogían los resultados aportados por ChatGPT y por Bing Image Creator, en función de lo que se le había pedido que realizaran y las nuevas condiciones que se les proponía.
La creación de los textos mediante IA se basa en una dinámica de construcción en la que se introducen las características que se pretende que el texto posea, y se rectifican estas características en función de los resultados ofrecidos por la IA. Estos resultados, agrupados en fases según si el código se detecta en el primer resultado o en resultados sucesivos, son los que se pueden observar en la Tabla 3. Aquí se observa la codificación realizada mediante ATLAS.ti, el número que se da y en qué fase o momento aparece.
| Código | Resultados y agrupamiento en Fases | ||||||||
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | Totales | |
| Asigna un color distinto | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 |
| Cambia características ya definidas | 2 | 7 | 5 | 1 | 1 | 1 | 0 | 0 | 17 |
| Equivoca el lugar | 6 | 3 | 0 | 4 | 0 | 0 | 0 | 0 | 13 |
| Equivoca el tiempo del suceso | 1 | 6 | 0 | 3 | 1 | 0 | 0 | 0 | 11 |
| Equivoca u omite un sentimiento | 2 | 6 | 4 | 0 | 3 | 1 | 0 | 0 | 16 |
| Faltan detalles importantes | 9 | 4 | 3 | 2 | 1 | 0 | 1 | 0 | 20 |
| Genera texto repetitivo | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 2 |
| Incluye personaje inexistente en la narración | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 3 |
| Introduce texto innecesario y superfluo | 3 | 4 | 2 | 1 | 0 | 0 | 0 | 0 | 10 |
| Inventa una acción no definida | 10 | 10 | 2 | 1 | 0 | 0 | 0 | 0 | 23 |
| Omite acciones ya definidas | 1 | 5 | 6 | 1 | 2 | 2 | 0 | 0 | 17 |
| Omite nombres de personajes | 5 | 1 | 1 | 1 | 1 | 0 | 0 | 1 | 10 |
| Totales | 42 | 48 | 24 | 14 | 9 | 4 | 1 | 1 | 143 |
Fuente: Elaboración propia.
De forma simultánea a la codificación de los resultados ofrecidos por la IA, se aborda la codificación de las nuevas condiciones de revisión del texto generado. Procediendo de la misma manera que en la tabla anterior, estas condiciones de revisión, agrupadas en fases según si el código afecta al primer resultado o a resultados sucesivos, son los que se pueden observar en la Tabla 4.
| Código | Condiciones de revisión y agrupamiento en Fases | ||||||||
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | Totales | |
| Se elimina personaje | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 |
| Se generan sentimientos | 6 | 5 | 5 | 0 | 1 | 0 | 1 | 0 | 18 |
| Se incluyen nombres | 5 | 1 | 0 | 0 | 1 | 0 | 0 | 1 | 8 |
| Se invita a crear acciones nuevas | 12 | 9 | 7 | 0 | 1 | 1 | 0 | 0 | 30 |
| Se rectifica el color | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 |
| Se rectifica el lugar | 7 | 5 | 0 | 3 | 1 | 0 | 0 | 0 | 16 |
| Se rectifica el momento de un suceso | 6 | 10 | 3 | 3 | 0 | 1 | 0 | 0 | 23 |
| Se rectifica el papel del personaje | 5 | 10 | 4 | 2 | 0 | 0 | 0 | 0 | 21 |
| Se rectifica la acción | 9 | 14 | 7 | 6 | 1 | 1 | 2 | 0 | 40 |
| Se rectifican nombres | 3 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 5 |
| Totales | 55 | 56 | 26 | 14 | 5 | 3 | 3 | 1 | 163 |
Fuente: Elaboración propia.
Como se puede observar en las tablas que anteceden, hubo 143 asignaciones de códigos designando errores en distintos momentos de los textos, y 163 asignaciones de códigos para rectificar dichos errores detectados.
La creación de imágenes y el análisis del proceso parte de premisas similares a las de la creación de la historia que se ha visto anteriormente. La creación se aborda desde una dinámica basada en una petición y una respuesta, pero bajo un proceso particularmente distinto y diferenciador. Para crear una narrativa visual que recoja las ideas y pensamientos incluidos en los textos, se tiene que realizar una síntesis de dichas historias. Esta síntesis debe recoger los hitos, personajes o ideas que destaquen y que sean significativos dentro de la historia narrada, para que dirija la creación de la narrativa visual. De esta forma, identificando todo aquello que se considere representativo, se aborda la elaboración gráfica de lo narrado.
Como se ha comentado, la IA utilizada ha sido Bing Image Creator. Esta utiliza DALL·E 34. A través de un mensaje de texto, la IA generará un conjunto de imágenes que se aproximarán a lo que se expresa en los indicadores del mensaje, de forma que, mediante la construcción de frases descriptivas, se represente visualmente una aproximación de lo solicitado. A partir de ahí, se podrán editar las imágenes y descargarlas para su uso. Una de las principales limitaciones observadas para la construcción de las frases descriptivas ha sido la limitación a 480 caracteres en la versión gratuita de la herramienta, cuestión que inicialmente ha limitado bastante la definición de los indicadores para que reflejen una descripción precisa de la imagen.
Como se ha comentado anteriormente, fue 22 la muestra de trabajos recogidos. Dada la extensión del análisis en su conjunto, en la Tabla 5 se recoge una muestra representativa de cinco de los trabajos realizados, y en donde se especifica el indicador inicial proporcionado a la IA, cuantas repeticiones fueron necesarias para alcanzar una imagen adecuada, si hubo que editar la imagen final —representadas en la tabla por las abreviaturas Rep. y Ed. respectivamente—, además de las muestras de la imagen inicial y final. También se incluye un análisis del caso, centrado en la composición y el cromatismo.
| Caso | Indicador inicial | Rep. | Ed. | Inicial | Final |
| 1 | Un piloto manejaba un avión y mientras cruzaba el ecuador del planeta, decidió ponerse una película sobre gladiadores para no aburrirse. Mientras veía en su descanso del vuelo la película, fue interrumpido por el ruido de unos niños del pasillo del avión que no paraban de reírse mientras contaban chistes. | 5 | N | ||
| Análisis del caso: En el proceso inicial de creación de las imágenes implicó que apareciesen elementos inesperados, como gladiadores acercándose al avión al aterrizar. Esta IA estableció los elementos visuales y los escenarios básicos, pero en circunstancias y posiciones absurdas, aunque, a priori aportaban dinamismo con cierta correspondencia con la narración. En la imagen final se eliminó todo lo superfluo, construyéndose desde la síntesis y la simplicidad, concretándose en una lectura básica pero efectiva. Aquí, la composición se establece desde una zona central con un gran contraluz, lo que permite destacar los elementos principales de la historia. El cromatismo también evoluciona desde esquemas de color simples hacia colores más intensos, lo que proporciona la interpretación y un desarrollo en la narración visual, pasando de configuraciones estáticas a escenas dinámicas con mayor atracción e impacto visual. | |||||
| 2 | Haz un cartel de cine con animales fantásticos y dos mundos paralelos, el mundo animal y el mundo humano en un arco dimensional. | 32 | S | ||
| Análisis del caso: En la imagen inicial y en varias de las posteriores se observa una composición con elementos aislados, sin una integración completa. La representación gráfica es rica en elementos, pero está falta de narrativa. A medida que se avanza hacia las imágenes posteriores, la composición se vuelve más compleja y equilibrada. Se introduce un enfoque tridimensional con la distribución de elementos visuales. El escarabajo, como personaje principal, se destaca por su tamaño y posición central, creando un punto focal claro. Además, se logra un equilibrio visual al distribuir los elementos de manera simétrica. El cromatismo evoluciona hacia una paleta más simbólica. Se utilizan colores como el azul y el amarillo para representar emociones y conceptos, añadiendo profundidad y significado a la composición. La progresión desde las primeras imágenes hasta las finales muestra un desarrollo significativo, pasando desde una estructura básica con elementos aislados hacia una complejidad visual equilibrada y simbólica. La imagen final está compuesta a modo de collage debido a que la IA no es capaz de representar con fidelidad la historia en la que se basa la imagen. | |||||
| 3 | Crea un cartel de un historiador llamado Marvin cuyo barco se hunde y acaba sumergido en el mar revelándose ante él los secretos de aquellas cartas anónimas. Al final, Marvin acaba en una isla desierta. | 21 | S | ||
| Análisis del caso: La imagen inicial resultante muestra al protagonista con acceso a un portal submarino que lo puede transportar a una ciudad. La composición es equilibrada y proporcional, con un claro enfoque en el centro. El proceso de las imágenes que podemos observar nos lleva hacia la imagen final, con una composición más dinámica, con direcciones claras sugeridas por los brazos y piernas del personaje, así como por la perspectiva del barco y el horizonte. Además, se introduce la proporción áurea, lo que añade un peso visual específico a ciertos elementos. En cuanto al cromatismo, inicialmente se utiliza una paleta basada en colores fríos de tonalidad azul, con variaciones debidas a la luz, típicas de un entorno marino. En la imagen final se observa una armonía de colores adyacentes, con naranja, azul y verde, lo que añade profundidad y movimiento a la imagen mostrando un claro avance en la complejidad de la composición y el cromatismo. | |||||
| 4 | Crea una imagen de una familia en un barrio muy pobre de Bogotá. | 7 | S | ||
| Análisis del caso: En la primera imagen, la composición se centra en los protagonistas, ubicados en el centro de la imagen, generando cierto equilibrio, pero con una clara falta de información de contexto. En la imagen final estas cuestiones se han superado, ya que, los personajes protagonistas están definidos en cuanto sus características personales, junto con las líneas de las casas y tejados que inducen a dirigir la mirada hacia un punto de fuga, creando un sentido de dirección, además de aportar información contextual. Cromáticamente, aunque la primera imagen tiene colores bastante definidos y realistas, es en la imagen final donde se observa un cambio significativo en el cromatismo. Los colores pasan de ser llamativos a tonalidades más apagadas y tristes, reflejando la desolación del barrio. Los rostros de los personajes también cambian, mostrando expresiones más serias y tristes, lo que refuerza el tono emocional de la historia y ayuda a la interpretación de esta a través de la narrativa visual. La imagen final logra un impacto visual profundo, alineándose con el mensaje de la historia. | |||||
| 5 | Crea un cartel de cine donde salga Confucio de fondo, una rata de laboratorio y los altos cargos en China. | 16 | S | ||
| Análisis del caso: Desde la primera imagen hasta la final se observa una evolución significativa en la composición y el cromatismo. Inicialmente, las imágenes presentaban una estructura estática, con elementos distribuidos de manera poco dinámica y un uso de colores limitado. Sin embargo, a medida que se avanza, la composición se vuelve más fluida con un mayor contraste y una distribución más armoniosa de los elementos visuales, además de finalizar con un gran dinamismo compositivo. En términos de cromatismo, la primera imagen muestra una paleta de colores reducida y poco vibrante. En cambio, en la imagen final, se aprecia una mayor variedad de tonos y una utilización más estratégica del color para resaltar los elementos clave. Esto contribuye a un mayor impacto visual y a una mejor narrativa dentro del cartel. | |||||
Fuente: Elaboración propia.5
El proceso de elaboración de los textos y las imágenes es dinámico, ya que cada decisión se tomará en relación con lo obtenido previamente, asignando sucesivos indicadores para acomodar lo obtenido a un nuevo resultado modificado. Esto conlleva una progresión con cambios en las narrativas hasta conseguir la que mejor se adecúe a la historia original.
Según los datos obtenidos de las acciones realizadas por los intervinientes (Tabla 3), se pueden establecer los errores más comunes realizados por la IA. La frecuencia de cada tipo de error, ordenándolos de mayor a menor frecuencia total, son los siguientes:
Inventa una acción no definida: 23 veces.
Faltan detalles importantes: 20 veces.
Cambia características ya definidas: 17 veces.
Omite acciones ya definidas: 17 veces.
Equivoca u omite un sentimiento: 16 veces.
Equivoca el lugar: 13 veces.
Equivoca el tiempo del suceso: 11 veces.
Omite nombres de personajes: 10 veces.
Introduce texto innecesario y superfluo: 10 veces.
Incluye personaje inexistente en la narración: 3 veces.
Genera texto repetitivo: 2 veces.
Asigna un color distinto: 1 vez.
Los resultados están relacionados, principalmente, con la invención de acciones que no han sido definidas previamente, la omisión de información importante y la alteración de características establecidas previamente. También cobra importancia el hecho de que la IA no respete acciones que han sido aceptadas, variándolas sin ningún tipo de justificación aparente. Al parecer, también tiene problemas para representar sentimientos, ya sea porque los equivoca o porque los omite, aunque se le diga que lo represente. También resulta interesante que equivoque el lugar del suceso bastante a menudo, aunque se le informe de cuál es, así como omitir el nombre de los personajes, aunque se le haya dicho que lo incluyese. Los errores más frecuentes se producen en las primeras fases de codificación, especialmente en la segunda (47 errores) seguida por la primera (41 errores).
Los datos muestran una tendencia clara de mejora en la precisión a lo largo de las intervenciones. En las primeras etapas, los errores son muy frecuentes, especialmente los relacionados con la invención de la información y la omisión de detalles importantes. Sin embargo, durante el proceso, los errores disminuyen, lo que sugiere que los participantes logran ajustar su comprensión y precisión narrativa. Las primeras intervenciones son las más problemáticas, mientras que, hacia el final del proceso, los participantes demuestran un mayor control sobre la información y como deben describirla. Esto refuerza la idea de que la repetición y la práctica tienen un impacto positivo en la reducción de los errores.
Con relación a las nuevas condiciones de revisión de los textos (Tabla 4), la frecuencia de cada una de ellas, ordenadas de mayor a menor, es la siguiente:
Se rectifica la acción: 40 veces.
Se invita a crear acciones nuevas: 30 veces.
Se rectifica el momento de un suceso: 23 veces.
Se rectifica el papel del personaje: 21 veces.
Se generan sentimientos: 18 veces.
Se incluyen nombres: 8 veces.
Se rectifican nombres: 5 veces.
Se elimina personaje: 1 vez.
Se rectifica el color: 1 vez.
Las acciones más frecuentes están relacionadas con la rectificación de información errónea (acción, momento del suceso, papel del personaje), así como la invitación a agregar nuevas acciones. Esto sugiere que los textos iniciales presentan muchas alteraciones en la secuencia de eventos y en las acciones de los personajes. En contraste, las correcciones más específicas (color, eliminación de personaje, rectificación de nombres) son las menos comunes. Es de destacar que las indicaciones para que se generen sentimientos (18 veces) es algo que está presente, al igual que como ocurrió en el momento de la detección de errores.
Las revisiones más frecuentes se producen en las primeras fases de codificación, especialmente en la segunda (56 codificaciones) seguida por la primera (55 codificaciones), disminuyendo de forma clara en las siguientes fases. A partir de la tercera revisión, hay una reducción progresiva, con un mínimo de una sola corrección en la octava. Al igual que ocurrió en la detección de errores, esta tendencia sugiere que los participantes comienzan con muchas modificaciones, lo que indica problemas iniciales con la precisión o la coherencia de la información. Sin embargo, a medida que avanzan las intervenciones, parece que logran indicar con mayor precisión, y que la IA va perfeccionando su salida.
En general, al igual que ocurrió en la fase de detección de errores, los datos reflejan una evolución positiva, demostrando que la práctica, el proceso y la revisión sistemática tienen un impacto significativo en la mejora del producto creado por la IA. Tanto los errores detectados, como las instrucciones para corregirlos, como es natural, evolucionan de forma paralela, lo que evidencia una evolución claramente positiva en la estrategia diseñada para la creación de textos mediante IA.
El análisis de las imágenes se realiza en función de la composición y del cromatismo que reflejan las imágenes generadas, dado que, analizar los procesos de elaboración plástica y su estructura espacial, desde el punto de vista del orden, la estructura y la significación (Villafañe, 2012), resulta de gran interés para estos investigadores. Cómo se organizan los elementos y cómo evolucionan dentro de un esquema de construcción paulatina, la composición planificada y las variaciones cromáticas elaboradas a partir de un texto, configuran una gran parte de la formación que se les ofrece a los participantes.
Una vez recopilados los datos del proceso de creación de imágenes, tal y como se ha podido ver en la Tabla 5, se pueden establecer una serie de elementos comunes que evidencian los procesos realizados en las 22 creaciones realizadas. Estos son los siguientes:
Progresión visual y narrativa
En todas las imágenes analizadas, hay un claro desarrollo desde una composición inicial más básica y desordenada hacia una más estructurada y equilibrada. La narrativa visual se fortalece progresivamente, con mejoras en la disposición de los diversos elementos, en la integración de detalles simbólicos y en la coherencia con la historia que se pretende contar.
Mejora en la composición
Las imágenes iniciales suelen presentar una distribución poco refinada de los elementos visuales, mientras que en las versiones finales se logra un mejor equilibrio respecto a las anteriores. Se observa un uso generalizado de la simetría, de la perspectiva y del espacio negativo a través de contraluces, contribuyendo a la percepción de los elementos destacados y a crear una armonía visual.
Evolución del cromatismo
El color juega un papel fundamental en la transformación de las imágenes. En las primeras versiones, la paleta de colores es simple o con pocos matices, mientras que en las versiones finales se observa una mayor riqueza cromática y un uso bastante más estratégico del color que en las imágenes iniciales. Se emplean contrastes bastante marcados y se introducen colores con cierto peso simbólico, reforzando la atmósfera emocional de las escenas.
Coherencia con la historia
A medida que las imágenes evolucionan, se representan mejor con las narrativas originales. En bastantes casos, los elementos visuales iniciales eran incongruentes con la historia o no lograban transmitir las indicaciones iniciales. Sin embargo, en las versiones finales se eliminan detalles innecesarios y se integran elementos que refuerzan el mensaje narrativo. Sobre este aspecto, hay que tener en cuenta la destreza inicial de los sujetos a la hora de introducir los indicadores iniciales, variables que serán determinantes para un resultado aceptable.
Elaboración visual y expresividad
Se podría decir que, en general, las imágenes finales logran una significancia perceptiva avanzada, debido a la mejora en la composición y el cromatismo. En las imágenes se aprecia una elaboración planificada de los detalles expresivos, de los personajes y de la atmósfera general de conjunto. Se observa un uso adecuado de la iluminación y las sombras, para resaltar elementos clave y mejorar en la tridimensionalidad de las imágenes y de las perspectivas.
De forma general, se podría decir que el análisis de las imágenes revela un proceso de mejora visual y narrativa, fruto del proceso de análisis de los resultados y de las modificaciones que se han realizado. Muestra una evolución clara en términos de composición, cromatismo y coherencia narrativa. Las versiones finales no solo presentan mejoras en la disposición de elementos y en el uso del color, sino que también logran una mayor expresividad y conexión con la historia. Este proceso de afinamiento demuestra la importancia del diseño visual en la comunicación de ideas y emociones, subrayando cómo los detalles visuales pueden transformar significativamente la percepción que se tiene de una imagen y su mensaje.
Tras realizar el análisis de las dinámicas descritas y de los resultados obtenidos, se ha podido constatar que las acciones llevadas a cabo por los intervinientes han evolucionado hacia la demostración del dominio de la materia, tanto a nivel conceptual teórico, evidenciado por la actitud crítica durante la elaboración de los textos, como a nivel práctico o constructivo, al generar imágenes plásticas modificando sus características hasta ofrecer una solución aceptable, relacionada, de forma inequívoca, con la historia original.
Resulta particularmente importante el cuarto objetivo planteado al inicio de este escrito: “Analizar el proceso llevado a cabo por los participantes para comprobar si la IA generativa proporciona la consistencia fundamental para ser utilizada de forma crítica en la metodología docente expresada, reflexionando, además, sobre la propia propuesta educativa como acción metodológica válida”. En él se describe la intención final de la investigación. Como se ha podido comprobar, los participantes comienzan en todos los casos con imprecisiones y falta de coherencia en lo que se le pedía a las IA, lo que conllevado bastantes modificaciones iniciales. No obstante, según iban avanzando en el proceso de construcción, tal y como era de esperar, las IA han ido perfeccionando sus salidas debido, según interpretamos, a la mejora paulatina en las peticiones, y al propio aprendizaje que pudieran haber realizado estas IA.
Si nos centramos en la creación de las imágenes, podríamos decir que ha habido un proceso de mejora visual y narrativa de los resultados. La evolución está clara si nos basamos en la comparativa de construcción de texto y en la de la construcción de las imágenes, ya que los conceptos fundamentales para la construcción de imágenes han mostrado una evolución muy positiva en términos de composición, color y coherencia narrativa, afianzando igualmente una gran expresividad y una conexión real con las historias.
Sin duda, integrar la IA dentro del proceso de construcción del pensamiento, resulta beneficiosa. En esta investigación no nos interesaba analizar los resultados de las IA como tal, sino indagar en cómo se construye el proceso de aprendizaje a través de ellas, cuestionando, desde el conocimiento, todo aquello que ofrecían, ya fuese texto o imagen, sin dar por bueno cualquier resultado por muy efectista que pareciese. Resulta particularmente interesante haber observado cómo ha sido la evolución de la narrativa visual, utilizando elementos simbólicos o introduciendo los sentimientos, aunque, según los resultados obtenidos, la IA todavía presenta dificultades para integrarlos de forma adecuada.
En todos los casos, se ha percibido que el proceso ha ido evolucionando de forma muy positiva, reforzando la idea de que la práctica, junto con la revisión sistemática de los resultados, permiten estructurar el pensamiento para aplicar diversos conceptos de aprendizaje de una manera coherente, acorde a lo esperado en el aprendizaje de la materia.
El análisis de los textos y de las imágenes generadas, nos ha llevado a poder comprender los resultados en función de los procesos que se han realizado, las dinámicas de elaboración y el compromiso adquirido por los participantes para realizar las tareas. Esto nos lleva a poder afirmar que integrar las IA en las metodologías de aprendizaje aporta beneficios, ya sean del propio aprendizaje disciplinar, como en la formación del interviniente desde parámetros de toma de decisiones, razonamiento, planificación y control de su propio aprendizaje durante la toma de decisiones.
Bansal, G., Nawal, A., Chamola, V. y Herencsar, N. (2024). Revolutionizing Visuals: The Role of Generative AI in Modern Image Generation. ACM Transactions on Multimedia Computing, Communications, and Applications, 356(20), 1-22. https://doi.org/10.1145/3689641
Brisco, R., Hay, L. y Dhami, S. (2023). Exploring the role of text-to-image ai in concept generation. Proceedings of the Design Society, 3, 1835-1844. https://doi.org/10.1017/pds.2023.184
Flores-Vivar, J. M. y F. J. García-Peñalvo (2023). Reflexiones sobre la ética, potencialidades y retos de la Inteligencia Artificial en el marco de la Educación de Calidad (ODS4). Comunicar, 74, 37-47. https://doi.org/10.3916/C74-2023-03
Franganillo, J. (2023). La inteligencia artificial generativa y su impacto en la creación de contenidos mediáticos. Methaodos. Revista de Ciencias Sociales, 11(2). http://dx.doi.org/10.17502/mrcs.v11i2.710
Huerta, R. y Domínguez, R. (2024). Inteligencia Artificial. Sinergias entre humanos y algoritmos creativos. Educación artística: revista de investigación (EARI), 14. https://doi.org/10.7203/eari.14.27945
López de Mántaras, R. (2016). La inteligencia artificial y las artes. Hacia una creatividad computacional. VV. AA. El próximo paso. La vida exponencial. Madrid: BBVA, 99-123. Disponible en https://www.bbva.com/wp-content/uploads/2024/07/BBVA-OpenMind-libro-El-proximo-paso-vida-exponencial1.pdf
Marín-Viadel, R., Campos, R. y Roldán, J. (2024). Inteligencia artificial, Goya y el aprendizaje del dibujo. Primeros pasos. Arte, Individuo y Sociedad, 36(2), 1-17. https://doi.org/10.5209/aris.92891
Peirón, F. (2023). Nueva York prohíbe el ChatGPT en sus escuelas. La Vanguardia. Consultado el 12 de enero de 2025 en https://www.lavanguardia.com/vida/20230106/8669098/nueva-york-prohibe-escuelas-chatgpt-temor-mentiras.html
Pise, M., Yadgiri, N., Gaikwad, P., Dusawar, Y. y Nandanwar, P. (2024). AI Image Generator. International Journal of Advanced Research in Science, Communication and Technology, 4(4), 773-778. https://doi.org/10.48175/ijarsct-18385
Ramón-Verdú, A. J. (2023). Del texto narrativo a la imagen visual: factores del proceso metodológico en una acción educativa. Educación Artística: revista de investigación (EARI), 14, 138-151. https://doi.org/10.7203/eari.14.26389
Ranscombe, C., Tan, L., Goudswaard, M. y Snider, C. (2024). Inspiration or indication? Evaluating the qualities of design inspiration boards created using text to image generative AI. Proceedings of the Design Society, 4, 2207-2216. https://doi.org/10.1017/pds.2024.223
Rodrigo-Martín, I., Rodrigo-Martín, L. y Pérez-García, Álvaro. (2022). Creativity as a tool for understanding education: The role of creativity as a catalyst for educational transformation. VISUAL REVIEW. International Visual Culture Review Revista Internacional de Cultura Visual, 9(3), 1–12. https://doi.org/10.37467/revvisual.v9.3533
Srivastava, A. (2024). Advancements in Text-to-Image Generation through Generative AI. International journal of scientific research in engineering and management, 9(2). https://doi.org/10.55041/ijsrem33569
Vicente-Yagüe-Jara, M.I., López-Martínez, O., Navarro-Navarro, V., y Cuéllar-Santiago, F. (2023). Escritura, creatividad e inteligencia artificial. ChatGPT en el contexto universitario. Comunicar, 77, 47-57. https://doi.org/10.3916/C77-2023-04
Villafañe, J. (2012). Introducción a la teoría de la imagen. Pirámide.
Este artículo está relacionado con el proyecto “DECHADOS. Creatividad inclusiva en secundaria mediante la relación entre centros educativos y museos”, concedido por el Ministerio de Ciencia e Innovación, en la convocatoria de Proyectos de Generación de Conocimiento en Ciencias Sociales / Educación. El proyecto está promovido por el grupo de Investigación en Pedagogías Culturales (CREARI) de la Universidad de Valencia, que cuenta con 17 investigadores y su número de referencia es PID2021- 123007OB-I00.↩︎
Según la consulta realizada a ChatGPT el 19 de febrero de 2025, ChatGPT es un modelo de inteligencia artificial desarrollado por OpenAI, diseñado para procesar y generar texto en lenguaje natural. Utiliza aprendizaje profundo y redes neuronales avanzadas para comprender preguntas, responder con coherencia y adaptarse a distintos contextos conversacionales. Es capaz de analizar información, generar resúmenes, redactar textos y ofrecer asistencia en diversas áreas, como educación, creatividad y programación.↩︎
Según la consulta realizada a ChatGPT el 19 de febrero de 2025, Bing Image Creator es una herramienta de generación de imágenes basada en inteligencia artificial, desarrollada por Microsoft y potenciada por modelos avanzados de IA, como DALL·E. Permite a los usuarios crear imágenes a partir de descripciones textuales, utilizando aprendizaje automático para generar representaciones visuales realistas o estilizadas según las indicaciones proporcionadas.↩︎
Según la consulta realizada a Bing Chat el 19 de febrero de 2025, DALL-E 3 es la última versión del modelo de generación de imágenes a partir de texto desarrollado por OpenAI. Este modelo crea imágenes realistas y detalladas basadas en descripciones textuales. Sus principales características son: mejora en la precisión, fiabilidad y en la calidad de la imagen, integración con ChatGPT, Bing Chat y Bing Create, incorporando mayor seguridad y ética.↩︎
La autoría de las imágenes corresponde a los propios grupos de trabajo que las elaboran y Bing Image Creator como herramienta de creación.↩︎