¿La inteligencia artificial ya es más creativa que los seres humanos?
Un estudio con 100.000 personas y varios modelos de inteligencia artificial revela que sistemas como GPT-4 ya superan la creatividad media humana, aunque siguen lejos de los individuos más creativos. La investigación abre un debate clave sobre el futuro de la creatividad, la IA generativa y el trabajo creativo.
Por Enrique Coperías, periodista científico
Un estudio científico a gran escala, con 100.000 participantes y los modelos de IA más avanzados, pone a prueba una de las últimas fronteras de la mente humana: la creatividad. Crédito: IA-Gemini-©RexMolón Producciones
La creatividad humana ha sido considerada por los arqueólogos y neurocientíficos uno de los últimos bastiones de la mente humana: una capacidad esquiva, ligada a la imaginación, la cultura y la experiencia vital. Pero la irrupción de los grandes modelos de lenguaje —los sistemas de inteligencia artificial generativa capaces de escribir poemas, cuentos o guiones en cuestión de segundos— ha reavivado una pregunta incómoda: ¿puede una máquina ser tan creativa como una persona? Y, más aún, ¿puede llegar a superarla?
Un estudio publicado en la revista Scientific Reports aporta una de las respuestas más ambiciosas hasta la fecha. El trabajo compara el rendimiento creativo de varios modelos de inteligencia artificial con el de nada menos que 100.000 personas. El resultado es tan matizado como revelador: algunas IA ya superan al promedio humano en determinadas pruebas de creatividad, pero siguen quedándose cortas frente a las personas más creativas.
La investigación ha sido liderada por un equipo internacional de neurocientíficos, psicólogos y expertos en inteligencia artificial, con la participación de figuras destacadas como Yoshua Bengio, uno de los padres del aprendizaje profundo. Su objetivo no era dirimir si las máquinas piensan como nosotros, sino algo más concreto y medible: comparar la capacidad de generar ideas diversas y alejadas entre sí, una faceta clave de lo que los psicólogos llaman pensamiento divergente.
🗣️«Nuestro estudio muestra que algunos sistemas de inteligencia artificial basados en grandes modelos de lenguaje ya pueden superar la creatividad media de los humanos en tareas bien definidas», explica Karim Jerbi, profesor de Psicología en la Universidad de Montreal (Canadá) y autor principal del trabajo.
Medición de la creatividad sin jueces humanos
Evaluar la creatividad siempre ha sido un reto. Tradicionalmente se han utilizado pruebas como pedir usos alternativos para un objeto cotidiano —un ladrillo, por ejemplo—, pero estas evaluaciones suelen depender de jueces humanos y están cargadas de subjetividad. Para evitarlo, los autores del estudio recurrieron a una herramienta más reciente y objetiva: el Divergent Association Task (DAT).
La prueba es simple en apariencia. Se pide a los participantes que escriban diez palabras que sean lo más distintas posible entre sí en significado y uso. No se permiten nombres propios ni términos técnicos. La creatividad se mide calculando la distancia semántica entre esas palabras mediante modelos computacionales del lenguaje: cuanto más alejados estén los conceptos en el espacio semántico, mayor es la puntuación.
La gran ventaja del DAT es que permite comparar directamente a humanos y máquinas usando exactamente el mismo criterio. En el estudio, los investigadores analizaron las respuestas de 100.000 personas angloparlantes —equilibradas por edad y sexo— y las confrontaron con las de una amplia gama de modelos de lenguaje, desde sistemas comerciales, como GPT-4 y Gemini Pro, hasta modelos abiertos más pequeños.
«Hemos desarrollado un marco riguroso que nos permite comparar la creatividad humana y la de la inteligencia artificial utilizando las mismas herramientas, basándonos en datos de más de 100.000 participantes —subraya Jerbi— en colaboración con Jay Olson, de la Universidad de Toronto».
Cuando la IA supera al humano medio
Los resultados son sorprendentes. GPT-4, uno de los modelos más avanzados de OpenAI, obtuvo una puntuación media en el DAT superior a la del conjunto de participantes humanos. Gemini Pro, el modelo de Google, quedó prácticamente empatado con la media humana. En otras palabras: en esta prueba concreta de pensamiento divergente, algunas IA ya rinden mejor que la persona promedio.
🗣️ «Este resultado puede resultar sorprendente —e incluso inquietante —reconoce Jerbi. Y añade—: Pero nuestro trabajo también pone de relieve una observación igual de importante: incluso los mejores sistemas de IA siguen estando por debajo de los niveles alcanzados por los seres humanos más creativos».
Sin embargo, el titular se matiza rápidamente al observar la distribución completa de resultados. Cuando los investigadores compararon a los modelos con los humanos más creativos —el 50%, el 25% o el 10% superior de la muestra—, ninguna IA logró superarlos. Incluso los sistemas más potentes quedaron por debajo de la media de la mitad más creativa de las personas.
«La brecha persiste en la parte alta de la creatividad humana», concluyen los autores. Dicho de otro modo: la inteligencia artificial puede imitar —e incluso mejorar— la creatividad estándar, pero todavía no alcanza el nivel de quienes destacan de forma excepcional.
«Al confrontar directamente las capacidades humanas y las de las máquinas, estudios como este nos obligan a replantearnos qué entendemos por creatividad», señala Karim Jerbi, autor principal del estudio.
Creatividad ajustable: el efecto de las instrucciones
Uno de los hallazgos más interesantes del estudio es que la creatividad de las máquinas no es fija, sino que puede modularse. Los investigadores demostraron que cambiar las instrucciones —los llamados prompts— o ajustar parámetros internos del modelo altera significativamente su rendimiento creativo.
Por ejemplo, al pedir explícitamente a los modelos que variaran la etimología de las palabras (su origen lingüístico), las puntuaciones de creatividad aumentaron. En cambio, cuando se les indicó que buscaran palabras con significados opuestos, el rendimiento cayó, ya que los opuestos suelen estar semánticamente más próximos de lo que parece.
Otro factor clave es la llamada temperatura, un parámetro que controla cuán predecible o arriesgada es la salida del modelo. A mayor temperatura, más variadas e impredecibles son las respuestas. En GPT-4, aumentar este valor elevó notablemente las puntuaciones de creatividad, hasta situarlas por encima del 72% de los participantes humanos.
Este paralelismo no pasa desapercibido para los autores: subir la temperatura en una IA se asemeja, en cierto modo, a fomentar la fase de exploración del proceso creativo humano, cuando se generan muchas ideas antes de seleccionar las mejores.
Más allá de las palabras sueltas
Pero la creatividad no se limita a listar palabras inconexas. Para comprobar si estos resultados se mantenían en contextos más complejos, el equipo analizó también la capacidad de los modelos para escribir textos creativos: haikus (poema corto japonés de tres versos, sin rima, que sigue una estructura de 5, 7 y 5 sílabas o moras), sinopsis de películas y relatos de ficción breve.
Aquí, la ventaja vuelve a inclinarse hacia el Homo sapiens. Aunque GPT-4 supera a otros modelos en estas tareas y se aproxima al rendimiento humano, los textos escritos por personas muestran, de media, una mayor riqueza semántica y una integración más compleja de ideas. Especialmente en formatos muy estructurados, como el haiku, los humanos mantienen una clara superioridad.
Los análisis computacionales revelan, además, que los textos generados por humanos y máquinas ocupan regiones distintas en el espacio semántico, como si pertenecieran a estilos narrativos o universos creativos diferentes. No se trata solo de calidad, sino de una huella lingüística distinta.
¿Creatividad real o imitación sofisticada?
El estudio subraya una cuestión clave: que una IA obtenga buenas puntuaciones en pruebas de creatividad no significa que sea creativa en el mismo sentido que un ser humano. Las máquinas no tienen experiencias vitales, emociones ni intenciones. Su creatividad emerge de la recombinación estadística de enormes cantidades de texto previo.
Aun así, el paralelismo en los resultados plantea interrogantes profundos sobre cómo medimos la creatividad. Si una prueba diseñada para humanos puede ser superada por una máquina, ¿estamos captando la esencia del fenómeno creativo o solo una de sus manifestaciones?
🗣️ «Al confrontar directamente las capacidades humanas y las de las máquinas, estudios como el nuestro nos obligan a replantearnos qué entendemos realmente por creatividad», reflexiona Jerbi.
Ni sustitución ni rendición
Frente a los temores recurrentes sobre la sustitución de escritores, artistas o guionistas por máquinas, el estudio ofrece un mensaje más sereno. La inteligencia artificial avanza rápidamente y ya iguala —o supera— el promedio humano en tareas creativas acotadas. Pero la creatividad más exigente, la que define carreras artísticas o impulsa cambios culturales, sigue siendo patrimonio humano.
«Aunque la IA ya puede alcanzar niveles de creatividad similares a los humanos en ciertas pruebas, debemos ir más allá de esta sensación engañosa de competición» advierte el investigador.
Más que una competencia directa, los autores proponen pensar en la colaboración humano-máquina. Las IA pueden convertirse en herramientas poderosas para estimular ideas, explorar alternativas o desbloquear procesos creativos, sin reemplazar la chispa humana que da sentido a esas ideas.
🗣️ «La inteligencia artificial generativa se ha convertido, ante todo, en una herramienta extremadamente potente al servicio de la creatividad humana: no sustituirá a los creadores, pero transformará profundamente la manera en que imaginan, exploran y crean —para quienes decidan utilizarla—», concluye Jerbi.
La pregunta, entonces, no es si la inteligencia artificial ha superado nuestra creatividad humana, sino cómo redefinimos la creatividad en un mundo donde las máquinas inteligentes también juegan. Y, sobre todo, qué haremos los humanos con esa nueva compañía en el terreno de la imaginación.▪️
Información facilitada por la Universidad de Montreal
Fuente: Bellemare-Pepin, A., Lespinasse, F., Thölke, P. et al. Divergent creativity in humans and large language models. Scientific Reports (2026). DOI: https://doi.org/10.1038/s41598-025-25157-3

