La IA puede superar a la mayoría de los humanos en tareas de pensamiento creativo, según un nuevo estudio: los chatbots de IA de modelo de lenguaje grande (LLM) pueden superar al humano promedio en una tarea de pensamiento creativo en la que el participante idea usos alternativos para objetos cotidianos, un ejemplo en el que se aplica el pensamiento divergente. Sin embargo, los participantes humanos con las puntuaciones más altas superaron a las mejores respuestas del chatbot en la misma prueba.

Mika Koivisto, de la Universidad de Turku, en Finlandia, y Simone Grassini, de la Universidad de Bergen, en Noruega, publicaron recientemente un nuevo estudio en la revista Scientific Reports en el cual concluyen que los chatbots de Inteligencia Artificial (IA) pueden ser más creativos que el ser humano promedio. A pesar de esto, las máquinas aún no pueden superar a las ideas más creativas generadas por los seres humanos.

La era de las máquinas creativas

La creatividad ha sido tradicionalmente considerada una capacidad exclusiva del ser humano, una característica que nos diferenciaba claramente del resto de las especies, desde que nuestros antepasados comenzaron a crear y utilizar múltiples herramientas con distintos objetivos o a desarrollar el arte rupestre.

Sin embargo, el vertiginoso desarrollo de la Inteligencia Artificial (IA) plantea interrogantes sobre las diferencias entre la creatividad humana y la de las máquinas: ¿puede la IA, que es precisamente una creación humana, superar a nuestra propia capacidad creativa? Por ejemplo, se han desarrollado chatbots de IA generativa que pueden producir obras de arte de alta calidad, por lo menos en cuanto al dominio de las técnicas formales de expresión. El tiempo dirá si también pueden lograr la misma complejidad simbólica y filosófica a la que ha llegado el arte humano.

Vale recordar que los chatbots son aplicaciones de software que simulan mantener una conversación con una persona y proveen respuestas automáticas: el gran adelanto es que son capaces de aprender y evolucionar a partir de sus propias experiencias, abriendo un gran interrogante con respecto a dónde puede estar su límite y potencial de crecimiento.

La IA aún no alcanza el nivel de las mejores ideas humanas

Según una nota de prensa del Grupo Nature que reproduce Tech Xplore, en la nueva investigación los científicos compararon las respuestas de 256 participantes humanos con las de tres chatbots de IA: ChatGPT3, ChatGPT4 y Copy.Ai. La prueba a través de la cual se realizó la comparación entre humanos y máquinas consistía en proponer tantos usos alternativos como sea posible para un objeto cotidiano, en un corto período de tiempo.

Se trata de una actividad a través de la cual se evalúa el pensamiento divergente, un tipo de proceso de pensamiento comúnmente asociado con la creatividad, que implica generar muchas ideas o soluciones diferentes para una tarea determinada. En este caso, las respuestas se calificaron en función de cuatro categorías: fluidez, flexibilidad, originalidad y elaboración.

En promedio, las respuestas de los chatbots obtuvieron puntuaciones significativamente más altas que las respuestas humanas, incluso principalmente en creatividad. Al mismo tiempo, las puntuaciones máximas humanas fueron generalmente más altas que las alcanzadas por las máquinas. En concreto, la mejor respuesta humana superó a la mejor respuesta de cada chatbot en casi todas las categorías de puntuación.

Los resultados muestran que los chatbots de IA de modelo de lenguaje grande (LLM) pueden alcanzar y superar actualmente la creatividad humana promedio, aunque no llegan al nivel de las mejores ideas humanas. Los investigadores creen que futuros estudios podrían explorar cómo se puede integrar este avance de la IA en el proceso creativo humano, para mejorarlo y optimizarlo.

(Una primera versión de este artículo se publicó el 15 de septiembre de 2023)

Referencia

Best humans still outperform artificial intelligence in a creative divergent thinking task. Mika Koivisto and Simone Grassini. Scientific Reports (2023). DOI:https://doi.org/10.1038/s41598-023-40858-3