La gente confía demasiado en la inteligencia artificial: un estudio advierte que sobreestimamos la seguridad de la IA

Un experimento con cientos de participantes revela que las personas perciben a la inteligencia artificial como más segura y competente que los seres humanos, incluso cuando ambos cometen exactamente los mismos errores. El descubrimiento ayuda a explicar por qué los chatbots y algoritmos resultan tan persuasivos aunque puedan equivocarse con frecuencia.

Por Enrique Coperías, periodista científico

Podcast RexMolón: «¿Por qué confiamos tanto en la IA?»
Con Google NotebookLM / RexMolón Producciones
La aparente seguridad con la que se expresan los sistemas de inteligencia artificial hace que muchas personas perciban a la IA como más fiable y competente que los humanos, incluso cuando ambos cometen los mismos errores.

La aparente seguridad con la que se expresan los sistemas de inteligencia artificial hace que muchas personas perciban a la IA como más fiable y competente que los humanos, incluso cuando ambos cometen los mismos errores. Crédito: IA-DALL-E-RexMolón Producciones

La inteligencia artificial (IA) no solo responde: también transmite una sensación de seguridad. Cuando un chatbot redacta una explicación impecable, cuando un sistema de navegación corrige una ruta o cuando un algoritmo médico sugiere un diagnóstico, muchos usuarios interpretan automáticamente que la máquina sabe lo que hace.

Pero esa impresión puede ser engañosa. Un nuevo estudio publicado en la revista Communications Psychology concluye que las personas tienden a sobreestimar de manera sistemática el grado de confianza de los sistemas de inteligencia artificial, incluso cuando estos se comportan exactamente igual que nosotros.

La investigación, dirigida por la psicóloga Clara Colombatto, de la Universidad de Waterloo (Canadá), y el neurocientífico Stephen M. Fleming, de la University College de Londres (Reino Unido), analizó cómo los seres humanos atribuyen confianza —o seguridad subjetiva— a las decisiones tomadas por humanos y máquinas. Y los resultados apuntan a un sesgo profundo: cuando observamos a una IA actuar, tendemos a pensar que está más segura de sus respuestas de lo que realmente estaría una persona en idénticas condiciones.

➡️ «Descubrimos una auténtica ilusión de confianza en la inteligencia artificial», escriben los autores en Communications Psychology. Y añaden—: Los participantes atribuían sistemáticamente una mayor seguridad a los sistemas artificiales, incluso cuando su comportamiento era exactamente el mismo que el de un ser humano».

Qué descubrió exactamente el estudio sobre inteligencia artificial y confianza

El trabajo llega, sin duda alguna, en un momento especialmente sensible. La IA generativa se ha integrado en buscadores, asistentes virtuales, herramientas educativas y sistemas de recomendación médica o financiera. Aunque estos modelos pueden cometer errores graves —las conocidas alucinaciones de la IA—, suelen expresarse con un tono fluido y convincente que induce a confiar en ellos.

El nuevo estudio sugiere que el problema no depende solo de cómo hablan las máquinas, sino también de cómo funciona la psicología humana.

Los investigadores realizaron siete experimentos con cientos de participantes. En ellos, las personas observaban a distintos agentes —seres humanos y sistemas de IA— resolver tareas visuales o preguntas de cultura general y debían estimar cómo de seguros parecían estar de sus respuestas.

Lo importante del caso es que, en muchos casos, el comportamiento de ambos agentes era idéntico: mismos aciertos, mismos errores y mismos tiempos de respuesta. Sin embargo, los observadores seguían considerando que la IA parecía más confiada.

Por qué el cerebro humano confía tanto en la IA

El hallazgo resulta especialmente llamativo porque los participantes sí demostraban ser sensibles a señales reales de confianza. Por ejemplo, inferían correctamente que un agente parecía más seguro cuando respondía rápido o acertaba en tareas fáciles.

«La gente tiene una comprensión bastante sofisticada de las pistas que revelan confianza», señalan los autores. Pero, además de esas señales objetivas, intervenía un prejuicio previo: la mera etiqueta de algoritmo hacía que las personas asumieran un mayor grado de seguridad.

El estudio pone así de manifiesto una paradoja interesante. Durante años, numerosos trabajos sobre interacción humano-máquina habían descrito el fenómeno de la aversión algorítmica, la tendencia a desconfiar de las recomendaciones automáticas incluso cuando son mejores que las humanas. Sin embargo, la nueva investigación muestra que, al mismo tiempo, atribuimos a la IA una especie de aura de certeza técnica. No necesariamente creemos más en ella, pero sí pensamos que duda menos.

Los investigadores comprobaron que las personas tienden a atribuir más seguridad y competencia a los sistemas de inteligencia artificial que a los humanos, incluso cuando ambos muestran exactamente el mismo rendimiento.

Los investigadores comprobaron que las personas tienden a atribuir más seguridad y competencia a los sistemas de inteligencia artificial que a los humanos, incluso cuando ambos muestran exactamente el mismo rendimiento. Foto: Andy Kelly

Una confianza con consecuencias

Según los autores, esta percepción puede tener consecuencias importantes en contextos cotidianos y profesionales. En un experimento adicional, comprobaron que los participantes consideraban a los sistemas artificiales más competentes y más dignos de confianza que a las personas, aun cuando ambos actuaban igual.

La sensación de confianza transmitida por la máquina terminaba influyendo en la impresión social general.

🗣️«Las atribuciones de confianza están relacionadas con la formación de impresiones más amplias sobre la personalidad y la competencia, incluso en sistemas artificiales», sostienen Colombatto y Fleming.

La IA también parecía más competente y fiable que los seres humanos

Los resultados también ayudan a explicar por qué muchos usuarios aceptan con facilidad respuestas erróneas de modelos de lenguaje avanzados. Los sistemas actuales no solo producen información, sino que producen también señales implícitas de seguridad. Responden rápido, redactan con claridad y rara vez muestran vacilaciones. En la comunicación humana, esos rasgos suelen interpretarse como indicadores de confianza.

El cerebro humano parece aplicar automáticamente las mismas reglas a las máquinas.

El problema es que, a diferencia de las personas, los sistemas de IA todavía no poseen una metacognición fiable. Es decir, no siempre «saben cuándo no saben». El artículo recuerda que muchos modelos actuales ofrecen estimaciones de confianza mal calibradas: pueden mostrarse extremadamente seguros incluso cuando están equivocados.

El papel del contexto

En los seres humanos, la confianza suele disminuir cuando una tarea se vuelve difícil o cuando percibimos que hemos cometido un error. En cambio, algunos modelos de inteligencia artificial no siguen ese patrón. Pueden mantener un tono categórico independientemente de la calidad de la respuesta. Y los usuarios, según demuestra el estudio, están predispuestos a interpretar ese tono como una señal legítima de competencia.

La investigación también exploró hasta qué punto esta ilusión depende del contexto. El efecto apareció tanto en tareas visuales simples como en pruebas de cultura general.

Sin embargo, disminuía cuando las decisiones eran más subjetivas, por ejemplo al interpretar emociones en rostros humanos. Cuando no existe una respuesta claramente correcta, parece que las personas conceden menos autoridad automática a la máquina.

La ilusión de confianza en IA

Otro de los hallazgos relevantes es que la ilusión de confianza era más intensa al comienzo de los experimentos y se reducía parcialmente con la experiencia. Es decir, al observar durante un tiempo el comportamiento real de los sistemas, los participantes ajustaban algo mejor sus percepciones. Aun así, el sesgo nunca desaparecía del todo.

Para los investigadores, esto demuestra que el fenómeno está profundamente ligado a creencias previas sobre las capacidades tecnológicas. En el último experimento manipularon deliberadamente esas expectativas: hicieron creer a los participantes que un algoritmo era más preciso que otro, aunque luego ambos actuaran igual.

El resultado fue claro: el algoritmo supuestamente más competente fue percibido también como más seguro de sí mismo.

➡️ «La ilusión de confianza se basa en las creencias previas sobre las capacidades de los agentes», concluyen los autores. En otras palabras, no evaluamos únicamente lo que vemos hacer a una IA; también proyectamos sobre ella una idea cultural de precisión, objetividad y autoridad técnica.

Cómo afecta este sesgo a la vida cotidiana

Ese sesgo puede tener implicaciones especialmente delicadas en sectores sensibles como los que siguen:

Medicina: los pacientes podrían aceptar diagnósticos automáticos sin cuestionarlos suficientemente.

Educación: los estudiantes pueden asumir que una respuesta generada por IA es correcta simplemente porque suena convincente.

Justicia: jueces o abogados podrían otorgar demasiada autoridad a sistemas automatizados de recomendación.

Finanzas: los usuarios pueden seguir consejos financieros generados por IA sin evaluar adecuadamente los riesgos.

Información y medios: los chatbots pueden difundir errores o desinformación con apariencia de certeza técnica.

Si los usuarios interpretan automáticamente que un sistema artificial está muy seguro, podrían aceptar recomendaciones erróneas sin someterlas a suficiente escrutinio crítico. La propia fluidez de las respuestas podría convertirse en un factor de riesgo.

Los modelos de lenguaje como ChatGPT pueden transmitir una fuerte sensación de certeza gracias a su fluidez y rapidez al responder, aunque sus respuestas no siempre sean correctas, según advierte el estudio.

Los modelos de lenguaje como ChatGPT pueden transmitir una fuerte sensación de certeza gracias a su fluidez y rapidez al responder, aunque sus respuestas no siempre sean correctas, según advierte el estudio. Foto: Jonathan Kemper

Qué implicaciones tiene este hallazgo para el futuro de la inteligencia artificial

El trabajo se suma así a un creciente debate sobre cómo deberían diseñarse las futuras interfaces de IA. Algunos expertos proponen que los sistemas expresen explícitamente su incertidumbre o indiquen probabilidades de error de forma más transparente.

Otros especialistas defienden modelos capaces de reconocer sus límites y negarse a responder cuando no disponen de suficiente información fiable.

De forma resumida, la mayor parte de los expertos proponen que las futuras inteligencias artificiales:

✅ Indiquen niveles de probabilidad.

✅ Expresen dudas de manera explícita.

✅ Señalen cuándo la información puede ser incorrecta.

✅ Rechacen responder si no tienen suficiente fiabilidad.

Sin embargo, el nuevo estudio sugiere que el desafío no es solo tecnológico, sino también psicológico. Incluso aunque una IA comunique dudas, los usuarios podrían seguir interpretando su comportamiento como una señal de confianza superior. La fascinación cultural por las máquinas inteligentes parece predisponernos a atribuirles una seguridad casi automática.

El verdadero poder de la IA puede estar en cómo parece hablar

Paradójicamente, cuanto más humanas parecen las IA al comunicarse, más tendemos a aplicarles reglas sociales propias de la interacción entre personas.

El cerebro humano lleva miles de años entrenándose para detectar señales de confianza en otros individuos: rapidez al responder, firmeza verbal, ausencia de vacilaciones. Ahora esos mismos mecanismos cognitivos se activan frente a entidades artificiales que, en realidad, no experimentan confianza en ningún sentido humano.

La investigación de Colombatto y Fleming pone nombre a una intuición cada vez más extendida: la inteligencia artificial no solo influye por lo que dice, sino por cómo parece decirlo. Y esa apariencia de seguridad puede ser una de las herramientas más persuasivas —y potencialmente más peligrosas— de la nueva era algorítmica.▪️(18-mayo-2026)

PREGUNTAS&RESPUESTAS: IA y Confianza

🤖 ¿Por qué confiamos tanto en la inteligencia artificial?

Porque el cerebro humano interpreta señales como rapidez, fluidez y firmeza verbal como indicadores de confianza y competencia.

🤖 ¿La IA realmente sabe cuándo está equivocada?

No siempre. Muchos modelos actuales pueden ofrecer respuestas incorrectas con gran seguridad aparente.

🤖 ¿Qué son las alucinaciones de la IA?

Son errores en los que un sistema de inteligencia artificial inventa información falsa o incorrecta pero la presenta como verdadera.

🤖 ¿La inteligencia artificial es más fiable que los humanos?

No necesariamente. El estudio demuestra que las personas tienden a percibirla como más segura incluso cuando su rendimiento es idéntico al humano.

🤖 ¿Qué riesgos implica este sesgo?

Puede llevar a aceptar recomendaciones erróneas en ámbitos sensibles como medicina, educación, justicia o finanzas.

Anterior
Anterior

eROSITA descubre una galaxia Seyfert que cambia de aspecto e indica cómo «se alimentan» los agujeros negros supermasivos

Siguiente
Siguiente

SpaceX prepara el lanzamiento de Starship V3, el cohete más alto y potente de la historia