Los circuitos cuánticos ayudan a la IA a superar las limitaciones de memoria con un mínimo de nuevos parámetros
Mientras la inteligencia artificial necesita cada vez más memoria y potencia para seguir creciendo, un experimento pionero demuestra que unos pequeños circuitos cuánticos pueden mejorar el rendimiento de grandes modelos lingüísticos añadiendo apenas unos miles de parámetros. El avance abre una nueva vía para superar uno de los principales límites tecnológicos de la IA actual.
Por Enrique Coperías, periodista científico
Esta ilustración representa la idea central del estudio: un gigantesco modelo de inteligencia artificial compuesto por miles de millones de parámetros y enormes recursos de memoria puede mejorar su rendimiento gracias a pequeños adaptadores cuánticos. Los investigadores lograron optimizar Llama 3.1 8B añadiendo apenas 6.144 parámetros cuánticos ejecutados en hardware real. Crédito: IA-DALL-E-RexMolón Producciones
La inteligencia artificial (IA) avanza a una velocidad vertiginosa, pero su crecimiento se enfrenta a un obstáculo cada vez más evidente: la memoria. Los modelos lingüísticos más potentes del mundo, como ChatGPT, Gemini y Llama, necesitan miles de millones de parámetros para funcionar, lo que exige enormes cantidades de almacenamiento, energía y capacidad de cálculo.
Ahora, un equipo internacional de investigadores asegura en un artículo científico subido a arXiv haber dado un primer paso hacia una posible solución: utilizar circuitos cuánticos para mejorar el rendimiento de estos modelos sin necesidad de multiplicar su tamaño.
El trabajo, liderado por científicos de la empresa española Multiverse Computing, con sede en San Sebastián (España), y varias instituciones de investigación, demuestra por primera vez que un modelo de lenguaje de gran escala puede beneficiarse de componentes cuánticos ejecutados en hardware cuántico real. Aunque los resultados son todavía modestos, los autores consideran que representan una prueba de concepto comparable a los primeros experimentos que demostraron que la computación cuántica era físicamente posible hace más de dos décadas.
Por qué los grandes modelos de IA tienen un problema de memoria
Los modelos extensos de lenguaje o LLM (Large Language Models), también llamados modelos de lenguaje de gran tamaño o modelos de lenguaje a gran escala, han revolucionado la inteligencia artificial. Son capaces de redactar textos, programar, resumir documentos, responder preguntas e incluso ayudar en tareas científicas complejas.
Sin embargo, toda esa capacidad tiene un coste. Cada parámetro adicional necesita memoria para almacenarse y recursos computacionales para procesarse. A medida que los modelos crecen, el gasto energético y económico aumenta de forma casi descontrolada.
➡️ «Nos encontramos en una encrucijada histórica para la inteligencia artificial», escriben los investigadores en su artículo. Según explican, los sistemas actuales dependen de arquitecturas clásicas que exigen almacenar explícitamente cada parámetro, lo que impone límites físicos y económicos al escalado de los modelos.
Los flujos luminosos simbolizan las complejas conexiones de un gran modelo lingüístico, mientras que los cúbits actúan como atajos cuánticos capaces de reorganizar la información de forma más eficiente. El trabajo sugiere que la computación cuántica podría ayudar a superar algunas limitaciones de memoria y escalabilidad de la inteligencia artificial actual. Crédito: IA-DALL-E-RexMolón Producciones
La clave del estudio: los Cayley Unitary Adapters
La idea del nuevo estudio consiste en aprovechar una característica fundamental de la mecánica cuántica. Mientras que un ordenador convencional representa la información mediante bits que pueden valer 0 o 1, los cúbits pueden encontrarse en superposiciones de ambos estados. Esto permite describir espacios matemáticos enormemente complejos utilizando relativamente pocos recursos físicos.
Los autores han desarrollado una técnica denominada Cayley Unitary Adapters (CUA), que introduce pequeños bloques cuánticos dentro de un modelo de lenguaje ya entrenado.
En lugar de modificar los miles de millones de parámetros originales del sistema, estos bloques CUA añaden solo unos pocos miles de parámetros nuevos y actúan como una especie de capa correctora capaz de mejorar determinadas capacidades del modelo.
¿Cuántos parámetros se añadieron?
Para poner a prueba el concepto eligieron uno de los modelos abiertos más populares del mundo: Llama 3.1 8B, desarrollado por Meta y compuesto por algo más de ocho mil millones de parámetros. Los investigadores insertaron un único adaptador cuántico en una de las capas de atención del sistema.
El resultado fue sorprendente: con apenas 6.144 parámetros adicionales —menos de una milésima parte del tamaño total del modelo— lograron reducir la denominada perplejidad, una medida utilizada para evaluar la calidad de las predicciones lingüísticas. La mejora fue del 1,4 %.
A primera vista, una mejora del 1,4 % puede parecer poco espectacular. Sin embargo, en el mundo de los grandes modelos lingüísticos cualquier avance medible conseguido con tan pocos parámetros adicionales resulta extraordinariamente difícil de obtener.
➡️ «Consideramos este resultado fundacional porque demuestra la viabilidad física del enfoque y establece una base concreta para futuras ampliaciones», señalan los autores.
La importancia de usar hardware cuántico real
Lo más llamativo es que el experimento no se realizó únicamente mediante simulaciones por ordenador. Los adaptadores cuánticos fueron ejecutados en un procesador cuántico real de IBM equipado con 156 qubits superconductores.
Esto convierte al estudio en una de las primeras demostraciones prácticas de interacción entre grandes modelos lingüísticos y hardware cuántico comercial.
Ejemplo 1: astronomía
Además de medir la mejora estadística, los investigadores analizaron casos concretos. En una pregunta de astronomía sobre qué planetas gigantes del Sistema Solar poseen anillos, el modelo original respondió incorrectamente que solo Saturno dispone de ellos. Tras incorporar el adaptador cuántico, la respuesta pasó a ser correcta: Júpiter, Saturno, Urano y Neptuno presentan sistemas de anillos.
Ejemplo 2: biología evolutiva
Algo parecido ocurrió con una cuestión de biología evolutiva relacionada con el flujo génico entre poblaciones. El modelo convencional eligió una respuesta equivocada, mientras que la versión mejorada identificó correctamente que el intercambio de genes tiende a aumentar la homogeneidad genética entre poblaciones.
¿Puede la computación cuántica reducir la necesidad de memoria en la IA?
Para comprender mejor el fenómeno, el equipo realizó también experimentos con un modelo mucho más pequeño, denominado SmolLM2, de 135 millones de parámetros. Este sistema les permitió estudiar de forma exhaustiva cómo influían los adaptadores cuánticos en distintas capas de la red neuronal.
Los resultados mostraron una tendencia consistente: cuanto mayor era la dimensión de los bloques cuánticos utilizados, mejor era el rendimiento del modelo. En algunas pruebas lograron recuperar hasta el 83 % de la degradación producida previamente por técnicas de compresión de modelos diseñadas para reducir el tamaño de la red neuronal.
Según los investigadores, con Román Orús, físico teórico del Parque Científico y Tecnológico de Gipuzkoa, al frente, esta observación apunta a una posible ventaja fundamental de la computación cuántica. En un ordenador clásico, representar matemáticamente ciertas transformaciones requiere almacenar una cantidad de parámetros que crece exponencialmente. En cambio, un circuito cuántico puede describir transformaciones equivalentes utilizando un número mucho menor de parámetros físicos.
➡️ «La cuestión no es que los ordenadores clásicos no puedan realizar estos cálculos», explican los autores. «La ventaja potencial reside en que un procesador cuántico puede proporcionar una representación comprimida de esas transformaciones gracias a la estructura de sus circuitos».
Recreación artística de un ordenador cuántico generando lenguaje e información. Los adaptadores cuánticos desarrollados por los investigadores fueron ejecutados en un procesador IBM Quantum System Two de 156 cúbits y consiguieron mejorar el rendimiento de un modelo de lenguaje de más de 8.000 millones de parámetros utilizando una cantidad mínima de nuevos parámetros. Crédito: IA-DALL-E-RexMolón Producciones
Las limitaciones actuales
No obstante, los investigadores reconocen que todavía estamos lejos de una revolución cuántica en inteligencia artificial. Los circuitos empleados en este trabajo utilizan únicamente dos qubits y pueden simularse sin demasiada dificultad en ordenadores convencionales.
Además, cuando intentaron ampliar el número de cúbits, el ruido inherente a los procesadores cuánticos actuales degradó rápido los resultados. A partir de tres o cuatro cúbits, los errores crecían de forma tan intensa que las respuestas perdían coherencia.
Este problema refleja una de las principales limitaciones de la tecnología cuántica contemporánea. Los cúbits son muy sensibles a las perturbaciones del entorno y pierden información con facilidad. Por eso, gran parte de la investigación mundial se centra actualmente en desarrollar sistemas más estables y con menores tasas de error.
Qué significa este avance para el futuro de la inteligencia artificial
Aun así, los autores creen que el trabajo marca un hito relevante.
➡️ «La importancia de estos resultados no reside en la magnitud de las mejoras obtenidas, sino en el hecho de que existan —escriben en arXiv—. Los circuitos cuánticos insertados en un modelo de lenguaje de 8.000 millones de parámetros mejoran sus resultados, y esa mejora es medible, reproducible y ha sido verificada en hardware cuántico real».
El equipo compara esta situación con el famoso experimento realizado en 2001 por el físico holandés Lieven Vandersypen, que logró factorizar el número 15 mediante una versión experimental del algoritmo de Shor, un algoritmo cuántico desarrollado en 1994 por el matemático Peter Shor que permite factorizar números muy grandes en sus factores primos muchísimo más rápido que los mejores algoritmos clásicos conocidos.
Aquella demostración tenía escasa utilidad práctica, pero probó que la computación cuántica era posible fuera de los modelos teóricos.
Del mismo modo, sostienen los autores, este nuevo trabajo respondería a una pregunta que hasta ahora permanecía abierta: si los circuitos cuánticos pueden aportar ventajas reales a la inteligencia artificial moderna.
La respuesta, al menos según este estudio, parece ser afirmativa. Falta saber si esas pequeñas mejoras podrán crecer lo suficiente como para transformar el futuro de la inteligencia artificial. Pero por primera vez, un modelo lingüístico de escala industrial ha demostrado que la computación cuántica no es solo una promesa para el mañana: ya puede influir, aunque sea de forma modesta, en las máquinas que hoy utilizan millones de personas en todo el mundo.▪️(8-junio-2026)
INTELIGENCIA ARTIFICIAL
PREGUNTAS & RESPUESTAS: Modelos Extensos de lenguaje e IA
🤖 ¿Qué es un modelo extensos de lenguaje o LLM?
Es un sistema de inteligencia artificial entrenado con enormes cantidades de texto para generar lenguaje natural, responder preguntas y realizar tareas complejas de razonamiento.
🤖 ¿Qué es un cúbit?
Es la unidad básica de información en computación cuántica. A diferencia de un bit convencional, puede representar simultáneamente múltiples estados gracias a la superposición cuántica.
🤖 ¿Qué son los Cayley Unitary Adapters?
Son pequeños módulos cuánticos diseñados para integrarse dentro de modelos de lenguaje ya entrenados con el objetivo de mejorar su rendimiento utilizando muy pocos parámetros adicionales.
🤖 ¿Se utilizó un ordenador cuántico real?
Sí. Los experimentos fueron ejecutados en un procesador cuántico IBM Quantum System Two con 156 qubits superconductores.
🤖 ¿La computación cuántica ya supera a la inteligencia artificial clásica?
No. Los autores subrayan que estos experimentos constituyen una prueba de concepto y no una demostración de superioridad computacional general.
EN RESUMEN
Este estudio ofrece la primera evidencia experimental de que pequeños circuitos cuánticos pueden mejorar el comportamiento de modelos de lenguaje de escala industrial utilizando una cantidad mínima de nuevos parámetros. Aunque la ventaja obtenida todavía es modesta, el trabajo abre una nueva vía de investigación en la convergencia entre inteligencia artificial y computación cuántica, dos tecnologías llamadas a desempeñar un papel central en la próxima revolución digital.
Fuente: Borja Aizpurua, Sukhbinder Singh, Augustine Kshetrimayum, Saeed S. Jahromi, Roman Orus. Quantum-enhanced Large Language Models on Quantum Hardware via Cayley Unitary Adapters. arXiv (2026). DOI: https://doi.org/10.48550/arXiv.2605.05914

