La IA que calcula a la velocidad de la luz: así funciona la nueva computación óptica que lo hace todo «en un solo paso»

Una nueva técnica basada en luz promete revolucionar el corazón matemático de la inteligencia artificial, sustituyendo millones de operaciones electrónicas por un único destello óptico. Este salto fotónico abre la puerta a modelos más rápidos, eficientes y capaces de procesar información casi instantáneamente.

Por Enrique Coperías

Recreación de un Montaje experimental de computación óptica en el que un haz láser atraviesa moduladores y lentes para ejecutar cálculos matemáticos.

Recreación de un Montaje experimental de computación óptica en el que un haz láser atraviesa moduladores y lentes para ejecutar cálculos matemáticos. Este tipo de sistemas permite realizar operaciones clave de inteligencia artificial en un solo paso gracias al método POMMM desarrollado por investigadores de las universidades Aalto y Jiao Tong. imagen generada con DALL-E

En el corazón de casi todas las aplicaciones de inteligencia artificial (IA), desde el reconocimiento de voz en nuestro teléfono hasta los modelos de lenguaje que escriben textos complejos, late una operación matemática básica: multiplicar matrices.

Esta operación, repetida millones de veces, es el motor oculto de los algoritmos de aprendizaje profundo. Pero también es su mayor freno: requiere una enorme capacidad de cálculo, consume cantidades colosales de energía y obliga a diseñar chips cada vez más especializados y caros.

Un equipo de investigadores de las universidades Jiao Tong de Shanghái, Aalto (Finlandia) y la Academia China de Ciencias sostiene ahora que una parte clave de ese esfuerzo computacional podría desplazarse de los chips de silicio a un terreno tan antiguo como fundamental: la luz. En un trabajo publicado en la revista Nature Photonics, los autores del trabajo presentan un método que permite ejecutar multiplicaciones de matrices, incluso de manera masiva y en paralelo, mediante un único recorrido de un haz de luz coherente.

A esta técnica la han bautizado como POMMM: parallel optical matrix–matrix multiplication.

Lo que proponen los investigadores, dicho de forma muy simple, es que ciertos cálculos esenciales de la IA dejen de hacerse electrón a electrón y pasen a realizarse de un fotónazo, aprovechando las propiedades físicas de la luz para ejecutar operaciones que a un procesador digital le costarían miles de ciclos de reloj.

🗣️ «Nuestro método realiza los mismos tipos de operaciones que hoy ejecutan las GPU, como convoluciones y capas de atención, pero las hace todas a la velocidad de la luz. En lugar de depender de circuitos electrónicos, utilizamos las propiedades físicas de la luz para llevar a cabo muchas computaciones simultáneamente», explica el investigador principal, Yufeng Zhang, en un comunicado de la Universidad Aalto (Finlandia).

El cuello de botella: tensores, GPU y límites físicos

La multiplicación de matrices está en la base de las operaciones de los llamados tensores, el material con el que se construyen y entrenan las redes neuronales. Los chips más avanzados, como las Graphics Processing Units o GPU —procesadores especializados diseñados para realizar muchos cálculos en paralelo—, están optimizados para ello y cuentan con núcleos tensoriales dedicados a estas operaciones. Pero incluso estas bestias del cálculo tienen limitaciones: consumen bastante energía, requieren gran ancho de banda de memoria y, sobre todo, realizan los cálculos de manera secuencial, uno tras otro, aunque muy deprisa.

La computación óptica, en cambio, juega en otra liga. La luz se propaga de forma natural en paralelo, puede transportar información en múltiples dimensiones (amplitud, fase, frecuencia, posición…) y apenas consume energía mientras viaja. Por eso, los investigadores en fotónica llevan años soñando con ordenadores ópticos capaces de acelerar la IA.

El problema es que la mayoría de los enfoques ópticos desarrollados hasta ahora solo permiten realizar operaciones parciales —productos punto, convoluciones muy concretas, transformadas de Fourier— y normalmente requieren varios pasos ópticos conectados entre sí. No existe aún una arquitectura general que pueda sustituir directamente los cálculos que hoy resolvemos con GPU.

Es justo este hueco el que aspira a ocupar POMMM.

Cómo funciona POMMM: luz, Fourier y cálculos paralelos

El avance presentado en Nature Photonics se basa en dos propiedades clásicas de la transformada de Fourier óptica. En esencia:

Si desplazamos una señal en el espacio, su espectro no cambia.

Si aplicamos una pendiente de fase lineal, desplazamos ese espectro.

Los autores explotan simultáneamente ambas propiedades para codificar cada fila de una matriz de entrada en un campo óptico, modificándola con una inclinación de fase distinta. Luego, al hacer pasar el haz por un sistema de lentes y moduladores espaciales, las distintas filas se mezclan, se superponen y finalmente se separan en posiciones específicas del plano de salida gracias a cómo se reorganizan sus frecuencias. Todo ello permite que el resultado final de la multiplicación de las matrices A y B aparezca, completo, en una sola imagen óptica captada por una cámara.

Es decir, el resultado de una operación que en un ordenador requiere millones de instrucciones aparece en una única fotografía.

No se necesitan varias capas ópticas, ni recurrir a trucos como dividir la imagen en miles de subcanales. La operación completa ocurre durante un único recorrido del haz de luz a través del sistema.

Para explicar cómo funciona esta magia física, Zhang propone una metáfora sencilla: «Imagina que eres un agente de aduanas que debe inspeccionar cada paquete a través de varias máquinas con funciones distintas y luego clasificarlos en los contenedores correctos. Normalmente procesarías cada paquete uno por uno. Nuestro método de computación óptica fusiona todos los paquetes y todas las máquinas: creamos múltiples ganchos ópticos que conectan cada entrada con su salida correcta. Con una sola operación, un único paso de luz, todas las inspecciones y clasificaciones ocurren al instante y en paralelo».

Mientras los humanos y los ordenadores tradicionales realizan las operaciones tensoriales paso a paso, la luz puede ejecutarlas todas a la vez.

Mientras los humanos y los ordenadores tradicionales realizan las operaciones tensoriales paso a paso, la luz puede ejecutarlas todas a la vez. Cortesía: Photonics Group / Aalto University.

Validación experimental: cámaras, láseres y precisión sorprendente

Para demostrarlo, el equipo ha construido un prototipo óptico con láseres, moduladores de amplitud y fase, lentes cilíndricas y una cámara CMOS de alta resolución. El montaje permite introducir dos matrices —A y B— codificándolas en moduladores espaciales de luz (SLM), hacerlas interactuar conforme al principio POMMM y obtener en un disparo la matriz resultante A×B.

La prueba del algodón llegó al comparar los resultados ópticos con los obtenidos por una GPU convencional. Los autores realizaron docenas de experimentos con matrices de distintos tamaños, desde 10×10 hasta 50×50, tanto reales como complejas. La coincidencia fue sorprendentemente alta, ya que, según los autores, los errores medios fueron inferiores al 10% en todas las pruebas, y en muchos casos casi despreciables.

Además, el equipo analizó teóricamente todas las posibles fuentes de error —difracción, discretización de los moduladores, distorsiones ópticas— y mostró que pueden reducirse con técnicas de calibración y diseño más avanzadas.

Aplicación directa en CNN y Transformers

La validación más interesante vino después: ¿podría el POMMM ejecutar partes reales de redes neuronales convolucionales (CNN) y modelos vision transformer (ViT) sin necesidad de rediseñar los modelos?

La respuesta, según los experimentos, es sí. Anes de seguir, hay que recordar que las CNN son modelos de IA especializados en analizar imágenes y funcionan detectando patrones locales (bordes, texturas, formas) usando filtros que recorren la imagen, mientras que los ViT son modelos de IA que procesan imágenes dividiéndolas en pequeños bloques (patches) y aplicando mecanismos de atención para entender qué partes de la imagen son más importantes. Las CNN ven la imagen pieza a pieza, como quien pasa una lupa; y los ViT ven la imagen como un conjunto de bloques y deciden cuáles importan más.

El equipo probó su sistema con redes convolucionales y con modelos tipo vision transformer, dos de las arquitecturas más utilizadas en visión artificial. Tomaron modelos entrenados en GPU, extrajeron los pesos correspondientes a las capas lineales (convoluciones, atenciones, capas totalmente conectadas) y los ejecutaron directamente con POMMM.

El reconocimiento de imágenes en los conjuntos MNIST y Fashion-MNIST funcionó con una precisión prácticamente idéntica a la de la GPU. El prototipo experimental, aunque más ruidoso, consiguió resultados comparables usando los mismos pesos entrenados digitalmente.

Esto representa un hito clave: por primera vez, un sistema óptico puede ejecutar de forma directa las operaciones que realizan las redes neuronales digitales sin modificar su estructura.

Aún más sorprendente, los autores observaron que cuando algunas funciones no lineales (como ReLU) se desactivan, los modelos entrenados directamente con POMMM pueden superar el rendimiento de sus equivalentes estrictamente digitales en ciertas condiciones. Es una pista de que la computación óptica podría no solo acelerar la IA, sino ampliarla.

Más allá del RGB: computación multiespectral y tensores de orden superior

La luz tiene una ventaja adicional: distintas longitudes de onda pueden recorrer simultáneamente el mismo sistema sin interferir entre sí. El equipo aprovechó esta propiedad para extender POMMM a un nuevo nivel: multiplicar tensores tridimensionales usando varias longitudes de onda a la vez.

Para demostrarlo, codificaron matrices complejas usando dos colores distintos y realizaron multiplicaciones multiespectrales en dos pasos ópticos.

Los resultados se correspondieron con los obtenidos digitalmente, lo que abre la puerta a un futuro en el que la IA pueda paralelizarse en el espacio y en el espectro.

El futuro: chips fotónicos y adopción industrial

Los autores admiten que su prototipo aún está lejos de competir con una GPU moderna en rendimiento global. La eficiencia energética real, de momento, es baja porque los componentes no están optimizados para computación. Pero el potencial teórico es enorme: un sistema óptico dedicado podría ejecutar cientos o miles de millones de multiplicaciones por julio, superando ampliamente a las GPU más eficientes.

🗣️ «Este enfoque puede implementarse en prácticamente cualquier plataforma óptica. En el futuro, planeamos integrar este marco computacional directamente en chips fotónicos, lo que permitirá que procesadores basados en luz realicen tareas complejas de IA con un consumo de energía extremadamente bajo», apunta el profesor Zhipei Sun, líder del grupo de fotónica de Aalto.

Zhang coincide con él en que el siguiente paso es llevar esta tecnología a sistemas reales: «El objetivo final es implementar este método en el hardware y las plataformas ya establecidas por las grandes compañías. Estimo de forma conservadora que esta integración llegará en un plazo de entre tres y cinco años». Para él, el horizonte es claro: «Esto creará una nueva generación de sistemas de computación óptica, acelerando de forma significativa tareas complejas de inteligencia artificial en multitud de ámbito».

POMMM se erige así en una técnica de computación óptica que utiliza propiedades físicas de la luz para ejecutar operaciones fundamentales de IA, como multiplicación de matrices, convoluciones y atención, en un solo paso. Esto permite acelerar redes neuronales a la velocidad de la luz y reducir de forma drástica el consumo energético.

Si todo esto prospera, las redes neuronales del futuro podrían no solo ser más rápidas, sino literalmente funcionar a la velocidad de la luz. ▪️

Anterior
Anterior

Dos sesgos mentales que explican por qué tanta gente cree en las pseudociencias

Siguiente
Siguiente

Cómo los seres humanos y los perros se expandieron juntos por Eurasia durante 11.000 años