¿Qué genes causan enfermedades complejas como el cáncer, el asma y la diabetes? Una nueva IA tiene la respuesta
Investigadores de Northwestern han desarrollado TWAVE, una inteligencia artificial que identifica combinaciones de genes responsables de enfermedades complejas como el cáncer, la diabetes de tipo 1 y el asma.
Por Enrique Coperías
Científicos de la Universidad Northwestern han desarrollado una nueva herramienta computacional capaz de identificar combinaciones de genes responsables de enfermedades complejas como la diabetes y el cáncer, que están causadas por redes de múltiples genes que actúan en conjunto, a diferencia de los trastornos genéticos simples. Cortesía: Camila Felix
Enfermedades complejas como la diabetes, el cáncer y el asma no responden a un simple gen defectuoso. Al contrario, son el resultado de una orquesta descompasada de múltiples genes que interactúan de formas aún poco comprendidas.
Detectar qué combinaciones genéticas desencadenan estos trastornos ha sido uno de los grandes retos de la biomedicina. Pero un nuevo avance en inteligencia artificial promete cambiar las reglas del juego.
Un equipo de biofísicos de la Universidad Northwestern, en Estados Unidos, ha desarrollado una herramienta computacional revolucionaria, capaz de identificar los conjuntos de genes que, trabajando en conjunto, son responsables de enfermedades complejas. Su método, llamado TWAVE (Transcriptome-Wide conditional Variational auto-Encoder), utiliza modelos generativos de inteligencia artificial para predecir, con notable precisión, qué genes alteran la actividad celular de forma decisiva.
El problema de fondo, una combinación explosiva
Este avance, publicado en Proceedings of the National Academy of Sciences (PNAS), promete acelerar el desarrollo de tratamientos más eficaces, personalizados y dirigidos a múltiples genes a la vez.
A diferencia de enfermedades monogénicas, como la fibrosis quística, la mayoría de los trastornos crónicos, caso del asma, la diabetes de tipo 1 o ciertos tipos de cáncer, se deben a la interacción de numerosos genes. Esta multiplicidad complica enormemente su estudio, ya que las posibles combinaciones son astronómicas.
«Muchas enfermedades están determinadas por una combinación de genes y no solo uno —explica el físico Adilson Motter, autor principal del estudio. Y añade—: Es como un accidente de avión: raramente se debe a un solo fallo, sino a una combinación de errores. Y distintas combinaciones pueden conducir a un resultado similar. Esto complica identificar las causas reales. Nuestro modelo ayuda a simplificar las cosas señalando a los actores clave y cómo se combinan».
¿Cómo funciona TWAVE? Inteligencia artificial, transcriptomas y optimización
Hasta ahora, el enfoque más común han sido los estudios de asociación genética y transcriptómica, que buscan correlaciones entre genes y rasgos. Pero estos métodos analizan cada gen por separado, ignorando su interacción, y no tienen capacidad para inferir causalidad genética. Como resultado, muchas veces se pierde información crítica sobre cómo actúan los genes en conjunto.
«La identificación de genes individuales sigue siendo útil —matiza Thomas Wytock, coautor del trabajo. Y continúa—: Pero solo una fracción muy pequeña de los rasgos observables puede explicarse por cambios en un único gen. Sabemos que los fenotipos suelen ser el resultado de la acción conjunta de muchos genes. Así que tiene todo el sentido buscar combinaciones de genes».
TWAVE no busca asociaciones superficiales, sino que va más allá. Emplea inteligencia artificial generativa para generar perfiles sintéticos de expresión genética que imitan el comportamiento de células sanas o células enfermas, y luego calcula cuáles son los cambios genéticos mínimos —pero cruciales— que pueden transformar un estado en otro.
Del genoma al transcriptoma
El enfoque clave del equipo no es el análisis del ADN en sí, sino de cómo se expresa. Es decir, se centra en el transcriptoma: los patrones de genes activados o silenciados en una célula en un momento dado. Esta elección no es trivial.
«Estamos analizando la expresión de los genes, no la secuencia genética —explica Wytock—. Hemos entrenado nuestro modelo con datos clínicos en los que sabemos qué perfiles de expresión corresponden a personas sanas o enfermas. Además, tenemos datos experimentales que nos dicen cómo reacciona la red genética cuando activamos o desactivamos genes concretos».
En palabras de Wytock, «esa combinación nos permite inferir qué genes están implicados realmente en la enfermedad».
Además, usar expresión en lugar de secuencia tiene ventajas prácticas: el transcriptoma es más difícil de rastrear individualmente que el genoma, lo que protege la privacidad del paciente. Y también recoge la influencia del entorno, algo que el ADN por sí solo no puede hacer.
«Los factores ambientales pueden no cambiar el ADN, pero sí alteran la expresión génica —dice Motter—. Nuestro modelo tiene la ventaja de captar esos efectos de forma indirecta».
Muchos cánceres están causados por más de una mutación en el ADN de las células. Cortesía: National Cancer Institute
¿Cómo funciona TWAVE?
TWAVE emplea una arquitectura avanzada de red neuronal llamada autocodificadores variacionales condicionales. Esta red se entrena para comprimir los datos de expresión genética en un espacio latente —una especie de resumen—, y luego reconstruirlos con precisión. Así se eliminan el ruido y las variaciones irrelevantes.
El modelo genera nuevos perfiles de expresión simulados para representar estados sanos y enfermos. A partir de ahí, realiza una reducción de dimensiones utilizando eigengenes, combinaciones lineales de genes que varían de forma independiente entre sí. Esto permite proyectar la complejidad del transcriptoma en un espacio manejable, manteniendo las relaciones biológicas clave.
Luego, TWAVE aplica técnicas de optimización matemática para encontrar cuáles son las perturbaciones mínimas necesarias —activar o desactivar genes— que convierten un perfil sano en uno enfermo, o viceversa.
¿Qué enfermedades se analizaron?
El equipo probó el método en siete enfermedades complejas: asma alérgica, enfermedad inflamatoria intestinal, alergia alimentaria, degeneración macular, diabetes de tipo 1, cáncer metastásico y cáncer de pulmón de células no pequeñas. Los resultados fueron sorprendentes.
TWAVE no solo identificó genes ya conocidos como implicados, sino también otros que habían pasado desapercibidos en estudios anteriores. Por ejemplo, en el caso del asma alérgico, hallaron genes como el BMPR2, relacionado con la inflamación, y el TARDBP, vinculado con el metabolismo del ARN, cuya relación con el asma no era clara hasta ahora.
Pero lo más llamativo fue descubrir que no todos los pacientes con una misma enfermedad comparten los mismos genes causales. Es decir, distintas combinaciones genéticas pueden llevar al mismo diagnóstico clínico. Esto refuerza la idea de que la medicina personalizada —tratamientos ajustados a la causa concreta en cada paciente— es no solo deseable, sino necesaria.
«Una enfermedad puede manifestarse igual en dos personas distintas —afirma Motter—. Pero en realidad puede estar causada por genes distintos en cada caso, debido a factores genéticos, ambientales o de estilo de vida. Esta información puede orientar tratamientos personalizados».
Lo que causa una enfermedad no siempre la revierte
Otra observación reveladora del estudio es que los genes cuya alteración causa una enfermedad no son necesariamente los mismos que pueden revertirla.
En muchos casos, se necesita una combinación distinta de perturbaciones genéticas para deshacer el cambio fenotípico. Además, revertir la enfermedad puede requerir menos cambios que inducirla.
«Este fenómeno refleja la naturaleza asimétrica de las redes biológicas —explica Wytock. Y añade—: Al igual que en muchos sistemas complejos, deshacer un cambio no es tan simple como hacer lo contrario. Hay cierta irreversibilidad en las dinámicas celulares».
Casos extremos: cáncer y enfermedades monogénicas
TWAVE también fue capaz de abordar situaciones particularmente difíciles. En el caso del cáncer metastásico, utilizó datos de múltiples tipos de tejidos, algo que suele confundir a los métodos estadísticos tradicionales.
Sin embargo, el modelo logró identificar genes comunes implicados en la metástasis, como NF1 y SOX5, a pesar de la heterogeneidad biológica.
Por otro lado, se aplicó el método a una enfermedad monogénica bien conocida: MODY3, una forma de diabetes causada por mutaciones en el gen HNF1A. Sorprendentemente, TWAVE identificó correctamente a HNF1A como uno de los principales implicados, demostrando así que también puede captar efectos no obvios, como aquellos en los que un gen mutado no cambia su propia expresión, sino la de otros.
Un paso más cerca de la medicina de precisión
Los investigadores destacan que TWAVE puede aplicarse sin necesidad de conocer en detalle la red de interacciones genéticas, lo que lo convierte en una herramienta poderosa y flexible.
Además, como subraya Motter, el modelo se apoya en datos públicos, lo que permite replicar y escalar los análisis sin depender de costosos ensayos privados. En última instancia, TWAVE abre una vía para diseñar terapias que afectan a más de un gen dirigidas a los mecanismos reales de las enfermedades, no solo a sus síntomas.
TWAVE ofrece una nueva vía para, entre otras cosas:
✅ Diseñar terapias multigénicas.
✅ Reducir falsos positivos en estudios genéticos.
✅ Detectar causas ocultas de enfermedades sin recurrir a secuenciación invasiva.
✅ Implicar genes no directamente medidos, a través de análisis de coexpresión y redes causales
«TWAVE es más que una herramienta analítica —afirma Motter. Y concluye—: Es un nuevo enfoque para entender y tratar las enfermedades complejas. Creemos que puede cambiar profundamente la forma en que investigamos y afrontamos trastornos que hoy parecen intratables». ▪️
Información facilitada por la Northwestern University
Fuente: Benjamin Kuznets-Speck, Buduka K. Ogonor, Thomas P. Wytock, Adilson E. Motter. Generative prediction of causal gene sets responsible for complex traits. BioRxiv (2025). DOI: https://doi.org/10.1101/2025.04.17.649405