El origen del código genético: llegan nuevas pistas desde los primeros dipéptidos

Un hallazgo científico rastrea el origen del código genético hasta diminutas combinaciones de aminoácidos. Los dipéptidos primitivos revelan nuevas pistas sobre cómo surgió la vida y cómo este conocimiento puede transformar la biología moderna.

Por Enrique Coperías

Los dipéptidos no son meras combinaciones químicas al azar, sino piezas centrales en la historia evolutiva del código genético, según Gustavo Caetano-Anollés, uno de los autores de este hallazgo.

Los dipéptidos no son meras combinaciones químicas al azar, sino piezas centrales en la historia evolutiva del código genético, según Gustavo Caetano-Anollés, uno de los autores de este hallazo. Fotoilustración: Fred Zwicky

Los genes son los ladrillos de la vida, y el código genético es el manual de instrucciones que dicta cómo se construyen y funcionan los organismos. Pero una pregunta sigue fascinando a la biología desde hace décadas: ¿cómo surgió ese código y por qué adoptó la forma que hoy conocemos?

Un estudio reciente de la Universidad de Illinois en Urbana-Champaign, publicado en el Journal of Molecular Biology, ha dado un paso importante en esta dirección. El equipo liderado por Gustavo Caetano-Anollés ha rastreado el origen del código genético hasta los niveles más elementales de la química de la vida: los dipéptidos, pequeñas combinaciones de dos aminoácidos que pudieron actuar como los primeros módulos estructurales de las proteínas.

El hallazgo no solo ilumina el pasado remoto de la biología, sino que también plantea implicaciones profundas para el presente y el futuro: desde la biología sintética hasta la ingeniería genética y la medicina de precisión.

Dos lenguajes de la vida: genético y proteico

La vida, tal como la conocemos, funciona con dos lenguajes complementarios. Por un lado, el código genético, almacenado en el ADN y el ARN, que dicta qué aminoácidos deben unirse para formar proteínas. Por otro, el código proteico, que regula cómo esas proteínas —enzimas, receptores, transportadores— hacen posible el metabolismo celular y la existencia misma.

Entre ambos cogigos se encuentra el ribosoma, la gran fábrica de proteínas, asistido por el ARN de transferencia (ARNt) y las enzimas aminoacil-ARNt sintetasa, auténticos guardianes que garantizan que cada aminoácido se coloque en el lugar correcto.

La coexistencia de estos dos lenguajes plantea un enigma: ¿por qué la vida adoptó esta dualidad y no un sistema más simple?

«El ARN es torpe desde el punto de vista funcional —apunta Caetano-Anollés—. Las proteínas, en cambio, son expertas en manejar la maquinaria molecular de la célula. Todo indica que ahí reside la clave».

Una investigación con 4.300 millones de piezas

Para buscar respuestas, el equipo analizó una base de datos colosal de 4.300 millones de secuencias de dipéptidos —todas las posibles combinaciones de dos aminoácidos— extraídas de 1.561 proteomas que representan a los tres grandes dominios de la vida: arqueas, bacterias y eucariotas.

Con ellas, Caetano-Anollés, junto a sus colegas Minglei Wang y M. Fayez Aziz, construyeron un árbol filogenómico de dipéptidos (ToDS, por sus siglas en inglés), el primero de su clase, que reconstruye, paso a paso, cómo fueron apareciendo y diversificándose estos bloques básicos a lo largo de la evolución.

El resultado revela que la historia del código genético se entrelaza con la de los dipéptidos. No se trata de simples coincidencias: los patrones evolutivos de las parejas de péptidos son congruentes con los obtenidos en estudios previos sobre los dominios proteicos y los ARNt, lo que significa que los tres tipos de datos cuentan la misma historia.

Cuatro etapas en la cronología de los dipéptidos

El análisis detallado permitió identificar cuatro grandes fases en la evolución de los dipéptidos y, con ellas, en la formación del código genético:

1️⃣ La era de la leucina y la serina. Los dipéptidos más antiguos estuvieron dominados por estos dos aminoácidos (Grupo 1), con la leucina como auténtica protagonista. De hecho, el primer dipéptido que aparece en el registro filogenómico es LL (leucina-leucina).

2️⃣ La llegada de la tirosina y el Grupo 2. En una etapa posterior entraron en escena dipéptidos con tirosina y con aminoácidos como valina, isoleucina, metionina, lisina, prolina y alanina. Estos compuestos reforzaron un código operacional temprano en el que los ARNt empezaban a reconocer aminoácidos con mayor precisión.

3️⃣ La diversificación con el Grupo 3. Más adelante aparecieron dipéptidos que incluían aminoácidos asociados a funciones modernas del código genético, como la histidina, la glutamina, el triptófano y la asparagina. Esta fase marca el inicio de un código estándar más cercano al actual.

4️⃣ La entrada tardía de la cisteína. Finalmente, los dipéptidos con cisteína irrumpieron en el tramo final de la cronología. Este aminoácido es crucial porque permite formar enlaces disulfuro, que estabilizan proteínas complejas y son esenciales en la bioquímica moderna.

Este recorrido sugiere que el código genético no surgió de golpe, sino como el resultado de una acumulación gradual de interacciones moleculares cada vez más precisas.

El código genético es el sistema de instrucciones que permite a una célula fabricar una proteína específica a partir de la información contenida en un gen. Está escrito con las cuatro bases nitrogenadas del ADN —adenina (A), citosina (C), guanina (G) y timina (T)— que se combinan en “codones” de tres letras. Cada codón indica qué aminoácido debe incorporarse en una posición concreta de la proteína, funcionando como un alfabeto universal de la vida. Cortesía: National Human Genome Research Institute

La sorprendente dualidad dipéptido–antidipéptido

Uno de los hallazgos más llamativos del estudio fue la sincronía en la aparición de pares de dipéptidos y antidipéptidos, como alanina-leucina (AL) y leucina-alanina (LA).

Casi la mitad de estos pares surgieron al mismo tiempo en la línea evolutiva, un fenómeno inesperado que apunta a una codificación bidireccional temprana en cadenas de ácidos nucleicos.

En otras palabras, los primeros sistemas genéticos podrían haber funcionado con hebras complementarias que producían dipéptidos espejo, una estrategia que aumentaba la eficiencia y la estabilidad del sistema.

Proteínas primitivas en ambientes templados

Otro aspecto novedoso del estudio tiene que ver con el ambiente en el que surgieron las primeras proteínas. Al analizar la relación entre dipéptidos y la adaptación térmica de los organismos, los investigadores descubrieron que las características asociadas a la termoestabilidad de las proteínas —fundamentales para vivir en condiciones extremas— aparecieron muy tarde en la evolución.

Esto significa que las primeras proteínas se originaron en entornos suaves y templados, propios del eón Arcaico, hace más de 3.000 millones de años, y no en fuentes hidrotermales o ambientes extremos como defienden otras teorías.

Sun duda alguna, el hallazgo aporta un argumento más a favor de la idea de que la vida primitiva prosperó en condiciones moderadas, con abundancia de agua líquida y temperaturas estables.

Enzimas ancestrales y un mundo prerribosómico

El trabajo también conecta la evolución de los dipéptidos con enzimas ancestrales no ribosomales, como las ciclodipeptido sintasas (CDPS). Estas proteínas, que aún existen en bacterias modernas, son capaces de fabricar dipéptidos sin necesidad de ribosomas ni ARN de transferencia.

Los autores sugieren que las CDPS y enzimas similares podrían ser reliquias de un mundo prerribosómico, cuando la síntesis de péptidos se realizaba mediante mecanismos más simples pero altamente versátiles. Su existencia refuerza la idea de que los dipéptidos desempeñaron un papel central en la transición hacia el sistema genético moderno.

El equipo aplicó herramientas de análisis estadístico avanzadas (MANOVA, PCA, modelos lineales) para comprobar si las abundancias de dipéptidos en los proteomas eran fruto del azar o reflejaban patrones históricos. Los resultados fueron concluyentes: la composición de dipéptidos varía de forma significativa entre organismos y se relaciona con la antigüedad de los dominios proteicos.

Además, la reconstrucción filogenómica mostró que la evolución de los dipéptidos no fue lineal, sino episódica, con fases de rápida innovación seguidas de periodos de relativa estabilidad, un patrón que recuerda a la evolución de especies en paleontología.

El código genético, manual universal de la vida, permite entender enfermedades, diseñar terapias y aplicar la biotecnología en salud, agricultura e industria.

El código genético, manual universal de la vida, permite entender enfermedades, diseñar terapias y aplicar la biotecnología en salud, agricultura e industria. Cortesía: CDC

Un código proteico primigenio

La conclusión general es que los dipéptidos actuaron como un código proteico primigenio, que emergió en paralelo a un código operacional de ARN. Ambos sistemas, moldeados por la coevolución, la necesidad de edición y la especificidad, convergieron para dar lugar al código genético estándar que hoy compartimos todos los seres vivos.

Esta visión rompe con la idea de un único momento fundacional del código genético y lo presenta más bien como el resultado de un proceso gradual y modular en el que los dipéptidos fueron actores centrales. Más allá de reconstruir el pasado, estos hallazgos tienen consecuencias para el presente.

«La biología sintética reconoce cada vez más el valor de una perspectiva evolutiva —explica Caetano-Anollés. Y añade—: Comprender la antigüedad y la resiliencia de los componentes biológicos nos permite diseñar sistemas con mayor fundamento. Si queremos modificar la vida, necesitamos entender las reglas y las restricciones que la han hecho posible».

En el ámbito de la ingeniería genética, esta visión puede ayudar a optimizar enzimas o a diseñar nuevas rutas metabólicas, aprovechando la lógica ancestral del código genético. Y en biomedicina, ofrece un marco para explorar cómo ciertas mutaciones afectan a la estabilidad y función de las proteínas, un aspecto crucial en enfermedades relacionadas con el mal plegamiento proteico.

Una ventana al origen de la vida

En definitiva, el estudio de los dipéptidos ofrece una ventana única a los primeros pasos de la vida en la Tierra. Lejos de ser fragmentos irrelevantes, estas diminutas combinaciones de aminoácidos guardan la memoria de cómo las moléculas empezaron a organizarse, a plegarse y a interactuar, hasta formar las proteínas que sostienen la biología moderna.

El código genético que hoy parece inmutable no surgió de la nada, sino de un proceso largo, complejo y lleno de innovaciones moleculares. Los dipéptidos, esos ladrillos minúsculos, estuvieron allí desde el principio, allanando el camino hacia la diversidad y complejidad de la vida. ▪️

Anterior
Anterior

Descubrimiento astronómico: un púlsar «viuda negra» devora lentamente a su compañera estelar

Siguiente
Siguiente

Exoplanetas y agua: por qué los subneptunos no son mundos oceánicos como K2-18b