EL LENGUAJE DE LA GENÉTICA
En 1868, un joven médico suizo llamado Friedrich Miescher, aisló un compuesto nuevo de los núcleos de la célula, al que denominó nucleína, hoy día conocido como ácido nucleico. Dos años antes, un monje checo, Gregor Mendel descubrió, mediante experimentos sencillos con guisantes, que la herencia está contenida en muchos genes independientes. Sin embargo, durante mucho tiempo no se vio la conexión entre genes y ácidos nucleicos. Tuvo que pasar cerca de un siglo hasta que, en 1944, el científico americano Oswald Avery, con sus colaboradores, pudo transferir una propiedad heredable de una bacteria a otra utilizando un ácido nucleico puro, demostrando que los genes están formados por ácido desoxirribonucleico (ADN).
Los ácidos nucleicos son moléculas de una gran longitud, cuya estructura muestra una serie de regularidades, estando formados por un número limitado de piezas más pequeñas, conocidas como nucleótidos y abreviadas como A, C, T, y G. Si comparamos un ácido nucleico con un lenguaje, las piezas del ácido nucleico serían las letras del alfabeto del lenguaje. Con esta analogía podemos decir que el lenguaje de los ácidos nucleicos en la célula escribe nuestros caracteres hereditarios. Es decir, nos dice, por ejemplo, si nuestros ojos y los de nuestros hijos son azules o marrones.
Pero también existe un segundo lenguaje en nuestras células, el de las proteínas, escrito en el alfabeto propio de estas moléculas. Cada célula contiene miles de proteínas que realizan las reacciones químicas que se necesitan para la vida del organismo. La síntesis de cada proteína está dirigida por un ácido nucleico determinado. Así, el alfabeto de los ácidos nucleicos determina el alfabeto de las proteínas, siendo la clave genética el diccionario que nos da la traducción de un alfabeto al otro.
En 1961, Marshall Nirenberg llegó a una solución ingeniosa del jeroglífico: construyó un sistema in vitro utilizando un ácido nucleico que tenía las instrucciones para la formación de una proteína. Nirenberg utilizó un ácido nucleico muy simple, formado por una cadena con una sola letra repetida. El sistema produjo una proteína que también contenía una sola letra, escrita en el alfabeto de las proteínas. De esta manera, se descifró el primer jeroglífico y se mostró cómo puede usarse la maquinaria de la célula para la traducción de la clave genética. El trabajo posterior del propio grupo de Nirenberg, del grupo de Severo Ochoa y del grupo de Gobind Khorana dio como resultado el conocimiento completo de la clave genética. Se estableció que la clave genética es triplete; es decir, tres letras en el ácido nucleico determinan un aminoácido en la proteína. Teniendo en cuenta las cuatro letras en el alfabeto de los ácidos nucleicos, existen 64 tripletes posibles. Se demostró que 61 de ellos tienen la información para codificar algún aminoácido, siendo los tres tripletes restantes sin sentido, es decir, no tienen información para codificar a aminoácido alguno. Puesto que el número de aminoácidos que se encuentran presentes en los organismos es 20, la existencia de 61 tripletes implica que la clave genética está degenerada, es decir que un aminoácido puede ser determinado por más de un triplete.
El ADN no es el molde que se traduce para la síntesis de las proteínas. El ADN se transcribe, primero, en otro tipo de ácido nucleico, el ácido ribonucleico (ARN), concretamente en el llamado ARN mensajero (mARN), y es éste el que se traduce para dar lugar a la síntesis de las proteínas. En este mecanismo interviene otra clase especial de ARN, el ARN de transferencia (tARN) que es el que lee los tripletes del mARN y va incorporando el aminoácido correspondiente en una cadena polipeptídica, que es la proteína. Los aminoácidos se van incorporando siguiendo las instrucciones de los tripletes o codones en el mARN hasta que se llega a un triplete, llamado sin sentido, que constituye un triplete de terminación. Sería, en analogía con el lenguaje, el punto que separa dos frases. Del mismo modo que un texto sin puntos sería ilegible, un mensaje genético sin tripletes de terminación sería inviable pues, en vez de sintetizarse la proteína correcta, se sintetizaría una proteína mucho mayor que no sería funcional. Asimismo, un mensaje genético con tripletes de terminación en el sitio incorrecto daría lugar a una terminación prematura en la síntesis de la proteína que tampoco sería funcional. Pues bien, existen mecanismos de vigilancia que eliminan los mARNs que carecen de los tripletes de terminación en el sitio adecuado para sintetizar una proteína funcional.
La transferencia de información genética en la cual un gen formado por una determinada secuencia de ADN, da lugar al mARN correspondiente para que éste se traduzca en una proteína determinada, es la situación normal en organismos procariotas como las bacterias, en organismos eucariotas, entre los que se encuentra la especie humana, la situación es mucho más compleja. Las cadenas de ADN tienen exones, que son las secuencias que contienen la información genética que dan lugar a las proteínas, e intrones, que no están implicados en la síntesis de las proteínas, pero indican donde empieza y termina el mensaje para la síntesis de una determinada proteína. Es decir, el ADN se transcribe en un pre-mARN que, posteriormente, es procesado para formar el mARN que contiene los exones, siendo eliminados los intrones.
Los datos recientes obtenidos a raíz de la secuenciación del genoma humano indican la existencia de unos 40-50.000 genes. Sin embargo, debido al procesamiento antes indicado, el número de proteínas codificadas por esos genes puede ser hasta cinco veces mayor. Es decir, en el genoma humano, un gen puede codificar hasta cinco proteínas distintas.
Una característica fundamental del lenguaje de la genética es su fidelidad. A la vez que la célula paterna se divide en dos células hijas el ADN de las células debe replicarse exactamente de acuerdo con las reglas establecidas en 1953 por James Watson y Francis Crick, al determinar la estructura en doble hélice del ADN, en la cual la Adenina aparea con la Timina y la Guanina con la Citosina. Los errores en esta replicación son mínimos; ello, debido a una serie de mecanismos correctores que reducen las posibilidades de error a uno en cada diez millones de nucleótidos. Los mecanismos de supervisión y mantenimiento, son las enzimas de reparación del ADN, que identifican el error y lo reparan. Se calcula que, de esta forma, se corrigen un 99,9 por ciento de los errores que se cometen en la replicación del ADN. De nuevo, podemos comparar estos mecanismos con los procesos que tienen lugar en la edición de un texto. En principio, se cometen pocos errores pero, cuando ocurren, el proceso de corrección de pruebas elimina la mayor parte de ellos.
¿Qué ocurre cuando en el proceso de replicación del material genético se produce un error que no es corregido? Debido a la degeneración de la clave genética, es decir, al hecho de que un aminoácido puede ser codificado por más de un triplete, puede ocurrir que la mutación sea silenciosa y no dé lugar al cambio de un aminoácido por otro en la proteína correspondiente. También puede suceder que, habiendo cambio de aminoácido éste no altere la función de la proteína. Finalmente, la mutación puede originar un cambio de aminoácido que dé lugar a una proteína no funcional produciendo alteraciones que, en algunos casos, originan determinadas enfermedades. También existen enfermedades humanas debidas a que los genes contienen mutaciones en los exones que afectan el procesamiento del pre-mARN. Incluso mutaciones que hemos denominado silenciosas desde el punto de vista de su traducción en proteínas, pueden inactivar genes debido a que la maquinaria no es capaz de procesar dichos exones mutantes.
Por otra parte, hay que tener en cuenta que la expresión de los genes llamados estructurales, que son los que contienen la información para sintetizar la proteína correspondiente, depende de otros genes reguladores sin los cuales los primeros no se expresan. Así pues, mutaciones en los genes reguladores, que normalmente controlan la expresión de más de un gen estructural, pueden producir un efecto múltiple anulando la expresión de los genes estructurales a los que activan y, por tanto, imposibilitando la expresión de las proteínas correspondientes.
La clave genética es la información por la cual cuatro elementos en el mensaje genético, leídos de tres en tres, se traducen en otra información lineal de 20 elementos, que son los aminoácidos en las proteínas. Sin embargo, las proteínas no funcionan de esta manera lineal. Tienen que plegarse en una estructura tridimensional adecuada y compleja, que es la que contiene la actividad enzimática o la que va a servir como pieza estructural en la célula. El plegamiento de las proteínas es tan preciso que basta el cambio de un aminoácido por otro para que se inactive la proteína correspondiente. Se desconocen casi por completo las reglas que hacen que una proteína con una determinada secuencia de aminoácidos se pliegue de una forma (funcional) y no de otra (no funcional). Las proteínas suelen adoptar dos estructuras: una es la llamada hélice alfa en la que los aminoácidos se pliegan en forma de muelle o hélice, y otra es la llamada lámina beta. Recientemente se ha construido una lámina beta de 20 aminoácidos. Aunque las que existen en las proteínas contienen unos 50 aminoácidos, éste es un resultado muy prometedor para llegar a entender las reglas que traducen una secuencia lineal de aminoácidos a una forma tridimensional con funciones conocidas, clave que explicaría la denominada segunda parte de la clave genética. Volviendo a la analogía con el lenguaje, el plegamiento funcional de una proteína se podría comparar con la ordenación adecuada de las palabras para formar una frase con sentido.
PREGUNTA: La célula sabe leer, interpretar y expresar, esto se llama: