Capítulo 2: De la estructura celular a los polimorfismos de un solo nucleótido PDF

De la estructura celular a los polimorfismos de un solo nucleótido 2 14 Enfermedad multifactorial 44 Enfermedad mitocondrial 46 Concepto de polimorfismo de un solo nucleótido 47 Nomenclatura de los polimorfismos de un solo nucleótido 49 Codificación según pertenencia a ADN/ARN/proteínas 49 Nomenclatura en función del nucleótido mutado en el ADN 49 Nomenclatura en función del aminoácido cambiado en la proteína 51 Nomenclatura por código previamente acordado 52 Por un código de varios números pactado para el genoma humano 52 Lo que se expresa en informes de laboratorio sobre estudio de polimorfismo de un solo nucleótido 52 Nomenclatura de los polimorfismos de un solo nucleótido en el ADN mitocondrial 53 Comentario final sobre la nomenclatura 53 Conclusiones 54 Bibliografía 54 INTRODUCCIÓN En este capítulo se revisan, de forma esquemática, los conocimientos básicos de genética que permitirán entender los datos que nos ha proporcionado el conocimiento del genoma humano hasta el momento actual y su aplicación práctica en algunos temas concretos de la medicina predictiva. Sin duda, algunos de los conceptos que se exponen, a priori, se podrían dar por conocidos, pero se ha preferido incluirlos para facilitar el recorrido mental que va desde nuestros conocimientos de la herencia mendeliana, cuyas mutaciones en el ADN siempre se asocian a enfermedades, al concepto de polimorfismo de un solo nucleótido (SNP, single nucleotide polymorphism), es decir, un cambio de una sola base en el ADN, que per se no producirá ninguna enfermedad pero que, solo o en conjunción con otros SNP, puede «predisponer» a una determinada enfermedad y que su manifestación, o no, estará íntimamente ligada al estilo de vida (alimentación, sedentarismo, tabaquismo, consumo excesivo de alcohol, entre otros) y a la acción de xenobióticos (fármacos, aditivos alimentarios, plaguicidas, polucionantes ambientales). Como puede intuirse, el conocimiento de determinados SNP de cada persona puede ser la base para predecir las posibles enfermedades que esta persona podría presentar en función de sus hábitos de vida y, por lo tanto, se abre el camino para que, modificándolos de acuerdo con los conocimientos actuales derivados de publicaciones de gran solvencia científica, se pueda practicar una «medicina predictiva» como punto de partida científico para hacer una «medicina preventiva» especial para cada persona, es decir, la base de poder practicar una «medicina personalizada». A continuación exponemos algunos conceptos muy básicos de forma «comprimida», que consideramos mínimos necesarios para tener ideas claras sobre los SNP y mecanismos fundamentales de la herencia y poder entender los datos que aporta el conocimiento del genoma humano y su aplicación práctica en clínica, que se exponen en los diferentes capítulos de este libro. Todos ellos, sin duda, son conceptos conocidos por el lector, ya que se explican en la asignatura de bioquímica de primer curso en todas las facultades de medicina y de la que el autor fue docente durante muchos años en la UAB. Con su exposición no pretendemos ofender la sensibilidad de los lectores que ya los tengan claros, sino que los dirigimos a quienes no han vuelto a manejarlos desde los años de su formación universitaria con el fin de que, aunque sea en formato muy esquemático, los recuerden fácilmente, y así facilitar el seguimiento de la materia que se expone en los capítulos siguientes. 2 ESTRUCTURA DE LA CÉLULA La unidad estructural y funcional básica del cuerpo humano (y de todos los organismos, sean eucariotas o procariotas) es la célula. Una célula per se ya es un mundo biológico maravilloso, que incorpora nutrientes y los convierte en componentes de su estructura y en energía para realizar sus funciones con diferentes grados de especialización. Los componentes principales de la célula se resumen en la figura 2.1. Vamos a comentar los componentes principales desde el punto de vista funcional. © ELSEVIER. Es una publicación MASSON. Fotocopiar sin autorización es un delito. Es la «piel» de la célula. Regula el movimiento del agua y de los nutrientes y no es solamente un elemento de protección, sino que tiene una gran actividad metabólica, ya que sirve de barrera a sustancias nocivas y facilita el paso de nutrientes y metabolitos activos, tanto por mecanismos de difusión pasiva a favor de gradiente como de transporte activo contra gradiente mediante mecanismos específicos, que en general necesitan de aporte energético. La estructura básica de la membrana es una doble capa de fosfolípidos, con los FIGURA 2.1 Anatomía de la célula. Madrid: Elsevier, 2004. De la estructura celular a los polimorfismos de un solo nucleótido MEMBRANA CELULAR Tomado de Jorde LB, Bamshad MJ, Carey JC y White RL. Genética médica. 3.ª ed. 15 2 ácidos grasos en el interior —estructura lipofílica— y la parte del fosfato más la base —estructura hidrófila— en los exteriores. Contiene también colesterol, carbohidratos y proteínas; estas últimas son las que forman las estructuras de los receptores de los mensajes que se reciben a través de hormonas esteroideas, hormonas peptídicas y neurotransmisores. Mutaciones en los genes que codifican dichas proteínas transportadoras podrán afectar a su eficiencia y, por lo tanto, ser causantes de dismetabolismos. CITOPLASMA De la estructura celular a los polimorfismos de un solo nucleótido Es todo el contenido que hay en el espacio celular delimitado por la membrana y que consta de una emulsión coloidal, que se llama citosol, y una serie de orgánulos celulares que tienen diferentes funciones y que se describen seguidamente. Está formado por un 70% de agua y, según el tipo de célula, ocupa el 50-70% de su superficie. En él tienen lugar múltiples reacciones bioquímicas fundamentales del metabolismo celular. 16 RETÍCULO ENDOPLÁSMICO Es un «laberinto» membranoso que ocupa una gran parte en muchas células. Está casi en contacto con el núcleo. Su misión es de red de microtúbulos, llamados ciste-ARN, por los que se lleva a cabo el transporte de determinadas moléculas a sus destinos específicos con el fin de cumplir su misión metabólica. Endoplásmico significa «dentro de la célula» y «retículo» quiere decir red. Están el retículo endoplásmico rugoso, llamado así pues a él se adhieren externamente los ribosomas y está especializado en la síntesis de proteínas, y el retículo endoplásmico liso, que no contiene ribosomas y su misión es solamente el transporte de proteínas a sus lugares de actuación o eliminación dentro del cuerpo de Golgi. Los ribosomas son estructuras de ARN y proteínas que tienen dos subunidades y son funcionales cuando se unen a una cadena de ARNm y forman la unidad fundamental de la síntesis de proteínas. Los ribosomas se sintetizan en una estructura diferenciada del núcleo que se llama nucléolo y través de los poros de la membrana migran al citosol y donde permanecen flotando individualmente o se unen a la estructura de retículo endoplásmico rugoso. El núcleo controla la síntesis de proteínas, pues a través del ADN sintetiza ARNm que servirá de molde para dicha síntesis, como se describe más adelante. CUERPO DE GOLGI Es un conjunto de pequeños sacos de forma discoidal que tienen como misión sintetizar productos y almacenar productos sintetizados en otras estructuras de la célula, y ponerlos a su disposición cuando sean necesarios, así como digerir bacterias que hayan entrado en la células y trozos de moléculas degradadas a lo largo de los procesos metabólicos. Entre los productos sintetizados se encuentran glucoproteínas y enzimas secretoras, entre las que destacan las del páncreas. Su estructura es similar a la del retículo endoplásmico pero es más compacta. La liberación de las sustancias que almacena se hace principalmente a través de los lisosomas. LISOSOMAS Son unos cuerpos esféricos de 0,1-1 m de diámetro, englobados dentro de una membrana. Contienen enzimas hidrolíticas cuya misión es la destrucción de moléculas. Contienen proteasas, lipasas, nucleasas y polisacaridasas. En el interior del lisosoma hay un pH de 5, diferente del del citosol que suele estar en 7,2-7,4. Actúan en el componente ácido y esto es una «autoprotección» de la célula, pues si se rompen, al diluirse en el citosol, sube el pH y no pueden actuar; por lo tanto, es un mecanismo que evita la posible autodestrucción. Hace unos pocos años se asociaban al proceso de apoptosis, pero hoy se sabe que ésta actúa por otros mecanismos. 2 PEROXISOMAS © ELSEVIER. Es una publicación MASSON. Fotocopiar sin autorización es un delito. MITOCONDRIAS Son la «central energética de la célula». Su misión es producir toda la energía que el organismo necesita para sus funciones. Es una estructura formada por dos membranas, la externa y la interna. La membrana externa es la que cierra el contenido de la mitocondria y su estructura es similar a la membrana celular. Es semipermeable, por lo que en el interior de la mitocondria la concentración de moléculas pequeñas como electrolitos, aminoácidos y glucosa es igual a la del citosol, pero no la composición de proteínas, que son moléculas grandes que no atraviesan la membrana. La membrana interna está formada básicamente por proteínas y su función es la fosforilación oxidativa, con la finalidad de producir ATP, que es la molécula que almacena la energía para las funciones metabólicas que la precisen. Con el fin de ampliar su capacidad, la membrana no es concéntrica con la externa, sino que hace muchas circunvalaciones, que se llaman cristae, con lo que aumenta su diámetro real. En el interior de la membrana interna, entre las cristae, hay un espacio llamado matrix, su contenido es muy rico en proteínas y alberga toda la maquinaria biológica del ciclo de Krebs, que permite metabolizar la glucosa y los ácidos grasos en agua, CO2 y energía con el acoplamiento al sistema de transporte electrónico mitocondrial de la membrana interna. Una gran peculiaridad de las mitocondrias es que se pueden autorreproducir pues tienen su propio genoma. El ADN mitocondrial es de configuración circular y no está unido a una cubierta de proteínas protectoras, a diferencia del nuclear que es de doble hélice y envuelto por una estructura proteínica De la estructura celular a los polimorfismos de un solo nucleótido Son unos cuerpos esféricos que se asemejan a los lisosomas y su misión es liberar a la célula de sustancias tóxicas, como el peróxido de hidrógeno y otras de tipo oxidante, y para ello contienen enzimas relacionadas con el metabolismo de la molécula de oxígeno, que se importan del citosol. Es muy interesante el hecho de que todas las enzimas destinadas a ser incorporadas en el peroxisoma tienen una cadena terminal llamada PTS (persoxisomal targeting signal), que es la señal que permite a dichas enzimas ser reconocidas por la membrana del peroxisoma y permitir su entrada, lo que no puede ocurrir con ninguna otra molécula sin dicha señal. Son especialmente ricas en peroxisomas las células más involucradas en procesos de destoxificación, como las células hepáticas. 17 2 que lo protege de agresiones biológicas, principalmente de la acción de los radicales libres. Es decir, el ADN mitocondrial está «desnudo» frente a las agresiones de los radicales libres y, al estar en un ambiente que es precisamente donde se produce la mayoría de los radicales libres del organismo, está muy expuesto a la oxidación y, por lo tanto, a su alteración estructural. Obviamente, además del ADN, la mitocondria dispone de todo el entramado bioquímico necesario para producir proteínas in situ, que formarán parte de la estructura de la membrana interna y de muchas de las enzimas necesarias para las funciones de la mitocondria. Este ADN se hereda totalmente del genotipo materno, y como de su estructura, función y resistencia a la oxidación dependen en gran parte la conservación de la actividad mitocondrial y el mantenimiento activo de las células, la longevidad de las personas se asocia en muchas ocasiones a la longevidad de la madre. Las mitocondrias tienen también otras funciones más secundarias que no mencionamos en este breve resumen de conceptos. De la estructura celular a los polimorfismos de un solo nucleótido Producción de energía por la mitocondria La principal función de las mitocondrias es la producción de energía a partir de la glucosa y también de los ácidos grasos. La molécula básica del organismo para producir energía (ATP) es la glucosa. La glucosa puede producir ATP por dos mecanismos, uno anaeróbico y otro aeróbico energéticamente más rentable. El primero es el proceso de la glucólisis anaerobia que tiene lugar en el citosol y que convierte la glucosa en piruvato y en este proceso se generan cuatro moléculas de ATP por cada molécula de glucosa. El segundo proceso metabólico de la glucosa es aeróbico y tiene lugar en la mitocondria. Se inicia también a partir de glucosa que se transforma en dos moléculas de piruvato (tres carbonos), que en una primera etapa pierde un carbono y dos oxígenos para formar CO2 y en este proceso el balance energético es positivo pues una molécula de NAD+ se convierte en otra de más alta energía que es el NADH. El resto de la molécula de piruvato se une a una molécula de coenzima-A (CoA) y se forma acetil-CoA (dos carbonos), que se metaboliza a través del ciclo de Krebs; en el primer paso se une a una molécula de oxalacetato (cuatro carbonos) para formar una molécula de citrato (seis carbonos). A lo largo del ciclo se forman CO2 y varias moléculas de NAD+ y FAD+ que elevan su grado energético a NADH y FADH, lo que permite generar ATP a partir de ADP y AMP en la cadena de transporte electrónico mitocondrial ubicada en la membrana interna. En todo el ciclo a partir de la molécula de glucosa se generan 28 moléculas de ATP, de las cuales 24 lo son a partir de una molécula de piruvato. Se evidencia la gran rentabilidad del metabolismo aeróbico de una molécula de glucosa (28 ATP) frente a su metabolismo anaeróbico (4 ATP). También los ácidos grasos pueden producir energía a partir de este mecanismo, con una serie de reacciones previas que los transforman en moléculas de acetil-CoA. NÚCLEO 18 Es la estructura más visible y llamativa de los orgánulos de la célula y es el centro de control de todas las actividades de la misma. Tiene forma esferoide y está separado del citosol por una doble membrana que tiene poros en muchos © ELSEVIER. Es una publicación MASSON. Fotocopiar sin autorización es un delito. 2 De la estructura celular a los polimorfismos de un solo nucleótido puntos, lo que hace que sea selectivamente permeable. La estructura básica central del núcleo es la cromatina que está formada por ADN y proteínas (histonas), prácticamente al 50%, y pequeñas cantidades de ARN. Hay dos tipos de cromatina, la heterocromatina, que está doblada en muchos pliegues y está muy compactada, y la eucromatina, que es de estructura lineal. Las proteínas del núcleo se llaman histonas, son de carácter básico y tienen función estructural, las hay de varias clases y su misión principal es actuar como ovillos a cuyo «hilo» proteínico se une el ADN y ello permite compactarlo en unidades, conocidas como nucleosomas, que son estructuras diméricas o tetraméricas que tienen gran importancia en la regulación de la expresión genética y en los cambios epigenéticos del ADN. La unidad básica de un nucleosoma tiene unos 147 pares de bases. El ADN de un núcleo extendido linealmente sería una cadena de unos 2 m de largo, en tanto que compactado, unido a los ovillos de histonas, ocupa un espacio de unos 12 m de diámetro, y el conjunto de todo el ADN de una célula por este procedimiento se compacta 1/40.000 veces menos en volumen. Como dato curioso podemos extrapolar que si la cadena del ADN de una célula ocupara linealmente unos 2 m, teniendo en cuenta que en el cuerpo humano hay unos 300 trillones de células, todo el ADN del cuerpo humano haciendo una cinta única tendría una longitud de 182 billones de km, lo que permitiría «unir» la tierra y el sol 610 veces. Las histonas tienen también un papel muy importante como estructura de protección del ADN frente a la acción de los radicales libres. Las proteínas nucleares diferentes de las histonas son de carácter ácido y tienen funciones muy diversas, entre ellas la protección de ADN a la acción de los radicales libres y xenobióticos, y son también reguladoras de la expresión génica. En el núcleo el ADN se encuentra dispuesto como un conjunto de paquetes organizados que reciben el nombre de cromátidas, y dos cromátidas unidas por una estructura central llamada centrómero forman un cromosoma. El centrómero se denomina así incluso cuando los dos brazos de las dos cromátidas que forman el cromosoma no sean de la misma longitud y, por lo tanto, el centrómero no esté en posición central. La estructura del núcleo que contiene todos los componentes del genoma es el ADN. El ADN nuclear no está de forma amorfa apelotonado en el núcleo, sino que está organizado en determinadas piezas estructuralmente independientes y características de cada especie, que son los cromosomas. En la especie humana hay 46 cromosomas, 23 que se heredan de la madre y 23 del padre, apareados, excepto los dos cromosomas sexuales que se fusionan en el proceso de la meiosis. Las parejas de cada cromosoma tienen las mismas características de longitud, genes que engloban y su orden en el cromosoma, ésta es la razón por la que no puede haber reproducción entre las especies. Hay dos grupos de cromosomas, los autosomas, que son los pares del 1 al 22, y los gonosomas, cromosomas que definen el sexo, que son el X y el Y. Dos cromosomas X definen el genotipo de mujer y el XY define el genotipo de hombre. En la actualidad, ya se conoce la posición de la mayoría de los genes en cada uno de los cromosomas; el que tiene más genes localizados (4.220) es el cromosoma 1 y el que tiene menos, el cromosoma 11, con 379. Cada cromosoma puede diferenciarse por su tamaño, posición del centrómero, longitud relativa entre brazos cortos y brazos largos, así como patrón de bandas mediante tinciones específicas de células en metafase. 19 De la estructura celular a los polimorfismos de un solo nucleótido 2 20 Telómeros Son una estructura diferenciada en el cromosoma, y forman la porción distal, respecto al centrómero, de cada cromátide. El telómero tiene un ADN de secuencias muy repetitivas. Los telómeros tienen dos funciones bien diferenciadas, por un lado en el proceso de replicación, dar la señal que el cromosoma se ha terminado, y por otro lado, evitar que en la metafase los cromosomas se unan entre sí por sus extremos, ya que la estructura del ADN del telómero es incompatible con la unión a otros segmentos teloméricos de ADN. Recordemos que siempre que hay transferencias de material entre cromosomas se produce por roturas en el ADN no telomérico. Otra función de los telómeros es actuar como «relojes biológicos». En cada replicación celular se pierde una cantidad de telómero, que se regenera mediante la acción de una enzima sintetasa llamada telomerasa. Sin embargo, la reconstrucción no es total, y en cada replicación se pierden entre 50 y 200 bases, por lo que los telómeros quedan un poco más cortos. Cuando se han producido entre 50 y 60 replicaciones, debido a la longitud de los telómeros, la célula no puede replicarse más y entra en apoptosis, es decir se autodestruye. Éste es un mecanismo biológico de protección del cáncer. Resumiendo la situación, se sabe que se produce una mutación espontánea aproximadamente por cada 106 células; es decir, 1 por cada millón, y esta cifra se consigue al cabo de 20 ciclos de replicación. Al entrar las células en apoptosis a los 50-60 ciclos debido al acortamiento de los telómeros, ésta evita que se acumulen mutaciones y, por lo tanto, evita el riesgo de que su acumulación dé origen a líneas celulares cancerosas. También se ha visto que las células cancerosas pueden sobre expresar la subunidad TERT de la telomerasa y hacer una regeneración total e incluso alargar los telómeros, con lo que se contribuye a su perpetuación, pues en ellas no se produce la apoptosis derivada del acortamiento de los telómeros. La medicina personalizada, tema del libro, engloba entre otras actividades de la práctica médica la conocida como «medicina antienvejecimiento» o, más comúnmente, por su nomenclatura inglesa antiaging medicine y los telómeros tienen también un papel importante en el envejecimiento. Hemos dicho que en cada replicación se pierden 50-200 bases a pesar de la acción de la telomerasa, y continuamente cada nueva serie celular tiene sus telómeros algo más cortos que con los años —décadas— se hace significativo al condicionar cada vez ciclos de replicación celular más cortos. Actualmente, hay técnicas para medir la longitud de los telómeros; la más utilizada es la Q-FISH (Quantitative Fluorescence in situ hibridization) y efectivamente se ha visto que son más cortos a medida que se envejece y actualmente se utiliza como medida objetiva para conocer la edad biológica de las personas. Precisamente este proceso natural de acortamiento de los telómeros con el envejecimiento es la base de la teoría de Hayflick (Leonard Hyflick, 1956) sobre las causas del envejecimiento biológico de las personas. Los radicales libres acortan los telómeros, así como el estrés crónico, por lo que los procesos ligados a la producción de radicales libres y situaciones de estrés prolongadas son, precisamente, uno de los puntos a actuar en medicina antienvejecimiento. Se han encontrado enfermedades genéticas que producen una actividad reducida de la telomerasa y su consecuencia es un envejecimiento prematuro, caso de la progeria, que a los 20 años se tiene un fenotipo de anciano, o el síndrome de Werner. También se han encontrado alteraciones de la telomerasa en el síndrome de Down, en el que hay un evidente envejecimiento prematuro, aunque no tan acelerado como en los otros dos síndromes citados. La importancia de los telómeros en los procesos de envejecimiento y desarrollo del cáncer ha merecido su recompensa en el mundo científico con la concesión del Premio Nobel de Medicina de 2009 a Elizabeth H. Blakburn, Carol Greider y Jack Szostak, de Estados Unidos, por: The discovery of how chromosomes are protected by telomeres and the enzyme telomerase. 2 Con fines de disponer de un sistema útil para localizar la situación de los genes en los cromosomas, hay una nomenclatura de su estructura, muy utilizada en genética, y que consideramos útil citarla de forma resumida, pues el lector la encontrará con frecuencia en la descripción de mutaciones genéticas. Los cromosomas tienen dos unidades, denominadas brazos, mayoritariamente de longitud diferente, unidos en un punto llamado centrómero que se codifica como cen. Por lo tanto, hay un brazo largo que se codifica con la letra q y un brazo corto que se codifica con la letra p. Estas letras se asignaron así pues se partió de una publicación en francés que llamó petite al brazo corto, es decir el pequeño, y por eso se le asignó la letra p y aunque lo más lógico quizá hubiera sido llamar grand al brazo largo o grande y darle la letra g, se optó por llamarlo q, que en el alfabeto sigue a la p, todo ello poco práctico a efectos mnemotécnicos, pero así ha continuado y ninguna convención internacional de expertos ha considerado oportuno cambiarlo. La posición del centrómero en relación con la longitud total del cromosoma y en relación con los dos brazos da lugar a una clasificación morfológica de los cromosomas, que es la siguiente: mitad del cromosoma, es decir, ambos brazos tienen prácticamente la misma longitud. Son las parejas 1, 3, 16, 19 y 20. parejas 2, 4, 5, 6, 7, 8, 9, 10, 11, 12, 17, 18 y cromosoma X. técnicas convencionales, prácticamente no se observa, y el cromosoma tiene una imagen de V invertida. Son las parejas 13, 14, 15, 21, 22 y cromosomas Y. En la figura 2.2 se muestra un cariotipo, concretamente de un hombre, en que se puede ver la morfología de todos los cromosomas. MITOSIS Cada día en el cuerpo humano millones de células se dividen, y deben asegurar con la mínima probabilidad de error que su ADN será idéntico en las células hijas generadas. Mitosis es «el proceso de división binaria de las células mediante el que se conserva toda la información genética de los cromosoma a lo largo de las sucesivas generaciones celulares, así como de las estructuras De la estructura celular a los polimorfismos de un solo nucleótido © ELSEVIER. Es una publicación MASSON. Fotocopiar sin autorización es un delito. Nomenclatura de la estructura de los cromosomas 21 De la estructura celular a los polimorfismos de un solo nucleótido 2 22 FIGURA 2.2 Cariotipo de bandas de un hombre normal. Tomado de Jorde LB, Bamshad MJ, Carey JC y White RL. Genética médica. 3.ª ed. Madrid: Elsevier, 2004. de todos los orgánulos citoplasmáticos». El estado de las células en situación habitual antes de la mitosis se llama interfase. Cada vez que una célula va a dividirse debe previamente replicar todo su ADN, es decir replicar todos sus cromosomas. Es un proceso que tiene lugar de forma continua, pero que a efectos didácticos se ha dividido en varias fases. La interfase se divide en tres subfases (fig. 2.3). La fase G1 (Gap 1) es la que comprende desde que la célula nace hasta que se inicia la etapa S, y en ella la principal función de la célula es la síntesis de ARNm, es decir preparar la síntesis de proteínas. La fase S (síntesis) es aquella en que se produce la replicación del ADN, síntesis de ARNm y de histonas nucleares. La fase G2 (Gap 2) tiene como finalidad la síntesis del ARNm y de las proteínas necesarias para la síntesis de los microtúbulos del huso acromático. Durante toda la interfase la célula aumenta de volumen pues sintetiza más orgánulos y proteínas, necesarias para dotar a dos células en vez de una, y los cromosomas se duplican y ambas series se llaman cromátides hermanas que permanecen unidas por el centrómero. La mitosis propiamente dicha se subdivide en diversas fases: fase S, sus dos cromátides se condensan y se sintetizan las proteínas que van a formar la estructura del huso acromático, que son unos microtúbulos que serán la guía donde se unirán de forma ordenada los cromosomas para preparar su separación. Se duplica también el centriolo, que es la estructura proteínica que mantiene unidos por sus dos extremos —situación polar— la estructura de los microtúbulos del huso acromático. FIGURA 2.3 Fases principales de la mitosis celular en las que se muestra la alternancia de la interfase y la mitosis (división). Tomado de Jorde LB, Bamshad MJ, Carey JC y White RL. Genética médica. 3.ª ed. Madrid: Elsevier, 2004. más significativo de esta fase es la desaparición de la membrana nuclear, de forma que los microtúbulos con las dos cromátides adheridas de cada uno de los cromosomas quedan flotando en el citoplasma. Se sintetiza una nueva estructura proteínica llamada cinetocoro, de la que se sintetizan dos unidades por cromosoma, y se unen al centrómero, pero cada uno adherido a cada una de las dos cromátides. El huso acromático también va creciendo para poder facilitar la separación de los cromosomas en dos lotes idénticos. De la estructura celular a los polimorfismos de un solo nucleótido © ELSEVIER. Es una publicación MASSON. Fotocopiar sin autorización es un delito. 2 23 2 del huso acromático hasta alcanzar una posición central. Los cinetocoros de cada cromátide desplazan al centrómero de su unión, de forma que cada cromátide queda unida a los microtúbulos a través de su cinetocoro. Finalmente, todas las cromátides quedan unidas en un plano posicionado en el ecuador del huso entre los dos centriolos polares. De la estructura celular a los polimorfismos de un solo nucleótido hermanas (llamadas cohesinas) en el ecuador del huso acromático se rompen, lo que permite su separación y de cromátides hermanas se pasa a cromosomas hermanos diferentes, y se dirigen en dos lotes iguales, teniendo como guías a los microtúbulos, uno hacia cada posición de los dos centriolos opuestos en cada uno de los dos polos del huso. Al final de la anafase, se han logrado dos lotes idénticos de cromosomas separados entre sí y cada uno alrededor del centriolo que, en esta fase, se denomina centrosoma. 24 los procesos que han tenido lugar durante la profase y la anafase. Lo más característico es la formación de dos membranas celulares que envuelven a cada uno de los dos lotes de cromosomas en cada uno de los polos, así se forman dos nuevos núcleos, idénticos en material genético, y la cromatina de ellos vuelve a condensarse como estaba en la profase. Se ha terminado el proceso de división nuclear (cariocinesis), pero falta completar la división en dos células independientes y conceptualmente la mitosis ya ha terminado, pero de forma sucesiva tiene lugar el proceso de la citocinesis, que se considera conceptualmente diferente, pero sucesivo al de mitosis. acromático, se produce un surco de escisión que contiene un anillo proteínico contráctil de actina (una de las proteínas que forman la fibra muscular), que se sintetiza en el aparato de Golgi, que se va contrayendo, estrangulando el citoplasma, y finalmente da lugar a dos células hijas independientes. Se ha completado la división celular, manteniéndose toda la información genética idéntica en las dos nuevas células. CROMOSOMOPATÍAS Las alteraciones cromosómicas o cromosomopatías son mutaciones que implican una cantidad grande de material genético, en general del orden de 2.000 a 3.000 kb, y que son visibles al microscópico óptico, al estudiar mitosis en metafase mediante las técnicas de citogenética, y que se conoce como cariotipo. Las cromosomopatías fueron las primeras alteraciones genéticas diagnosticadas por técnicas de laboratorio. En 1956 Tjio y Levan por un lado y Ford y Hamerton por otro, pero casi simultáneamente, fueron los primeros que lograron obtener un cariotipo humano definiendo el número y la clase de los cromosomas (46, XY para el hombre y 46, XX para la mujer). Lejeune en 1959 fue el primero que logró asociar un cariotipo anómalo a una enfermedad: la trisomía 21 como causante del síndrome de Down. En 1963 se realizó el primer cariotipo en Barcelona, en el Laboratorio de la Cátedra de Pediatría de la Facultad de Medicina (Prof. Manuel Cruz Hernández) y del que el autor era Jefe de Servicio. Las alteraciones más frecuentes que se pueden producir en la estructura del ADN y que afectan a muchas bases en las cromosomopatías, pocas bases en las mutaciones que originan una enfermedad genética mendeliana y una sola base en las SNP son principalmente: 2 intersticial y se codifican como del. codifican como dup. segmento intercalado sufre una rotación de 180° y se codifican como inv. cromosomas y, por lo tanto, el proceso requiere puntos de rotura en ambos y se codifican como trans. Se producen como consecuencia de errores en el reparto o segregación de los cromosomas durante la división celular meiótica o mitótica. Las más frecuentes son las aneuploidías que son aquellas en que el número de cromosomas no es un múltiplo exacto de N. Su origen es una mala segregación de los cromosomas durante la meiosis, a causa de una falta de disyunción o un retraso en la anafase, situaciones que dan lugar a gametos disómicos o nulisómicos, que al ser fecundados por un gameto normal dan lugar a individuos monosómicos o trisómicos, es decir, monosomías o trisomías. El error se puede producir tanto en la primera división meiótica como en la segunda. En el caso de que el error sea una falta de disyunción, se puede producir en cualquier división celular somática o mitosis y si esto ocurre en las primeras fases del desarrollo embrionario, se generará un individuo en mosaico, es decir con dos o más líneas celulares con complementos cromosómicos diferentes. Como ejemplo clásico de una monosomía citamos el síndrome de Turner (45, X) y de trisomía, el síndrome de Down (47, XX, +21 o 47, XY, +21). No entraremos en detalle en la nomenclatura de las anomalías cromosómicas pues su interpretación no forma parte del objetivo de este libro, que se refiere a anomalías de un solo nucleótico (SNP), referimos a textos especializados y como información ponemos algunos ejemplos: del brazo largo del cromosoma 9. La letra h indica que es en la región de heterocromatina y, por lo tanto, no se expresará fenotípicamente. cromosoma 4. De la estructura celular a los polimorfismos de un solo nucleótido © ELSEVIER. Es una publicación MASSON. Fotocopiar sin autorización es un delito. ANOMALÍAS CROMOSÓMICAS NUMÉRICAS ANOMALÍAS CROMOSÓMICAS ESTRUCTURALES Se producen cuando hay roturas cromosómicas (frecuentemente, de forma espontánea) y se reparan de forma errónea. No todas las anomalías estructurales se manifiestan en el fenotipo pues algunas pueden ser equilibradas, es decir que no hay pérdida ni ganancia de ADN y, por lo tanto, puede ser que 25 2 no produzcan ninguna enfermedad en la persona afectada; ahora bien, esta anomalía se transmite a la descendencia, en ella sí que pueden dar lugar a una anomalía desequilibrada. Las más frecuentes son las ya citadas anteriormente de forma general: deleciones, duplicaciones, inversiones y translocaciones. Dentro de cada uno de estos grupos puede haber subgrupos, pero no los describimos porque esta obra no está dedicada a las cromosomopatías. Como ejemplo de enfermedades muy conocidas y que se deben a anomalías estructurales de los cromosomas podemos citar el retinoblastoma (del13q14) y el tumor de Wilms (del11p13). A lo largo de los brazos cortos o largos de los cromosomas se han identificado las zonas donde se localizan diferentes mutaciones genéticas relacionadas con enfermedades definidas o con determinados polimorfismos. De la estructura celular a los polimorfismos de un solo nucleótido ESTRUCTURA DEL ADN 26 EL ADN es el componente fundamental del material genético que ha pasado de los progenitores a la descendencia y propaga las características de la especie. La estructura del ADN en doble hélice fue descubierta por James Watson y Francis Crick en el año 1953; por la trascendencia de este hallazgo fueron galardonados en 1962 (junto con Maurice Wilkins) con el Premio Nobel de Medicina. La unidad básica del ADN (y del ARN) es el nucleótido, que está formado por una base nitrogenada (púrica o pirimidínica), un azúcar pentosa: desoxirribosa en el ADN y ribosa en el ARN y una molécula de ácido fosfórico. Las bases son las siguientes: Una hebra de ADN está formada por una secuencia de nucleótidos unidos 5’ de la molécula de fosfato de un nucleótido está unido al grupo hidroxilo en 3’ del azúcar del nucleótido siguiente. El extremo 5’ de una molécula de ADN corresponde al que posee un residuo de desoxirribosa en el que el átomo de carbono en posición 5’ no está unido a ningún otro azúcar. El extremo 3’ corresponde al que posee el carbono en posición 3’ de la desoxirribosa no unido a otra molécula de azúcar. La forma usual de describir una secuencia de ADN consiste en anotar la secuencia de bases nucleotídicas de una sola hebra en la dirección 5’ a 3’. Por lo tanto, en una hebra completa de ADN, su extremo 5’ carece de nucleótido en dicha posición, mientras que el extremo 3’ carece también de nucleótido en dicha posición. Este concepto no es trivial, pues tiene una gran importancia en todas las enfermedades relacionadas con inserciones y deleciones de material genético. La molécula de ADN está integrada por dos de estas hebras en forma de doble hélice antiparalela (fig. 2.4). Las dos hebras no son iguales en composición, sino que son complementarias entre sí. Siempre que hay una adenina en una cadena hay una timina en la otra, y de igual forma, una guanina en una cadena implica que habrá una citosina en la otra. El hecho de que la hélice formada por las dos hebras de ADN sea antiparalela lo intuyeron sus FIGURA 2.4 Doble hélice de DNA, con el esqueleto de azúcar-fosfato y las bases nitrogenadas. De la estructura celular a los polimorfismos de un solo nucleótido © ELSEVIER. Es una publicación MASSON. Fotocopiar sin autorización es un delito. 2 Tomado de Jorde LB, Bamshad MJ, Carey JC y White RL. Genética médica. 3.ª ed. Madrid: Elsevier, 2004. descubridores según criterios funcionales teóricos; confirmado más tarde por trabajos de bioquímica con ADN-polimerasas y definitivamente por análisis de 27 2 fosfodiéster tienen direcciones opuestas. En las dos hebras las bases se unen de forma estructural complementaria mediante puentes de hidrógeno que, como no son enlaces covalentes, se rompen y regeneran con gran facilidad y con el De la estructura celular a los polimorfismos de un solo nucleótido unen por dos puentes de hidrógeno (fig. 2.5). Una vuelta completa de la hélice del ADN incluye 10 nucleótidos y tiene una longitud de 4,3 nm. La característica fundamental del ADN es su capacidad de replicación. En un momento dado las dos hebras de ADN se separan (proceso en forma de Y) y cada hebra independiente sirve de molde para la síntesis de otra hebra comfinal de una replicación de éste, de un segmento de ADN se han derivado dos segmentos idénticos (fig. 2.6). Este mecanismo es la base de la herencia biológica. La función principal de la secuencia de bases a lo largo de la hebra de ADN es almacenar y transmitir durante generaciones la «memoria genética» para codificar la síntesis de todas las proteínas (proteoma) del cuerpo humano. En la cadena de ADN la secuencia de tres bases seguidas son la clave para codificar un aminoácido y estos tripletes de bases se llaman codones (tabla 2.1). Así pues, un codón es un segmento del ADN de tres bases que codifican un determinado aminoácido. Se dispone de cuatro bases diferentes (A, T, G, C) y con ellas se pueden hacer 64 combinaciones de tripletes diferentes, pero solamente hay 20 aminoácidos formadores de proteínas, de lo que se deduce que diferentes codones podrán codificar el mismo aminoácido. Este hecho ha condicionado el concepto de que el código genético está degenerado. El resumen de ello es que sólo la metionina y el triptófano están codificados por un solo codón, en tanto que los otros 18 aminoácidos pueden estar codificados por varios codones. La consecuencia práctica de ello es que cuando se produce un cambio de una base en un codón que codifica la metionina o el triptófano, necesariamente se codificará otro aminoácido y la proteína correspondiente presentará dicho cambio, FIGURA 2.5 Estructura química de las cuatro bases que muestra los enlaces por puentes de hidrógeno entre los pares de bases. Tomado de Jorde LB, Bamshad MJ, Carey JC y White RL. Genética 28 médica. 3.ª ed. Madrid: Elsevier, 2004. 2 © ELSEVIER. Es una publicación MASSON. Fotocopiar sin autorización es un delito. que puede ser «silente» a efectos de la función de la proteína afectada, o puede ser que condicione una alteración de su función, que daría lugar a una posible enfermedad o una predisposición a ella. Por el contrario, un cambio en una base en los codones que codifican a varios aminoácidos no necesariamente va a producir un cambio en la estructura de la proteína, pues puede ocurrir que el cambio de la base origine un codón que codifique el mismo aminoácido. En cuanto a su función, podemos clasificar el ADN en dos grandes grupos: ADN codificante es el que estructura los genes cuya misión es codificar la síntesis de proteínas y representa aproximadamente el 10% del total, y ADN no codificante que es el 90% del total, que no codifica proteínas (por lo tanto, sus mutaciones no van a afectar la estructura de éstas) y tiene funciones de protección frente a cambios y de regulación (hoy se está viendo que mutaciones en éstos puede tener también trascendencia patológica). Además, hay dos tipos de ADN no codificante, pero que forman parte de estructuras diferenciadas del cromosoma. Uno es el ADN centromérico constituyente de los centrómeros, que es un ADN alfoide que se dispone en conjuntos de repeticiones en tándem de unidades elementales de 171 pb que no son todas iguales. El componente mejor definido de cada unidad es una secuencia de 17 nucleótidos llamada «caja y precisamente las características de estos conjuntos sirven como marcador de cada par de cromosomas en reacciones de hibridación. El otro es el ADN telomérico que es el que forma los telómeros y es un ADN de secuencias muy repetitivas en tándem del hexanucleótido TTAGGG, que se repite hasta formar conjuntos de longitud variable, de un promedio de 10 kb (1.600 monómeros). En el extremo de la molécula de ADN del telómero, una de sus hebras tiene 12 nucleótidos más que la otra (por lo tanto, no cumple con el modelo), que se De la estructura celular a los polimorfismos de un solo nucleótido FIGURA 2.6 Replicación del DNA. Los puentes de hidrógeno entre las dos cadenas originales se rompen, permitiendo a las bases de cada cadena aparearse con bases complementarias libres. Tomado de Jorde LB, Bamshad MJ, Carey JC y White RL. Genética médica. 3.ª ed. Madrid: Elsevier, 2004. 29 2 Tabla 2.1 T De la estructura celular a los polimorfismos de un solo nucleótido C 30 A G Código genético T C A G TTT Phe (F) TCT Ser (S) TAT Tyr (Y) TGT Cys (C) TTC Phe (F) TCC Ser (S) TAC TGC TTA Leu (L) TCA Ser (S) TAA STOP TGA STOP TTG Leu (L) TCG Ser (S) TAG STOP TGG Trp (W) CTT Leu (L) CCT Pro (P) CAT His (H) CGT Arg (R) CTC Leu (L) CCC Pro (P) CAC His (H) CGC Arg (R) CTA Leu (L) CCA Pro (P) CAA Gln (Q) CGA Arg (R) CTG Leu (L) CCG Pro (P) CAG Gln (Q) CGG Arg (R) ATT Ile (I) ACT Thr (T) AAT Asn (N) AGT Ser (S) ATC Ile (I) ACC Thr (T) AAC Asn (N) AGC Ser (S) ATA Ile (I) ACA Thr (T) AAA Lys (K) AGA Arg (R) ATG Met (M) START ACG Thr (T) AAG Lys (K) AGG Arg (R) GTT Val (V) GCT Ala (A) GAT Asp (D) GGT Gly (G) GTC Val (V) GCC Ala (A) GAC Asp (D) GGC Gly (G) GTA Val (V) GCA Ala (A) GAA Glu (E) GGA Gly (G) GTG Val (V) GCG Ala (A) GAG Glu (E) GGG Gly (G) repliega sobre sí misma y por ello no puede replicarse de la forma habitual y necesita de la acción de la telomerasa, como ya se ha comentado. CÓDIGO GENÉTICO Según define la Real Academia Española, un código es «una combinación de signos que tiene un determinado valor dentro de un sistema establecido» o «un cifrado para formular y comprender mensajes secretos». De acuerdo con estas definiciones, el código genético es la correspondencia entre la serie de nucleótidos que forman los ácidos nucleicos y las series de aminoácidos en que se basa la estructura de las proteínas. Es como un diccionario que permite traducir la información genética (nucleótidos) a estructura de proteínas. A, T, C y G son las letras de código genético que representan a las cuatro bases utilizadas para configurar la estructura del ADN. Tres de estas bases forman un codón y un codón codifica un aminoácido. Es decir, una palabra de tres de estas cuatro letras se traducirá, en la proteína, con un determinado aminoácido. 2 Equivalencias de las letras en clave de aminoácidos Alanina ALA A Arginina ARG R Asparagina ASN N Ácido aspártico ASP D Cisteína CYS C Ácido glutámico GLU E Glutamina GLN Q Glicina GLY G Histidina HIS H Isoleucina ILE I Leucina LEU L Lisina LYS K Methionina MET M Fenilalanina PHE F Prolina PRO P Serina SER S Treonina THR T Triptófano TRP W Tirosina TYR Y Valina VAL V CONCEPTO DE GEN De la estructura celular a los polimorfismos de un solo nucleótido © ELSEVIER. Es una publicación MASSON. Fotocopiar sin autorización es un delito. Tabla 2.2 Un gen puede definirse como un segmento de ADN que codifica la información requerida para sintetizar un producto biológico funcional que, en general, será una proteína estructural o enzimática y es la unidad básica de la herencia biológica. En concepto más útil a la biología molecular, un gen se puede definir como «un segmento de ADN que contiene una unidad de transcripción y sus secuencias reguladoras principales (“promotor”)». El producto intermedio 31 Ahora bien, como hay cuatro bases diferentes, que se toman de tres en tres, hay 64 combinaciones posibles y sólo hay 20 aminoácidos formadores de proteínas. La consecuencia práctica es que un aminoácido podrá ser codificado por tripletes de bases diferentes, por lo que se dice que «el código está degenerado», como ya se ha comentado. Todos los aminoácidos pueden ser codificados por varios codones, excepto la metionina (ATG) y el triptófano (TGG). El nombre de los aminoácidos se reduce a tres letras, y más recientemente a una sola, con el fin de simplificar la expresión de los SNP (tablas 2.1 y 2.2). Las principales características de este código son: 1. Es universal: es compartido por todos los organismos vivos. Sólo se han encontrado excepciones en algunas mitocondrias, en las que algún triplete tiene un significado distinto. 2. Está organizado en tripletes o codones: cada aminoácido está determinado por tres nucleótidos. Los codones que traducen el mismo aminoácido son llamados sinónimos. La mayoría de los sinónimos difieren solamente en la última base del triplete. Los cambios en el ADN que conllevan la formación de tripletes sinónimos no producen cambios en la secuencia peptídica final; 61 de los 64 codones traducen un determinado aminoácido. De la estructura celular a los polimorfismos de un solo nucleótido 2 del proceso es el ARN, que en determinados casos per se podrá actuar también como producto funcional. El conjunto del material genético del organismo se llama genoma y todo el genoma está almacenado en los cromosomas, que son las estructuras fundamentales del núcleo de las células. Un gen tiene la capacidad de desencadenar reacciones específicas en el seno de la célula. Estas reacciones que —mediante la síntesis de proteínas— desencadenan los genes pueden ser señales para iniciar una reacción, detener una reacción o sintetizar elementos reguladores del metabolismo y, la cuantitativamente más importante, codificar la síntesis de todas las proteínas del organismo tanto estructurales como enzimáticas. Cada gen se localiza en un determinado punto de un cromosoma que se llama locus, que es el mismo en cada individuo de una especie. Los humanos —y todos los organismos que se reproducen sexualmente— tienen dos copias de cada gen, una de cada progenitor, a excepción de los genes localizados en el cromosoma Y que tiene una sola copia de dichos genes. Cada copia de un gen que proviene de un progenitor se llama alelo y, por lo tanto, en una misma persona los dos alelos pueden ser diferentes en alguna secuencia de su ADN y ello puede dar lugar a diferencias en los productos de expresión de dicho gen. La presencia de diferentes alelos en el conjunto de la población es la base de su diversidad genética, englobada en su conjunto personal de genes llamada genotipo, y esta diversidad dará lugar a cada persona, única e irrepetible, con sus características (altura, color de los ojos, color del pelo, rasgos de la cara, rasgos del cuerpo, etc.), lo que se conoce como fenotipo. Mientras que cuando hablamos de genotipo no nos referimos al conjunto de todos los genes, sino concretamente a un gen específico, cuando nos referimos a un conjunto de genes, y más concretamente a una combinación determinada de alelos, que se localizan muy próximos unos de otros en el cromosoma y que, debido a su proximidad, suelen heredarse juntos, hablamos de haplotipo. ESTRUCTURA DE UN GEN Aunque hay muchas variantes, podemos decir que la estructura de un gen está formada por segmentos discontinuos de ADN que codifican aminoácidos (antes nos hemos referido al ADN codificante), los exones, separados por secuencias no codificantes de aminoácidos, los intrones (fig. 2.7). El conjunto del gen (exones más intrones) tiene además una estructura corta que antecede al primer exón, denominada secuencia anterior, no traducida en la porción anterior FIGURA 2.7 Detalles de la estructura de un gen en la que se observa el promotor, las secuencias reguladoras en la región 5’ (amplificador) y el lugar de la unión de la cola poli-A. Tomado de 32 Jorde LB, Bamshad MJ, Carey JC y White RL. Genética médica. 3.ª ed. Madrid: Elsevier, 2004. © ELSEVIER. Es una publicación MASSON. Fotocopiar sin autorización es un delito. PENETRANCIA DE UN GEN La «penetrancia» de un gen se refiere a la proporción entre las personas que tienen una determinada mutación genética y que manifiestan en su fenotipo los signos y síntomas de dicha mutación y las que no la expresan. Si pocas personas manifiestan la enfermedad atribuida a una determinada mutación de gen, se dice que tiene «poca penetrancia» o «penetrancia incompleta». No se ha llegado a un consenso sobre qué porcentaje corresponde al concepto «poca». Podemos citar, como ejemplo, que las mujeres con mutaciones en los genes BRCA1 o BRCA2 tienen un alto riesgo de padecer cáncer de mama, pero no necesariamente como ocurre en las mutaciones que dan lugar a las enfermedades de transmisión mendeliana. Esta diferente «penetrancia» explica por qué para que la enfermedad se manifieste hacen falta otros factores que incidan sobre la manifestación de la mutación, y pueden ser factores epigenéticos entre los que cabe destacar: medioambientales, estilo de vida y tipo de alimentación, entre otros. 2 De la estructura celular a los polimorfismos de un solo nucleótido 5’(SANT), y también al final del último exón del gen suele haber una secuencia generalmente de bastante longitud, llamada secuencia posterior, no traducida en 3’(SPNT), que contiene la señal de poliadenilación del transcrito primario, que se representa por la letra griega. Es decir, un gen queda «empaquetado» entre ambas secuencias. Este conjunto forma la llamada unidad de transcripción, a la que hay que añadir las secuencias reguladoras inmediatas del proceso que se llaman promotores y también secuencias reguladoras alejadas que se llaman intensificadores o silenciadores de dicho gen, según sea su función, y todo este conjunto, «unidad de transcripción-promotores-intensificadores-silenciadores» forman una unidad genética funcional. La localización de un gen humano y su estructura puede buscarse a través de internet de forma libre en las bases de datos del NCBI (National Center for Biotechnology Information) de Estados Unidos (http://www.ncbi.nlm. nih.gov) y concretamente en: http://www.ncbi.nlm.nih.gov/mapview/ map_search.cgi, pulsando el «Map viewer», se puede acceder al esquema de los 22 autosomas y los cromosomas X e Y. Aparecen el esquema del cromosoma con bandas y luego los genes en un orden ya establecido por convención. Cada zona puede expandirse de forma que hasta pueden verse los exones e intrones. Para más información la secuencia de bases específica de cada exón u otras regiones se puede obtener pulsando el vínculo «seq». Se pueden visualizar también datos del ARNm y un resumen de la proteína codificada. Realmente para las personas que, como el autor, trabajaban ya en el diagnóstico de enfermedades genéticas en 1970, con los limitados recursos técnicos —y económicos— de la época, poder sentarse cómodamente ante un PC y tener todos estos datos parece un milagro o, simplemente, magia. Aunque estamos manejando estos datos de forma habitual, no somos realmente conscientes de lo que supone que la ciencia haya puesto en manos del hombre datos tan precisos y preciosos sobre los más íntimos detalles de la especie humana, como es el conocimiento exacto de la localización y la estructura bioquímica de sus genes y las consecuencias de todo ello, y disponer de los datos del genoma de cada persona para poder ofrecerle una medicina predictiva sobre su riesgo a determinadas enfermedades o su tolerancia y respuesta frente a la mayoría de los fármacos y otros xenobióticos. 33 2 EXPRESIVIDAD VARIABLE DE UN GEN En general, los trastornos genéticos se manifiestan clínicamente con pocas variaciones entre los afectados, pero puede haberlas. El término «expresividad variable» se refiere al rango de signos y síntomas que pueden ocurrir entre diferentes personas con la misma alteración genética. Por ejemplo, en el síndrome de Marfan, muchas personas manifiestan solamente talla alta y delgada con dedos largos y delgados, mientras que otras también manifiestan complicaciones de salud de diferente grado, principalmente de tipo cardiovascular, y a pesar de este abanico de procesos, la mutación en todos ellos está en el mismo gen (FBN1). En este caso se cree que los factores epigenéticos pueden tener más importancia que los factores medioambientales y de estilo de vida. De la estructura celular a los polimorfismos de un solo nucleótido SÍNTESIS DE PROTEÍNAS 34 La secuencia del proceso es: primero la replicación del ADN, es decir copias del ADN para hacer moléculas hijas idénticas, el segundo paso es la transcripción al ARNm, por el que parte del mensaje genético contenido en el ADN es copiado en el ARNm, y el último paso es la traducción a proteínas del mensaje contenido en el ARNm. TRANSCRIPCIÓN Es el proceso por el que un segmento de ADN que codifica la serie de aminoácidos, integrantes de una proteína, transcribe esta información a una cadena de ARNm cuyas bases tendrán una secuencia complementaria a las del ADN: C-G y A-U (recordemos que en el ARN el uracilo sustituye a la timina). Este ARN se llama ARNm, es decir ARN mensajero, pues es precisamente el depositario del «mensaje» que el núcleo emite para la síntesis de una proteína. Cada segmento de ADN que codifica un gen sintetizará una copia de ARNm complementario que, a su vez, codificará la secuencia de la proteína codificada por dicho gen. A cada base del ADN le corresponde una base complementaria en el ARNm y la secuencia de tres bases del ARNm codifica un aminoácido. Recordemos que hay tres clases de ARN: ARN mensajero (ARNm), ARN de transferencia (ARNt), ARN ribosomal (ARNr). En general, estos ARN son de hebra simple, pero el ARN de transferencia y el ARN ribosomal contienen bastantes regiones de doble hélice (la cadena de nucleótidos se dobla formando una horquilla). Los ARN más pequeños son los de transferencia, que contienen alrededor de unos 75 nucleótidos, mientras que los de mayor tamaño son los ARNm que pueden tener más de 5.000 nucleótidos. Debemos aclarar que previamente a este proceso las dos hebras de ADN deben separarse para que queden libres de apareamiento sus bases y puedan servir de molde para la síntesis del ARNm. De las dos cadenas de ADN que se separan sólo una es utilizada para la síntesis del ARNm y se llama «hebra molde». La síntesis de la cadena complementaria del ARNm está catalizada por la enzima El ARNm se sintetiza a lo largo de toda la cadena de ADN adecuada, pero en dicha cadena, de forma secuencial, está el ADN de los exones, el de los intrones y otros ADN no codificantes (fig. 2.7). Es por ello que hay que «depurar» la cadena nativa del ARNm eliminando de ella todo el ARN que no corresponda al ADN de los exones, y este mecanismo se conoce como splicing. La unidad de ARNm de tres nucleótidos que codifica un aminoácido se llama codón y reproduce el codón de tres bases del núcleo del cual procede. 2 Regulación de la transcripción 1. Secuencias promotoras: a. La caja TATA: está constituida por una secuencia TATAAA o muy © ELSEVIER. Es una publicación MASSON. Fotocopiar sin autorización es un delito. antes del triplete que indica el inicio de la transcripción). b. La caja GC: constituida por una secuencia GGGCGC o similar. es el mayor determinante de la eficacia del promotor ARNm maduro, que se obtiene por corte y empalme en el proceso ya citado del splicing. 2. Secuencias amplificadoras (enhancers, en la nomenclatura inglesa). Son de pequeño tamaño y, a diferencia de los elementos promotores cuya localización es relativamente constante, se encuentran a distancias variables del inicio de la transcripción. Su función en la regulación de la transcripción es independiente de su orientación. 3. Secuencias silenciadoras, cuya función es inhibir la actividad transcripcional de un determinado gen. TRADUCCIÓN Es el proceso específico de la síntesis de proteínas. Tiene lugar en el citosol y para ello es necesario que las cadenas del ARNm salgan del núcleo y se desplacen hasta él. En el proceso de la traducción se necesitan los siguientes tipos de moléculas diferentes: De la estructura celular a los polimorfismos de un solo nucleótido Para que las ARN polimerasas inicien la transcripción se requiere que una proteínas, denominadas «factores de transcripción», les señalen el gen que deben transcribir. Esto ocurre porque a poca distancia antes del inicio del gen hay unas secuencias de ADN, llamadas «región promotora», a las que se unen los factores de transcripción. La ARN-polimerasa reconoce este complejo, se activa e inicia la síntesis del ARN desde un punto concreto y predeterminado. Los factores de transcripción son sintetizados por genes físicamente alejados del lugar donde ejercen su acción y se llama acción «trans». Los elementos que conforman una región promotora actúan de forma «cis», puesto que su función se limita al gen que está situado a continuación. Los reguladores en «cis» de la transcripción de un gen son: 35 De la estructura celular a los polimorfismos de un solo nucleótido 2 36 También tiene tres etapas y vamos a comentarlas, pues esto ayudará a entender el mecanismo (fig. 2.8). Para que este proceso tenga lugar, antes se debe haber sintetizado el ARNt, que es una cadena de ARN que tiene los tripletes de bases que codifican para los diferentes aminoácidos, y cada uno de estos tripletes se conoce como anticodón, pues es el que va a materializar el mensaje que codifica el codón del ARNm. Los ARNt se unen a los ribosomas mediante unos enlaces específicos que se llaman lugares A, P y E. Los ARNt se sintetizan por lo mecanismos comunes de la síntesis del ARN mediante genes específicos, habiéndose identificado 497 en el núcleo, 22 en la mitocondria para la síntesis local de proteínas y 327 en regiones de las codificadas como seudogenes. Los genes que codifican el ARNt se agrupan en 49 familias, repartidos por todos los cromosomas, excepto el 22 y el Y. La transcripción del ARNt se realiza por la acción de la ARN-polimerasa III. La unión de cada triplete de ARNt con su aminoácido se lleva a cabo mediante reacciones bioquímicas que precisan aporte de energía a través del ATP. En una reacción que exponemos de forma muy sintetizada: La traducción se realiza en tres etapas diferenciadas: 1. Iniciación. La cadena del ARNm se fija a un ribosoma en el retículo endoplásmico rugoso. 2. Elongación. Los ARNt se unen a través de sus bases de forma complementaria a la cadena del ARNm fijada en el ribosoma y los aminoácidos que se van colocando secuencialmente se unen entre sí mediante el triplete de bases «iniciador» (starting codon) que tiene la secuencia AUG que, a su vez, es reconocido por el ARNt-iniciador. El ribosoma se va desplazando por el ARNm codón a codón y en cada paso fija el anticodón correspondiente de ARNt. 3. Finalización. La lectura del último codón que da la señal de «final de cadena» termina el proceso y «suelta» la cadena de la proteína recién sintetizada en el citosol. En este proceso se sintetiza una cadena de aminoácidos con una secuencia específica, que es la estructura primaria de la proteína, pero una vez en el citosol, esta cadena lineal sufre una serie de modificaciones que se conocen como modificaciones postraduccionales (o postranslacionales), que son cambios de su estructura lineal a una estructura secundaria, debidos a la unión de diversos aminoácidos mediante puentes de hidrógeno, y una estructura terciaria, mediante una serie de repliegues sobre sí misma por mecanismos que se conocen como hélice alfa y hoja plegada, que transforman la cadena lineal inicial en una molécula tridimensional con múltiples zonas de pliegues y repliegues, que definitivamente conforman la proteína en su configuración funcional. Este proceso se conoce como protein folding. Cuando una enzima para que sea funcional precisa del acoplamiento de varias proteínas diferentes, el conjunto funcional se conoce como estructura cuaternaria. Éste es el momento de exponer que en este proceso de pliegues y repliegues de la molécula de la De la estructura celular a los polimorfismos de un solo nucleótido © ELSEVIER. Es una publicación MASSON. Fotocopiar sin autorización es un delito. 2 FIGURA 2.8 Traducción (o translación) del RNAm a aminoácidos. El ribosoma se desplaza a lo largo de la cadena de RNAm en el sentido 5’-3’, formando una cadena polipetídica en extensión. Tomado de Jorde LB, Bamshad MJ, Carey JC y White RL. Genética médica. 3.ª ed. Madrid: Elsevier, 2004. 37 De la estructura celular a los polimorfismos de un solo nucleótido 2 38 proteína se pueden producir alteraciones, que no modificarán su secuencia de aminoácidos, pero que podrán modificar su configuración espacial y, por lo tanto, se podrá modificar su función biológica, y estas modificaciones, que también pueden estar ligadas a enfermedades, se conocen como postranslacionales y en la actualidad son motivo de estudio en determinados procesos. Si en la estructura del ADN se producen alteraciones en la secuencia de sus nucleótidos, se alterará la estructura del ARNm que codificarán y éste a su vez cambiará la estructura de las proteínas que sintetiza, y estas proteínas alteradas puede que no presenten ninguna alteración funcional, por lo que será una mutación «silente» o bien que se traduzca en una disfunción orgánica que podrá desencadenar una enfermedad. Por lo tanto, una enfermedad genética es la que se origina por una alteración del ADN que condiciona la síntesis de una o varias proteínas anómalas, que influyen de forma nociva en el funcionalismo del organismo que las sufre. Estas alteraciones genéticas —mutaciones— siempre se han de producir por primera vez, lo que se conoce como mutación de novo, pero una vez instauradas y bajo determinadas leyes biológicas, pueden transmitirse a la descendencia, lo que dará lugar a la aparición de las llamadas enfermedades genéticas. El resumen de todo el proceso se presenta en la figura 2.9. CONCEPTO DE ENFERMEDAD GENÉTICA Y SU TRANSMISIÓN CONCEPTO DE MUTACIÓN Todo cambio permanente ocurrido en la secuencia de bases de un gen se llama mutación. Por lo tanto, son alteraciones moleculares y su conocimiento y estudio fueron un segundo paso después del grado de alteraciones cromosómicas que facilitó la citogenética. Las mutaciones pueden ser espontáneas o inducidas. Las mutaciones espontáneas son las que ocurren en condiciones medioambientales normales, y las mutaciones inducidas son aquellas que para que se produzcan precisan necesariamente de un agente externo, llamado mutágeno, que actúa como acelerador de la tasa de mutaciones espontáneas. Es decir, el mutágeno per se no producirá mutaciones específicas, sino que causa una mayor frecuencia de todo tipo de mutaciones. Constantemente se están produciendo mutaciones y son precisamente imprescindibles para la evolución biológica. Las tasas de mutaciones espontáneas que dan lugar a una enfermedad dominante son del orden de 105, y como ejemplos de éstas podemos citar la corea de Huntington, la acondroplasia y el retinoblastoma, entre otras. El alelo que una vez mutado queda absolutamente imposibilitado para cumplir con su función y origina una enfermedad se conoce como alelo nulo. Una vez el gen ha mutado, su transmisión a la descendencia se podrá calcular de acuerdo con las leyes de la herencia, que sucintamente recordaremos más adelante. Las mutaciones se pueden clasificar atendiendo a un criterio puramente morfológico en función del cambio estructural que se produce en el gen, o bien atendiendo a un criterio funcional, es decir en relación con la enfermedad que producen. TIPOS DE MUTACIONES SEGÚN UN CRITERIO MORFOLÓGICO De la estructura celular a los polimorfismos de un solo nucleótido © ELSEVIER. Es una publicación MASSON. Fotocopiar sin autorización es un delito. 2 1. Puntuales. Son mutaciones que afectan a una sola base y se conocen de forma abreviada como SNP. En general, y de forma directa, no producen ninguna enfermedad y en la mayoría de las personas permanecen asintomáticas. Solamente pueden manifestarse por inducción por agentes externos, medioambientales o iatrogénicos, principalmente. También la asociación de varios SNP que afecten a una misma función puede producir una 39 FIGURA 2.9 Resumen de los pasos que se suceden en la formación de las proteínas a partir del DNA. La replicación y la transcripción se producen en el núcleo celular. El RNAm es transportado al citoplasma donde se produce la traducción del RNAm a la secuencia de aminoácidos que componen las proteínas. Tomado de Jorde LB, Bamshad MJ, Carey JC y White RL. Genética médica. 3.ª ed. Madrid: Elsevier, 2004. 2 enfermedad que individualmente sería asintomática. Se trata, por lo tanto, de la sustitución de una base, y se llaman transiciones cuando se cambian bases púricas o pirimidínicas entre sí, y transversiones cuando el cambio es de una base púrica por una pirimidínica o viceversa. 2. De extensión variable. Es cuando la mutación afecta a más de una base, y obviamente puede ser muy variable, de dos bases a decenas de bases. De forma muy similar a lo que hemos descrito para las cromosomopatías —aunque de mucha menor magnitud—, pueden ser deleciones, inserciones o repeticiones. TIPOS DE MUTACIONES SEGÚN CRITERIO FUNCIONAL De la estructura celular a los polimorfismos de un solo nucleótido Independientemente de la cuantía de la mutación, lo que en la práctica interesa es si producen o no algún proceso patológico. 40 1. Silenciosas. No tienen ninguna repercusión en el fenotipo. Son mutaciones que aun afectando a nucleótidos de un exón, es sobre codones en los que la mutación da lugar a otro codón que codifica el mismo aminoácido. También son mutaciones que se producen en zonas de intrones o de ADN satélite, aunque produzcan un cambio en la proteína que codifica. 2. No silenciosas. Son aquellas que producen algún efecto en el fenotipo. Las causas más frecuentes son las siguientes (fig. 2.10): a. De cambio de sentido. Producen el cambio de un solo aminoácido que, dependiendo de si modifica o no la configuración espacial de la proteína, podrá ser susceptible de alguna alteración funcional o equipararse a una silenciosa. b. Sin sentido. Es una situación en que el cambio de una sola base puede producir una enfermedad importante. Es cuando el cambio de la base da origen a un codón que es similar a los que dan la señal de final de lectura y, por lo tanto, su consecuencia es que se detendrá, en este codón, la síntesis de la proteína, lo que dará lugar a una cadena polipeptídica amputada en relación con la que debería haberse sintetizado. c. De cambio de marco. Son alteraciones que se producen por deleción o inserción. Se produce, por lo tanto, un cambio en el «marco» de lectura de los tripletes, al intercalarse o suprimirse una base en la secuencia del ADN. A veces hay deleciones e inserciones simultáneas y pueden compensarse mutuamente a efectos funcionales, y se transforman en silentes (fig. 2.11). d. De genes de control. Si la mutación afecta a secuencias de un promotor o un intensificador, las consecuencias sobre el fenotipo pueden ser también importantes. e. De repetición de tripletes. Se produce la repetición, una o varias veces, de un determinado triplete de bases. Pueden dar lugar a enfermedades graves y se ha visto que algunas frecuentes de herencia dominante se deben a este tipo de alteración. Podemos citar entre ellas la corea de Huntington y el síndrome del X frágil. En todas las mutaciones, para que produzcan manifestaciones en el fenotipo las alteraciones de la secuencia deben ser reproducibles a lo De la estructura celular a los polimorfismos de un solo nucleótido © ELSEVIER. Es una publicación MASSON. Fotocopiar sin autorización es un delito. 2 FIGURA 2.10 Sustitución de pares de bases. Las mutaciones de cambio de sentido (A) producen un cambio en un único aminoácido, mientras que las mutaciones sin sentido (B) producen un codón de terminación en el RNAm. Los codones de terminación finalizan la traducción del polipéptido. Tomado de Jorde LB, Bamshad MJ, Carey JC y White RL. Genética médica. 3.ª ed. Madrid: Elsevier, 2004. 41 De la estructura celular a los polimorfismos de un solo nucleótido 2 42 FIGURA 2.11 Mutaciones de cambio de marco de lectura. Se producen por la adición o la deleción de un número de bases que no es múltiplo de tres. Esto altera todos los codones a partir del sitio de inserción o deleción en sentido 3’. Tomado de Jorde LB, Bamshad MJ, Carey JC y White RL. Genética médica. 3.ª ed. Madrid: Elsevier, 2004. largo de las posteriores divisiones celulares, pues en caso de que esto no se produjera, no habrá ninguna enfermedad pues la mutación «moriría» con la apoptosis de la célula afectada. 3. Mutaciones somáticas. En general, las mutaciones que pueden afectar al fenotipo y que hemos descrito se refieren a mutaciones en las células germinales. Hay mutaciones que pueden afectar a las células somáticas y que son capaces de formar clones. No son hereditarias, pero son el principal mecanismo de la formación de tumores y cáncer. Una vez establecido que puede haber modificaciones en la estructura del ADN, aparece el concepto de enfermedad genética, que es la derivada de una o más mutaciones en el ADN que dan lugar a la síntesis de una o varias proteínas alteradas que no pueden cumplir adecuadamente su función biológica, total o parcialmente, y como consecuencia de ello aparece en el organismo afectado una determinada enfermedad característica de la mutación que, por su origen, se conoce como enfermedad genética. Cuando las alteraciones de dicha enfermedad son variadas pero constantes y descritas por primera vez por un determinado autor o autores se le suele llamar «síndrome de», con el nombre de los descubridores o de las características más importantes de la enfermedad. Durante muchos años, incluso antes del descubrimiento del ADN, la medicina tenía ya establecidas muchas enfermedades y síndromes de origen genético, según las conocidas leyes de Mendel, que fueron definidas en estudios con guisantes por el monje austríaco Juan Gregorio Mendel (1882-1884), presentados en la Sociedad de Ciencias Naturales de Brno (actualmente en la República Checa) en 1865. Los hallazgos de Mendel con guisantes no se aplicaron a la medicina hasta principios de 1900, época en que diversos médicos fueron aplicando a enfermedades humanas los conocimientos de las llamadas leyes de Mendel de la herencia. Se estableció que había dos tipos fundamentales de herencia la «dominante» y la «recesiva». 2 HERENCIA DOMINANTE © ELSEVIER. Es una publicación MASSON. Fotocopiar sin autorización es un delito. HERENCIA RECESIVA Es aquella en que el alelo portador de la mutación en la molécula del ADN, no «domina» sobre el alelo normal del otro progenitor y, por lo tanto, la enfermedad en condiciones habituales no se manifiesta (se puede manifestar en situaciones extremas frente a la misión de la molécula generada por el gen mutado). Para que se manifieste ha de concurrir que los dos progenitores sean portadores del mismo alelo mutado, y aunque en ellos no se manifiesta la enfermedad, se abre la posibilidad de que algunos integrantes de su descendencia hereden los dos alelos mutados y la manifiesten. En este caso el 25% de la descendencia manifestará la enfermedad, el 50% será fenotípicamente normal, pero con capacidad para transmitir la enfermedad, y el 25%, fenotípicamente normal no transmisor de la enfermedad. Esto se esquematiza en la figura 2.13. De la estructura celular a los polimorfismos de un solo nucleótido Es aquella en que el paciente portador de la mutación que genera la enfermedad, sea varón o mujer, la transmite al 50% de su descendencia sin distinción de sexos (si fuera homocigoto para dicha mutación, raro en la práctica, la transmitiría al 100%), es decir los efectos del alelo mutado en la estructura del ADN serán dominantes sobre el alelo normal del otro progenitor, que, a su vez, podrá transmitirla a su descendencia, y el otro 50% de la descendencia no manifestará la enfermedad y no será transmisor. Esto se esquematiza en la figura 2.12. FIGURA 2.12 Árbol genealógico que ilustra el patrón de herencia de la polidactilia postaxial, un trastorno autosómico dominante. Los individuos afectados se representan sombreados. Tomado de Jorde LB, Bamshad MJ, Carey JC y White RL. Genética médica. 3.ª ed. Madrid: Elsevier, 2004. 43 De la estructura celular a los polimorfismos de un solo nucleótido 2 44 FIGURA 2.13 Árbol genealógico que muestra el patrón de herencia del albinismo tirosinasa negativo, una enfermedad autosómica recesiva. La consanguinidad en este árbol genealógico está indicada por una doble barra que conecta a los progenitores de los individuos afectados. Tomado de Jorde LB, Bamshad MJ, Carey JC y White RL. Genética médica. 3.ª ed. Madrid: Elsevier, 2004. HERENCIA RECESIVA LIGADA AL X Cuando Mendel estableció sus leyes, no se conocía la existencia de la meiosis en el proceso de la replicación celular en la especie humana. Sin embargo, con posterioridad se observó que había enfermedades cuya mutación radicaba en uno de los cromosomas X, que era recesiva, de forma que las mujeres no presentaban la enfermedad pues el alelo normal del segundo X dominaba sobre el mutado; sin embargo, si el X con la mutación era heredado por un hijo varón, éste al no tener su contrapartida de otro X normal, sino que tenía el Y heredado del padre, manifestaba la enfermedad. En resumen, de padres fenotípicamente normales, la descendencia podría tener el 50% de los varones con la enfermedad, el 50% de los varones normales, el 50% de las mujeres normales pero transmisoras de la enfermedad y el 50% de las mujeres normales y no transmisoras de la enfermedad. Esto se esquematiza en la figura 2.14. ENFERMEDAD MULTIFACTORIAL Las enfermedades de tipo mendeliano son monogénicas, es decir un solo gen mutado ya da origen a ella. Sin embargo, hay otras que son debidas a la coexistencia de la mutación de varios genes, se conocen como enfermedades poligénicas y, en su mayoría, para que se manifiesten también deben confluir determinadas condiciones ambientales; en este caso se denominan enfermeda- 2 FIGURA 2.14 Árbol genealógico que muestra la herencia de un rasgo recesivo ligado al X. Los símbolos oscuros representan a los individuos afectados y los símbolos con un punto a las heterocigotas portadoras. Tomado de Jorde LB, Bamshad MJ, Carey JC y White RL. Genética médica. 3.ª des genéticas multifactoriales, y podemos definirlas como: patrón de herencia de los rasgos fenotípicos que están determinados a la vez por varias mutaciones genéticas y por factores ambientales. Algunos defectos congénitos no siguen el patrón de un único gen ni de anomalía cromosómica, sino que se deben a varias alteraciones o al efecto combinado de los genes y del ambiente. Es difícil predecir y diagnosticar la herencia de anomalías causadas por factores múltiples. Algunos ejemplos son determinados defectos cardíacos, el labio leporino o el paladar hendido y algunos defectos del tubo neural (defectos en la columna o en el cerebro). La complejidad del problema está en que se conjuga la acción de varias mutaciones que cada una de ellas aisladamente no condiciona ninguna enfermedad, pero la conjunción de varias de ellas puede ocasionarla, y además sumado a efectos medioambientales, entre los que queremos resaltar la dieta. Vamos a situar el tema en sus dos extremos. Es 100% genético padecer una fibrosis quística y es 100% ambiental caerse y romperse una pierna, pero entre medio hay procesos muy diversos que son suma de ambos factores y entre ellos podemos citar como ejemplo la diabetes tipo 1, que tiene un importante componente genético multifactorial, pero para que se manifieste hay que sumar también factores ambientales, y la diabetes tipo 2, que tiene un menor componente genético y mucho más carga de componentes ambientales, como la dieta y el sedentarismo. Además, la expresión en el fenotipo de las variaciones que los diversos genes involucrados con pequeñas mutaciones al interaccionar con factores ambientales, que a veces pueden ser intermitentes, hace que estas manifestaciones, no de igual intensidad ni tampoco coincidentes en el tiempo, aparezcan en tiempos a veces no relacionados y dependiendo del mayor o menor impacto de los factores ambientales influyentes en cada una, o de la conjunción de las pequeñas mutaciones. Con la edad —el tiempo—, van modificándose hasta llegar a un punto que se manifiestan en el genotipo con alteraciones de la salud, en general leves y confusas, pero que a partir de ese primer inicio pueden agravarse y en De la estructura celular a los polimorfismos de un solo nucleótido © ELSEVIER. Es una publicación MASSON. Fotocopiar sin autorización es un delito. ed. Madrid: Elsevier, 2004. 45 2 una determinada porción de la población originar una enfermedad evidente. Dentro de este grupo, y en el subgrupo muy escorado hacia el componente medioambiental, colocamos la aplicación práctica de la nutrigenética y la nutrigenómica. ENFERMEDAD MITOCONDRIAL De la estructura celular a los polimorfismos de un solo nucleótido La mitocondria tiene su propio genoma, su ADN propio (ADNmt) que se replica in situ. A diferencia del nuclear, no está recubierto por histonas y no tiene intrones. Las enfermedades mitocondriales son un grupo heterogéneo de fenotipo complejo, cuyo origen se debe a mutaciones del ADNmt. Ahora bien también hay enfermedades por disfunción mitocondrial cuyo origen está en mutaciones en el ADN nuclear que codifica enzimas de la cadena de transporte electrónico mitocondrial y, por lo tanto, puede dar lugar a una disfunción de las mitocondrias. La enfermedad originada en general está asociada a encefalopatías. Las diferencias entre el ADNmt y el nuclear son fundamentalmente tres: 46 1. La herencia del ADNmt es exclusivamente materna. Ello se explica porque su localización en la célula es en una estructura del citoplasma y, por lo tanto, independiente del ADN nuclear. Los varones heredan el ADNmt de sus madres, pues en los espermatozoides hay muy pocas mitocondrias y además en el momento de la fertilización no penetran en el óvulo, cuyo citoplasma es mucho mayor que el de los espermatozoides y que, por lo tanto, no contribuyen con mitocondrias en la fecundación. 2. Durante la división celular, las mitocondrias se distribuyen al azar entre las células hijas. Una misma célula puede tener moléculas de ADNmt diferentes, con mutaciones o sin ellas, de ahí la gran heterogeneidad en los fenotipos de afectados de enfermedades por mutaciones en el ADNmt. Esta heterogeneidad en la composición del ADNmt se llama heteroplasmia. Más detalles sobre el genoma del ADNmt se pueden obtener en la web: http://mitomap.org. 3. Precisamente por no estar protegido por el recubrimiento proteínico con histonas, como el nuclear, y estar en la mitocondria, compartimento subcelular donde se genera la mayor parte de los radicales libres del organismo, tiene una alta tasa de mutaciones espontáneas, unas 10 veces más que en el ADN nuclear. El ADNmt se encuentra empaquetado en forma de molécula circular de 16.569 Mpb. Ha sido completamente secuenciado y contiene 37 genes ya diferenciados y que codifican 2 tipos de ARNr, 22 de ARNt y 13 de ARNm que codifican para 13 proteínas que son subunidades de algunos de los complejos de la fosforilización oxidativa, en la cadena de transporte electrónico. En total, corresponde a siete subunidades del complejo I, una del complejo III, tres del complejo IV y dos del complejo V. El complejo II es codificado totalmente por ADN nuclear. La longevidad se asocia al mantenimiento equilibrado del metabolismo mitocondrial, y es por ello que la longevidad de las personas —independientemente del estilo de vida y mutaciones genéticas— se asocia con la edad materna. Hay correlaciones entre la longevidad de la madre y de los hijos, pero no se encuentran relaciones entre la longevidad del padre y de los hijos. Estamos ante el concepto que más se va a utilizar en los análisis del ADN (o ARN) con fines de medicina predictiva como base científica para aplicar una medicina preventiva personalizada de la era posgenómica. Casi diríamos que llegar a él con las ideas bien asentadas ha sido el objetivo principal de este capítulo. Las mutaciones genéticas que dan lugar a una enfermedad de tipo mendeliano son de una dimensión importante dentro de la estructura del gen, y la alteración inducida en la proteína sintetizada es de magnitud suficiente para producir directamente una enfermedad. Hay también polimorfismos, es decir cambios en porciones de ADN, de dimensión mucho más pequeña que un gen involucrado en enfermedades de tipo mendeliano y, según los nucleótidos afectados, se conocen como tandem repeat segments, que pueden ser microsatélites cuando tienen 2-100 repeticiones de nucleótidos, y minisatélites cuando tienen repeticiones de 1-20 kb. También, como se ha comentado, hay deleciones, inserciones y duplicaciones. La realidad es que todos somos portadores de miles de alteraciones genéticas que afectan a un solo nucleótido del ADN, lo que dará lugar a la alteración de una sola base en el ARN y finalmente a un solo aminoácido (o a ninguno debido a lo ya mencionado del código genético degenerado) en la cadena de la proteína producto final del proceso. Esto se llama SNP (single nucleotide polymorphism), que cuantitativamente viene a ser el 90% de todas las variaciones de nucleótidos en nuestro genoma; se estima que hay un SNP cada 200-300 pares de bases. Podemos hacer una extrapolación diciendo que en todo el genoma humano puede haber unos 165.000 SNP en el conjunto de sus 20.000-25.000 genes, lo que puede representar el 1,5% de todo el genoma. En la mayoría de los casos no tiene ninguna trascendencia clínica. Estos polimorfismos afectan a todo el ADN. Pero debemos recordar que el ADN está repartido en «paquetes» con diferente función. La porción del ADN que codifica genes está concentrada en las porciones llamadas «exones» y supone solamente el 2% de todo el ADN, y es precisamente el que tenemos que estudiar para la búsqueda de SNP con posible interés clínico. El 74% del total de bases corresponde al ADN intergénico que, como su nombre indica, su única función es poner distancia espacial entre los diferentes genes, y finalmente el 24% del ADN corresponde a los intrones, que son porciones de ADN que codifican genes muy antiguos que hasta hace poco se consideraba sin importancia y que de hecho eran silenciados en la transcripción. Sin embargo, en la actualidad se cree que algunos pueden codificar pequeñas proteínas con capacidad reguladora. Recordemos que cuando hemos hablado de la estructura del gen, además de las regiones de los exones y los intrones, éste también tenía las regiones promotoras, adyacentes a la zona del exón donde se inicia la secuencia de un gen. Obviamente, el ADN de las regiones promotoras también puede tener SNP y, según su situación, podrá o no derivar en un cambio de expresión. Así los SNP de las zonas promotoras pueden ser silentes, no hay cambios, pueden disminuir la expresión o pueden aumentarla. Los SNP de las regiones de los exones pueden ser también silentes, ya sea porque el cambio de base no cambia los aminoácidos de la secuencia proteínica (como consecuencia de que el código genético está «degenerado») o porque aun cambiando un aminoácido éste no afecta a la estructura de la proteína. Sin 2 De la estructura celular a los polimorfismos de un solo nucleótido © ELSEVIER. Es una publicación MASSON. Fotocopiar sin autorización es un delito. CONCEPTO DE POLIMORFISMO DE UN SOLO NUCLEÓTIDO 47 De la estructura celular a los polimorfismos de un solo nucleótido 2 48 embargo, en algunos otros el cambio de una base que se traduzca en el cambio de un aminoácido podrá originar alguna alteración funcional en la proteína, y precisamente el mayor interés está en localizar este último grupo para utilizarlo en medicina predictiva. Finalmente, se está observando que los SNP de las regiones intrónicas también pueden tener algunos efectos en el metabolismo. Recordemos que las regiones intrónicas no codifican proteínas, pero al igual que el ADN exónico, pueden sintetizar moléculas de micro-ARN que pueden tener acciones reguladoras sobre el ARNm, y actualmente son también motivo de estudio. El micro-ARN es un ARN de cadena sencilla y no codificante que puede regular la expresión genética uniéndose al ARNm por un nucleótido 3’UTR. Como en la actualidad hay información de todo —o casi todo—, hay también un banco de datos que recoge todos los SNP que afectan al micro-ARN y de los que se conoce si actúan en el conjunto de la expresión génica. Esta base de datos se encuentra en: http://compbio.utmem.edu/miRSNP/. Este 2% del ADN que caracteriza genes, tras el estudio del genoma humano se estima, en el año 2008, que codifica unos 28.000 genes, que para cada gen hay varios exones separados por ADN intergénico y que el número de exones por cada gen es bastante variable, la gran mayoría tiene entre uno y cuatro exones, pero hay genes que pueden llegar a tener 100 exones. Como es lógico, a más exones más bases y a más bases más aminoácidos, por lo tanto, cuanto más aminoácidos tenga una proteína, más pares de bases necesitará el ADN del gen que la codifica. La proteína más compleja de la especie humana es la «titina», que forma parte del músculo estriado y está formada por 26.926 aminoácidos, y su gen (el gen TTN, situado en el cromosoma 2q31.1) tiene 234 exones, el máximo encontrado para un gen en la especie humana. Por lo tanto, a efectos prácticos, para la búsqueda de genes involucrados en enfermedades, no ha habido que buscar polimorfismos en todo el ADN, sino solamente en el 2% de éste, es decir el codificante de genes, los 28.000 ya mencionados, y de cada uno de ellos, grupos de científicos buscan la existencia de SNP en la población. Este ingente trabajo, hace muy pocos años era una quimera imposible, hoy es posible gracias al gran avance que ha significado la posibilidad de su estudio mediante el uso de microarrays. Actualmente, tras la secuenciación del genoma humano y la disponibilidad de microarrays que pueden detectar simultáneamente miles de SNP (plataformas de «Affymetrix», unos 40.000 por array, y de «Illumina», menos pero con más pares de bases), se están realizando estudios sobre la incidencia en la población de los diferentes tipos de SNP. Cuando una mutación SNP aparece en más del 1% de la población, se registra como susceptible a ser estudiada como causante de algunas alteraciones en el grupo de herencia multifactorial, y obviamente si un SNP aparece en el 5-10% o más de la población, pongamos por ejemplo, está ya muy justificado realizar su determinación en grupos de enfermedades que se sospecha sean multifactoriales y en las que, por conocimiento de su acción biológica, se pueda intuir que pueda estar relacionada. En todos estos casos la posible enfermedad derivada estará ligada a la conjunción de esta mutación con otras y/o con factores ambientales, como puede ser la ingesta de un fármaco, la ingesta de un determinado principio activo de plantas o componente de alimentos, de contaminantes ambientales (pesticidas, herbicidas, productos derivados de la combustión del petróleo, de la producción de productos ahumados, derivados del tabaco, etc.). 2 NOMENCLATURA DE LOS POLIMORFISMOS DE UN SOLO NUCLEÓTIDO Entramos en un tema que es crucial para que el lector pueda comprender el significado de los datos sobre SNP que tendrá que interpretar de los informes que reciba de los laboratorios de análisis genómicos. Adelantamos que exponer el tema no es fácil y entenderlo requiere hacerlo con tranquilidad y sin prisas. Hay diversos tipos de nomenclaturas, y no hay un consenso absoluto o normativa establecida. Cada vez se acepta más las normas de la Human Genome Variation Society (http://genomics.energy.gov), recopiladas en su Nomenclature for the description of sequence variants, que se va actualizando periódicamente (http://www.genomic.unimelb.edu.au/mdi/mutnomen/). Vamos a citar las más frecuentes. La secuencia del alelo que se considera el más frecuente o el original en la mayoría de la población se codifica con las letras wt, de Wild Type (tipo salvaje). Codificación según pertenencia a ADN/ARN/proteínas >T). >T). >C). © ELSEVIER. Es una publicación MASSON. Fotocopiar sin autorización es un delito. >u). Nótese que cuando se refiere al ADN las bases se identifican por su letra de código en mayúsculas y cuando codifican un cambio de base en el ARN, su letra de código aparece en minúsculas. También indicar que cuando en la nomenclatura no se pone ninguna de las letras minúsculas anteriores, se da por entendido que es ADN. En primer lugar, hay que especificar de qué gen estamos hablando (código o nombre del gen), y además en que exón está el polimorfismo. Aunque en los intrones obviamente también hay polimorfismos, no se comunican en los estudios de los laboratorios de diagnóstico dado que no tienen influencia en el producto final que es la proteína, aunque sí que existe nomenclatura para los polimorfismos de los intrones que se utilizan en investigación y que no citaremos para no complicar al lector. También puede haber polimorfismos en los genes reguladores y en los que codifican el inicio o el final de la cadena. Los más conocidos son, lógicamente, los que afectan a los exones. Nomenclatura en función del nucleótido mutado en el ADN En primer lugar se pone el nombre del gen en forma codificada. Si el gen y la proteína que codifica tienen la misma nomenclatura, cuando se habla de gen se escribe en cursiva y cuando es la proteína en normal. A continuación se pone la letra c, a continuación un número que indica la posición en la secuencia del gen, empezando por el primero en posición 5’ del nucleótido en el que está el polimorfismo, a continuación, la letra que codifica la base en el alelo wt, seguida del signo > y finalmente la letra que indica la base que en el alelo polimórfico De la estructura celular a los polimorfismos de un solo nucleótido La nomenclatura irá precedida de una letra minúscula según el material biológico a que se refiere: 49 2 ha sustituido a la del wt. Ejemplo, en el gen de la MTHFR (metil-tetra-hidrofolato reductasa, enzima clave en el metabolismo del ácido fólico y que tiene importancia en los tratamientos de quimioterapia del cáncer): MTHFRc1298A>C Quiere decir polimorfismo en el ADN, en el nucleótido en posición 1298, del gen de la MTHFR, por el que la adenina del alelo wt ha sido sustituida por la citosina. Otra forma de expresión puede ser: De la estructura celular a los polimorfismos de un solo nucleótido MTHFR.cA1298C 50 SNP en el nucleótido 1298 del ADN de gen de la MTHFR por el que la adenina del alelo wt ha sido sustituida por una citosina. El inconveniente de esta nomenclatura que informa del cambio de base es que no da información de si en realidad ha habido una modificación en la proteína que codifica. Recordemos que el código está «degenerado» y que salvo para la metionina y el triptófano, un aminoácido puede ser codificado por varios tripletes diferentes, por lo tanto, un cambio en una base no necesariamente implica un cambio en un aminoácido de la proteína. Respecto a la numeración, hay que tener en cuenta que no existe el nucleótido 0. El nucleótido 1 es la A (adenina) del codón ATG de iniciación de la translación. El nucleótido 5’ del codón de iniciación es el -1, el anterior -2 y así sucesivamente. Muy recientemente se ha añadido que el nucleótido 3’ del codon-stop de la translación se codifica como *1, el siguiente *2 y así sucesivamente. En mi opinión, este añadido no es muy afortunado pues puede inducir a confusiones en no expertos pues, como veremos más adelante, la nomenclatura *número, se utiliza, en algunos casos, para reconocer SNP de forma simplificada, y no tiene nada que ver con lo anterior. Para el caso del ARN, análisis que determinan la expresión génica (es decir, según la secuencia del ARN y no del ADN), la nomenclatura es igual, pero anteponiendo r y las iniciales de las bases en minúscula, como ya hemos citado anteriormente. Estos ejemplos corresponden al simple cambio de un nucleótido por otro. Es decir, una sustitución. Ahora bien, puede haber otros tipos de polimorfismos que afectarán a varias bases, y que son los siguientes: Deleciones. Pérdida de uno o más nucleótidos. Se antepone «del» (c76_78del o bien c76_78delACT). Significa que hay una deleción (pérdida de nucleótidos) del nucleótido 76 al 78 y que son ACT en la secuencia que se especifique. Otro ejemplo: c6_8del o c6_8delTG, indica una deleción de los nucleótidos 6 y 7 de la secuencia ACTTTGTGCC, que queda como ACTTTGCC. Inversiones. Se designan como «inv», con una indicación respecto al primero y el último de los nucleótidos afectados por la inversión (ejemplos: c203_506inv o bien 203_506inv304). Significa que ha habido 304 nucleótidos invertidos desde la posición 203 a la 506. Inserciones. Se designan como «ins» después de la indicación del nucleótido que flanquea el lugar de la inserción, seguido de una descripción de los nucleótidos insertados. Ejemplo: c76_77insT, significa que una timina se ha insertado entre los nucleótidos 76 y 77 del ADN de la secuencia de referencia. Duplicaciones, triplicaciones (o más). Las duplicaciones se designan como «dup» después de la indicación del primero y el último nucleótido duplicado. Ejemplo: c.77_79dup o bien c.77_79dupCTG o bien c.77_79dup3. Significa que hay tres nucleótidos del 77 al 79 que se han duplicado y en la nomenclatura segunda se especifica además que son CTG. En el caso de triplicaciones o más se pone «trip» o tres letras indicando el múltiplo. 2 Como puede intuirse, en un mismo gen pueden coexistir sustituciones, deleciones, inversiones, inserciones y duplicaciones y la nomenclatura será la suma de todas ellas, lo que para un lector no especializado puede parecer más un jeroglífico egipcio que una nomenclatura científica. Afortunadamente no es lo habitual, y en estos casos el laboratorio especializado en genómica suele aclarar bien de qué se trata para que lo entiendan los no especialistas. © ELSEVIER. Es una publicación MASSON. Fotocopiar sin autorización es un delito. En este caso la nomenclatura informa del aminoácido que debido al polimorfismo se ha cambiado en la cadena de la proteína. Es decir, se define el efecto del SNP en la molécula biológicamente activa y, según su posición, por modelos moleculares puede intuirse si puede originar algún cambio ostensible de su función. Como en el caso anterior, primero se describe el gen afectado por el SNP a través de su código, a continuación el aminoácido presente en el alelo wt, a continuación el número de orden del codón afectado y a continuación el aminoácido que ha sustituido al wt. Los aminoácidos se expresan por tres letras que suelen ser informativas o una sola letra (tabla 2.2). Vamos a partir de la nomenclatura anterior añadiendo esta segunda. Ejemplo: MTHFRc1298A>C SNP en el nucleótido 1298 del gen de la MTHFR por el que la adenina del alelo wt ha sido sustituida por una citosina. Y su consecuencia es: MTHFR (Glu429Ala) SNP en el codón 429 del gen de la MTHFR por el que el ácido glutámico ha sido sustituido por la alanina. Es evidente que el número del nucleótidos (1298 en el caso anterior) será aproximadamente tres veces mayor que el número del codón afectado en la proteína (429 en el ejemplo anterior), ya que tres nucleótidos son los que forman un codón que, a su vez, codifica solamente a un aminoácido. De la estructura celular a los polimorfismos de un solo nucleótido Nomenclatura en función del aminoácido cambiado en la proteína Comentario sobre los textos en inglés Las frases de los textos en inglés pueden inducir a dudas en personas no nativas, y lo comentamos. En el caso de la MTHFR A1298C, se describiría como «SNP causing an Adenine to Citosine replacement at nucleotide 1298». En el caso de MTHFR (Glu429A) se describiría como «SNP causing a Glutamic Acid to Alanine 51 2 substitution at codon 429». Es decir, «to» señala lo que ha quedado después de producirse la alteración, y la primera molécula que se cita es la del alelo wt, ya sea base o aminoácido. De la estructura celular a los polimorfismos de un solo nucleótido Nomenclatura por código previamente acordado En la actualidad, los estudios de SNP han entrado en la práctica clínica. Hay casos en que se estudian los SNP que solamente afectan a un determinado exón, pero a veces se comunican ya de varios y/o de diferentes genes; informes analíticos con 50-100 SNP son ya habituales en determinados campos de la práctica médica. En cada uno de los casos interpretar, recordando letras y número, la nomenclatura anterior es difícil. En el caso concreto de los SNP del grupo de los CYP450 involucrados en el metabolismo de fármacos, se ha constituido un comité que ha establecido una nomenclatura mucho más sencilla. A cada uno de los polimorfismos de un gen, del que se conocen la base cambiada (por ejemplo, A>C) y/o el aminoácido cambiado en la proteína (por ejemplo, Glu>Ala) se le asigna un número (1, 2, 3, 4…) precedido de un asterisco (*) y a veces, debido a que se van encontrando nuevos SNP, después del número se sitúa una letra mayúscula, lo que es mucho más fácil de recordar y de manejar en la práctica clínica. Este comité es el Human Cytochrome p450 (CYP) Allele Nomenclature Committee (http://www.cypalleles.ki.se). Vamos a poner unos ejemplos: nos referimos al CYP2C9. Alelo wt: CYP2C9*1A Alelo CYP2C9*3A es aquel que por acuerdo del comité se ha dado a: CYP2C9. c42614A>C, o CYP2C9.cA426C, que equivale en la proteína a: CYP2C9. Ileu359Leu, que más simplificado es CYP2C9.I359L. Y finalmente, se añade en el informe, si se produce e

Capítulo 2: De la estructura celular a los polimorfismos de un solo nucleótido PDF

Document Details

Tags

Related

Summary

Full Transcript