Tema 6: Secuenciación del DNA PDF
Document Details
Uploaded by SmilingBegonia
Universidad de Valencia
Tags
Summary
Este documento resume diferentes métodos de secuenciación del ADN, incluyendo el método de Sanger y las estrategias para secuenciar grandes fragmentos. También se discuten las técnicas de secuenciación de segunda y tercera generación, incluyendo la secuenciación clonal y los diferentes dispositivos utilizados.
Full Transcript
Tema 6 Secuenciación del DNA El método de Sanger: inhibidores de cadena! Secuenciación manual! Secuenciación automatizada! Estrategias para la secuenciación grandes fragmentos! La perdigonada o shotgun! Obtención de la secuencia de genomas de referencia! Secuenci...
Tema 6 Secuenciación del DNA El método de Sanger: inhibidores de cadena! Secuenciación manual! Secuenciación automatizada! Estrategias para la secuenciación grandes fragmentos! La perdigonada o shotgun! Obtención de la secuencia de genomas de referencia! Secuenciación de segunda y tercera generación Secuenciación clonal! Ilumnina! Ion torrent! Secuenciación de molécula individual! PacBio! Oxford nanopore Tema 10. Técnicas de Ingeniería Genética, pp. 321-352 Tema 9. Secuenciación del DNA La secuenciación de RNAs y proteínas fue previa a la secuenciación del DNA Presente 1.000.000 millones de bases Secuenciación Método de Sanger Método de Sanger Método de Sanger Método de Sanger Método de Sanger Método de Sanger Vectores de clonación: fago M13 Originalmente el método de Sanger requería utilizar como molde DNA de cadena sencilla Obtenido a partir de DNA clonado en un vector basado en el fago M13 Método de Sanger Método de Sanger Método de Sanger Secuenciación DNA doble cadena El descubrimiento de las polimerasas termo- resistentes permite hoy secuenciar DNAs de doble cadenas (DNAs clonados en plásmidos, DNA genómico etc…) Secuenciación DNA doble cadena Método de Sanger Originalmente se requerían cuatro series distintas de reacciones cada una de las cuales difería en un único nucleótido dideoxy La tecnología moderna permite que todos los componentes puedan ser mezclados con los CUATRO dideoxys diferencialmente etiquetados con fluoróforos que emiten a diferente longitud de onda para que puedan ser "leídos" específicamente con láser. Además, el gel (bloque) ha sido reemplazado por polímeros en tubos capilares Método de Sanger Método de Sanger: secuenciación automática Método de Sanger: secuenciación automática Método de Sanger: secuenciación automática Principio (20-40 bases): La migración de los productos pequeños es irregular Mitad: entre 500 y 1000 bases Final: picos de menor intensidad de bandas (menos cantidad de producto) Método de Sanger: secuenciación automática En organismos diploides nos podemos encontrar con posiciones donde aparecen dos bases distintas: heterocigotos Estrategias de secuenciación La capacidad de de lectura del método de Sanger es limitada. A partir de 1.000 pb la lectura se hace imprecisa, con muchos errores e indeterminaciones ¿Qué podemos hacer para secuenciar fragmentos más largos? Estrategias de secuenciación Enzimas de restricción. Deleciones seriadas. Paseo con cebadores. Perdigonada o secuenciación aleatoria. Estrategias de secuenciación R1 R2 R3 R4 R5 R6 R7 M13 universal M13 universal primer primer directo reverso Enzimas de restricción R3 R4 R4 R5 Estrategias de secuenciación Por ejemplo, tenemos el fragmento a secuenciar clonado entre los sitios HindIII y EcoRI. Cortamos con HindIII, digerimos con una exonucleasa (por ejemplo, exonucleasa III) y luego volvemos a cerrar. Esto nos acercará el sitio de hibridación del cebador a secuencias no accesibles para secuenciación en la construcción original >>>>>> >>>>>> Deleciones seriadas. Estrategias de secuenciación Paseo con cebadores. Secuenciamos primero con el oligo universal (hibrida con secuencias del plásmido próximas al MCS). Antes de que las lecturas no son buenas, a partir de la información de la secuencia, diseñamos nuevos cebadores para seguir secuenciando Estrategias de secuenciación Enzimas de restricción. Deleciones seriadas. Paseo con cebadores. Perdigonada o secuenciación aleatoria. Estrategias de secuenciación Estrategias de secuenciación Pero para poder alinear estos fragmentos (cuando proceden de un genoma completo) se necesita una información previa que permita su ordenamiento. Se utiliza como base uno o más GENOMAS DE REFERENCIA del organismo en el que estamos trabajando Shotgun sequencing El problema lo tenemos ahora en cómo secuenciar una colección de fragmentos aleatorios cuya secuencia ? desconocemos completamente Shotgun sequencing Necesitamos: 1) Separar físicamente un fragmento de otro 2) Tener una secuencia conocida para diseñar cebadores Shotgun sequencing Podemos utilizar estrategias clásicas de clonación para separar los fragmentos y, una vez obtenidos clones individuales, con un plásmido que contiene un fragmento determinado, proceder a su secuenciación mediante el método de Sanger. Este procedimiento es muy laborioso Shotgun sequencing Podemos utilizar estrategias clásicas de clonación para separar los fragmentos y, una vez obtenidos clones individuales, con un plásmido que contiene un fragmento determinado, proceder a su secuenciación mediante el método de Sanger. Este procedimiento es muy laborioso Shotgun sequencing También son posibles otras estrategias utilizadas en la segunda y tercera generación de secuenciadores Segunda y tercera generaciones de secuenciación Segunda Generación (Next Generation; Amplified Single Molecule Sequencing) 454 (roche) Illumina (Solexa) SOLiD (Applied Biosystems) Ion Torrent (Life Technologies) Tercera Generación (Next Next Generation; Single Molecule Sequencing) Helicos (Helicos Genetic Analysis System) Pacific Biosciences Oxford Nanopore Technologies Segunda y tercera generaciones de secuenciación Segunda Generación (Next Generation; Amplified Single Molecule Sequencing) 454 (roche) Illumina (Solexa) SOLiD (Applied Biosystems) Ion Torrent (Life Technologies) Tercera Generación (Next Next Generation; Single Molecule Sequencing) Helicos (Helicos Genetic Analysis System) Pacific Biosciences Oxford Nanopore Technologies Segunda y tercera generaciones de secuenciación Gran volumen de secuencia a partir de Gbp: 1,000,000,000 fragmentos cortos GAII, HiSeq, NextSeq, MiSeq: Illumina IonPGM, Ion Proton: Ion Torrent PacBio RS : Pacific Biosciences GS FLX, GS Junior: Roche 454 Segunda y tercera generaciones de secuenciación Capacidad de obtener secuencias continuas de grandes fragmentos Gbp: 1,000,000,000 GAII, HiSeq, NextSeq, MiSeq: Illumina IonPGM, Ion Proton: Ion Torrent PacBio RS : Pacific Biosciences GS FLX, GS Junior: Roche 454 PacBio Ion Torrent Illumina Sanger Estrategias de secuenciación Tercera generación de secuenciación Clonal: necesitamos hacer muchas copias idénticas(clones) del fragmento que vamos a secuenciar Segunda generación de secuenciación “Single molecule” Los datos de secuenciación proceden de una única molécula Amplificación de un fragmento (obtención de “clones”) Vamos a ver primero como es la AMPLIFICACIÓN CLONAL Primero tenemos que separar físicamente los fragmentos La amplificación se realiza en dos pasos 1) Adición a los fragmentos de extremos de secuencia conocida 2) Amplificación enzimática de los fragmentos Segunda y tercera generaciones de secuenciación Adición de secuencias terminales Si queremos secuenciar las dos cadenas de un fragmento (“Paired-end sequencing”) deberemos de añadir secuencias conocidas en los extremos, pero que sean DIFERENTES en un extremo y otro Además, podemos añadir otra información en los oligonucleótidos terminales, a modo de código de barras para indicar, por ejemplo, la procedencia de la muestra Fragmentación y etiquetado El objetivo es Añadir en los extremos oligonucleótidos de secuencia conocida (adapter, primer,…) Fragmentación y etiquetado Primero fragmentamos, reparamos y modificamos los extremos del fragm el DNA debe fragmentarse hasta 200–600 pb los extremos de los fragmentos deben repararse enzimáticamente se agrega una extensión dA en 3’ que evita la concatemerización de fragmentos Se liga un adaptador (en forma de Y) con una cola dT, que minimiza la formación de dímeros de adaptador. Fragmentación y etiquetado Le pegamos un oligonucléotido con una región de doble cadena y los extremos desapareados, lo que le da una forma de “Y” El extremo 5’ del adaptador en forma de Y contiene un grupo fosfato y el extremo 3' contiene dT. Los enlaces fosforotioato proporcionan resistencia a nucleasas. Fragmentación y etiquetado Después de pegar el adaptador llevaremos a cabo dos reacciones que permitirán que cada extremo incluya una secuencia diferente. Los nombres de estas secuencias son P5 y P7 Fragmentación y etiquetado Otra alternativa es la tagmentación. Se preparan transposon que al transponerse en el DNA genómico lo fragmentan e incorporan secuencias específicas en los extremos. Luego se seleccionan aquellos fragmentos donde las secuencias de sus extremos son diferentes. A continuación, se incorporan las secuencias P5 y P7 en los extremos amplificando con cebadores que hibridan con las secuencias introducidas por los transposones y llevan las secuencias P5 y P7 en sus extremos 5’. Fragmentación y etiquetado El resultado es que cada fragmento se convierte en una molécula con esta estructura Fijación a soporte Segunda fase: Separación y amplificación de los fragmentos etiquetados Fijación a soporte En los métodos de segunda generación necesitamos colecciones de moléculas de DNA iguales que derivan de una única molécula por amplificación de ésta. Esta colección de moléculas debe estar físicamente separada del resto Dos alternativas (a) Síntesis de “polonias” en una superficie (flow cell) por PCR. Illumina (b) Amplificación de una molécula de DNA en celda. Ion Torrent No obstante, el principio es el mismo Fijación a soporte 2) Síntesis de “polonias”(Illumina) Polonias: Illumina La flow cell está recubierta de oligos complementarios a las secuencias P5 y P7 Los oligos pegados a la flow cell sirven de cebadores para la síntesis de una cadena de DNA que ahora está covalentemente unida a la flow cell Polonias: Illumina Polonias: Illumina Sucesivas reacciones en las que el fragmento unido a la flow cell actúa como molde permiten “cubrir” esta zona de la flow cell con una población de moléculas con una u otra cadena del fragmento etiquetado. Luego se elimina específicamente una de las cadenas para dejar sólo la otra Segunda y tercera generaciones de secuenciación Secuenciación por síntesis (Illumina) Secuenciación por síntesis, detección óptica (Illumina) Secuenciación por síntesis (Illumina) La secuenciación por síntesis hace uso de nucleótidos marcados con un fluoróforo (distinto en cada caso) y bloqueado en 3’ OH (de forma reversible). En cada ciclo, un solo nucleótido entra a formar parte de la cadena, el resto (los no incorporados) se eliminan en el lavado. Se mide entonces la fluorescencia específica que se emite l nucleótido incorporado. Para la siguiente entrada hay que eliminar el agente bloqueante y el fluoróforo que lleva el último nucleótido incorporado Secuenciación por síntesis (Illumina) Secuenciación por síntesis (Illumina) Illumina https://www.youtube.com/watch?v=womKfikWlxM Ion torrent Ion Torrent Amplificación clonal Ion Torrent El proceso es similar, sólo que los oligos complementarios a P5 o P7 están cubriendo beads que están distribuidas en celdas En cada celda se deposita una o ninguna partícula que lleva muchas copias de la misma secuencia Ion Torrent Ion Torrent Ion Torrent Ion Torrent Ion torrent Ion Torrent Detección Segunda y tercera generaciones de secuenciación Ion torrent La situación a la hora de secuenciar es similar a la de Illumina: cadenas de un fragmento unidas a la bead. Así pues, utilizamos el cebador complementario para empezar a copiar la cadena unid y vamos detectando que nucleótido se incorpora Ion torrent Ion torrent Los protones liberados en las reacciones de polimeración son dan lugar a una corriente eléctrica que es detectada. Lógicamente para saber qué nucleótido se ha incorporado se debe de añadir en cada ciclo los nucleótidos POR SEPARADO y registrar aquel en el que se produce la reacción Ion torrent Ion Torrent https://www.youtube.com/watch?v=WYBzbxIfuKs Análisis de resultados https://www.youtube.com/watch?v=WYBzbxIfuKs Secuencia del genoma humano Secuencia del genoma humano Sin embargo, los avances recientes en la secuenciación del genoma de lectura larga y los métodos de ensamblaje han permitido el ensamblaje completo de cromosomas humanos individuales de telómero a telómero sin espacios Secuencia del genoma humano Tercera Generación Next Next Generation La tercera generación se caracteriza por la secuenciación de moléculas individuales a diferencia de los de segunda generación basados en la amplificación clonal. Las tecnologías más nuevas y relevantes son a) secuenciación de una sola molécula en tiempo real (SMRT) de Pacific Biosciences (PacBio) b) secuenciación por nanoporos desarrollado por Oxford Nanopore Technologies. Ofrecen las ventajas de la secuenciación de una sola molécula, incluidas longitudes de lectura opcionalmente largas (>20 kb), la secuenciación de elementos repetitivos e incluso la detección directa de modificaciones epigenéticas. La secuenciación también sólo dura unos pocos minutos/horas, lo cual es muy atractivo en un entorno de diagnóstico. Aunque las tecnologías basadas en nanoporos son simples y de bajo coste y, probablemente, representen las plataformas futuras, la secuenciación SMRT es actualmente más aplicable desde el punto de vista diagnóstico por su menor tasa de error PacBio Pacific Biosciences SMRTbell (el molde)! Es una molécula de DNA circular de cadena sencilla que se obtiene al ligar adaptadores de horquilla a los dos lados de un fragmento de DNA de doble cadena ds DNA Cada una de las moléculas se sitúa en una mini- celda llamada ZMW (zero-modewaveguide) Es la unidad de secuenciación. La luz sólo llega a la base de la celda donde hay una molécula de polimerasa inmovilizada que puede unirse a la horquilla de la SMRTbell y empezar la replicación Cada SMART cell contiene 150.000 ZMW Pacific Biosciences Se pueden obtener lecturas de gran precisión secuenciando fragmento de longitud corta-media Debido a la estructura circular de la biblioteca, un fragmento corto será cubierto varias veces en una lectura continua. Cada paso de la molécula de DNA original proporciona una “sublectura” , que pueden combinarse en un consenso altamente preciso denominado secuencia de consenso circular (CCS) Pacific Biosciences Con los fragmentos largos lo normal es que se produzca un paso único que generan secuencias lineales con errores puntuales (serían los marcados en negro). No obstante, estas lecturas de paso único pueden finalmente solaparse en un consenso de alta calidad Pacific Biosciences Se añaden cuatro nucleótidos marcados fluorescentemente. La marca fluorescente está unida al fosfato gamma. La fluorescencia se detecta cuando el nucleótido es incorporado a la cadena y cesa cuando el fluoróforo unido al pirofosfato liberado difunde fuera de la ZMW.. La reacción de polimerización se prolonga durante aproximadamente 0,5-4 horas y la molécula circular que se lee, permite registrar la secuencia de las dos cadenas Pacific Biosciences Cada SMRT cell permite lectura de entre entre 0,5 y 1.109 bases Pacific Biosciences Incluso se pueden identificar metilaciones porque las bases metiladas incrementan ligeramente el tiempo que tarda el nucleótido complementario en incorporare al molde Pacific Biosciences https://www.youtube.com/watch?v=NHCJ8PtYCFc Oxford nanopore Oxford nanopore Preparación de la “biblioteca” No hay límite en la longitud del DNA que se puede secuenciar con esta técnica ya que no requiere síntesis de DNA. El tamaño promedio de las lecturas suele ser superior a 10 kb y, para algunas moléculas de DNA ultra-largas, puede alcanzar 1 Mb. También sirve para secuenciar directamente RNA. Lo veremos cuando analicemos la técnica del RNA-seq. El principal inconveniente de la tecnología de secuenciación de nanopore es su tasa de error relativamente alta en comparación con la tecnología SMRT, en la que la tasa de error se puede reducir mediante el CCS. En la secuenciación de nanoporos, el error es sistemático, y la corrección sólo se puede lograr en comparación con datos de secuenciade lecturas cortas. Sin embargo, esta tecnología está mejorando rápidamente para superar los problemas actuales (como la corrección de errores) y la preparación de la biblioteca se está optimizando para lograr ds DNA ultralargos de alta calidad Oxford nanopore El DNA de interés se divide en fragmentos que van desde 500 pb hasta el récord mundial actual de 2,3 millones de pb de largo. A continuación, se agregan secuencias adaptadoras a los extremos del DNA. Estos fragmentos van a servir como sitio de unión para una proteína motora Oxford nanopore Oxford nanopore El primero, el 'adaptador líder', consta de dos oligos con complementariedad parcial que forman una estructura en forma de Y una vez hibridadas las dos cadenas El segundo, el "adaptador de horquilla", es un oligo único con complementariedad interna para formar una estructura en horquilla. Ambos adaptadores en el kit de secuenciación utilizado para este estudio están precargados con proteínas “motoras” que median el movimiento del DNA a través del poro. Otra función de los adaptadores es guiar los fragmentos de DNA a las proximidades de los poros mediante la unión a oligos unidos a la membrana de polímero. Oxford nanopore La secuenciación comienza en el extremo monocatenario de 5' del adaptador líder. Una vez se llega a la región bicatenaria del adaptador, la proteína motora cargada en el adaptador líder abre el dsDNA, permitiendo que la primera hebra vaya pasando por el nanoporo base a base. Después de llegar al adaptador de horquilla, una proteína adicional, la "proteína de horquilla", permite que la hebra complementaria de DNA pase a través del nanoporo en una manera similar. Oxford nanopore Los nanoporos que están incrustados en una membrana impermeable que separa dos soluciones de electrolitos diferentes. Los nanoporos son el único método de transporte de iones y, a medida cada nucleótido pasa a través del nanoporo, Oxford nanopore Cuando se aplica un voltaje a través de la membrana, se genera una corriente iónica que fluye a través del nanoporo. Oxford nanopore Dada la diferente forma de las bases, hay un volumen característico de la solución de electrolitos que pasa a través del nanoporo. Esta información se captura debido a que cada nanoporo de la membrana tiene su propio electrodo y sensor, lo que permite recopilar y analizar el cambio en los datos eléctricos utilizando algoritmos de para proporcionar información Oxford nanopore El sensor mide la corriente en el nanoporo varios miles veces por segundo. Los datos de las transmisiones se pasan al ASIC (circuito integrado de aplicación específica) y el software MinKNOW permite analiza los datos eléctricos utilizando algoritmos ue los convierten en la secuencia responsable del cambio eléctrico observado Dado que el número de nucleótidos que condicionan el paso de electrolitos por el poro es de cinco, existen 45 (= 1,024) posibles pentámeros (5-mers) Oxford nanopore La secuencia de la lectura será Oxford nanopore Oxford nanopore Oxford nanopore https://www.youtube.com/watch?v=3UHw22hBpAk