🎧 New: AI-Generated Podcasts Turn your study notes into engaging audio conversations. Learn more

Tema 1. Conceptos básicos en Genómica I.pdf

Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Full Transcript

Tema 1 TEMA 1. CONCEPTOS BÁSICOS EN GENÓMICA (I) Qué es un genoma, qué es la genómica Disciplinas en la genómica y otras “ómicas” Proyectos genoma y su importancia Estrategias usadas para la secuenciación y ensamblaje d...

Tema 1 TEMA 1. CONCEPTOS BÁSICOS EN GENÓMICA (I) Qué es un genoma, qué es la genómica Disciplinas en la genómica y otras “ómicas” Proyectos genoma y su importancia Estrategias usadas para la secuenciación y ensamblaje de genomas completos Determinación de la localización y función de los genes: análisis computacional y técnicas experimentales 1 Tema 1 1. ¿Qué es un genoma? The term genome (gene + chromosome) was coined in 1920 (Hans Winkler) to describe “the haploid chromosome set, which, together with the pertinent protoplasm, specifies the material foundations of the species” A more expansive definition of the genome: “an informational entity, often but not always manifest as DNA, encoding a broad set of functional possibilities that, together with other sources of information*, produce and maintain the organism” Goldman y Landweber 2016 Se requiere la presencia de una compleja maquinaria bioquímica* para que la información sea interpretada y convertida en diversas funciones moleculares  expresión génica Modificaciones cromatina  epigenoma 2 Tema 1 1. ¿Qué es la genómica? GENÓMICA: Estudio molecular del contenido, organización, función y evolución de la información genética del genoma de un organismo (Thomas H. Roderick, 1986) o Los estudios genómicos se caracterizan por ser interdisciplinares: Para interpretar la enorme cantidad de datos generados se combinan tanto conocimientos relativos a diversas disciplinas biológicas (genética, bioquímica, biología celular) como conocimientos estadísticos e informáticos (bioinformática) 3 2. Disciplinas dentro de la genómica Tema 1  Diversas subdisciplinas dentro de la Genómica: GENÓMICA ESTRUCTURAL: Secuenciación de los genomas y análisis de la información contenida en los mismos (proyectos genoma) GENÓMICA FUNCIONAL: Análisis funcional de los genes de un genoma y sus interacciones para dar lugar a las características propias de una especie (transcriptómica, proteómica, etc.) GENÓMICA COMPARATIVA: Comparación de genomas de diversos organismos tanto en su estructura como contenido génico (estudios evolutivos, predicción funciones génicas, etc.)  Relación entre el Proyecto Genoma Humano y la Genómica: El inicio del Proyecto Genoma Humano (PGH) fue fundamental para el desarrollo de la Genómica 4 2. Disciplinas relacionadas con la genómica Tema 1 El desarrollo del PGH y de nuevas técnicas de análisis a nivel global (secuenciación de exomas, RNA-seq, ChIP-seq, microarrays, proteómica, análisis del epigenoma, etc.) ha sido responsable de la aparición de nuevas disciplinas relacionadas (ómicas): Otros ejemplos: * Paleogenómica: estudio de la secuencia, estructura y posible función de genomas (nucleares o de orgánulos) de organismos extintos, p.e. homininos arcaicos * Metagenómica: Secuenciación de los genomas de comunidades microbianas en un ambiente determinado (metagenoma o microbioma: bacterioma, viroma, micobioma, etc.) 5 3. Proyectos genoma y su importancia Tema 1 El desarrollo de nuevas técnicas de secuenciación de DNA ha permitido reducir enormemente los costes del proceso: ↑ número de genomas secuenciados DNA Sequencing Costs: Data from the NHGRI Genome Sequencing Program (GSP) https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data 6 3. Proyectos genoma y su importancia Tema 1 Evolución de las técnicas de secuenciación (Métodos iniciales, Sanger, NGS: Next generation sequencing, TGS: Third generation sequencing)  Ingeniería Genética Giani et al. 2020 Timeline illustrating many of the major genome assembly achievements ranging from the beginning of the sequencing era to the large-scale genome projects currently ongoing. Each genome or genome project (GP) is placed under a color-coded background according to the sequencing approach adopted. Light red: early sequencing methods, Yellow: Sanger-based shotgun sequencing, Green: NGS, Light blue: TGS. VGP: Vertebrate Genome Project 7 3. Proyectos genoma y su importancia Tema 1 Objetivo final: Obtener la secuencia completa del genoma de un organismo para localizar los genes que contiene y obtener información biológica de interés  Predecir e identificar el número total de genes - genes humanos responsables de enfermedades hereditarias - genes víricos o bacterianos que codifican productos de interés industrial (nuevas funciones) - genomas de plantas y animales domésticos  mejora agrícola y ganadera  Predecir las proteínas codificadas por el genoma y agruparlas en clases funcionales: obtención de energía, información, comunicación, señalización, etc. Genómica estructural Categorías funcionales de proteínas codificadas por el Genoma Humano  Conocer la estructura de genes (proteínas y RNAs), regiones reguladoras y no codificantes 8 Tema 1 3. Proyectos genoma y su importancia Genómica comparativa Permite comparar los genomas de diferentes especies o individuos de la misma especie Ejemplo: Comparación de las categorías funcionales de genes en eucariotas Conclusión: todos poseen el mismo conjunto básico de genes (>complejidad  >número) Finalidades: Estudiar la evolución de los genomas, identificar secuencias distintivas de una especie o grupo Identificar variantes asociadas a enfermedades (SNPs: single nucleotide polymorphisms) La secuenciación y estudio de genomas de organismos modelo (E. coli, S. cerevisiae, C. elegans, Drosophila, ratón, Arabidopsis, chimpancé) ha permitido inferir la función de genes humanos Genómica funcional Estudia la expresión génica global en una célula u organismo en distintas condiciones o estadios de desarrollo (expresión diferencial) También permite estudiar interacciones génicas a nivel global 9 Tema 1 4. Estrategias usadas para la secuenciación y ensamblaje de genomas completos Ingeniería genética don’t (coding and regulatory) 10 Tema 1 4. Estrategias usadas para la secuenciación y ensamblaje de genomas completos  PASOS DURANTE LA SECUENCIACIÓN DE UN GENOMA ─ El genoma se rompe en fragmentos pequeños cuya secuencia es determinada individualmente (lecturas). Es la fase de secuenciación. ─ Las lecturas se analizan con programas informáticos que encuentran secuencias idénticas y permiten conectarlas en secuencias más largas o contigs (cóntigos). A este proceso se le denomina ensamblaje. (un cromosoma = un contig) A cobertura (coverage depth): número de veces A A que una posición nucleotídica es leída (5-10x / 30- A A 50x). A A ─ La secuencia del genoma se analiza para localizar los genes y determinar sus funciones. Es la fase de anotación. 11 Tema 1 4. Estrategias usadas para la secuenciación y ensamblaje de genomas completos  ESTRATEGIAS USADAS EN SECUENCIACIÓN DE GENOMAS Método jerárquico Método aleatorio 12 Tema 1 4. Estrategias usadas para la secuenciación y ensamblaje de genomas completos 1) Método aleatorio (whole-genome shotgun) - No se requiere tener información previa sobre el genoma - Implica la rotura aleatoria de todo el genoma, la generación de una librería genómica (A), la secuenciación de los fragmentos y el ensamblaje computacional de las secuencias (B) (A) o métodos mecánicos Es opcional, también se pueden secuenciar directamente los fragmentos obtenidos 13 Tema 1 4. Estrategias usadas para la secuenciación y ensamblaje de genomas completos (B) Secuenciación de los fragmentos (por diferentes métodos) y ensamblaje: ensamblaje de novo (B) ensamblaje comparativo Genoma de referencia (especie relacionada sintenia) 14 Tema 1 4. Estrategias usadas para la secuenciación y ensamblaje de genomas completos - Estrategia usada tradicionalmente para la secuenciación de genomas de procariotas o de orgánulos) - Plantea problemas si el genoma presenta secuencias repetitivas (eucariotas) - El desarrollo de nuevas técnicas de secuenciación más potentes, en las que se obtienen lecturas más largas, permite su utilización en genomas complejos 15 Tema 1 4. Estrategias usadas para la secuenciación y ensamblaje de genomas completos 2) Método jerárquico - Estrategia usada tradicionalmente para la secuenciación de genomas “grandes” o con muchas secuencias repetitivas (eucariotas) - Se requiere disponer de información previa del genoma (mapa genético o molecular) - Se secuencian fragmentos del genoma clonados y de localización conocida 1 2 3 4 5 2 3 Repeat sequences 16 Tema 1 4. Estrategias usadas para la secuenciación y ensamblaje de genomas completos Proyecto Genoma Humano 17 Tema 1 4. Estrategias usadas para la secuenciación y ensamblaje de genomas completos Proyecto Genoma Humano (consorcio público y Celera Genomics) 18 Tema 1 5. Determinación de la localización y función de los genes Una vez conocida la secuencia del genoma de un organismo, hay que localizar los genes y definir su estructura (anotación estructural), y asignarles una función (anotación funcional)  LOCALIZACIÓN Y ESTRUCTURA DE GENES (anotación estructural) 1. Por análisis de las secuencias (métodos informáticos) 1.1. Búsqueda de características propias de genes  predicción de novo (ab initio) Método simple: búsqueda de ORFs (p.e. ORFfinder) - Codón de inicio y de terminación en fase (≥ 50 codones codificantes): ORF (open reading frame) - Se analizan las 6 posibles pautas de lectura de una secuencia - Solo para genes que codifican proteínas - Eficiente en procariotas (P), limitaciones en eucariotas (E): DNA intergénico (falsos ORFs): ↑ en el genoma humano (+ del 50%) presencia de intrones (exones menores de 50 codones) 19 Tema 1 5. Determinación de la localización de los genes Métodos más complejos  se tienen en cuenta otros aspectos y motivos/señales (p.e. GeneScan) Sesgo en el uso de codones. No todos los codones que codifican un aminoácido se utilizan con la misma frecuencia en cada organismo (P y E)  información previa Regiones promotoras y reguladoras (P y E) Señales de terminación de la transcripción (P) y de inicio de la traducción (P, Shine-Dalgarno y E, Kozak) Sitios de splicing: límites exón-intrón y secuencias consenso en intrones (E) Señales de poliadenilación (E) ncRNAs programas específicos (p.e. LncFinder): estructuras secundarias 1.2. Búsqueda de secuencias homólogas en otras especies  predicción comparativa Wang et al. 2015 Uso de herramientas informáticas y bases de datos para comparar el genoma secuenciado con genomas ya anotados de especies cercanas 20 Tema 1 5. Determinación de la localización de los genes BLAST/FASTA: Programas utilizados en comparaciones de secuencias (nucleótidos o aminoácidos) Alineamiento de secuencias Dos resultados en las comparaciones de secuencias: % de identidad (solo aminoácidos o nucleótidos idénticos) % de similitud (solo en proteínas: aminoácidos idénticos y químicamente relacionados) BLAST: Basic Local Alignment Search Tool Sesión aula informática 21 Tema 1 5. Determinación de la localización de los genes 2. Técnicas experimentales para la localización de genes 1 2 3 2.1. Basadas en hibridación de ácidos nucleicos Transferencia Northern Objetivo: detectar los transcritos del gen predicho Se transfiere el RNA celular a una membrana Sonda: fragmento de DNA (marcado) que contiene el gen Resultados esperados: Se detectan los transcritos de genes contenidos en el fragmento de DNA (solo genes que se expresan) La detección de varias bandas puede indicar: Procesado alternativo del pre-mRNA Presencia de varios genes en el fragmento Gen perteneciente a una familia multigénica Si no se detectan bandas puede ocurrir que: El fragmento no contiene genes (predicción incorrecta) El gen no se expresa en el tejido, estadio de desarrollo o en la condición experimental analizados 22 Tema 1 5. Determinación de la localización de los genes 2.2. Identificación de transcritos por otros métodos Identificación y análisis de cDNAs El cDNA es la copia en DNA del mRNA de un gen (*) Al comparar la secuencia de cDNA con la del DNA genómico se delimita la posición de exones, intrones y regiones 5’UTR y 3’UTR del gen (estructura) Los cDNAs se pueden obtener e identificar por RT-PCR * Obtención de cDNA a partir de mRNA * Generación de una genoteca de cDNA * Hibridación con el fragmento de DNA 23 Tema 1 5. Determinación de la función de los genes  FUNCIÓN DE LOS GENES (anotación funcional) 1. Métodos informáticos Búsqueda de genes homólogos en otras especies (genómica comparativa): genes evolutivamente relacionados presentan secuencias y funciones similares p.e. estudio de genes implicados enfermedades humanas en organismos modelo Identificación de dominios o motivos proteicos conservados: permiten predecir la función del producto que codifica, pero no el proceso celular en el que está implicado - motivo dedos de zinc tipo Cys2His2  proteína de unión a DNA - dominios transmembrana  diferentes funciones Existen muchos genes con función desconocida: genes huérfanos 24 Tema 1 5. Determinación de la función de los genes 2. Técnicas experimentales 2.1. Inactivación génica (I)  mutagénesis dirigida o al azar Estrategia: inactivar el gen e identificar un fenotipo mutante asociado (genética reversa) a) Recombinación homóloga (dirigida) Se inactiva un gen interrumpiéndolo con un segmento de DNA no relacionado (organismos modelo, como levadura o ratón, y células) La copia cromosómica recombina con una versión interrumpida del gen incluida en un vector de clonación 25 Tema 1 5. Determinación de la función de los genes b) Nucleasas programables  Sistema CRISPR/Cas9 (dirigida) Schambach et al. 2024 Distinct tools for genome editing. Nucleases act by recognising specific DNA sequences, which are predefined by the user, and introducing DSBs that can be repaired by either the NHEJ or the HDR pathways. ZFNs and TALENs act as a pair, with one ZFN or TALEN binding to the user-predefined target sequence on the forward DNA strand and one binding to the reverse strand, to position their nuclease domain for introducing the DSB. (A) Once bound to the target strand of DNA, Cas9 undergoes a conformational change, allowing for a targeted DSB in the genome, which can be repaired by different repair machineries. NHEJ results in indels or the integration of an exogenous donor template. Alternatively, the host cell repairs the Cas9-induced DSB via the more precise HDR pathway. 26 Tema 1 5. Determinación de la función de los genes c) Interferencia por RNA o RNAi (dirigida) d) Elementos transponibles (al azar) Silenciamiento génico mediado por RNA de Inactivación de genes por inserción de doble cadena un elemento en la región transcrita o Dicer: corte del RNA en moléculas de 21-25 promotora nt (siRNAs) Drosophila o C. elegans RISC (RNA-induced silencing complex): Escisión imprecisa (deleciones) responsable de la degradación del RNAm 27 Tema 1 5. Determinación de la función de los genes 2.1. Inactivación génica (II) 2.2. Sobreexpresión página anterior or transposons CRISPR/Cas9, RH, mutagénesis por PCR Sobreexpresión: se utiliza cuando la inactivación del gen es letal o no produce un fenotipo detectable (redundancia de función) 28 Bibliografía Capítulos de libros Capítulos 1, 4, 5 y 6. Genomes, transcriptomes and proteomes; Sequencing genomes; Genome annotation; Identifying gene functions. Brown TA. (2017, 2023). Genomes 4 y Genomes 5. Garland Science y CRC Press. Capítulos 19 y 20: Molecular genetic analysis and biotechnology. Genomics and proteomics. Pierce B. A. (2020). Genetics: A conceptual approach, 7th edition. Macmillan Learning. Capítulo 21: Genómica, bioinformática y proteómica. Klug WS, Cummings MR, Spencer CA y Palladino MA. (2015). Conceptos de Genética. Pearson Inc. Capítulos 1 y 3: Introduction and background; Mapping, sequencing, annotation, and databases. Lesk AM. (2017). Introduction to Genomics, 3rd edition. Oxford University Press Capítulo 8: Analyzing the structure and expression of genes and genomes. Strachan T. y Read A. (2018). Human Molecular Genetics, 5th Edition. CRC Press, Taylor & Francis Group. Capítulos 10, 11, 12 y 13: Secuenciación del DNA; Expresión de genes clonados y análisis de la función génica; Modificación de secuencias de DNA; Manipulación del DNA a escala genómica. Real M.D., Latorre A. y Rausell C. (2017). Técnicas de Ingeniería Genética. Editorial Síntesis. Artículos Giani AM, Gallo GR, Gianfranceschi L, Formenti G. (2020). Long walk to genomics: History and current approaches to genome sequencing and assembly. Comput Struct Biotechnol J 18: 9-19. Goldman AD, Landweber LF. (2016). What is a genome? PLoS Genetics 12, e1006181. Han S, Liang Y, Ma Q, Xu Y, Zhang Y, Du W, Wang C, Li Y. (2018). LncFinder: an integrated platform for long non-coding RNA identification utilizing sequence intrinsic composition, structural information and physicochemical property. Briefings in Bioinformatics 2018, 1-19. Schambach A, Buchholz CJ, Torres-Ruiz R, Cichutek K, Morgan M, Trapani I, Büning H (2024). A new age of precision gene therapy. Lancet 403: 568-582. Yandell M, Ence D. (2012). A beginner’s guide to eukaryotic genome annotation. Nature Rev Genet 13: 329-342. Wang Y, Chen L, Song N, Lei X. (2015). GASS: genome structural annotation for eukaryotes based on species similarity. BMC Genomics 16: 150. Recursos online Curiosidades de la genética: La era de la genómica (2017): https://genotipia.com/la-era-de-la-genomica/ Para qué sirve secuenciar un genoma: https://elpais.com/elpais/2018/09/06/ciencia/1536235534_114719.html Entrevista a Fernando Carrasco, responsable del Servicio de Genómica y Secuenciación Masiva del Centro de Biología Molecular Severo Ochoa (2020): https://genotipia.com/genetica_medica_news/fernando-carrasco- entrevista/?utm_source=nwl&utm_medium=mail&utm_term=https%3A%2F%2Fgenotipia.com%2Fgenetica_medica_news%2Ffernando- carrasco-entrevista%2F&utm_content&utm_campaign=Hoy+en+Genotipia+23072020 Genomics Education Program: https://www.genomicseducation.hee.nhs.uk/ https://www.the-scientist.com/features/large-scientific-collaborations-aim-to-complete-human-genome-70423 29

Use Quizgecko on...
Browser
Browser