Podcast
Questions and Answers
¿Cuántos pares de bases hay en la base de datos abierta de WGS?
¿Cuántos pares de bases hay en la base de datos abierta de WGS?
¿Cuál es el nombre de la base de datos que se va a utilizar para descargar el genoma humano completo?
¿Cuál es el nombre de la base de datos que se va a utilizar para descargar el genoma humano completo?
¿Es necesario darse de alta, rellenar formularios, utilizar software complejo, etc. para descargar el genoma humano completo?
¿Es necesario darse de alta, rellenar formularios, utilizar software complejo, etc. para descargar el genoma humano completo?
¿Cuántas bases de datos abiertas se mencionan en el texto?
¿Cuántas bases de datos abiertas se mencionan en el texto?
Signup and view all the answers
¿Qué tipo de información se puede descargar de la base de datos abierta de GENCODE?
¿Qué tipo de información se puede descargar de la base de datos abierta de GENCODE?
Signup and view all the answers
¿Cuál es el nombre de la base de datos que se utiliza para almacenar información de expresión génica?
¿Cuál es el nombre de la base de datos que se utiliza para almacenar información de expresión génica?
Signup and view all the answers
¿Qué es el genoma humano completo?
¿Qué es el genoma humano completo?
Signup and view all the answers
¿Cuál es el nombre de la base de datos que se utiliza para almacenar información de asociación genética?
¿Cuál es el nombre de la base de datos que se utiliza para almacenar información de asociación genética?
Signup and view all the answers
¿Cuál es el formato en que se va a descargar el genoma humano completo?
¿Cuál es el formato en que se va a descargar el genoma humano completo?
Signup and view all the answers
¿Cuál es el nombre de la base de datos que se utiliza para almacenar información de referencia genómica?
¿Cuál es el nombre de la base de datos que se utiliza para almacenar información de referencia genómica?
Signup and view all the answers
Study Notes
El formato FASTA
- El formato FASTA es un formato simple y ampliamente utilizado para almacenar secuencias biológicas (ADN y proteína).
- Se almacena en un archivo de texto plano con la extensión
.fasta
. - Cada secuencia comienza con una línea que inicia con el carácter ">" y sirve para describir la secuencia, seguida de la propia secuencia.
- El formato FASTA es necesario para intercambiar datos, reducir errores, permitir reproducibilidad y procesar información con software específico.
Identificación de secuencias biológicas
- Ante una secuencia desconocida, se buscan:
- Codón de inicio (en eucariotas): AUG
- Codones de parada (UAA, UAG o UGA)
- Se identifican los ORFs (open reading frame), marco de lectura abierto
- Secuencia de ARN que aparece entre codón de inicio y codón de parada
- No se consideran los intrones (no codificantes)
- Las secuencias se leen en dirección 5’ a 3’
Características del ADN
- El ADN está compuesto por 2 hebras, antiparalelas (corren en direcciones opuestas).
- Cada hebra tiene un extremo 5’ y otro 3’ y las leemos de 5’ a 3’.
Bases de datos abiertas
- Existen bases de datos abiertas que almacenan información sobre secuencias biológicas, como:
- Gene Expression Omnibus
- PDB – Protein databank
- ArrayExpress – Functional Genomics Data
- Refseq – genomic, transcript and protein reference sequences
- GENCODE
- GWAS
- dbGaP
- Se puede descargar el genoma humano completo desde GENCODE.
- No es necesario darse de alta, rellenar formularios, utilizar software complejo, etc.
- El genoma humano se puede descargar en formato FASTA.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Description
Aprende a analizar secuencias de ADN en formato FASTA, identificando codones de inicio y parada, ORFs y secuencias de ARN. ¡Prueba tus conocimientos en biología molecular!