Biología Molecular: Análisis de Secuencia de ADN FASTA
10 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

¿Cuántos pares de bases hay en la base de datos abierta de WGS?

  • 19.086.596.616
  • 19.086.596.617
  • 19.086.596.616.569 (correct)
  • 19.086.596.615
  • ¿Cuál es el nombre de la base de datos que se va a utilizar para descargar el genoma humano completo?

  • Gene Expression Omnibus
  • GENCODE (correct)
  • PDB – Protein databank
  • GWAS
  • ¿Es necesario darse de alta, rellenar formularios, utilizar software complejo, etc. para descargar el genoma humano completo?

  • No (correct)
  • En algunos casos
  • Depende de la base de datos
  • ¿Cuántas bases de datos abiertas se mencionan en el texto?

    <p>62</p> Signup and view all the answers

    ¿Qué tipo de información se puede descargar de la base de datos abierta de GENCODE?

    <p>Secuencias genómicas, transcripciones y proteínas</p> Signup and view all the answers

    ¿Cuál es el nombre de la base de datos que se utiliza para almacenar información de expresión génica?

    <p>ArrayExpress</p> Signup and view all the answers

    ¿Qué es el genoma humano completo?

    <p>La secuencia de ADN de un individuo</p> Signup and view all the answers

    ¿Cuál es el nombre de la base de datos que se utiliza para almacenar información de asociación genética?

    <p>GWAS</p> Signup and view all the answers

    ¿Cuál es el formato en que se va a descargar el genoma humano completo?

    <p>No se menciona en el texto</p> Signup and view all the answers

    ¿Cuál es el nombre de la base de datos que se utiliza para almacenar información de referencia genómica?

    <p>Refseq</p> Signup and view all the answers

    Study Notes

    El formato FASTA

    • El formato FASTA es un formato simple y ampliamente utilizado para almacenar secuencias biológicas (ADN y proteína).
    • Se almacena en un archivo de texto plano con la extensión .fasta.
    • Cada secuencia comienza con una línea que inicia con el carácter ">" y sirve para describir la secuencia, seguida de la propia secuencia.
    • El formato FASTA es necesario para intercambiar datos, reducir errores, permitir reproducibilidad y procesar información con software específico.

    Identificación de secuencias biológicas

    • Ante una secuencia desconocida, se buscan:
      • Codón de inicio (en eucariotas): AUG
      • Codones de parada (UAA, UAG o UGA)
      • Se identifican los ORFs (open reading frame), marco de lectura abierto
      • Secuencia de ARN que aparece entre codón de inicio y codón de parada
      • No se consideran los intrones (no codificantes)
      • Las secuencias se leen en dirección 5’ a 3’

    Características del ADN

    • El ADN está compuesto por 2 hebras, antiparalelas (corren en direcciones opuestas).
    • Cada hebra tiene un extremo 5’ y otro 3’ y las leemos de 5’ a 3’.

    Bases de datos abiertas

    • Existen bases de datos abiertas que almacenan información sobre secuencias biológicas, como:
      • Gene Expression Omnibus
      • PDB – Protein databank
      • ArrayExpress – Functional Genomics Data
      • Refseq – genomic, transcript and protein reference sequences
      • GENCODE
      • GWAS
      • dbGaP
    • Se puede descargar el genoma humano completo desde GENCODE.
    • No es necesario darse de alta, rellenar formularios, utilizar software complejo, etc.
    • El genoma humano se puede descargar en formato FASTA.

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Description

    Aprende a analizar secuencias de ADN en formato FASTA, identificando codones de inicio y parada, ORFs y secuencias de ARN. ¡Prueba tus conocimientos en biología molecular!

    More Like This

    Use Quizgecko on...
    Browser
    Browser