Summary

This document provides an introduction to metagenomics, focusing on the study of genetic material extracted from environmental samples. It discusses the advantages of environmental DNA sequencing, the identification of marker genes, and the challenges of species definition in microorganisms, along with operational taxonomic unit (OTU) definitions. It also explores the concepts of 16S rRNA and 18S rRNA sequencing in prokaryotic and eukaryotic organisms, respectively.

Full Transcript

Metagenómica 1. Introdução à metagenómica Também conhecida como genómica ambiental, ecogenómica ou genómica de comunidades, a metagenómica é o estudo do material genético extraído diretamente de amostras ambientais (água, solo, etc.). Esta abordagem é especialmente relevante pois permite...

Metagenómica 1. Introdução à metagenómica Também conhecida como genómica ambiental, ecogenómica ou genómica de comunidades, a metagenómica é o estudo do material genético extraído diretamente de amostras ambientais (água, solo, etc.). Esta abordagem é especialmente relevante pois permite o estudo da componente biótica de um determinado nicho biológico, o que fornece informação valiosa não apenas a nível das populações de microrganismos, mas também da interação destes com o ambiente onde estão inseridos. Nota: tudo o que tem “meta-” envolve amostras ambientais → metagenómica, metaproteómica, etc. A metagenómica representa uma abordagem revolucionária em Biologia Molecular pois baseia-se no uso das novas tecnologias de sequenciação para sequenciar todo o material genético extraído de amostras ambientais. Isto é possível devido às capacidades de alto débito das tecnologias de sequenciação. Assim, a sequenciação de DNA ambiental é vantajosa por diversos motivos, nomeadamente: Grande parte dos organismos presentes na natureza não consegue crescer em ambiente laboratorial; Mesmo que o conseguissem, populações clonais dos organismos não representam o ambiente natural dos mesmos; As espécies não vivem isoladas, elas comunicam-se entre si e com o ambiente em que estão inseridas, sendo estas características importantes no estudo de um determinado nicho ecológico; Muitas das proteínas existentes na natureza têm função desconhecida; no entanto, através da sequenciação do material genético, torna-se possível identificar estas proteínas em contextos ecológicos e biológicos inéditos, assim como desvendar novos processos celulares fundamentais e potencialmente aplicáveis a outros organismos, como por exemplo o ser humano; Nota: a sequenciação também permite identificar novas proteínas potencialmente relevantes sob a perspetiva da biotecnologia. Para além do estudo ambiental, a metagenómica também tem especial relevância no estudo do microbioma humano, isto é, o estudo das comunidades de microorganismos que coloniza diferentes partes do organismo humano (intestino, pele, cavidades oral e nasal, etc). Sob esta mesma ótica, o estudo do microbioma de outros animais (ex: galinha) e até mesmo de superfícies como teclados de computador também se torna relevante. 2. Sequenciação de DNA e perfil microbiano Os estudos realizados em consequência da sequenciação de diversos genomas permitiram a identificação de genes marcadores. Estes genes são utilizados em DNA metabarcoding (ou amplicon metagenomics) por permitirem a identificação dos organismos a níveis variáveis de especificidade. Os genes marcadores, de um modo geral, correspondem a genes altamente conservados entre espécies, o que permite o desenho de primers “consenso” (“válidos”, que possam ser utilizados por diferentes grupos de investigação de maneira a “normalizar” os resultados obtidos). No entanto, estes genes apresentam também, no seu interior, regiões altamente variáveis entre espécies, o que vai permitir a identificação do organismo. Assim, o conceito de DNA metabarcoding relaciona-se com os genes marcadores na medida que estas regiões variáveis correspondem ao “código de barras” do organismo, isto é, a um código único e específico que identifica aquela espécie. Deste modo, a sequenciação destas regiões e posterior alinhamento dos dados obtidos contra as bases de dados genómicas vai permitir a identificação do(s) organismo(s) em estudo. Genes marcadores mais utilizados: 16S rRNA (procariontes) e 18S (eucariontes) ITS-1 e ITS-2 COX1 (eucariontes) O problema da definição de espécie: A definição clássica de espécie baseia-se na capacidade de dois organismos distintos se reproduzirem e gerarem descendentes férteis (só são da mesma espécie se tal for verificado). No entanto, este conceito, quando transposto para bactérias e fungos, torna-se problemático, pois estes microrganismos não realizam reprodução sexuada; a transferência de informação genética é, neste caso, realizada através de processos como a transferência horizontal de genes e a infeção por vírus, por exemplo. Assim, torna-se necessário estabelecer um parâmetro para o agrupamento (binning) de sequências obtidas de amostras ambientais. Operational Taxonomic Unit (OTU) – define, de maneira arbitrária, as unidades taxonómicas (grupos nos quais as reads serão agrupadas) de acordo com a divergência entre as sequências analisadas. Em suma, corresponde a um parâmetro que define um grupo. o Numa mesma amostra, vão existir diferentes OTU’s, isto é, diferentes agrupamentos de sequências. Estas OTU’s, por sua vez, são utilizadas para caracterizar e quantificar a diversidade de comunidades microbianas em estudos de diversidade, através do cálculo das diversidades α e β; o Diversidade α – diversidade dentro duma amostra (num único timepoint) → corresponde à contagem de OTUs numa mesma amostra; o Diversidade β – diversidade entre amostras (ao longo de diferentes timepoints) → corresponde à diferença da composição das OTU’s de diferentes amostras. Os genes marcadores são, normalmente, genes “housekeeping”, isto é, genes essenciais ao normal funcionamento do organismo e que se encontram expressos em todas as células. Logo, têm menor probabilidade de estarem envolvidos na transferência horizontal de genes; Nota: é importante referir que, numa mesma célula, normalmente existem múltiplas cópias dos genes 16S (ou 18S); isto deve ser levado em consideração aquando da interpretação dos resultados, pois a “quantidade” de gene sequenciado pode não corresponder à quantidade daquele organismo numa dada amostra (falso positivo). No esquema, os organismos A e B encontram-se presentes no meio em igual abundância, mas, por terem número de cópias diferentes do gene marcador, os resultados obtidos poderiam facilmente ser mal-interpretados, dando origem a um falso positivo. Assim, os genes marcadores atuam como binning tags; estes, por sua vez, podem ser analisados com base na sua composição ou com base na semelhança, a nível das sequências; Nota: binning = agrupamento em OTU’s. Bases de dados para genes marcadores: Silva e RDP Softwares utilizados para binning tags: TETRA e PhyloPythia (Composition-based binning), MEGAN e ARB (Similarity-based binning) Importante – A sequenciação dos genes marcadores, apesar de permitir a identificação a nível da espécie/estirpe, apenas tem utilidade caso já exista informação sobre este organismo nas bases de dados genómicas. No entanto, existem muitos microrganismos que ainda não foram sequenciados, nem mesmo identificados. Representações gráficas dos dados: Gráficos de barras simples → “Quais espécies estão presentes?” Curvas de rarefação → “O quanto da comunidade foi amostrado?” Principal Component Analysis (PCA) → “Quais são os principais fatores a segregarem as comunidades?” Bootstrapping e jack-knifing → “O quão confiáveis são as nossas medições de diversidade?” 3. Whole shotgun metagenomics e single-cell genomics Whole genome metagenomics X Single-cell metagenomics Sequenciação do conteúdo de ácidos nucleicos Sequenciação do conteúdo de ácidos nucleicos realizado pelas tecnologias HTS. de uma única célula. Tem o objetivo de analisar comunidades Tem o objetivo de analisar as características microbianas complexas, permitindo não apenas genéticas de uma única célula, revelando a identificação de microrganismos, mas também informações que poderiam ser ocultas por a caracterização das suas funções e interações. abordagens que consideram uma população como um todo. Na abordagem single-cell genomics, a análise do genoma é feita célula a célula, logo, cada assembly será constituído por fragmentos do genoma de uma mesma célula. Já na abordagem da metagenómica, o material genético de uma dada amostra é analisado como um todo, podendo, assim, ocorrer o cross- assembly, onde fragmentos de DNA genómico de diferentes células são unidos num mesmo assembly. Assim, podemos considerar que a metagenómica envolve uma etapa “a mais” comparativamente à single-cell genomics, na medida que envolve a construção de assemblys e a identificação dos organismos presentes em cada assembly (phylogenetic binning). 4. Considerações especiais Independente do tipo de sequenciação, é importante ter em mente os seguintes aspetos: Armazenamento por longos períodos pode comprometer a integridade da amostra (perda seletiva de algumas espécies); A sequenciação de DNA genómico não discrimina entre microrganismos vivos e mortos; para isso, teríamos de extrair e sequenciar RNA; Realizar a sequenciação da região 16S utilizando bases degeneradas (bases “ambíguas”) é mais eficiente, pois permite uma melhor cobertura da diversidade de regiões variáveis; para além disso, escolher as regiões variáveis com cuidado; Incluir réplicas em todos os ensaios; Os resultados da amplificação do 16S podem ter “bias”, isto é, podem dar origem a falsos positivos devido à variação do número de cópias por célula; A sequenciação não é livre de erros (erros associados à própria plataforma utilizada, sequenciação acidental dos adaptadores, etc.); A própria preparação de uma biblioteca pode introduzir erros na sequência; A própria reação de PCR pode introduzir erros na sequência; A amplificação por PCR não é perfeita, pois a polimerase pode “pular” partes da molécula de DNA, dando origem a produtos de amplificação quiméricos. Em suma:

Use Quizgecko on...
Browser
Browser