Structure des génomes 2024 PDF

Summary

Le document présente la structure et la composition des génomes, y compris les génomes nucléaires, mitochondriaux et chloroplastiques. Il examine les arbres phylogénétiques, la taxonomie biologique, et les différences dans la taille et la densité des génomes chez différents organismes.

Full Transcript

Structure et composi-on des génomes Qu’est-ce qu’un génome ? Défini(on historique (1920) = ensemble des gènes d’un organisme Défini(on actuelle = ensemble des molécules d’acides nucléiques transmises de généra(on en généra(...

Structure et composi-on des génomes Qu’est-ce qu’un génome ? Défini(on historique (1920) = ensemble des gènes d’un organisme Défini(on actuelle = ensemble des molécules d’acides nucléiques transmises de généra(on en généra(on – Génome nucléaire – Génome mitochondrial – Génome chloroplas(que Un arbre phylogénétique est un arbre schématique qui montre les relations de parentés entre des groupes d'êtres vivants. Chacun des nœuds de l'arbre représente l'ancêtre commun de ses descendants D’après Woese et al. 1990. En 1977, découverte d’une nouvelle forme de vie (Archées) qui bouleverse les fondements de la taxonomie biologique alors basée sur la division Procaryote Eucaryote. Découverte basée sur l’étude des gènes des ARN 16s et 18s. Depuis, de nombreux arbres sont proposés, dont les méthodes de construction sont basées sur la comparaison des génomes obtenus par séquençage. Génome mitochondrial Génome mitochondrial humain: ADN db, circulaire, 16569 pb, code 13 protéines, 2 ARNr, 22ARNt, code géné(que différent L'origine de la mitochondrie semble établie : elle dérive de l’endosymbiose d'une bactérie de la classe des α-protéobactéries dans une cellule précurseur. Le génome mitochondrial des plantes est beaucoup plus grand que chez les animaux : 195 à 2400 kpb. La plupart de l'ADN en excès est non codant. L'hérédité de l'ADNmt est cytoplasmique : Un oeuf hérite de l'ADNmt du cytoplasme de l'ovule, il ne reçoit pas d'ADNmt du spermatozoïde. Les mitochondries sont donc d'origine maternelle ce qui explique pourquoi les maladies géné(ques mitochondriales sont transmises par les mères Organisme Taille (kb) Homme 16,6 Souris 16,2 Xenope 18,4 Drosophile 18,4 Levure 75 Pe(t pois 110 Arabidopsis 367 Génome mitochondrial Intérêt de l’ADN mt en médecine légale et en paléonthologie comme marqueur de l’évolu(on Taux de muta(on 100 fois plus élevé que l’ADN nucléaire. No(on d’hétéroplasmie (présence de plusieurs types d’ADN mt/ cellule) - Plus de 1000 copies iden(ques d’ADNmt par cellule alors qu’il n’y a que 2 copies de chaque molécule d’ADN nucléaire. - Son abondance fait qu’on le retrouve plus facilement dans des restes humains après accidents ou en archéologie (30 000 ans) - Hérédité maternelle à pas de recombinaison. On peut suivre facilement et sûrement des filia(ons maternelles. - Région hypervariable (D-loop) qui permet de dis(nguer des groupes humains proches si nécessaire. Pathologies mitochondriales - Les gènes de l’ADNmt codent des protéines de la Chaîne respiratoire - Les mitochondries fournissent une grande par(e de l’énergie cellulaire sous forme d’ATP. Tout dysfonc(onnement mitochondrial sera une cause importante de pathologie humaine. Génome mitochondrial Il y a des milliers de copies d’ADNmt par cellule Le taux d’hétéroplasmie (ADNmt muté/ADNmt total) peut varier de 0 à 100 % A partir de quel degré d’hétéroplasmie, la pathologie s’exprime-t-elle? CARACTERISTIQUES DE LA GENETIQUE Large spectre de symptômesMITOCHONDRIALE de sévérité variable Il y a des milliers de copies d ’ADNmt par cellule Hétéroplasmie de de Hétéroplasmie l’ADN mitochondrial l’ADNmt ADN mt normal ADN mt muté Le taux de mutation (heteroplasmie) peut varier de 0 and 100 % A partir de quel degré d ’hétéroplasmie la pathologie se manifeste-t-elle ? JP Mazat Taille des génomes Quan(té d’ADN contenu dans une copie d’un génome. Peut être mesurée en masse (pg) ou en nombre de pb (Mb, Megabase = 1 million de pb); 1pg = 978 Mb, valeur c. - Quelques dizaines de milliers de pb pour le génome d’un virus - Quelques millions de pb pour une bactérie - 3 milliards de pb pour le génome humain - 16 milliards pb pour le génome du blé Taille des génomes Organisme Bp Genes ratio micoplasme E. coli HIV-1 10 000 10 1000 BACTERIES levure Haemophilus influenzae 1 830 000 1703 1075 CHAMPIGNONS Escherichia coli 4 600 000 4288 1072 pois nénuphar PLANTES Methanococcus jannashchii 1 660 000 1738 955 drosophile INSECTES Amoeba dubia 670 000 000 000 ~5000? 134 000 000 MOLLUSQUES Amoeba proteus 270 000 000 000 ~5000? 54 000 000 requin POISSONS CARTILAGINEUX Saccharomyces cerevisiae 13 000 000 5885 2209 POISSONS OSSEUX Erysiphe cichoracearum 1 500 000 000 ~10 000? 150 000 grenouille salamandre (champignon) AMPHIBIENS Coscinodiscus asteromphalus 25 000 000 000 ~5000? 5 000 000 REPTILES (diatomée) OISEAUX Caenorhabditis elegans 100 000 000 ~14 000 7000 humain MAMMIFERES Drosophila melanogaster 170 000 000 ~12 000 14 000 Arabidopsis thaliana 120 000 000 ~10 000 12 000 10 5 10 6 10 7 10 8 10 9 10 10 Lilium formosanum 36 000 000 000 ~15 000? 2 400 000 (nénuphar) Nombre de paires de bases par génome haploide Zea mays 2 300 000 000 32 000 70 000 4 Allium cepa Pas de rela(on de propor(onnalité entre taille du génome (oignon) 18 000 000 000 ~20 000? 900 000 et complexité d’un organisme Protopterus aethiopicus (dipneuste) 140 000 000 000 ~40 000? 3 500 000 5 Homo sapiens 3 400 000 000 ~25 000 100 000 Taille des génomes Les génomes sont compactés; Génome humain: 3,2 10 9 pb, longueur environ 2m Sous forme de chromaZne chez les eucaryotes, également compactés chez procaryotes (Nucléoïde) Les génomes sont très divers dans leur taille, leur nombre de chromosomes, leur contenu Les génomes eucaryotes sont tous sous forme de chromosomes linéaires, il y a plus de diversité de forme chez les procaryotes Taille des génomes La comparaison de la taille des génomes ne permet pas de faire des corrélaZons précises, Pas de stricte proporZonnalité entre taille des génomes et: - complexité des organismes - nombre de chromosomes - nombre de gènes - Néanmoins: - génome bactéries plus peZt que génome eucaryotes - Les organismes les plus complexes ont une densité génique (nb de gènes/ Mb) plus faible - à corrélaZon inverse : ex: Homme plus peZte densité génique que E. coli Taille des génomes Densité génique = nb de gènes / Mb Comparaison de la densité génique RelaZon entre densité génique et complexité de l’organisme est inversée à Deux facteurs expliquent la faible densité génique chez les eucaryotes: l’augmentation de la taille des gènes et l’augmentation des séquences d’ADN intergénique. Augmentation de la taille des gènes: Taille moyenne d’un gène humain: 27 kb; Taille moyenne de la région codante: 1,3 kb Les eucaryotes simples ont beaucoup moins de régions introniques. Seuls 3,5% des gènes possèdent un intron. L’augmentation de la taille des régions intergéniques est responsable de la diminution de la densité génique chez les organismes les plus complexes De quoi sont composées ces régions intergéniques? ProporZon des régions codantes dans les génomes L’esZmaZon du nombre de génes humain a évolué avec l’amélioraZon des connaissances du génome: 100 000 à 30 000 à 23 000 gènes Proportion of functional elements within genomes 13% 2% 28% 28% 85% 70% 2% 71% 0.5% E. coli Yeast Nematode S. cerevisiae C. elegans 82% 0.05% 0.05% 1.2% 0.01% 17% 98% 99.5% 0.5% Drosophila Human Lungfish (dipnoi) Coding (protein) RNA Non-coding Génome Humain Eléments fonctionnels dans le génome humain 3.1 109 nt ~20 000 gènes protéiques tRNA, rRNA, snRNA, miRNA… Régions codantes > 0.05% (protéines) 1.2% ADN satellite (centromères, chrom. UTR 0.7% Y, chrom. acrocentriques) 6.5% Elements fonctionnels non-quantifiés: - ARN non-traduits: Xist, H19, etc. Introns - Eléments régulateurs: promoteurs, 31% enhancers, etc. - Origines de réplications, MAR, télomères ADN intergénique Eléments non-fonctionnels: 61% - Pseudogènes : 1.2% - Elements transposables (SINES, LINES, HERV, etc.) : 42% >90% sans fonction connue Génome Humain Structure des gènes codant des protéines Valeurs moyennes - Gène 45kb - CDS 1500nt - Exon 145nt - Intron 5200nt - 5’UTR 210nt - 3’UTR 740nt - Nombre d’introns 6 - Epissage alterna(f dans plus 90 % des gènes - Promoteur alterna(f, Site de polyadényla(on alterna(fs Gènes non traduits ARNt:350 gènes ARNr: 18s (1800nt), 5,8s (160nt), 28s (5000nt): 200 gènes 5s (120nt): 250 gènes snARN: 100 gènes (épissage) snoARN (small nucleolar RNA) : 100 gènes, matura(on des ARNr dans le nucléole miARN (microARN): 250 gènes iden(fiés ? ARN interférence Autres gènes non-traduits: Xist, H19, …. La majorité des séquences intergéniques humaines se compose de séquences d’ADN répétées Environ la moi(é du génome humain est composée de séquences d’ADN qui se répètent de nombreuses fois dans le génome Séquences répétées en Tandem (Tandem repeats) Satellite Minisatellite Microsatellite Séquence répétées dispersées (Interspersed repeats) ADN transposon Retrotransposon Les séquences répétées en tandem Taille Taille de la zone Génome Satellite 2-2000nt jusqu’à 10 Mb (centromerique) 6,5 % Minisatellite 2-64nt 100-20 000pb 0,3% Microsatellite 1-6nt 10-100pb (environ 10 000) 2% Satellite SINE LINE Rétrovirus endogènes Transposons Séquences non-répétées Les séquences répétées de type transposon représentent prêt de 45 % du génome humain Principales classes d’éléments transposables dans le génome humain Nombre de Fraction Taille copies du génome ORF1 ORF2 (pol) LINE AAAA autonome 6-8 kb 850 000 20% SINE AAAA non-autonome 100-300 pb 1 500 000 13% gag pol (env) autonome 6-11 kb Rétrovirus 450 000 8% (gag) endogènes non-autonome 1,5-3 kb transposase autonome 2-3 kb 300 000 3% Transposons non-autonome 80-3000 pb Les séquences LINES (Long Interspersed nuclear element) - 21 % du génome humain (850 000 copies). Le plus commun de ces éléments se nomme Line-1 et fait 6kb - ConZennent un promoteur et 2 ORF - L’ARN LINE s’assemble avec ses propres protéines et se déplace vers le noyau où l’ARN est reverse-transcrit et s’insère dans le génome. Les séquences SINEs (Short Interspersed nuclear element) - ConZennent un promoteur mais pas de gène - 13 % du génome humain. 3 types: Alu, Mir, et Ther2/Mir3 - 1 500 000 SINE par génome humain Les pseudogènes - Un pseudogène désigne un gène inacZf au sein d’un génome du fait d’altéraZons généZques le rendant non foncZonnelle. - Résulte de la duplicaZon d’un gène ancestral dont une copie (le pseudogène) a subi une altéraZon généZque - Considérés auparavant comme inacZfs, on s’est aperçu que certains pouvaient être néanmoins transcrit et donc avoir un effet sur le foncZonnement cellulaire Bien que l’on ait longtemps pensé que ces séquences répétées de l’ADN étaient inuZles, leur conservaZon au sein des génomes sur des centaines de milliers de généraZons suggère que l’ADN intergénique confère un avantage sélecZf à l’organisme qui le conZent. En quoi nos génomes diffèrent-ils? - Les individus d’espèces différentes ont des génomes différents par la taille, l’ordre et la nature des informa(ons qu’ils con(ennent. -On considère souvent que 2 individus de la même espèce possèdent le « même » génome. En fait, le génome de chaque individu est unique. Chez l’homme le génome diffère de 0.5% entre 2 personnes non apparentées Homme/chimpanzé – Codant: 98,5% iden(que – Non codant: ~97% iden(que – Quelques duplica(ons/délé(ons importantes de région de quelques dizaines de kb Homme/souris – Codant: 90% iden(que – Non codant: la majorité est sans iden(té apparente, mais on trouve quand même de nombreux segments semblables (« conservés ») Homme/poulet – Codant: 80% iden(que Homme/poisson – Codant: 70% iden(que UZlité des séquences intergéniques comme ouZls en généZque Polymorphisme: Défini(ons Toute varia(on de séquence génomique entraînant l’existence au même locus d’au moins 2 formes différentes de la séquence, appelées allèles, dans la popula(on Fréquence au moins = à 1% Types de polymorphisme: -Subs(tu(on d'un nucléo(de (SNP: single nucleo(de polymorphism), très abondant, 1 SNP tous les 100 à 1000pb -Polymorphisme de répé((on (VNTR, CA repeat ), 2-4 pb, pour un même locus, très nombreux allèles possibles le plus fréquent est le dinucléo(de CA -Inser(on/délé(on ou inversion UZlité des séquences intergéniques comme ouZls en généZque Le marqueur géné(que sert à repérer ou iden(fier un segment de chromosome ou un allèle transmis Il doit être informa(f, c’est à dire suffisamment variable dans la popula(on UBlisaBon des marqueurs généBques - Analyse de liaison généBque: suivre la transmission des allèles d’un marqueur par rapport à un trait morbide. on teste s’il y a co-ségrégaBon entre un allèle du marqueur et la maladie. Si oui, il y a liaison géné(que: le marqueur est alors géné(quement proche de la maladie. Étude d’associaBon chez des malades non apparentés: établir une différence de distribu(on des fréquences alléliques d’un marqueur chez un groupe de malades non apparentés par rapport à un groupe témoin. (Etude ApoE et Alzheimer) - IdenBfier un individu avec cer(tude : médecine légale, paternité UZlité des séquences intergéniques comme ouZls en généZque Analyses de liaison But mezre en évidence une liaison géné(que entre un marqueur géné(que (de localisa(on connue) et le locus de la maladie (inconnu) Type d’études: familiales Marqueurs très informa;fs : microsatellites Type d’analyse : analyse paramétrique avec modèle de la maladie Liaison testée par méthode de vraisemblance : Lod-score : ra(o de la vraisemblance de l’hypothèse de liaison sur celle de non liaison. les seuils de significa(vité: Liaison entre la maladie et le marqueur: Z>3.00 Rejet de la liaison quand Z

Use Quizgecko on...
Browser
Browser