Biologie Moléculaire S1 - Juliette AURY-LANDAS - Variabilité du Génome - PDF
Document Details
Uploaded by SnappyRetinalite4350
Juliette Aury-Landas
Tags
Summary
These notes cover molecular biology, specifically focusing on genome variability, polymorphisms, and mutations. They detail the structure and function of DNA and the processes involved in protein synthesis and expression. The document also touches on the evolutionary and medical aspects related to these topics.
Full Transcript
Biologie moléculaire S1 Juliette AURY-LANDAS Variabilité du génome Polymorphisme et mutations Nombre de lecture : 1 2 3 4 5 6 7 8 9...
Biologie moléculaire S1 Juliette AURY-LANDAS Variabilité du génome Polymorphisme et mutations Nombre de lecture : 1 2 3 4 5 6 7 8 9 10 1/15 Introduction Pourquoi étudier la variabilité du génome ? Histoire évolutive de l’espèce humaine Mouvements migratoires Métissages Généalogie Filiation, Tests de paternité Génétique + environnement/mode de vie Apparence physique Santé Maladies génétiques et maladies héréditaires Variabilité du génome Polymorphisme : diversité des phénotypes et de leur réponse à l’environnement couleur des yeux, groupe sanguin… Risque plus ou moins élevé de développer certaines maladies... ADN : support de l’information génétique Double hélice composée de pare de base enroulée autour des histones → pour former les chromosomes. Structure : découvert en 1953 (Nobel 1962) = 2 chaines antiparallèles formant une hélice. Séquence du génome de référence : CRCh38 → séquence consensus retrouvée dans 90% des génomes = utilisé pour savoir si un individu est sain ou malade. Avril 2022 : Consortium Telomere to Telomere des 22 autosomes et du chromosome X → permet de connaitre la séquence entière du génome. Le génome humain contient 3 milliards de pb, principalement non codante, avec 60 000 gènes pourtant seulement 20 000 gènes qui codent pour des protéines. Exome (30Mb) : somme de tous les exons (zones codante) = 1% du génome. De l’information génétique à la fonction biologique Les cellules doivent maintenir leurs structures et fonctions tout au long de leur vie. Les informations nécessaires à la synthèse des éléments structurels et fonctionnels sont contenues dans les gènes qui doivent donc être exprimés de façon continue et reproductible. Les protéines assurent les structures et les fonctions biologiques dans la cellule. 2/15 La synthèse des protéines : 2 étapes La transcription : dans le noyau = ADN → ARN messager La traduction : dans le cytoplasme = ARN messager → protéine Code génétique : Cadre de lecture : Succession des codons → 1 codon = 3 nucléotides consécutifs : 64 codons. Universel : Tous les êtres vivants (sauf quelques exceptions) possèdent le même non ambiguë : à un codon correspond un seul et unique acide aminé Dégénéré : À un acide aminé peuvent correspondre plusieurs codons (il existe en e et 64 possibilités de codons et seulement 20 acides aminés). Les protéines : Molécules composées de chaînes d'acides aminés liés les uns aux autres. Le groupement R est variable. Les 20 acides aminés ont des propriétés physico chimiques di érentes : hydrophobe : n’interagissent pas avec l’eau hydrophile : interagissent avec l’eau chargé : interagissent avec les molécules de charge opposées Structure : primaire secondaire tertiaire quaternaire Les protéines : Eléments essentiels de la cellule car elles ont des rôles très variés Structure déterminée génétiquement (Relation Structure Fonction) Synthétisées et dégradées en permanence dans les cellules 3/15 ff ff Rôle : Structure : les bres protéiques Mouvement Transport de substances dans le sang Transport de substances à travers la membrane des cellules Hormones Identi cation des cellules Défense : les anticorps Enzymes Variabilité du génome Variant : Changement intervenu dans la séquence de l’ADN, à l’échelle d’un chromosome à un nucléotide : À l’origine de la diversité des individus Situés dans une région codante ou non Pathogènes ou non On classe les variants en fonction de leur fréquence dans la population par rapport à une population de référence Fréquence allélique (Minor Allele Frequency) : Variants communs / polymorphismes : MAF > 1% Variants rares 0,1% < MAF < 1% Variants très rares MAF < 0,1% Variants privés : présent chez 1 seul individu / famille En fonction des populations et de l’histoire évolutive de l’homme, la population n’ont pas les mêmes fréquences de variations. Mais les références sont faites à partir des mutations observées dans la population européenne, pas à partir de la fréquence des variations pour d’autre populations. Un projet est actuellement lancé pour avoir un maximum d’information sur toutes les populations. Les di érents types de variants : Les variations peuvent aller d’un seul nucléotide jusqu’à un chromosome entier. 4/15 ff fi fi SNVs : Single Nucleotide Variations → la plus fréquente Variation ponctuelle de la séquence : substitution au niveau d’un nucléotide Très nombreux : 10x106 snv / génome humain réparti dans tout le génome CNVs : Copy Number Variations variation du nombre de copies d’un fragment du génome (altération structurale chromosomique) perte ou gain de fragments de génome de quelques 50 pb à 5 Mb 10 % du génome humain Polymorphismes de répétition : séquences répétées en tandem de nombreuses fois, à partir de motifs de longueur variable : Microsatellites : SSR (Séquences Simples Répétées) répétitions d’une séquence de 2 à 12 pb (ex : TGTGTGTGTG) < 100aines de pb Minisatellites : VNTR (Variable Number of Tandem Repeats) répétitions d’une séquence de 9 à 64 pb 100pb à 20 kb Polymorphisme important utilisé en médecine légale (criminologie, test de paternité) Satellites : répétitions d’une séquence de 5 à 171 pb 100kb à pls Mb → pas le même nombre pour une région donnée d’un individu à l’autre. Utilisation de ces variations par la police scienti que : En France : étude de 13 loci (= régions répétées) très polymorphiques (= très variables) → ces variations sont présentes chez 5 à 20% des individus → Permet d’identi er avec précision Le pro l génétique spéci que d’un individu. Probabilité que l’ADN ne soit pas celui de l’individu suspect ? → 1 chance sur plus de 1 milliard (entre 1/2013 et 1/513) → 1/1000 = 1/500 qu’il ait un jumeau x ½ que ce soit l’ADN du jumeau Les variants du génome : les causes : Modi cations du génome (séquence d’ADN) Induites agressions exogènes (radiations et agents génotoxiques de l’environnement) agressions endogènes (radicaux libres, …) Spontanées erreurs de réplication accidents de recombinaison Généralement, ces modi cations sont corrigées ou éliminées (machinerie de réparation cellulaire). Un échappement au système de réparation est à l’origine des mutations = extrêmement rare. Si le variant touche l’ADN contenu dans une cellule reproductrice, il peut être transmis à la descendance. 5/15 fi fi fi fi fi fi Mutations acquise VS constitutionnelle VS germinale Mutation acquise / somatique Mutation apparue dans une cellule somatique d’un tissu Non présente initialement dans le génome de la cellule Peut être à l’origine d’un clone cellulaire porteur de cette mutation, ne touchant qu’un seul ou quelques tissus Non transmissibles à la descendance Mutations somatiques pathogènes impliquées dans la formation de cellules tumorales = pas transmise à la descendance, mais transmise via les mitoses. Mutation constitutionnelle Mutation présente ou survenue avant la fécondation, ou lors des premières divisions du zygote Présente dans toutes les cellules somatiques de l’individu, et également dans ses cellules germinales Transmissible à la descendance Mutation germinale Mutations survenues lors de la méiose dans une cellule germinale, au niveau d’un gamète parental Présente de façon constitutionnelle chez l’individu issu de ce gamète (porteur d’une mutation de novo ou néo mutation) Non présente dans les cellules somatiques du parent transmetteur de la mutation Conséquences : Selon la variation et son contexte génétique (localisation dans un gène ou non…) Béné que pour l’individu / amélioration d’une fonction (diversité, évolution) Délétère, à l’origine de certaines maladies génétiques Sans conséquence pour l’individu (neutre) = di érente en fonction de la localisation de la variation La majorité des variants sont « neutres » : pas d’e et notable sur la survie de l’espèce, conservés, renforcent la diversité entre les individus (couleurs des yeux, des cheveux) Certains variants ont pu être favorables à la survie de l’espèce et ont été conservés au cours de l’évolution Peau claire : avantage pour les populations vivant dans des zones où les UV sont moins intenses qu’à l’équateur → pénétration des UV nécessaires à la production de vitamine D → protection contre le rachitisme (maladie des os due à une carence en vitamine D) Rarement, à l’origine de maladies génétiques 6/15 fi ff ff Description des variants Faux-sens Non-sens Décalage du cadre de lecture par addition d’un nucléotide Décalage du cadre de lecture par suppression d’un nucléotide À l’échelle du chromosome = macrolésions Anomalies chromosomiques de nombre Anomalies chromosomiques de structure Détectées par des approches de cytogénétique (génétique chromosomique) À l’échelle du gène = micolésions Substitutions = mutations ponctuelles (remplacement d’un nucléotide par un autre) Insertions ou délétions (qq nt à 10 100 nt) Détectées par des approches de génétique moléculaire Echelle génétique : Variation à l’échelle du gène (séquence codante ou non) Substitutions : remplacement d’un nucléotide par un autre Insertions et/ou délétions de 1 ou quelques nucléotides Insertions et/ou délétions de quelques 10aines à 100aines de nucléotides Mutations instables A) Substitution Remplacement d’un nucléotide par un autre Variation la plus fréquente (~70% des mutations) 2 types de substitutions : Transition : remplacement d’une des purines (Adénine ou Guanine) par l’autre purine, ou d’une des pyrimidines (Cytosine ou Thymine) par l’autre pyrimidine. Transversion : changement d’une des pyrimidines en l’une des purines, ou le contraire, d’une des purines en l’une des pyrimidines. 7/15 Causes : erreurs spontanées de réplication ayant échappé au système de réparation, erreurs du système de réparation, perturbations biochimiques dues à des agents physiques ou chimiques exogènes/agents environnementaux mutagènes (substances chimiques, rayonnements…) ou produits par le métabolisme endogène. Conséquences : Mutation de type « faux sens » (« missense ») le codon muté code un autre acide aminé Souvent sans e et pathogène (polymorphisme) Parfois délétère, en fonction de la localisation de l’aa touché : Altération du repliement protéique Altération de la stabilité protéique Altération de domaines fonctionnels ou de sites d’interaction avec d’autres protéines → de type perte de fonction ou gain de fonction Mutation de type « non-sens » (stop) Le codon muté code un codon stop Généralement pathogène car synthèse d’une protéine tronquée → instable et dégradée (e et perte de fonction) ou avec un e et dominant négatif (e et gain de fonction) Mutation de type « synonymes » Le codon muté code le même acide aminé (code génétique dégénéré) Souvent sans e et pathogène (polymorphisme) E et délétère possible : substitution sur un motif de séquence nucléotidique → exemple : épissage, régulation du niveau d’expression, etc… 8/15 ff ff ff ff ff ff Les variants synonymes sont-ils vraiment neutres ? Chez la levure Saccharomyces cerevisiae Criblage fonctionnel (CRISPR/Cas9) : construction de 8341 souches mutantes (1866 variants synonymes, 6306 faux sens, 169 non-sens dans 21 gènes) → Impact sur le taux de croissance des souches mutées vs souche sauvage ? Variant neutre, béné que ou nuisible ? Variants synonymes : 75,9 % sont signi cativement nuisibles 1,3 % sont signi cativement béné ques Et chez l’Homme ? Rq : 2/3 des patients évocateurs d’une maladie génétique n’ont pas de variants causaux détectés dans les régions codantes du génome. B) Insertion et délétion Insertion (gain) et/ou délétion (perte) d’un ou qq nucléotides ( seuil (>50 répétitions en général) : instabilité et possibilité d’expansion du nb de répétitions maladies à expansion de triplets , par ex : maladies neurodégénératives et neuromusculaires, augmentation au cours des générations successives du risque de développer la maladie, ou de la sévérité ou précocité des signes = phénomène « d’anticipation » 9/15 fi ff ff ff fi fi fi ff ff fi ff Régions codantes ou non codantes Fréquemment : expansion du nombre de répétitions Rarement : contraction du nb de répétitions Causes : accidents de « dérapage réplicatif » (pendant la réplication de l’ADN), impliquant les ADN polymérases D) Réarrangement génomique Insertion (gain) et/ou délétion (perte) d’un grand nombre de nucléotides (qq 10aines à 100aines de nucléotides soit des fragments, voire la totalité, d’un ou de plusieurs exons et/ou introns) par rapport à la séquence initiale Causes : Réparations incomplètes de lésions de l’ADN Anomalies de recombinaison Anomalies de réplication E) Conséquences des mutations codantes Conséquences des mutations sur la fonction de la protéine Mutation non-sens (stop) Mutation responsable d’un décalage du cadre de lecture (dont anomalies de l’épissage) Mutation du codon d’initiation de la traduction = absence de protéine / protéine tronquée → activité nulle ou réduite. Mutation faux sens Délétion / insertion en phase (dont anomalie épissage) = changement de la séquence protéique → conséquence variée : stabilité, adressage, maturation, assemblage, fonction Exemple de la mucoviscidose : Perte de fonction 10/15 Allèles amorphes ou nuls : Perte totale d’expression de la protéine ou synthèse d’une protéine totalement inactive. Allèles hypomorphes : Perte partielle d’expression de la protéine ou synthèse d’une protéine partiellement inactive. → Retrouvées dans la majorité des maladies récessives (un seul allèle fonctionne sur les deux) → Retrouvées dans certaines maladies dominantes par haplo insu sance : la perte de 50% de l’activité du gène est su sante pour entraîner un phénotype clinique. E et dominant négatif Allèles anti-morphes : Perte de fonction + interférence avec la fonction normale de la protéine chez les htz Gènes codant les protéines de structure, ou capables de former des homo ou hétéro dimères → modi cations conformationnelles a ectant la fonction de la protéine normale Gain de fonction Allèles hypermorphes : Surexpression du gène sauvage (exceptionnel) ou d’une forme hyperactive de la protéine. Allèles néo-morphes : Codant une protéine dont la fonction est di érente de la protéine sauvage. F) Conséquences des mutations non-codantes 11/15 ff fi ffi ff ff ffi e ets délétères potentiels en altérant des séquences régulatrices Conséquences des mutations sur l’expression du gène Régulation de la transcription (mutations du promoteur, d’enhancers , de silencers Régulation de la maturation de l’ARN messager (et surtout l’épissage) Régulation de la stabilité de l’ARN messager G) Nomenclature des mutations – HGVS Nom de la séquence de référence Nature de la séquence modi ée g. pour une séquence d’ADN génomique c. pour une séquence d’ADN complémentaire : numérotation à partir du codon d’initiation de la traduction (+1) p. pour une séquence protéique Type de modi cation > pour une substitution nucléotidique del pour une délétion ins pour une insertion nucléotidique au niveau protéique : → X pour un codon stop → fs pour un décalage du cadre de lecture 12/15 ff fi fi Interprétation des mutations Détermination du caractère causal d’une variation identi ée Fréquence dans la population générale (grand nombre de sujets témoins) → si beaucoup de personne la possède, elle n’est surement pas responsable de la maladie. Conservation de la séquence nucléotide/ protéine au cours de l’évolution → si très conservée : très important. Localisation au niveau de la protéine (région fonctionnelle) Type de mutation : acide aminé concerné (polarité, charge, encombrement stérique…) Prédictions in silico (= sur un ordinateur) de l’impact fonctionnel, Altération de la transcription, de l’épissage Co-ségrégation familiale, Mutation de novo ++ Est ce que la mutation est retrouvée chez les autres membres de la famille ? Lien entre la présence de la maladie et la présence de la mutation ? Études fonctionnelles in vitro (conséquences sur la fonction de la protéine) Études in vivo La somme des toutes ces informations nous conforme dans l’idée que la maladie est liée à la mutation ou non. = on peut savoir si le variant est plutôt bénin ou plutôt pathogène. 13/15 fi Echelle chromosomique : Chromosomes →Visibles sous forme condensée (métaphase) 4 types de chromosomes selon la position du centromère et la longueur des bras (p : bras cours / q : bras long) Types d’anomalies chromosomiques Anomalies de nombre de chromosomes Polyploïdies : nombre anormal de chromosomes (globalement) Aneuploïdies : nombre anormal de chromosome pour une seul paire chromosomique. Résultent le plus généralement d’une non-disjonction chromosomique (lors de la méiose) Dysgonosomies : anomalies de nombre des gonosomes X et Y Anomalies de structure de chromosomes Polyploïdies touchent le nombre global de chromosomes > 2n chromosomes dans les cellules → accident de fécondation le plus fréquent dans l’espèce humaine (1 à 3% des ovules fécondés) responsables de la majorité des avortements spontanés du premier trimestre de la grossesse. Triploïdie 3n chromosomes par cellule triploïde (soit 3x23=69 chromosomes) résulte de la fusion d’un gamète diploïde avec un gamète normal Repérage des grossesses triploïdes : Retard de croissance intra utérin sévère souvent létal Ventriculomégalie Malformations variables et multiples Rarement, naissance à terme --> survie très brève (quelques semaines) Tétraploïdie 4n chromosomes par cellule tétraploïde (soit 4x23=92 chromosomes) extrêmement rare à la naissance → syndrome très malformatif, non viable à long terme (retard de croissance sévère, microcéphalie, dysmorphie faciale, malformations congénitales) Aneuploïdie Aneuploïdies impliquant les autosomes observables à la naissance : Trisomie 13 (1/ 5000)(47, XY,+13) Trisomie 18 (1/ 3000)(47, XY,+18) Trisomie 21 (1/ 650) (47,XY,+21) T13, T18 : anomalies extrêmement sévères et rapidement létales (tableau malformatif généralement diagnostiquées in utero) Aneuploïdies impliquant les gonosomes (1/800) Trisomies (1/800) 47,XXX (trisomie X) : femmes de grandes tailles, phénotype normal 47,XYY (syndrome de Jacob) : hommes de grandes tailles, phénotype normal 47,XXY (syndrome de Klinefelter) : garçons avec caractères sexuels secondaires peu développés (pas de phénotype particulier jusqu’à l’adolescence) Monosomies : non viables chez l’Homme sauf : 45,X (syndrome de Turner) : lles de petite taille avec insu sance gonadique Cause : non disjonction des chromosomes lors de la méiose Anomalies autosomiques de structure une ou plusieurs cassures chromosomiques suivies d’un recollement anormal peuvent a ecter un, deux voire plusieurs chromosomes 14/15 ff fi ffi peuvent être équilibrées (ni gain ni perte sur les chromosomes) ou déséquilibrées (réarrangement avec gain ou perte de gènes) PAS VU PAS EVALUE 15/15