Étude de l'expression des gènes PDF
Document Details
Uploaded by PleasedTabla
Tags
Related
- Chapitre 3 : L'expression du patrimoine génétique PDF
- Biologie Moléculaire Ronéo 2: Expression des Gènes (PDF)
- Structures des gènes et expression du message génétique chez E.Coli PDF
- Cours - Génétique - Expression du patrimoine génétique - PDF
- Régulation de l’expression des gènes procaryotes PDF
- Cours 8 - Regulation, Synthèse, Maturation des ARNs PDF
Summary
Ce document traite de l'étude de l'expression des gènes, incluant des informations sur le génome humain, l'ADN, et l'histoire de la découverte de ces concepts. Il explore les principes de base de la génétique, et fournit une description de l'expression des gènes.
Full Transcript
Étude de l’expression des gènes Le génome humain est l’ensemble du matériel géné que (patrimoine héréditaire) d’un individu, présent en totalité dans chaque cellule de l’organisme. L’ADN est le support moléculaire de l’informa on géné que et permet une stabilité et une transmission de ce e informa...
Étude de l’expression des gènes Le génome humain est l’ensemble du matériel géné que (patrimoine héréditaire) d’un individu, présent en totalité dans chaque cellule de l’organisme. L’ADN est le support moléculaire de l’informa on géné que et permet une stabilité et une transmission de ce e informa on. La taille du génome humain est de 3 milliards de paires de bases (3 Gpb ou 3.109 pb). Contexte historique - Darwin : 1859 Évolu on par sélec on naturelle - Mendel :1865. Il a Découvert des principes de l’hérédité biologique. Il a entrepris des expériences sur le croisement des plantes ce qui a mis en lumière les bases de la géné que moderne : Un caractère peut exister sous di érentes versions (allèles), les unes dominantes, les autres récessives - => Lois de la transmission de certains traits héréditaires - Miescher :1871 : Découverte de la « nucléïne », composant principal du noyau des cellules (=ADN) - Morgan :1913, il a obtenu le prix Nobel 1933. Il a découvert la théorie chromosomique de l’hérédité. Il a réalisé ses travaux sur la Drosophile : Première carte géné que des chromosomes - Avery :1944. Il a découvert l’ADN en tant que molécule porteuse des informa ons héréditaires (suite des travaux de Gri th 1928) - Watson et Crick :1953 Découverte de la structure de l’ADN : Prix Nobel 1962 - Jacob, Monod, et Lwo : 1958. Découverte de l’ARNm, intermédiaire entre ADN et protéine, découverte de la régula on de l’expression génique : Prix Nobel 1965 - Nirenberg, Khorana & Holley : 1966. Découverte du code géné que : Prix Nobel 1968 - Sanger, Maxam & Gilbert : Technique de Séquençage (Sanger : 1977) - Technologie de l’ADN recombinant : 1970’. Clonage de l’ADN - Mullis : découverte de la PCR : 1986 Le séquençage Sanger est encore u lisé de nos jours pour des pe ts segments d’ADN Le séquençage du génome humain : - 1990 : Début du projet interna onal « Human Genome Project » (HGP) - 2001 : première publica on d’une par e de la séquence du génome humain - 2004 : seconde publica on, plus complète, d’une séquence du génome humain - 2006 : appari on d’une nouvelle méthode la nouvelle généra on de séquenceurs à très haut débit (= NGS). Le NGS est beaucoup plus rapide et moins cher, aujourd’hui le séquence d’un génome coute moins de 1000$, elle a permis d’augmenter le nombre de séquençage. On peut soit séquencer tout le génome soit l’exome (tous les exons) L’exome ne représente qu’1 à 2% du génome, mais on s’intéresse à ces régions car elles sont codantes pour des protéines. L’exome correspond au séquençage de 200 000 exons soit environ 20 000 gènes codant des protéines Une fois qu’on a séquencé le génome, on va chercher à iden er les gènes I. Les gènes Un gène est un segment d’ADN exprimé (transcrit) dans le but de produire une en té fonc onnelle : ti ffi ff ti f ti ti ti ti ti ti ti tt ti ti ti ti fi ti ti ti ti ti ti ti ti ti - Soit une protéine - Soit un ARN non codant On dis ngue 2 types de gènes : - Gènes classiques qui codent pour des protéines (transcrits) ➔ ARNm - Gènes non codants qui ne codent pas pour une protéine (non transcrits) ➔ ARNt, ARNr, miARN. Les ARN non codants ont des fonc ons cataly ques, structurales et régulatrices. Par exemple, les miARN vont cibler des ARNm et se reconnaitre une sequence par culière sur l’ARN cible, en se xant ils inhibent ou dégradent l’ARNm cible, ainsi il par cipent a la regula on de l’expression génique Structure d’un gène codant une protéine On a tout d’abord, le promoteur, puis le site d’ini a on de la transcrip on. Nous avons après, une région exonique avec : - Région 5’ UTR (= transcrite mais non traduite) - Codon d’ini a on de la traduc on AUG (ATG méthionine) (peut aussi se retrouver dans les exons 2 ou 3 ; pas toujours dans le premier) Ensuite, il y a une région intronique puis il y a une une alternance de régions exoniques – régions introniques. En général, les régions introniques sont beaucoup plus grandes que les régions exoniques. Le gène se termine par une région exonique avec : - Codon stop UAA UAG UGA (tjrs dans le dernier exon) - Région 3’ UTR (= transcrite mais non traduite) Les introns ne sont pas traduits MAIS SONT TRANSCRITS. Dans le GENOME HUMAIN, nous avons environ 20 000 GENES (représentant 1,5% du génome humain). La TAILLE D’UN GENE est de 35 000 PAIRES DE BASES (7 exons / 6 introns). La taille de l’intron est de 6 400 paires de bases et celle de l’exon est de 310 paires de bases. Il n’y a pas de corréla on entre la taille du gène et la taille de la protéine ti ti ti ti ti ti ti ti ti ti fi ti ti ti Quand on blaste on prend une séquence aléatoire et on la met dans un ou l d’alignement qui nous indique à quelle par e d’un gène appar ent la séquence. Pour blaster on u lise des génome brother. Ici dans notre exemple nous avons un extrait du gène BRCA2. Les traits épais représentent les régions exoniques et les lignes au région introniques. On voit qu’au sein d’un même gène la taille des régions introniques et exoniques est extrêmement variable. Dans le génome humain, nous avons : - Séquences codantes (exons) 1,5% - Séquences non codantes intra géniques (introns) 23,5% - Séquences non codantes intergéniques 75% Un gène va être transcrit ARN pré messager (introns – exons). Cet ARN va subir l’épissage (matura on des ARN), qui élimine les région introniques et assemble les régions exoniques. On a alors l’ARNm mature. C’est cet ARN qui sera traduit pour abou r à la protéine. Il y a beaucoup plus de transcrits que de gènes. L’épissage alterna f permet de produire plusieurs transcrit (isoformes) à par r d’un même gène. Un gène peut produire plusieurs isoformes (ARN et protéines). Orienta on des gènes Les gènes sont transcrits à par r d’un seul brin (sens ou an sens). Sur un segment d’ADN on peut avoir 2 gènes di érents, l’un sera transcrit à par r du brin sens et l’autre sera transcrit à par r du brin an sens. Par exemple, ici le gène NF1 va être transcrits à par r du brin sens et de l’autre coté sur le brin an sens on va avoir 3 gènes qui peuvent être transcrits Le génome est composé 20 000 gènes codant des protéines (avec 1 gène environ 35 000 pdb) La par e codante représente 1 à 2 % du génome humaine Comparaison entre le génome nucléaire et mitochondriale ti ti ti ti ti ti ti ti ti ti ff ti ti ti ti ti ti ti SCHÉMA RECAP Le site AG est les sites accepteurs d’épissage, on parle de site 3’ d’épissage. Les sites GT sont les sites donneurs d’épissage, on parle de site 5’ d’épissage Plus de 95% des gènes sont soumis à transcrip on, épissage, matura on 3’ alterna fs. ti ti ti On retrouve 250 000 transcrits codant des protéines pour 20 000 gènes. L’augmenta on du nombre de transcrits par rapport au nombre de gène est dû à l’épissage alterna f. Il s’agit d’assemblages di érents des par es exoniques, mais commençant toujours avec un promoteur. Il y a donc une augmenta on de la possibilité de créée di érente protéine ayant des fonc ons biologiques di érentes à par r d’un même gène D’autres mécanismes existent comme les promoteurs alterna fs pour produire di érentes protéines Il y a alors plusieurs promoteurs dans un gène (1 promoteur avant l’exon 1 et 1 promoteur avant l’exon 2). Si le promoteur 2 est ac vé, on n’aura pas inclusion dans le transcrit de l’exon 1 et transcrip on à par r de l’exon 2 seulement. Le troisième mécanisme est les sites de polyadényla ons alterna fs pour produire di érentes protéinés. Ces sites peuvent se me ent à la n de plusieurs exons. Ces 3 mécanismes perme ent d’augmenter le nombre de protéines. Pouvant perme re l’augmenta on du répertoire protéique fonc ons biologiques mul ples Et perme ent la régula on de l’expression génique. L’expression des gènes Tous les gènes ne sont pas transcrits dans une même cellule donnée. Seule une par e de gènes sera transcrite dans une cellule donnée. L’ensemble de transcrit est le transcriptome. Le transcriptome est l’ensemble des transcrits présents dans un type cellulaire donné, à un temps donné et dans une condi on biologique (physiologique ou pathologique) ou expérimentale donnée. L’expression des gènes dépend des besoins de la cellule Certains gènes sont exprimés de façon ubiquitaire dans toutes les cellules et à des taux rela vement constants, on parle de gène de ménage. Mais, bien que toutes les cellules d’un organisme con ennent le même génome, elles n’expriment pas toutes les mêmes gènes. L’expression d’un grand nombre de gènes fais l’objet d’une régula on ne par cipant, notamment, à la di érencia on cellulaire. La variabilité de l’expression de certains gènes en fonc on de : - Du stade de développement (tous les gènes ne s’expriment pas en même temps et au même endroit) - De la spéci cité cellulaire et ssulaire (type cellulaire) ff ti ti ti tt ti fi ti tt ti ff ti ti ff tt tt ff ti ti ti fi ti ff ti ti ti ti ti ti ti fi ti ti ff ti ti ti ti - De la réponse à des s muli endogènes ou exogènes - Du cycle circadien (alternance du jour et de la nuit et horloge interne de l’organisme) - De l’état normal ou pathologique Certains gènes ne s’expriment que dans certain ssu Par exemple l’insuline ne s’exprime que dans les cellules du pancréas. On va pouvoir u liser les comparateurs de génomes pour savoir dans quel ssu est exprimé le gène codant l’insuline. Le gène codant l’insuline va être régulé en fonc on des taux de glucose Pour analyser l’expression des gènes provenant d’un ssu, on va d’abord extraire l’ARN du ssu puis on va étudier à l’aide d’un RNAseq l’expression des gènes dans chaque ssu. On peut avoir une dérégula on de l’expression génique dans les cellules cancéreuses. La modi ca on d’expression des gènes va par ciper la tumorogenèse. On peut avoir, la perte d’expression de gènes suppresseurs de tumeurs ou l’augmenta on de gènes oncogènes. De plus on peut avoir des gènes modi é qui peuvent entrainer le développement de nouvelles fonc ons Certains enzymes ou protéines sont exprimés dans toutes les cellules comme l’ac ne (= ubiquitaires). Dans des condi ons normales, des gènes s’expriment mais quand il y a appari on de cancer, ces gènes ne s’expriment plus ou sont modi ées géné quement qui vont conduire à la forma on de nouvelles protéines. Celles-ci peuvent acquérir de nouvelles propriétés abou ssant à une tumeur. La régulation de l’expression génique peut avoir lieu à différents niveaux : - Transcrip on ajout de la coi e en 5’ - Matura on (épissage) polyadényla on, édi on de l’ARN et contrôle qualité de l’ARN - Export localisa on et stockage des ARNm, stabilité des ARNm et régula on par les microARN - Traduc on modi ca ons post-traduc onnellles, stabilité des protéines, localisa on des protéines, partenaires ti ti fi ti ti ti ti ti ti fi ti ti fi ti ti ti ti fi ti ff ti ti ti ti ti ti ti ti ti ti ti ti ti ti 1) Régulation au niveau de la transcription L’expression des gènes est en par e régulée par des mécanismes épigéné ques : méthyla ons de l’ADN ou modi ca ons des histones. Des éléments de régula on cis (séquences d’ADN) et trans (protéines) par cipent à la régula on posi ve (ENHANCER) ou néga ve (SILENCER) de la transcrip on (ac ve du promoteur). Des facteurs de régula on de l’ini a on de la transcrip on peuvent agir de façon combinatoire pour réguler l’expression des gènes. Ces facteurs peuvent agir en 5’ du gène ou en 3’ (en amont ou en aval de la transcrip on). Ces facteurs induisent la mise en contact de régions à distance du promoteur avec le promoteur. Il y a donc : - Ac va on de la transcrip on d’un gène (gène exprimé) - Répression de la transcrip on d’un gène (gène non exprimé) L’u lisa on de promoteurs alterna fs permet de produire di érents transcrits (isoformes) à par r d’un même gène. 2) Régulation au niveau de la maturation (EPISSAGE) L’épissage est un étape clé de la matura on des ARNm. Elle élimine les introns et assemble les exons. ARN pré-messager —> ARN messager, par l’épissage alterna f, est un processus nécessaire à l’expression de la majorité des gènes. L’épissage met en jeu : - Des éléments cis (séquences spéci ques) - Des éléments trans (facteurs protéiques de régula on) L’épissage se fait grâce au spliceosome. Le spliceosome reconnait les séquences exoniques des séquences introniques. Le site 3’ d’épissage est le site accepteur d’épissage (jonc on intron – exon) alors que le site 5’ d’épissage est le site donneur d’épissage (jonc on exon – intron). Ce sont les points d’embranchements. Plus la le re est grande, plus les nucléo des sont conservés au niveau des sites d’embranchements. Ce sont les nucléo des AG 3’ et GU (localisés sur les 2 dernières bases de l’intron) 5’. Mais d’autres nucléo des sont aussi conservés a proximité sont conservé et on son impliqué dans la reconnaissance, on parle de consensus Les éléments de la régula on de l’épissage sont : - séquence ESS exonic splicing silencer (6 à 8 nucléo des) - séquence ESE exonic splicing enhancer - séuqence ISS intronic splicing silencer ti ti ti ti ti ti ti ti ti ti ti ti ti ti ti ti ti ti ti ti ti ti ti fi ti ti ti ti fi tt ti ti ti ti ti ti ti ff - séquence ISE intronic splicing enhancer Ces séquences ISE ou ESE perme ent la xa on de facteurs de régula on de l’épissage. Les facteurs de régula on de l’épissage sont SR (serine / arginine rich proteins) ces protéines s mulent le recrutement du spliceosome, au niveau des sites d’épissage. Les séquences ESE perme ent l’inclusion des exons dans le transcrit mature. À l’inverse, les ESS et ISS perme ent la xa on de facteurs de régula on de l’épissage. Les facteurs de régula on de l’épissage sont hnRNP ces protéines inhibent le spliceosome. 95% des gènes humains produisent plusieurs transcrits alterna fs. Cet épissage alterna f donne une source de diversité et de complexité fonc onnelle. Il y a des : - Exons casse e (saut d’exons) dans un même gène on observera des transcrits qui introduisent ou excluent cet exon - Exons mutuellement exclusif dans les transcrits on observera l’inclusion de l’un ou l’autre des exons (jamais les 2 ensembles) - Réten on d’intron dans son intégralité pour certains transcrit on observera la conserva on en ère de l’intron dans le transcrit mature (changement du cadre de lecture -> produc on de protéines di érentes) - Sites 5’ d’épissage alterna f - Sites 3’ d’épissage alterna f ➔ Délé on par elle d’un exon selon le site 5’ ou 3’. Exemple de régula on de l’expression génique par épissage alterna f (en fonc on du type cellulaire) gène alpha- tropomyosine A par r d’un même gène, on peut avoir des protéines avec des fonc ons di érentes. Transcrits di éremment exprimés en fonc on du type de ssu musculaire (par épissage alterna f) En fonc on de l’inclusion ou exclusion de l’exon 9 2 transcrits : les protéines auront des propriétés antagonistes. L’inclusion de ex9 donnera à la protéine des propriétés an -apopto c : empêche l’apoptose. Pour la protéine excluant l’ex9 on aura le contraire. L’épissage alterna f n’est pas toujours connu pour tous les gènes, La plupart du temps on a l’inclusion des 27 exons, cependant il arrive qu’on au des transcrits alterna fs. 16% de transcrits alterna f n’ont pas d’inclusion de l’exon 2. On peut également avoir des reten ons d’intron. On ne connait la fonc on et le rôle biologique de ces di érences. ti ti ti ti ti ti ti ff tt ff ti ti ti ti ti ti ti ti ti ti ti ff ti ti tt ti fi ti ti ti ff ti ti tt ti fi ti tt ti ti ti ti ti ti Analyse du transcriptome Le transcriptome est l’ensemble des transcrits présents dans un type cellulaire donné, à un temps donné et dans une condi on biologique ou expérimentale donnée. La variabilité de l’expression génique donne une di érence qualita ve et une di érence quan ta ve. La di érence quan ta ve renvoie au niveau d’expression du transcrit et la di érence qualita ve renvoie à la nature même du transcrit. Cela a un lien avec le pro l d’expression des gènes. Cela a des conséquences fonc onnelles et une signature moléculaire (pouvant servir de biomarqueur) Lorsqu’il y a une augmenta on du taux de transcrits il n’y a pas toujours une augmenta on de la transcrip on du gène. En e et les di erences quan taves peuvent resulter de la modi ca on de la vitesse de la transcrip on, du niveau de transcrip on et de la vitesse de degrada on des transcrits qui n’est pas le meme pour tous les transcrits. En e et, Il faut prendre en compte la demi-vie d’un transcrit. Les demi-vies sont variables d’une cellule à l’autre. La demi-vie d’un ARNm est de 30min à 20h. Dé ni on d’un PROFIL D’EXPRESSION GENIQUE : ⇨ Caractéris que intrinsèque de l’échan llon à un moment donné dans des condi ons physiologiques ou pathologiques déterminées. Il y a un établissement d’une signature moléculaire spéci que. La signature molécule spéci que est u lisée en RECHERCHE FONDAMENTALE : - Connaissances des fonc ons / des voies biologiques ac vées - Iden ca on poten elle des nouvelles cibles thérapeu ques Et est u lisé en CLINIQUE (= biomarqueurs). Biomarqueurs u lisés pour faire : - Diagnos c - Pronos c - Prédic on de réponse à certains traitements thérapeu ques / médecine génomique de précision (personnalisée) Il y a plusieurs analyses possibles pour étudier le transcriptome : - Analyse ciblée : étude de l’expression spéci que d’un gène o Méthodes RT-PCR, RT-QMPSF, RT-PCR en temps réel, northern blot, hybrida on in situ - Analyse globale : étude du transcriptome o Méthodes puces à ADN = microarray, séquençage à haut débit (RNA-seq) ff fi ti ff ti fi ti ti ti ti ti ti ti ti ti ti ti ti ti ti ti ti fi ti fi fi ff ti ti ti ff ti ti ti fi ff ti ti ti ti ff fi ti ti ff ti ti ti En amont de toutes ces techniques, il y a l’extrac on des ARN totaux. Ce e extrac on est très importante pour les techniques. L’ADN est plus stable que l’ARN, de plus des RNase vont entrainer la dégrada on de l’ARN, il nécessaire de préserver l’intégrité de l’ARN pour nos études ti tt ti ti