Biologie Moléculaire 3ème - Cours PDF
Document Details
Uploaded by WarmSelenium7607
HELHa Haute École Louvain en Hainaut
Tags
Summary
Ce document présente un cours sur la biologie moléculaire pour la 3ème. Il couvre les concepts de base sur les enzymes, les nucléases, les enzymes de restriction et les polymérases. Le texte est structuré en chapitres et sous-chapitres.
Full Transcript
Biologie moléculaire 3ème 1 Chapitre 1 : les enzymes en biologie moléculaire 1.1 Rappels théoriques de base Composition chimique de l’ADN : Structure de l’ADN : ➔ Double hélice antiparallèle (possibilité de déshybrider la molécule) ➔ Composée de bases azotées : Adénine toujours avec...
Biologie moléculaire 3ème 1 Chapitre 1 : les enzymes en biologie moléculaire 1.1 Rappels théoriques de base Composition chimique de l’ADN : Structure de l’ADN : ➔ Double hélice antiparallèle (possibilité de déshybrider la molécule) ➔ Composée de bases azotées : Adénine toujours avec thymine & Guanine avec cytosine (tjrs les mêmes en raison des ponts H) 1 Structure de l’ARN : ➔ Simple brin ➔ Thymine remplacée par uracile 2 1.2 Les nucléases Définition : = Les nucléases sont des enzymes de dégradation qui hydrolysent les liens phosphodiesters entraînant soit la libération d’un 3’OH et d’un 5’PO4 ou d’un 3’PO4 et d’un 5’OH 1.2.1 Endonucléases & Exonucléases Définition : = Les endonucléases sont capables de couper au milieu de la chaîne, par opposition aux exonucléases qui n'attaquent que les nucléotides situés aux extrémités des fragments. Les types de coupure : = Coupure franche : Génère des extrémités bicaténaires (bouts francs) (Ex : Hae III) 3 = Coupure décalée : Génère des extrémités monocaténaires (extrémité cohésives/ bouts collants) 1.2.2 Exemples de nucléases La Dnase I : = enzyme de la digestion des ADN chez les animaux (bouffe l'ADN pour en faire des nucléotides) ➔ Hydrolyse les ADN double ou simple brin jusqu’à un mélange de nucléotides et d’oligonucléotides ➔ Endonucléase, préférentiellement sur les liaisons adjacentes aux nucléosides pyrimidiques (C et T) ➔ Mg++ (Mn++) ➔ Pas de séquence spécifique reconnue (sauf si Mn++) ➔ Bouts francs ➔ La DNase pancréatique est utilisée pour introduire des brèches au hasard dans l’ADN double brin en vue d’un marquage par la DNA polymérase. 4 Nucléase SI : = Aspergillus oryzae (champignon que l’on retrouve dans les fromages) : Hydrolyse l’ADN et l'ARN monocaténaire en oligonucléotides ou mononucléotides (bien qu’à des concentrations élevées elle agisse aussi sur les hybrides). Fonctionne en milieu acide, en présence d’ions Zinc. = Utilisée : ➔ Pour faire des bouts francs aux extrémités des fragments d’ADN double brin ➔ Pour hydrolyser les fragments d’ADN simple brin au niveau des brèches (même s’il ne manque qu’une seule liaison) ➔ Pour isoler les hybrides ADN & ARN lors de l’hybridation entre un gène et le cDNA correspondant ➔ Pour ouvrir les épingles à cheveux formées lors de la synthèse des cDNA 1.2.3 Les enzymes de restriction Définition : = Une enzyme de restriction est une endonucléase qui peut couper un fragment d‘ADN au niveau d'une séquence de nucléotides caractéristique appelée site de restriction. Les séquences spécifiques sont de 4,6 ou 8 pb (le nombre de paires de base influence la fréquence de coupures : + il est long - il y a de coupures dans le génome) et sont souvent palindromiques (se lit dans les deux sens). 5 = Ces mécanismes de restriction sont produits par des bactéries. Ces enzymes constituent une défense contre les virus bactériophages (elles coupent l’ADN des virus qui entrent dans la cellule). = Enzymes devenues des outils indispensables en génie génétique : besoin de ces enzymes pour les séquences d'ADN cohésives et complémentaires = La réaction générale catalysée par les enzymes de restriction implique la présence dans le milieu réactionnel des facteurs suivants : ➔ Enzyme (3.1.21.n) ➔ Substrat : ADN double brin non digéré ➔ Produit : ADN double brin digéré ➔ Cofacteurs enzymatiques = En général, seul le Mg++ est indispensable. Quelques endonucléases font appel à d’autres cofacteurs. Des facteurs physiques contrôlent aussi ces réactions (pH, potentiel d’oxydoréduction, force ionique,..) L’énergie libre dégagée par l’hydrolyse est suffisamment importante pour que la réaction ne soit pratiquement pas réversible dans les conditions habituelles Origine des enzymes de restriction : = Durant les années 1970, découverte de nucléases bactériennes : Reconnaissance de site spécifiques sur des duplex d’ADN. Ce qui assure une protection contre les infections par des bactériophages. = Prévention de la destruction de l’ADN bactérien par modification épigénétique (au-delà du gène) : Ex de EcoRI méthylase qui protège le site de restriction bactérien par ajout d’un groupement méthyle sur le groupement amine de l’adénine (Adénine → 6-méthyl adénine), ce qui protège l'ADN de la bactérie de se faire attaquer par ses propres enzymes de restriction 6 Classification des enzymes de (nomenclature) : = Classification par l’Union Internationale de Biochimie (1961). Basée sur le type de réaction catalysée et le type de substrat, elle est composée de 6 classes. L’identification des enzymes se fait par 4 chiffres précédés de EC. = Les 6 classes d’enzymes : ➔ Oxydoréductases : transfert d’électrons ➔ Transférases : transfert de C-, N-, ou P- ➔ Hydrolases : Rupture de liaison chimique (H2O dépendant : en présence d’eau) ➔ Lyases : Rupture de liaison chimique (H2O dépendant) ➔ Isomérases : Formation d’isomères ➔ Ligases : Hydrolyse d’un P- pour former une nouvelle liaison Les enzymes de restriction sont des hydrolases (classe 3 de la E.C.) agissant sur des liaisons esters (sous-classe 3.1), c’est-à-dire des estérases = Exemple d’enzyme de restriction : EcoRI → EC. 3.1.21.4 ➔ 3 = hydrolase (classe) ➔ 1 = estérase (type de fonction chimique du substrat qui réagit : brisent un lien phosphodiester) ➔ 21 = endonucléase qui produit un 5’-phosphate ➔ 4 = nécessité d’un cofacteur, l’ion Mg++ dans le milieu = Le nom de chaque enzyme est dérivé du nom d’espèce ou de variété de la bactérie qui la produit : Ex de EcoRI 7 ➔ E = l’initiale du nom du genre (Escherichia) ➔ co = les deux initiales du nom de l’espèce (coli) ➔ R = 1 lettre ou 1 nombre pour désigner la variété (ou souche) (variété R) ➔ I = après un espace un chiffre romain pour désigner successivement les différentes enzymes de restriction obtenues à partir de la même souche (première des enzymes obtenues) Tampons d’incubation : = Différents tampons sont utilisés pour les enzymes de restriction permettant l’optimisation des réactions de multiples enzymes avec le même tampon. Toutes les enzymes de restriction nécessitent la présence de l’ion Mg++. Le pH (compris entre 7,0 - 7,9), le potentiel d’oxydo- réduction (dithiothréitol 1 mM), la force ionique (NaCl ou CH3COOK de 0 à 100 mM) varient d’un tampon à l’autre. De rares enzymes nécessitent des conditions spéciales précisées par leur mode d’emploi. Le site de restriction : = Le site de liaison à l’ADN est formé de six paires de nucléotides. = Les sites de restriction sont souvent de type palindrome = Ex de EcoRI : 5’ GAATTC 3’ & 3’ CTTAAG 5’ Mécanisme d’action : = Coupure avec formation de bouts collants ou à bouts francs 8 ➔ Coupure avec formation de bouts francs : ➔ Coupure avec formation de bouts collants : Isoschizomère et néoschizomère : ➔ Isoschizomère : deux enzymes reconnaissant le même site de restriction ➔ Néoschizomère : deux enzymes reconnaissant le même site de restriction, mais dont le site de clivage est différent Enzymes compatibles : = Enzymes qui ont des sites de restriction différents mais qui donnent naissance aux même extrémités cohésives 9 ➔ Application : Les deux enzymes sont-elles compatibles ? Applications : 1) Combien de fragments de restriction vont être produits par une enzyme de restriction que l’on fait agir sur le plasmide (molécule d’ADN circulaire) ci-dessous ? 2) Soient les enzymes de restriction BamH I et Pst I dont les sites reconnus sont : ➔ BamH I : 5' G/GATCC 3' ➔ Pst I : 5' CTGCA/G 3’ = Encadrer les sites de restriction en indiquant la position des coupures : = Quels paramètres de l’activité enzymatique doivent être pris en considération afin d’optimiser la digestion enzymatique de l’ADN ? : optimum de pH, de température, cofacteurs enzymatiques (comme le magnésium) 1.3 Ligases = Les ADN ligases catalysent la liaison de l’extrémité 5’-phosphate terminale d’un brin d’ADN avec l’extrémité 3’-OH terminale d’un autre brin. Elles marchent aussi bien sur des simples brins que sur des extrémités franches. 10 Exemple d’ADN ligase (E. coli) : = L’ADN ligase de E. coli permet : ➔ De lier des fragments d’ADN double brin à extrémités collantes ➔ De fermer une brèche dans un brin d’ADN dont la resynthèse est achevée. Ce sont des cassures d'ADN qui si ne sont pas réparées par les ligases peuvent subir des mutations et devenir des cellules oncogènes. ➔ De lier les bouts francs de l’ADN en présence de réactifs d’exclusion = L’ADN ligase de E. coli utilise le NAD+ comme coenzyme donneur d’énergie selon la réaction : NAD+ → NMN+ + AMP = Elle n’a pas d’activité sur l’ARN (ne fonctionne que sur l'ADN) = Les ADN ligases (ou DNA ligases) sont utilisées dans le clonage des fragments d’ADN et dans la construction des vecteurs. 11 1.4 Polymérases Définition : = Les DNA-polymérases (préciser que c'est celle de l'ADN car plein d'autres types de polymérases) sont des enzymes du noyau cellulaire qui agissent en phase S du cycle pour doubler systématiquement l’ensemble du génome diploïde. Elle polymérise les nucléotides pour recopier de l'ADN. = Tous les êtres vivants ont besoin d’une ADN polymérase pour la réplication de leur ADN. Celles des êtres vivants les plus simples (virus, archéobactéries) sont souvent dépourvues de fonctions d’édition. = Elles synthétisent l’ADN nouveau par fragments qui, après excision des amorces, sont liés entre eux par une DNA-ligase. Une polymérase a une vitesse d’incorporation des nucléotides généralement comprise entre 35 et 100 nucléotides par seconde. Elles ont aussi une activité exonucléasique, qui leur permet en particulier d’hydrolyser le dernier nucléotide en 3’ du brin synthétisé si celui-ci ne s’apparie pas correctement avec le nucléotide complémentaire du brin modèle. Caractéristiques générales : ➔ Protéines d’environ 100 000 daltons ➔ Ont besoin d’un cofacteur (ion Mg++) ➔ Milieu alcalin ➔ Température optimale d’action se situe habituellement dans une fourchette de 20 à 40 °C ➔ Substrats : dNTP (dATP, dCTP, dGTP et dTTP) et des amorces d’ARN et d’ADN 12 Exemples d’ADN polymérases : 1) T7 ADN polymérase = ADN polymérase du bactériophage T7, constituées d’une protéine du phage (gène 5) et d’une protéine de la cellule-hôte (thioredoxine). Elles sont dépourvues de toute activité d’édition. Ce sont les plus rapides de toutes les ADN polymérases (incorporation de +/- 300 nucléotides par seconde). Elles sont utilisées dans les techniques de séquençage (Sanger). Elles sont responsables de quelques erreurs à défaut d’activité d’édition : de l’ordre de 1 mauvais appariement pour 1000 paires de bases. 2) Taq polymérase = Thermus aquaticus est une bactérie thermophile des sources chaudes du parc de Yellowstone. Ce sont des enzymes thermorésistantes, dont une DNApolymérase (Taq polymérase) résistante à l’ébullition et active à 75-80 °C. La Taq polymérase est dépourvue d’activités d’édition. Elle est inhibée par les ions phosphates. Elle est utilisée pour la réaction de polymérisation en chaîne (Polymerase Chain Reaction = PCR), technique courante d’amplification des fragments d’ADN. Elle est responsable de nombreux mésappariements : de l’ordre de 1 pour 100 paires de bases. 3) Reverse transcriptase = Les transcriptases inverses sont des DNA polymérases qui peuvent synthétiser un brin d’ADN complémentaire (ADNc ou cDNA) en prenant un ARN comme matrice, pour former un hybride ADN-ARN. Elles catalysent donc la réaction inverse de la transcription, d’où le nom de transcriptases inverses. Elles sont produites par des cellules infectées par des rétrovirus, virus à ARN qui font synthétiser un ADNc par la cellule-hôte afin de permettre leur réplication. Elle est utilisée pour l’étude des ARN. Après la synthèse de l’ADN complémentaire, on détruit l’ARN matrice, puis on soumet l’ADNc à l’amplification par la PCR, qui fournit une grande quantité d’ADNc hybridé avec une copie ADN de la séquence de l’ARN de départ. 13 1.5 Autres enzymes Protéinase K : = La protéinase K est une protéase végétale très active, même en présence de sodium dodecyl sulfate (SDS) ou d’EDTA. Elle n’a aucun effet d’hydrolyse sur les acides nucléiques. Elle hydrolyse (casse des liaisons chimiques en présence d'eau) les protéines de toutes origines en quelques heures avec une préférence pour les liaisons peptidiques situées après les acides aminés hydrophobes (leucine, par exemple). La protéinase K est utilisée dans les techniques de préparation et de purification des acides nucléiques. = Chauffer et centrifuger ne sont pas suffisants pour faire éclater toutes les cellules, et on rajoute donc du SDS et de la protéinase K dans la colonne avec le tampon d’extraction. Le SDS est un détergent qui permet de détruire la membrane de la cellule en elle-même, et la protéinase K permet de détruire les protéines comprises dans la membrane. Phosphatase alcaline : = Les phosphatases sont des enzymes à très large spécificité, hydrolysant le radical phosphoryle porté par une liaison ester ou anhydride (hydrolyse un groupement phosphate). Il y a plusieurs classes en fonction de leur pH optimum d’action (phosphatases acides, phosphatases alcalines). La phosphatase alcaline du commerce est celle extraite de l’intestin de veau. La phosphatase alcaline est utilisée au laboratoire pour déphosphoryler les extrémités 5’ des acides nucléiques, soit pour préparer un marquage en 5’ par une polynucléotide kinase, soit pour empêcher la circularisation d’un ADN circulaire linéarisé (vecteurs de clonage). 14 2 Chapitre 2 : Préparation des échantillons 2.1 Objectif accès à l’information génomique = L’analyse de l’ADN est un élément essentiel de l’élevage et des programmes d’enregistrement des animaux. Des analyses d’ADN très précises sont utilisées : ➔ Pour la filiation, parenté et identité ➔ Pour identifier des mutations de l’ADN liées à certaines maladies ➔ Pour identifier des mutations de l’ADN sur certaines caractéristiques des animaux (cartographie) 2.2 Préparation de l’échantillon = La première étape du processus d’analyse de l’ADN consiste à prélever un échantillon suffisamment grand et de bonne qualité. Chez les animaux on peut prélever plusieurs échantillons : Bulbe de poils, sang (prélèvement avec tube EDTA ou héparine), sperme (spermatozoïdes possèdent bcp d’ADN), écouvillons, cartilages, plumes, …. ➔ Remarque pour le sang : on va prélever des globules blancs car ils ont un noyau avec de l’ADN (chez animaux à sang chaud les GR sont sans noyau) = Des échantillons insuffisants ou de mauvaises qualités peuvent retarder l’enregistrement des animaux et engendrer des coûts supplémentaires d’échantillonnage, de transport et d’analyse en laboratoire. Follicule pileux : = Les follicules pileux sont privilégiés pour les échantillons utilisés dans les analyses d’ADN. Cette méthode d’échantillonnage est l’option la plus sécuritaire et la plus économique car : ➔ Elle est sans douleur et sans danger pour les animaux (plus simple pour prélever l’ADN d’un animal sauvage) ➔ Le prélèvement est simple et il peut être effectué sans l’aide d’un vétérinaire, contrairement aux prélèvements sanguins. ➔ Elle est non invasive et ne laisse pas d’ouverture susceptible de faire entrer des pathogènes comme c’est le cas des aiguilles utilisées pour les prélèvements sanguins. ➔ L’échantillon est facile à prélever et les coûts de transports jusqu’au laboratoire sont moindres puisqu’il peut être envoyé par la poste ordinaire. = Comment prélever un échantillon de poils de qualité ? : ➔ S’assurer que l’animal n’est pas mouillé lorsque vous prenez des échantillons de poils. L’humidité facilite la croissance des bactéries et le développement de la moisissure qui peuvent dégrader l’ADN de l’échantillon ➔ Retirer toute la terre ou les débris avant de prélever un échantillon sur un animal ➔ L’échantillon de poils devrait être collecté sur l’une des zones recommandées ➔ Prélever un échantillon de 50 à 60 poils d’une zone nettoyée. Ceux qui ne sont pas utilisés pour l’analyse seront archivés au laboratoire pour d’autres tests, au besoin. 15 ➔ Tirer fermement sur les poils dans le sens inverse de la pousse. Pour éviter d’avoir un ADN de qualité insuffisante, les poils doivent être arrachés et non coupés et ils ne doivent pas être brisés ou être tombés d’eux-mêmes. ➔ Vérifier la présence de follicules, des bulbes qui se trouvent à l’extrémité de la tige et dans lesquels on trouve l’ADN. Un examen plus attentif pourrait être nécessaire pour les animaux plus jeunes puisque leurs poils sont plus fins et que les follicules sont plus difficiles à voir. Prélèvements de cellules à l’aide d’écouvillons : 1) Bien rincer la bouche (si possible avec de l’eau). L’animal ne peut rien manger ou boire une heure avant le prélèvement. 2) Ouvrir avec prudence l’emballage. 3) Prendre l’applicateur de l’emballage et frotter avec l’applicateur deux fois à la gauche et deux fois au droit de l’intérieure de la joue de l’animal. 4) Tenir le tube debout et tournez le couvercle. Mettre l’applicateur dans le tube liquide. 5) Casser l’applicateur et mettez le couvercle sur le tube. 6) Un prélèvement d’un seul applicateur par animal suffit. 7) Identifier clairement les données sur l’étiquette du tube. 2.3 Extraction d’ADN génomique 2.3.1 Méthodes d’extraction = L’extraction d’acides nucléiques d’un matériau biologique requiert : la lyse cellulaire (ou tissulaire), l’inactivation des nucléases cellulaires (Déprotéinisation de la solution), la séparation de l’acide nucléique souhaité de débris cellulaires (Précipitation de l’ADN). Lyse des cellules ou des tissus : = Objectif : Libérer le contenu cellulaire (dont l’ADN) par broyage mécanique ou extraction chimique (utilisation de détergents avec micelles) = Dispersion des bicouches phospholipidiques membranaires (phospholipides avec un seul résidu d'acides gras), dénaturation des protéines dont celles associées à l’ADN dans la chromatine. On obtient une solution très visqueuse. 16 = La lyse idéale est souvent un compromis de techniques et doit être suffisamment rigoureuse pour briser le matériau de départ complexe (par exemple, le tissu), mais suffisamment douce pour préserver l’acide nucléique cible. Les procédures de lyse courantes sont : ➔ La rupture mécanique : On casse les cellules (ex : broyage ou lyse hypotonique) ➔ Le traitement chimique (ex : lyse détergente, agents chaotropiques) ➔ La digestion enzymatique : Elle vient casser les protéines (ex : protéinase K) Déprotéinisation de la solution : = Objectif : récupération de l’ADN, on fait une extraction par des solvants organiques. = On dénature la structure tridimensionnelle des protéines. Pour cela on met en contact notre lysat avec des solvants organiques (en général phénol et chloroforme). On va le vortexer puis le centrifuger à froid ce qui fait qu'on a deux phases : la phase aqueuse (avec l'ADN), la phase organique. Elles forment un précipité à l’interface phénol/eau. Précipitation de l’ADN : = Objectif : Purification de l’ADN par l’addition d’éthanol/d’isopropanol dans la phase aqueuse (mieux s'il est très froid pour faire un choc thermique) = L’ADN précipite dans l’éthanol/l’isopropanol (méduse d’ADN). Puis on fait un lavage de l’ADN par centrifugation. Récupération de l’ADN purifié en solution aqueuse. 17 2.3.2 Méthodes de purification = Par kit d’extraction sur colonne : L’ADN est précipité sur une membrane de silice de manière spécifique par ajout d’agents chaotropique. Celui-ci est ensuite purifié et lavé de tout contaminants. 2.3.3 En pratique ➔ Attention aux conditions de travail : risque de contaminations ➔ Port de gants ➔ Décontamination de la paillasse et des outils ➔ Disposition du matériel ➔ Identification des tubes Matériel nécessaire : ➔ Micropipettes et tips ➔ Portoirs pour tubes ➔ Centrifugeuse ➔ Vortex ➔ Plaque chauffante ➔ Poubelle Etapes : 1) Prélever la préparation cellulaire 2) Incubation 90 min (ou toute la nuit) à 50°C 3) Ajouter la solution d’extraction (détergent, protéinase K, phénol) 4) La solution devient trouble (précipitation des protéines) 5) Vortexer 6) Incubation sur glace 10 min 7) Centrifugation 5 min à 14 500 rpm (sens du tube, équilibre) 8) Garder le surnageant qui contient l’ADN (sans toucher le culot) 9) Ajouter 40 µL EtOH 100% 10) Mélanger les tubes par inversion 11) Incubation 5 min à température ambiante 12) Centrifuger 2 minutes à 14 500 rpm L’ADN précipite (le culot est normalement visible) 13) Vider le surnageant (sans toucher le culot) 18 14) Lavage avec EtOH 70% (lavage des sels) 15) Centrifugation 2 minutes à 14 500 rpm 16) Vider le surnageant (sans toucher le culot) : il va rester toujours un peu de liquide d'éthanol on va le sécher car il est toxique pour la suite des opérations 17) Séchage de l’ADN (étuve, pompe à vide, …) 18) Resuspension de l’ADN dans une solution aqueuse (solution tampon) 2.4 Quantification de l’ADN Pureté et dosage de l’échantillons : = Si extraction foirée on ne va pas lancer une PCR pour rien. On va donc mesurer l'absorption de la lumière par l'ADN à 260 nm (pour vérifier qu'il y a bien présence de l'ADN). Loi de Beer-Lambert : A = ε. l. C = Les acides nucléiques absorbent dans l’UV à λmax = 260 nm. En mesurant l’absorbance d’une solution d’acide nucléique pure à 260 nm, on obtient sa concentration à l’aide de l’équation de la loi Beer-Lambert. En pratique, c’est une équation modifiée qui est employée : Cm = (A. ε) / l ➔ Cm = concentration massique d’acide nucléique en ng/µl ➔ A = absorbance à 260 nm ➔ ε = coefficient d’extinction massique ou la constante en ng.cm/µl. Le coefficient d’extinction ε dépend de la séquence d’ADN ou d’ARN et est spécifique à chaque ADN/ARN ➔ l = trajet optique en cm = On va utiliser un NANODROP (technique de spectro moléculaire) qui mesure notre ADN sur une microgoutte 19 = Dans un laboratoire classique, on considère que des ratios A260/A280 et A260/A230 > 1,8 = matériel pur 2.5 Visualisation sur gel d’agarose 2.5.1 Principe = Migration de fragments d’ADN à travers un gel d’agarose sous l’influence d’un champ électrique (ADN se trouve dans un gel d'agarose et on va le faire migrer le long). Suivant la taille des fragments d’ADN, la vitesse de migration sera différente (les fragments les plus petits migreront plus vite et par conséquent plus loin dans le gel d’agarose). = Le gel est versé dans une boîte et des échantillons contenant les acides nucléiques que l'on souhaite séparer sont chargés dans des puits préfabriqués sur le gel. Une fois les échantillons chargés, une différence de potentiel électrique est appliquée aux extrémités du gel, ce qui crée un champ électrique qui fait migrer les molécules à travers le gel en fonction de leur charge et de leur taille. 20 2.5.2 Préparation du gel d’agarose 1) Peser 1,5g d’agarose (attention à faire refroidir agarose à 50 degrés) + 15 ml de TBE 10X + 135 ml d’eau déminéralisée → faire fondre en portant la solution à ébullition 2) Couler le gel sur un plateau (colmaté au masking tape) + placer les peignes 3) Quand le gel est pris, placer le gel dans la cuve (submerger le gel avec du TBE 1X) 4) Le gel est prêt à être chargé (Tampon TBE : Tris-borate-EDTA pH8). Les ions Borate sont présents pour favoriser le mvmt de l'ADN qui chargé. 2.5.3 Préparation des échantillons = Échantillon : L’ADN = Problèmes : Liquide dans liquide, incolore, besoin de faire une révélation 2.5.4 Tampon de chargement = Le glycérol : Il est excessivement lourd et va faire sédimenter ADN au fond du puit = Coloration des échantillons (pour savoir où en est l'ADN on va regarder des codes couleur) : Bromure d’éthidium/Gel Red qui est rendu visible sous UV = 3 colorants : Orange G, bleu de bromophénol, xylène Cyanol = Utilisation du Loading Buffer (concentré) 21 = Révélation de l’ADN par le bromure d’éthidium : Liaison du bromure d’éthidium à l’ADN en s’intercalant entre les bases de l’ADN double brin. Le bromure d’éthidium absorbe la lumière UV et émet de la lumière visible. = Alternative au bromure d’éthidium : Révélation de l’ADN par utilisation du gel red qui se lie à l’ADN en s’intercalant entre les bases de l’ADN double brin, et absorbe la lumière UV et émet de la lumière visible. 2.5.5 Etapes 1) Chargement des échantillons 22 2) Migration : Une différence de potentiel qui est mise sur l'ADN ➔ Tout ce qui est chargé négativement va chercher à rejoindre la borne + (et on sait que l’ADN est chargé négativement à cause de son groupement phosphate). ➔ Les plus petites molécules migreront plus rapidement et se retrouveront près de l'anode, tandis que les plus grandes molécules migreront plus lentement et se retrouveront près de la cathode (le gel crée des mailles pour empêcher la migration des molécules ce qui empêche les plus grosses molécules de passer) 3) Résultats : Une fois la migration terminée, les molécules sont révélées en utilisant des colorants spécifiques qui se lient à l'ADN, à l'ARN. Un appareil sous UV permet de visualiser les résultats du gel sous forme de photos. En comparant la taille des bandes obtenues avec des marqueurs de taille connue, on peut déterminer la taille des molécules séparées. Application : = Un échantillon contenant différents fragments d’ADN (12 pb, 250pb, 1050 pb et 3200pb) sont déposés sur gel. Quel sera le résultat observé ? 23 3 Chapitre 3 : La PCR 3.1 Introduction = Chercher à repérer un gène particulier dans un génome entier, qui en contient jusqu'à des centaines de milliers (notre cible de la PCR est dans une masse énorme), c'est un peu comme chercher une aiguille dans une meule de foin. La technique de PCR permet de réaliser cet exploit en multipliant spécifiquement le segment d'ADN d'intérêt (aussi appelé ADN cible) et symbolisé ici par l’épingle rouge dans le foin. = La PCR (Polymerase Chain Reaction) ou amplification d'ADN in vitro est une technique mise en œuvre à la fin des années 1980 par un chercheur, K.B. Mullis, qui a eu pour cela le Prix Nobel de Chimie en 1993. La rapidité avec laquelle ce Prix a été décerné est due au fait que la PCR est une technique qui a complétement révolutionné la façon de faire de la biologie moléculaire, que ce soit dans les laboratoires ou du point de vue des applications. En particulier la PCR a été à l'origine du développement de la génomique, notamment parce qu'elle a permis le développement du séquençage à haut débit. Plus généralement, la PCR est un outil de base du chercheur, que ce soit pour cloner des gènes, pour identifier des organismes et leur fonctionnement, pour analyser des génomes et repérer des maladies génétiques, pour la police scientifique, pour garantir la qualité des produits en particulier alimentaires etc... 3.1.1 Rappels 24 25 La dénaturation de l’ADN : = La dénaturation de l'ADN est le processus par lequel la double hélice de l'ADN se sépare en deux brins complémentaires. Cela consiste à déstabiliser et rompre les ponts H entre les bases azotées complémentaires. Ce phénomène peut se produire par différentes : Méthodes physiques (température), chimiques (NaOH). C’est un processus réversible (si on redescend la température) : il peut y avoir hybridation/renaturation (appariement des deux brins). 3.2 Principe 3.2.1 Définition de la PCR = La PCR (Polymerase Chain Reaction) est une réaction biochimique de synthèse ADN réalisée in vitro et de manière répétée, ce qui permet d'amplifier en grande quantité un fragment d'ADN à partir d'une matrice d'ADN qui contient ce fragment. = Elle permet d'obtenir, à partir d'un échantillon complexe et peu abondant, d'importantes quantités d'un fragment d'ADN spécifique et de longueur définie. L'ordre de grandeur à retenir est celui du million de copies en quelques heures. C'est, généralement suffisant pour une utilisation ultérieure. 3.2.2 Principe de la PCR = Comme tout processus de synthèse d'ADN, la polymérisation se déroule à partir d’une amorce d’oligonucléotide hybridée à une matrice simple brin d'ADN ; elle allonge le brin néosynthétisé de 5' en 3’. On ajoute des amorces spécifiques de notre segment d'ADN amplifié. Cette amorce vient se coller au simple brin. 26 = Les amorces oligonucléotidiques (ou oligonucléotides) sont des courts segments d'acides nucléiques (ARN ou ADN), longs de quelques dizaines de nucléotides. Ils sont en général obtenus par synthèse chimique, sous forme simple brin. (Attention dans le cas d'une réaction de PCR, on utilise uniquement des amorces constituées d'ADN). = L'originalité de l'approche de PCR est que le processus de synthèse de l'ADN est répété plusieurs fois successivement si bien que comme il y a duplication de l'ADN à l'issue de chaque cycle de synthèse, l'amplification de l'ADN est exponentielle. 3.2.3 Déroulement d’un cycle de PCR = 1 cycle (1 réaction) comprend 3 étapes : 1) Dénaturation de la matrice d'ADN (94-95°C, 30 secondes): La température est élevée pour séparer les deux brins d'ADN. Cette étape dénature l'ADN double brin en deux brins simples. 2) Hybridation de la matrice avec les amorces (température d'hybridation à définir au cas par cas, 30 secondes) : La température est abaissée pour permettre aux amorces (courtes séquences d'ADN complémentaires aux extrémités de la séquence cible) de se lier aux brins simples d'ADN. Ces amorces sont nécessaires pour initier la synthèse de nouveaux brins d'ADN. 3) Polymérisation d'ADN à partir des amorces et à l'image de la matrice (72°C, entre 30 secondes et 5 minutes selon la longueur du fragment d'ADN qui doit être amplifié) : La température est ensuite augmentée à celle d'optimal pour l'enzyme polymérase (par exemple, Taq polymérase). Cette enzyme commence à ajouter des nucléotides aux amorces, synthétisant ainsi de nouveaux brins d'ADN complémentaires aux brins simples. 27 ➔ Cet enchaînement d'étapes qui constitue un cycle d'amplification est reproduit successivement de 20 à 50 fois pour obtenir une amplification exponentielle de la séquence d'ADN cible. 3.3 Etapes de la PCR 3.3.1 Dénaturation = La dénaturation est la première étape d'un cycle de PCR. Elle consiste à séparer les 2 brins de l'ADN double brin en 2 simples brins par cassure des ponts H qui lient les bases complémentaires. Le contenu en GC augmente le temps de dénaturation (car ces bases forment trois liaisons hydrogène entre elles. Alors que A et T n’en forment que deux). En pratique cela dure 2 minutes mais il faut faire attention à ce que le temps ne soit pas trop long. Tm : = température de demi-dénaturation (température à laquelle 50 % des brins d'ADN double brin se séparent pour former des brins simples) = melting temperature (température à laquelle l’ADN double brin se dénature) = Tm dépend de la composition en bases de la séquence ADN considérée (Si GC plus long) 3.3.2 Hybridation (annealing) = Besoin de 2 amorces spécifiques : sens et anti-sens (2 Tm). Chaque amorce fait de 15 à 25 nucléotides environ. L’hybridation se fait de part et d’autre de la séquence cible. En pratique, ça dure 30 secondes. = Ces oligonucléotides doivent avoir des températures d’hybridation voisines. La température d’hybridation est variable (45 - 65 °C) : La température d’hybridation (annealing = Ta), est inférieure de 5° à la température de demi dénaturation. Attention la Ta ne doit pas être : 28 ➔ Trop basse : Une température basse peut faire que si les amorces sont totalement complémentaires elles peuvent se coller partout (par ex plus de puits sur gel électrophorèse). La spécificité diminue mais la sensibilité augmente. ➔ Trop haute : Si on chauffe trop les amorces ne savent pas se coller sur ADN cible. La spécificité augmente mais sensibilité diminue Spécificité et sensibilité : ➔ Spécificité : Fait qu’une seule partie du chromosome est amplifiée ➔ Sensibilité : Jusqu'à quel niveau notre ADN peut être amplifié 3.3.3 Polymérisation (élongation) = Synthèse de l’ADN grâce à la polymérase. Cette étape se déroule à une température optimale pour l'enzyme (La température de polymérisation de cette Taq polymérase est de 72°C). Elle effectue la polymérisation à partir de l’extrémité 3’ OH libre d’une amorce (le dernier nucléotide du primer doit l'avoir à tout prix sinon ne fonctionne pas) en ajoutant des nucléotides aux amorces dans le sens de synthèse, 5’ vers 3’. Ce qui synthétise de nouveaux brins d'ADN complémentaires. 29 3.3.4 Etapes : résumé 3.4 Conditions expérimentales 3.4.1 Choix des amorces = Le choix des amorces, qui est évidemment crucial, est entre les mains de l'expérimentateur. Pour définir et faire synthétiser les amorces, il faut en général connaître la séquence du fragment que l'on veut amplifier. A partir de la séquence disponible, il faut déterminer les enchaînements nucléotidiques à partir desquels la polymérase pourra synthétiser de novo les brins d'ADN. = Les amorces doivent donc être complémentaires des brins d'ADN existants et "orientées" dans le "bon" sens de façon à permettre la synthèse d'ADN de 5' en 3'. = Les amorces utilisées pour la PCR ont des longueurs habituellement comprises entre 17 et 25 pb, selon les applications pour lesquelles elles sont définies. Les amorces sont obtenues par synthèse chimique et à la demande, c'est-à-dire selon la séquence que définit l'expérimentateur. = Commander une amorce se fait par internet et revient à 5-10 euros, livraison comprise. 3.4.2 Température d'hybridation des amorces = La température d'hybridation des amorces avec la matrice est déterminante. Elle conditionne l'existence et la spécificité de l'amplification de l'ADN. ➔ Si la température d'hybridation est trop élevée, les amorces ne s'hybrideront pas avec la matrice et la synthèse d'ADN ne pourra pas s'enclencher. ➔ Si la température d'hybridation est trop basse, les amorces risquent de s'hybrider non seulement à la position choisie mais aussi de manière non spécifique avec d'autres régions d'ADN de séquence proche de celle qui a été sélectionnée. On risque alors une amplification de fragments d'ADN autres que celui qui intéresse l'expérimentateur. Méthode pour calculer la température d'hybridation des amorces : = Une formule, simplifiée à outrance, du calcul de la température optimale d'hybridation d'une amorce est, en degrés Celsius : Tm = 4 (G+C) + 2 (A+T) 30 ➔ Où G, C, A et T sont respectivement les nombres de bases G, C, A et T composant l'amorce. Ainsi, pour une amorce qui contiendrait 5 fois chacune des bases, la température optimale d'hybridation serait : Tm = 4 x 10 + 2 x 10 = 60°C 3.4.3 Réalisation pratique d'une réaction de PCR = De quoi a-t-on besoin pour amplifier une séquence d’ADN par PCR ? = Pour réaliser une réaction de PCR, il faut établir le mélange réactionnel suivant : ➔ L’ADN matrice ➔ Les amorces oligonucléotidiques à partir desquelles la polymérisation de l'ADN s'enclenche ➔ Les désoxyribonucléotides qui sont incorporés dans l'ADN (dATP, dCTP, dGTP et dTTP) ➔ La TAQpolymérase ➔ Une solution tampon appropriée au bon fonctionnement de la TAQpolymérase. + un thermocycleur 3.4.3.1 L’ADN matrice = Le fragment d'ADN qui est amplifié est celui qui est physiquement délimité par les deux amorces oligonucléotidiques. C’est un fragment d'ADN spécifique et de longueur définie et dont les extrémités doivent être connues. = En théorie une copie ADN de la séquence recherchée est suffisante pour avoir une amplification, il faut cependant tenir compte de la probabilité de « rencontre » des molécules d’ADN matrice avec les amorces. Dans la pratique plusieurs copies sont nécessaires pour avoir un résultat correct. Mais attention, la mauvaise qualité et/ou une quantité trop importante d’ADN matrice peut conduire à une amplification aspécifique, voire à une inhibition enzymatique. Il est possible d’expliquer cette inhibition par la présence de contaminants provenant de l’échantillon ou des réactifs utilisés dans les protocoles d’extraction d’ADN. 31 3.4.3.2 L’ADN polymérase = Taq polymérase est une enzyme obtenue à partir de la bactérie thermophile Thermophilus aquaticus qui résiste aux hautes températures (stable à des températures proches de 100°C). = Elle nécessite un ADN matrice (dénaturé) et elle synthétise le fragment d’ADN complémentaire à partir d’une amorce. = Elle lit dans le sens 3’ →5 et synthétise dans le sens 5’→3’ : Elle Ajoute des désoxy ribonucléotides A, T, C G (dNTPs ou dATP, dTTP, dCTP et dGTP) = Il existe différents types de Taq Polymérase commercialisés. Elles sont protégées par des brevets. Elles présentent des fiabilités, des vitesses de synthèse et donc des coûts différents. Une TAQpolymérase "classique" synthétise 2000 bases par minute pour un coût compris entre 0,1 et 0,5 euros par réaction de PCR. Il faut tenir compte de la vitesse de synthèse d'ADN pour déterminer la durée de l'étape de polymérisation de l'ADN réalisée à 72°C. De nos jours, les enzymes utilisées sont dites recombinantes, ce qui simplifie considérablement leur obtention, et leurs propriétés ont été largement modifiées pour les rendre plus efficaces et plus fidèles. 3.4.3.3 Les amorces = Ce sont des séquences d’ADN simple brin ayant une extrémité libre (chaque amorce a une extrémité qui est complémentaire à la séquence cible d'ADN et qui s'hybride à celle-ci pour initier la synthèse de nouveaux brins d'ADN). Une amorce est composée de 20 à 40 nucléotides. Les amorces sont spécifiques à la séquence cible à amplifier. Il en faut 2 (une sens et une anti-sens) ➔ Correspondent à des séquences situées de part et d’autre du segment d’ADN à amplifier et sur des brins opposés. 32 3.4.3.4 Tampons Composition : ➔ Du tris-HCl à pH basique 8,5 à 9 qui maintenir stable le pH du milieu réactionnel au niveau optimal pour la Taq polymérase ➔ Des cations bivalents Mg2+, cofacteurs indispensables pour la réaction de polymérisation avec la Taq polymérase ➔ Des cations monovalents (K+ ou NH4+) vont neutraliser les charges négatives des groupements phosphates au niveau de l’ADN et ainsi stabiliser les hybrides ADN/ADN. La concentration en sel doit cependant rester compatible avec l’activité de l’ADN polymérase. 3.4.3.5 Les dNTPs 3.4.3.6 Le thermocycleur = La réaction de PCR est réalisée grâce à un appareil appelé thermocycleur. Un thermocycleur n'est rien d'autre qu'un bain marie perfectionné qui peut changer rapidement de température pour respecter les consignes de température et de durée choisies par l'expérimentateur. 33 3.4.4 Optimisation d’une PCR = Pour optimiser une réaction PCR, il faut veiller à certains critères : ➔ Gamme de concentration en MgCl2 (cofacteur de la polymérase) ➔ dNTP en général 200 μM en concentrations identiques pour les 4 dNTP ➔ Choix et concentrations des amorces (critère le plus important) ➔ Gamme de températures d’hybridation ➔ Concentration de l’ADN matrice : S’il y a trop ou pas assez de matériel génétique, la polymérase sera inhibée et la PCR ne fonctionnera donc pas. Facteurs qui influencent la Température d’hybridation (Ta) : = Facteurs intrinsèques au fragment d’ADN : ➔ Pourcentage en G et C : Plus il y a de G et de C dans le fragment concerné, et plus le Tm est élevé car il y a 3 liaisons hydrogènes entre C et G (au lieu de 2 entre A et T). ➔ Longueur du fragment : Plus le fragment d’ADN est long, plus il faut d’énergie pour le dissocier, et donc plus le Tm est élevé. = Facteurs extrinsèques au fragment d’ADN : ➔ Autres facteurs : Le milieu dans lequel se situe le fragment d’ADN influence sur la valeur du Tm. Par exemple, les calculateurs de Tm prennent en compte (lors de la conception d’amorces) la concentration en sels et la concentration en amorces elles-mêmes lors de leur calculs (en plus des 2 facteurs intrinsèques que sont la longueur et le pourcentage en G et C). Plus les concentrations en sels et/ou en amorces sont élevées, plus Tm est élevé. 3.5 Visualisation 3.5.1 Révélation de la PCR = On réalise une électrophorèse sur gel d’agarose (polymère de sucre). L’ADN étant naturellement chargée négativement, les fragments vont migrer de la borne négative vers la borne positive grâce au champ électrique. L’agarose contenu dans le gel va former une sorte de maillage, ce qui va permettre une séparation des différents fragments sur base de leur taille. Plus le fragment d’ADN est petit, plus il a tendance à migrer vite car il passe plus facilement à travers les mailles de l’agarose, et inversement. La quantité d’agarose dans le gel influence aussi car, plus il y a d’agarose, plus les mailles vont être serrées et plus les fragments d’ADN auront des difficultés à passer. Par exemple, si les fragments à différencier n’ont pas beaucoup de paires de bases de différence, il veut mieux prendre un gel avec une grande quantité d’agarose (5% environ) pour pouvoir les distinguer plus facilement. → Tampon = TBE (Tris Borate EDTA) 34 3.5.2 Analyse = On utilise du Gel Red, qui est un agent intercalant, fluorescent sous UV, et qui nous permet de visualiser la position des fragments d’ADN dans le gel après l’électrophorèse. Agent intercalant : C’est une molécule qui est capable de s’insérer entre les bases appariées d’un acide nucléique. = Le produit d’une réaction PCR est un fragment de taille déterminée. La taille du fragment dépend de la distance séparant les amorces utilisées pour réaliser l’amplification. Pour visualiser le résultat d’une expérience de PCR, il suffit donc de faire migrer le mélange réactionnel sur un gel d’agarose et de rechercher la présence d’un fragment correspondant à la taille attendue. 35 3.6 Les empreintes génétiques 3.6.1 Contexte = L’identification des chiens et des chats par puce électronique ou par tatouage est obligatoire, permettant un suivi des animaux domestiques. = Les avantages de cette technique sont : ➔ Degré de fiabilité élevé ➔ Grand nombre d’informations obtenues ➔ Possibilité de compléter l’information d’identité par, éventuellement, le dépistage de maladies ou de traits Complexité du génome : = Chaque gène est localisé sur une position particulière du génome (appelé Locus) = Chez l’Homme, on dénombre plus ou moins 18 000 gènes pour 39 paires de bases (10% de codant). En général, il y a une relation de complexité entre l’organisme et la taille de son génome. Mais ce n’est pas toujours le cas, car on peut retrouver de longues séquences non codantes répétées. = Chez les mammifères, on les classes en 2 catégories : ➔ ADN à faible nombre de copies (low copy number DNA) : Peu de répétitions ➔ ADN à haut nombre de copies (high copy number DNA) : Beaucoup de répétitions = Les organismes les plus complexes ont une densité génique décroissante. Si on prend par ex Escherichia coli : Les procaryotes ont un tout petit génome donc les parties de leur génome doivent être utile. Exon : = C’est un segment d’un précurseur ARN qui est conservé dans l’ARN après épissage, et que l’on retrouve dans l’ARN mature du cytoplasme. Un exon correspond à ce qui va être exprimé. Intron : = C’est une portion d’un gène non codante, située entre 2 exons, et qui permet la création de nombreuses protéines différentes (Chez les humains, on retrouve majoritairement des introns). 36 3.6.2 Les séquences répétées = Dans le génome de tout individu, il y a une mise en évidence des marqueurs génétiques constitués par des séquences répétées de bases (C, T, A ou G). La longueur de ces marqueurs est variable en fonction du nombre de bases qui les constituent. Ces séquences répétées, également appelées microsatellites, se transmettent en groupes inséparables de génération en génération. = Chez l’humain, ces séquences répétées représentent 10% du génome. Ce sont des séquences plus ou moins longues, appelées noyaux, motifs ou encore unités de répétition (ex : GAAA), et elles se répètent successivement un certain nombre de fois (ex : GAAAGAAAGAAAGAAA). = Parfois, ces séquences se trouvent à proximité de gènes codants et une modification du nombre de répétitions peut alors entrainer des répercussions cliniques. Par exemple, la maladie de Huntington où il y a atteinte neurodégénérative héréditaire, caractérisée par une expansion de triplets CAG supérieure à 30 dans le gène HTT de l’huntingtine. = Il y a 2 types de séquences répétées (en fonction de la taille du motif) : ➔ Les minisatellites ou VNTR (Variable Number Tandem Repeat) : Ils contiennent un motif de 9 à 80 bases. Répétés plus de 3000 fois, ils sont instables et donc variables d’une génération à l’autre (polymorphisme). ➔ Les microsatellites ou STR (Short Tandem Repeat) : Ils contiennent un motif de 1 à 9 bases. Ce sont ces dernières qui sont utilisées pour l’identification des individus par empreinte génétique. En faible cluster (10 à 40 paires de bases), de longueurs variables en raison du « glissement » de la polymérase (polymorphisme). = Les minisatellites (VNTR) étant plus grands, ce sont des zones instables auxquelles on ne peut pas réellement se fier. À l’inverse, les microsatellites (STR) sont beaucoup plus stables car ils sont plus petits, ce qui permet de les utiliser plus facilement pour les tests de filiation ou autres. Polymorphisme : = C’est la capacité d’un gène à prendre différentes formes. Cette variation du nombre de répétitions se présente d’un individu à un autre, au sein d’une même population. Par exemple, pour une position génomique donnée, un individu (bleu) pourrait avoir sur son chromosome paternel la répétition (CG)6 et sur son chromosome maternel la répétition (CG)8. Un autre individu (rouge) pourrait porter sur ses chromosomes les allèles (CG)6 et (CG)9. 37 = L’identification de plusieurs régions répétées au sein du génome permet d’associer à un individu une combinaison unique. Une palette de 13 loci + 2 loci sur les chromosomes sexuels est aujourd’hui utilisée par la police scientifique pour identifier n’importe quel individu. = Le caryotype ci-contre montre la position et le nom de ces microsatellites sur les chromosomes : Réalisation de l’empreinte génétique : = Pour créer une empreinte génétique, il suffit de : ➔ Mesurer la taille de ces 13 régions répétées en les amplifiant par PCR. ➔ Pour chaque microsatellite, on utilise un couple d’amorces flanquant le microsatellite en question. ➔ Une des 2 amorces est couplée à un fluorochrome qui permet ensuite l’identification de la séquence (va émettre à une certaine longueur d'onde de la fluorescence). Analyse de fragments : = L’analyse des fragments PCR se fait à l’aide d’une électrophorèse capillaire. Les fragments migrent dans un capillaire plus ou moins vite et leur temps de passage est mesuré lors de la détection du fluorochrome par un laser. Les résultats sont représentés par des pics de fluorescence dont la position sur l’axe des abscisses correspond à la taille du microsatellite. ➔ Les petits fragments d’ADN migrent plus vite, alors que les gros fragments d’ADN migrent plus lentement. En mesurant le temps nécessaire au déplacement des fragments, on peut donc déterminer la taille de ceux-ci. 38 = Par exemple, un individu homozygote pour le locus VWA. À ce locus, cet individu possède 4 répétitions TCTG à la fois sur le chromosome maternel et sur le chromosome paternel. Son génotype pourrait s’écrire : (TCTG)4 / (TCTG)4 ➔ La PCR amplifie des amplicons tous de la même taille et un seul pic est détecté avec l’analyse de fragments. = Si l’individu est hétérozygote avec le génotype suivant : (TCTG)4 / (TCTG)5, on observe 2 pics et une diminution des amplitudes. Créer une empreinte génétique : = Pour créer une empreinte génétique, il faut : ➔ Faire la même chose pour les 13 loci ➔ Faire une PCR multiplexe en mélangeant tous les couples d’amorces et en discriminant chaque locus à l’aide de 4 fluorochromes différents, ainsi que par des tailles de microsatellites différentes. ➔ Faire un traçage de l’ensemble des pics, on obtient l’empreinte génétique. ➔ La probabilité que 2 individus (non jumeaux) aient le même profil est extrêmement faible, de l’ordre de 10-10 = Procédé et kit d'identification d'un chien par l'analyse d'un échantillon biologique (ex : analyses de selles où on peut retrouver le propriétaire du chien) 39 40 Il est également possible d’indiquer les probabilités d’obtenir un jeune avec un polymorphisme précis. La précision des probabilités est très forte quand les tests sont bien réalisés (hautement significatifs). S’il s’agit d’une reproduction sexuée, cela signifie que le jeune possède un gène du père et un gène de la mère. Pour chaque chromosome, il peut y avoir jusqu’à 4 combinaisons de gènes différentes. 41 3.7 Techniques de PCR dédiées à certaines applications 3.7.1 RT-PCR ou reverse transcription-PCR = Il s’agit d’une amplification à partir d’ARN. La PCR est une technique qui amplifie des fragments d’ADN, il faudra donc faire une reverse transcription pour pouvoir étudier l’ARN par PCR. Cette reverse transcription (transformer l’ARN en ADN) est nécessaire, car l’ADN est stable lors de la manipulation, alors que l’ARN ne l’est pas. (De l’ARN en dehors d’une cellule est un phénomène qui ne doit pas se produire. Quand ça arrive, cela veut souvent dire qu’il y a la présence d’un virus). Principe : = Une enzyme, la transcriptase inverse, transforme l’ARN messager (ou autre : ribosomal, viral) en son ADN complémentaire, l’ADNc. Cet ADNc pourra être amplifié par la technique de PCR déjà décrite. Cette enzyme fonctionne de la même manière que l’ADN polymérase, c’est-à-dire qu’elle nécessite la présence d’une amorce hybridée à la cible pour pouvoir exercer son activité. 42 Deux possibilités d’amplification : One-step RT-PCR Two-step RT-PCR Schéma général Etapes Deux étapes dans le même tube : Deux étapes séparées : Il y a d’abord La reverse transcription (RT) et la un reverse transcription (RT) dans un PCR sont réalisées en une seule 1er tube, puis une PCR dans un 2ème et même étape. tube. Avantages ➔ Il y a moins de risque de ➔ L’efficacité est plus grande car les contamination car il y a moins deux réactions sont réalisées de pipetage à réaliser. séparément. Inconvénients ➔ Il y a beaucoup de produits ➔ Cette technique prend plus de dans un seul et même tube, temps et coute plus cher. donc l’efficacité est moindre. ➔ Il y a un plus grand risque de contamination et une perte génétique à chaque pipetage. Les 3 types d’amorces : = Oligo(dT) : Primer qui se colle lorsqu’il y a une suite de nucléotides A. (Ne marche pas avec la two steps) = GSP (gene specific primer) : Utilisation d’un primer spécifique qui ciblera un endroit précis de l’ARN. = Random hexamer : Utilisation d’un primer dégénéré qui peut se coller à différents endroits sur l’ARN. Cette amorce est utile si le fragment est segmenté (endommagé ou avec des mutations). (Ne marche pas avec la two steps). 43 3.7.2 PCR nichée (nested PCR) Principe : = La PCR nichée (nested PCR) est une méthode d’amplification au cours de laquelle le produit issu d’une première PCR est de nouveau amplifié à l’aide d’un second couple d’amorces. Ce second couple d’amorces s’hybride à une partie interne (nested ou nichée) de la séquence amplifiée. = Cette technique de PCR nichée se pratique comme la PCR avec le couple d’amorces externes pour quelques dizaines de cycles d’amplification. À cette étape, on ajoute un excès d’une ou deux amorce(s) internes avant de prolonger l’amplification pour encore 30 cycles environ. Cette procédure permet le plus souvent d’obtenir l’amplification spécifique d’un seul fragment. 44 Intérêts : = La sensibilité de la méthode est considérablement augmentée, puisque 2 PCR successives sont réalisées, et qu’il y a donc 2 couples d’amorces qui sont utilisés : Des amorces externes dont la spécificité peut permettre d’amplifier en une fois un petit nombre de séquences homologues et des amorces internes permettant d’amplifier spécifiquement une des séquences révélées par le couple d’amorces externes. = Cette technique est initialement utilisée pour « réduire » le risque de contamination : le fragment cible devait pouvoir interagir avec 2 couples d’amorces, donc 2 niveaux de spécificité. Maintenant, cette technique est très utilisée par les virologues travaillant sur les virus à ARN qui peuvent avoir une haute mutabilité. Le 1er couple d’amorces est conçu pour pouvoir accrocher les quelques parties stables du génome viral, et le 2ème couple d’amorces permet d’identifier le sous-type. Elle permet aussi une meilleure sensibilité du résultat. = En pratique, le risque de contamination peut être accru suite à l’ouverture plus fréquente des tubes PCR (plusieurs dizaines de milliers à plusieurs millions de copies de la cible). Limites : Le risque de contamination est considérable. Pour effectuer la 2ème PCR, il est nécessaire d’ouvrir le tube afin d’ajouter le deuxième couple d’amorces. 3.7.3 PCR de microsatellites Microsatellites : = Ce sont des courtes séquences répétées d’ADN, faisant entre 2 et 5 paires de bases, et qui possèdent des polymorphismes de longueur. Marqueur : = C’est une variation du nombre de répétitions, qui varient en fonction de l’individu. Un marqueur est unique car les séquences de part et d’autre du marqueur sont uniques. 45 3.7.4 Amplification par PCR en temps réel Principe : = Avant l’apparition de la PCR en temps réel, on utilisait la PCR en point final : 1) ADN amplifié 2) Analyse des produits 3) Mise en évidence d’un mutation/polymorphisme = Maintenant, on utilise la PCR en temps réel, qui nécessite une seule étape. Il y a un suivi en temps réel de toutes les étapes de la PCR, et la détection du signal se fait après le traitement des données. 1) ADN amplifié 2) PCR avec détection et amplification d’un signal fluorescent dont l’intensité d’émission est proportionnelle à la quantité de produits amplifiés. 46 = La réaction d’amplification de la séquence d’ADN cible suit les mêmes étapes qu’une PCR classique. La PCR en temps réel utilise une sonde fluorescente (amorce spécifique qui est légèrement fluorescente) qui permet la quantification et la caractérisation de l’amplicon formé en temps réel. Avantages de la PCR en temps réel : ➔ Grande sensibilité (on est capable de dire le nombre de molécules qu'il y avait ai départ dans le tube) et grande spécificité ➔ Réduction des risques de contamination (absence de manipulation en post-PCR) ➔ Capacite de multiplexage (techniques qui permettent de détecter et de quantifier simultanément plusieurs cibles biologiques, comme des gènes, des ARN ou des protéines, dans un même échantillon) ➔ Choix de nouvelles chimies de détection des produits amplifiés ➔ Rapidité de l’amplification : 30 à 60 minutes pour amplifier 25 à 30 cycles ➔ Capacité d’analyse qualitative (qualité des fragments amplifié) et quantitative des acides nucléiques ➔ Permet l’analyse à haut débit ➔ Excellente homogénéité de température pour les différentes étapes d’un cycle ➔ En termes de coût, la PCR en temps réel permet un gain de temps en main-d’œuvre considérable et une économie réelle au niveau du matériel utilisé dans d’autres étapes de PCR, comme l’étape de détection des produits amplifiés. Deux types de quantification des acides nucléiques : ➔ Quantification relative : Comparer les niveaux d'expression d'un gène d'intérêt par rapport à celui d'un ou plusieurs gènes de référence ➔ Quantification absolue : Déterminer le nombre exact de copies d'un acide nucléique cible dans un échantillon. Méthode la plus chère mais la plus précise Principaux appareils actuellement utilisés pour la PCR en temps réel : = Plusieurs automates ont été développés pour l’étude qualitative et quantitative des acides nucléiques par PCR en temps réel. Ces automates sont généralement composés d’un thermocycleur, d’un compartiment permettant la détection de la fluorescence, d’une station de travail qui va permettre le traitement du signal Différentes chimies utilisées : = Plusieurs systèmes sont utilisés pour la détection ou la quantification du signal fluorescent en temps réel, et sont divisés principalement en 2 groupes : ➔ Les agents intercalants : Ce sont des molécules chimiques capables de se fixer sur l’ADN double brin en s’intercalant entre les deux hélices. Ex : le SYBRGreen ➔ Les systèmes qui utilisent les sondes d’hybridation marquées par un fluorophore : Ce sont des séquences nucléotidiques simple brin capables de reconnaitre leurs séquences homologues dans le génome. Ex : les sondes TaqMan, les sondes d’hybridation FRET 47 3.7.4.1 SYBRGreen = Molécule qui se lie à l’ADN double brin, et qui fait partie de la catégorie des agents intercalants (comme le bromure d’éthidium BET par exemple) c’est un fluorophore particulier qui fluore dans le vert. Dans les réactions de PCR en temps réel, cet agent s’accompagne d’une augmentation du signal fluorescent quand il est lié à l’ADN double brin. Ce colorant permet la détection et la quantification de produits amplifiés. Principe : = Au cours de l’hybridation des amorces, puis de l’extension réalisée par l’ADN polymérase, ce colorant s’intercale entre les 2 brins d’ADN nouvellement synthétisés et émet une fluorescence (quand seul dans la solution il n'est pas fluorescent mais quand il rencontre l’ADN double brin il sait s'intercaler dans cet ADN double brin et quand il est lié à lui il va être fluorescent). La quantité du signal fluorescent, lorsqu’elle est suivie en PCR en temps réel, est augmentée proportionnellement au nombre de produits amplifiés formés (effet quantitatif). Cette émission de fluorescence décroit complètement à l’étape de dénaturation du cycle suivant. L’acquisition de la fluorescence est réalisée une fois par cycle à une température déterminée en général entre 70 °C et 90 °C (selon le Tm calculé du produit amplifié) juste après la fin de l’extension par l’enzyme. = Il y a une corrélation directement proportionnelle entre la quantité d’ADN présente dans le tube et l’intensité de la fluorescence. Exemple : 40 cycles d’amplification (240) = 1.099.510.000.000 molécules → Fluorescence émise pour se multiplier par le nombre de molécules intercalées entre les 2 brins d’ADN. 48 Avantages : ➔ L’agent intercalant le plus fréquemment utilisé en PCR en temps réel ➔ Toxicité pour le manipulateur moindre qu’avec le bromure d’éthidium (BET) ➔ Plus grande sensibilité (insensible au mésappariement des produits entre eux) ➔ Compatibilité avec les spectres de fluorescence des instruments employés ➔ Insensible à la présence de mésappariements au niveau de l’ADN ➔ Ne nécessite aucune expertise pour la mise au point de la technique, contrairement aux sondes fluorescentes ➔ Économique : La moins chère ➔ Grande facilité d’utilisation Inconvénients : ➔ Absence totale de spécificité : Ce produit s’intercale entre 2 molécules d’ADN double brin, quelles qu’elles soient (les produits d’amplifications spécifiques, les produits non spécifiques ou, tout simplement les dimères d’amorces). Cependant, l’optimisation du dessin des amorces permet de réduire considérablement la formation de dimères d’amorces. ➔ La fluorescence est dépendante de la masse moléculaire d’ADN : Pour la même réaction de PCR, les produits amplifiés longs fixent davantage de molécules fluorescentes que les fragments courts. ➔ Le SYBRGreen ne permet pas de différencier 2 fragments de même taille (allèle par ex.) au cours d’une PCR multiplex. 49 3.7.4.2 Sondes d’hybridation ou sondes FRET = FRET (Fluorescent Resonnance Energy Transfert) : C’est un transfert d’énergie par résonnance fluorescente. Ce système est basé sur l’emploi de 2 sondes linéaires complémentaires d’une séquence cible. Les 2 sondes sont marquées par 2 fluorochromes : ➔ Une sonde est marquée en 3’ par un marqueur fluorescent, qui émet une fluorescence verte. ➔ Une sonde est marquée en 5’ par un marqueur fluorescent, qui émet une fluorescence rouge. = Il s’agit d’une hybridation « tête à queue » sur l’ADN cible. Il y aura une proximité des fluorochromes et un transfert d’énergie, ce qui entrainera une fluorescence rouge. Principe : = Cette technique est réalisée via 4 étapes : a) Phase de dénaturation, la fluorescence n’est pas détectée à 640 nm b) Mesure de la fluorescence à l’étape d’hybridation. c) Dénaturation des sondes par la polymérase à l’étape d’élongation. d) À la fin de l’étape d’élongation, l’ADN est double brin et les sondes d’hybridation sont trop éloignées pour permettre le transfert d’énergie par résonnance fluorescente (FRET). Avantages : ➔ Permet la détection de mutations ou de polymorphismes ➔ Excellente sensibilité ➔ Grande capacité de multiplexage ➔ Utilisée aussi bien pour la détection de mutation que pour la quantification des gènes ➔ Spécificité du signal fluorescent Inconvénient : = Ces sondes ont un prix élevé comparé aux autres chimies utilisées en PCR en temps réel vu qu’elles sont beaucoup plus spécifiques. Applications : ➔ Détection de polymorphisme ou de mutations ponctuelles ➔ Détection et quantification d’agents pathogènes comme les virus, les bactéries et certains parasites ➔ Quantification de l’expression des gènes 50 3.7.4.3 Sondes TaqMan (sondes à hydrolyse) = Les sondes d’hydrolyse sont les sondes les plus fréquemment utilisées pour la détection de mutations ponctuelles ou la quantification de gènes. La sonde fait environ 15 à 30 bases, mono brin et linéaires marquées par 2 fluorophores : un émetteur et un extincteur (ou quencher). Le quencher étant à proximité du donneur, il inhibe l’émission de fluorescence par ce dernier (phénomène d'absorption de fluorescence : trou noir du fluorophore. Grâce à l’activité exonucléasique de l’ADN polymérase (activité 5'-3' exonucléase), celle- ci hydrolyse la sonde (dans la réaction 5’→3’). Le fluorophore donneur, suffisamment éloigné de l’action du quencher, émettra un signal fluorescent mesurable par l’instrument. Avantages : ➔ Sensibilité élevée ➔ Coute moins cher que FRET car une seule sonde ➔ Grande spécificité d’hybridation de la sonde fluorescente à sa séquence d’ADN complémentaire, ce qui réduit considérablement le bruit de fond fréquemment observé en présence de dimères d’amorces ou des mésappariements divers. ➔ Meilleure capacité de multiplexage puisqu’il est possible de distinguer plusieurs produits amplifiés dans un même tube mais détectés par des sondes ayant des fluorophores avec des longueurs d’ondes différentes. ➔ Sondes largement utilisées, aussi bien pour la détection de mutations ponctuelles ou de polymorphismes bi-alléliques, que pour la quantification des gènes. Inconvénients : ➔ Système qui hydrolyse irréversiblement les sondes. Par conséquent, cette technique ne peut être utilisée pour effectuer une courbe de fusion en post-PCR. ➔ Diminution de l’efficacité de ces sondes pour la détection de certaines mutations localisées dans les régions du génome comportant des séquences répétées ou très riches en bases AT ou CG (nécessite l’emploi de sondes ayant de longues séquences). 51 3.8 Contrôles = Pour chaque série de PCR, il est indispensable d’effectuer un contrôle positif et, de préférence, un ou plusieurs contrôles négatifs. Contrôle positif : = On utilise un ADN témoin connu qui permet de vérifier les bonnes conditions de préparation du mélange réactionnel, d’amplification et de détection. Il faut un nombre de copies raisonnablement faible afin de contrôler la sensibilité de la méthode. (Lors du premier test d’un ADN, il n’y a pas besoin de faire un contrôle positif étant donné que cet ADN n’a jamais été amplifié au préalable). Contrôle négatif : = Il existe 2 possibilités : ➔ Soit un tube contenant tous les réactifs et l’enzyme mais sans ADN. Il permet de s’assurer qu’aucun réactif et qu’aucune enzyme ne sont contaminés. C’est le contrôle négatif le plus utilisé. ➔ Soit, en plus des réactifs et de l’enzyme, un ADN témoin, non amplifiable avec les amorces utilisées, est ajouté. Il permet de vérifier la spécificité de la réaction. = L’évolution des techniques, l’apparition de la PCR en temps réel et une certaine automatisation ont eu pour effet de rendre ces précautions moins drastiques. Il convient toutefois de toujours garder ce risque à l’esprit. = Le contrôle négatif doit toujours être mis dans l’un des derniers puits. Il doit être mis en dernier, lorsque tous les autres pipetages ont été réalisés. Ainsi, si une erreur à été commise pendant l’un des pipetages, on s’assurer que l’erreur sera visible. 3.9 Applications de la PCR Applications d’une PCR « classique » sur gel : = La PCR est une technique qui permet le diagnostic concernant la présence d’une entité biologique déterminée : diagnostic médical (détection de pathogènes,...), détection de contaminants alimentaires (bactéries pathogènes, OGM, espèces animales,...) = La PCR est également utilisée pour le clonage moléculaire d’un fragment d’intérêt dans un plasmide : Contrôle (témoin) positif pour PCR, expression de protéines en vue d’études fonctionnelles 52 Limites : ➔ Pas d’information sur la cinétique d’amplification (inhibition légère,...) car l’analyse (visualisation) des produits PCR se fait en « point final ». ➔ Difficilement exploitable d’un point de vue quantitatif ➔ Recourt à la PCR quantitative en temps réel Kits commerciaux : = La technique PCRun propose un système de révélation bien plus avantageux que les techniques d’électrophorèse sur gel d’agarose, qui sont des processus couteux, difficiles et exigeants en termes de qualifications. Ici, il suffit d’introduire l’échantillon amplifié dans une cassette que l’on clipse. Par capillarité, le liquide migre sur la bandelette où la réaction immunochromatographique s’effectue. La révélation se fait donc tout simplement sur le même principe que les tests rapides couramment utilisés en clinique, tout en garantissant une absence de contamination. 53 4 Chapitre 4 : Le clonage moléculaire 4.1 Introduction Clonage : = Le clonage désigne plusieurs choses : ➔ Une multiplication à l’identique (conservation parfaite de l’information génétique) : à l’échelle cellulaire (clonage cellulaire) ou à l’échelle de l’organisme entier (clonage reproductif) ➔ L’amplification d’un fragment d’ADN par des micro-organismes après son insertion dans un vecteur : clonage moléculaire. (C’est le même but que PCR mais utilisation d'un microorganisme) = Le clonage permet d’obtenir une population de bactéries, de cellules ou d’organismes qui contiendront le même matériel génétique. Il s’agit d’une population homogène de cellules identiques (population clonale), des organismes vivants à l’identique de l’organisme d’origine. = Buts du clonage : ➔ Pour amplifier et conserver une séquence d’ADN ➔ Pour exprimer une séquence d’intérêt ➔ Pour introduire un gène dans des cellules ou des organismes ➔ Pour produire une protéine d’intérêt Clone : = Un clone correspond à un grand nombre de molécules ou de cellules identiques provenant d'un seul ancêtre (cellule ou molécule). L'opération qui consiste à obtenir ce grand nombre de cellules ou de molécules s'appelle le clonage. Clonage moléculaire : = Le clonage moléculaire (ou nucléique) consiste en l’insertion d’un fragment d’ADN dans un vecteur, ce vecteur étant propagé dans une cellule hôte. La culture de cette cellule et la purification ultérieure du vecteur permettent de produire des quantités quasiment illimitées du fragment d’ADN cloné que l’on désire étudier/utiliser. = Autrement dit, on force la bactérie à produire un petit morceau de gène d'intérêt (contenu dans une autre cellule eucaryote) qu'elle ne produisait pas et qu'elle l'exprime en protéines. ADN recombinant : = Il s’agit d’un ADN hybride obtenu au laboratoire par la combinaison de 2 ADN appartenant à 2 espèces différentes. 54 4.2 Les banques d’ADN = On peut distinguer 2 méthodes permettent de construire une banque d'ADN : ➔ La première consiste à fragmenter la molécule d'ADN à l'aide d'enzymes de restriction (car ADN trop grand pour rentrer dans un plasmide) : Banque d’ADN génomique. ➔ La seconde consiste à purifier de l'ARN messager qui seront ensuite transcrit en ADN complémentaire (ADNc) par une transcriptase inverse : Banque d’ADNc 4.2.1 Banque d'ADN génomique = Afin d’accéder à la cartographie physique pour l’étude du génome, une banque de clone va être construire. Le but est de fragmenter la molécule d’ADN à l’aide d’une enzyme de restriction. Le découpage de l’ADN (digestion par des enzymes de restriction) en fragments qui sont insérés dans des constructions moléculaires appelées vecteurs de clonage. Ces vecteurs sont ensuite intégrés dans des cellules qui assureront le maintien et la réplication du fragment d’ADN. Un ensemble de cellules portant des fragments d’ADN de l’espèce étudiée constitue une banque de clones (un fragment par clone). 4.2.2 Banque d'ADNc = Cette méthode consiste à purifier de l’ARN messager, qui sera ensuite transcrit en ADN complémentaire (ADNc) par une transcriptase inverse. Pour ce faire, il faut sélectionner les seules séquences d’ADN qui sont transcrites en ARN et qui sont donc supposées correspondre à des gènes : les ARN messagers. = Pour rappel, il faut existe 3 types d’ARN : 55 = Cette méthode consiste à : ➔ Extraire l’ARN messager (ARNm) à partir des cellules ➔ À faire une copie d’ADN complémentaire (ADNc) de chaque molécule d’ARNm présente grâce à une transcriptase inverse (capable de catalyser la synthèse d’une chaine d’ADN à partir d’une matrice d’ARN) ➔ Convertir, via l’ADN polymérase, les molécules d’ADN monocaténaires synthétisées par cette enzyme en molécules d’ADN bicaténaire ➔ Insérer dans des plasmides et cloner les molécules d’ADNc, pour ensuite obtenir une banque d’ADNc 4.3 Les vecteurs de clonage 4.3.1 Vocabulaire Vecteur : = ADN dans lequel on insère le fragment d’ADN à étudier (= le plasmide). Insert : = ADN inséré, aussi appelé ADN étranger ou ADN exogène (notre gène d'intérêt). Cette séquence nucléotidique est capable de s’auto-répliquer. Il est nécessaire d’introduire ces bactériophages ou plasmides dans les bactéries pour réaliser une multiplication de ceux-ci : affaiblir la bactérie pour laisser rentrer le gène dans plasmide 4.3.2 Les plasmides = Les plasmides sont des petits (on est pas mal restreint par leur taille) fragments d’ADN circulaire présents dans la cellules bactérienne et indépendants du génome bactérien. Propriétés générales des plasmides : ➔ ADN bicaténaire ➔ Circulaire ➔ Avec un nombre de nucléotides inférieur à 10 kb (1 kilobase = 1000 nucléotides) ➔ Nombre de plasmides dans une cellule bactérienne peut être considérable (plusieurs centaines) ➔ Portent normalement des gènes qui leur confèrent un avantage sélectif (ex : résistance à un antibiotique) ➔ Réplication indépendante de celle du génome bactérien ➔ Région avec des sites multiples et uniques pour des enzymes de restriction connues : Cette région est appelée « polylinker » ou MCS (multiple colning site), et son rôle est de permettre l’insertion du fragment d’ADN étranger. Avantages des plasmides Désavantages des plasmides ➔ Petite taille du vecteur, permettant un travail ➔ Désavantages : Faible efficacité pour la expérimental aisé. transformation des bactéries. ➔ Sélection des plasmides recombinants (sélection ➔ Impossibilité d'insérer des larges fragments d'ADN. par les antibiotiques) 56 Exemple de plasmide : le pBR322 = C’est un plasmide artificiel. L’origine de réplication de type bactérien est à contrôle relâché. Ce plasmide peut être présent à raison de 10 à 20 copies par cellule dans des conditions standard de culture. Si la culture est faite en présence de chloramphénicol qui bloque la réplication du chromosome bactérien mais pas celle du plasmide, ce dernier peut s’accumuler jusqu’à près de 1000 copies par cellule (1000 pBR322 par cellules). = Il porte également 2 gènes de résistance à des antibiotiques : ➔ Le gène bla code la β-lactamase qui dégrade l’ampicilline ➔ Le gène tet confère la résistance à la tétracycline = Une bactérie portant pBR322 pourra donc pousser en présence de ces antibiotiques : elle est devenue AmpR et TetR. À l’inverse, une bactérie sans plasmide est tuée par l’ampicilline et la tétracycline : elle est AmpS et TetS. = Protocole : Il possède de nombreux sites uniques de clonage. S’il est digéré par une enzyme de restriction (ex : BamH1), il est linéarisé et ne comporte qu’un seul fragment avec des extrémités cohésives. Il peut être religué avec un autre fragment d’ADN présentant des extrémités cohésives compatibles. Cette réaction à 2 molécules est raisonnablement probable. ➔ Digestion du plasmide par BamH1 ➔ Obtention de plasmides linéarisés, avec le reste de plasmide non coupé (rendement inférieur à 10%) ➔ Addition d’ADN à insérer et ligase = Résultat : On obtient un plasmide recombiné où le gène tet est interrompu par l’ADN étranger. Il y a donc une coexistence de 2 sortes de plasmides : ➔ Le plasmide natif portant bla et tet fonctionnels ➔ Les plasmides recombinés portant le gène bla fonctionnel et tet interrompu par un fragment étranger = Si on transforme des bactéries réceptrices sensibles à l’ampicilline et à la tétracycline avec les plasmides obtenus, nous allons obtenir 3 types de bactéries (notre intérêt est de récupérer les bactéries transformées avec le pBR322 recombiné) : ➔ Celles qui n’ont pas été transformées (entre 50 et 90%), qui sont restées sensibles à l’ampicilline. ➔ Celles qui ont reçu un plasmide natif qui sont devenues résistantes à l’ampicilline et la tétracycline. ➔ Celles qui ont reçu un plasmide recombiné qui sont devenues résistantes à l’ampicilline mais sont restées sensibles à la tétracycline. 57 Exemple de plasmide : le pUC19 = C’est un plasmide classique, dont la séquence complète est connue (2686 nucléotides). Il comporte les particularités suivantes : ➔ Un gène de résistance à l’ampicilline (antibiotique) : La présence de ce gène permettra à la bactérie porteuse de ce plasmide de na pas être sensible à l’effet de cet antibiotique. ➔ Le gène lac Z qui code pour la β-galactosidase dans l’opéron lactose. ➔ Une région avec des sites multiples et uniques pour des enzymes de restriction connues. Cette région est appelée « polylinker » ou MCS (multiple cloning site), et son rôle est de permettre l’insertion du fragment d’ADN étranger. = Un plasmide pUC est un plasmide pBR dans lequel on a remplacé le gène de résistance à la tétracycline (qui sert à repérer les plasmides recombinés) par un gène bactérien lacZ qui code la β-galactosidase. Cette enzyme a pour propriété d'hydrolyser le lactose en glucose et galactose. ➔ Le X-gal est un produit non toxique pour la cellule bactérienne, et il est également substrat de la β-galactosidase. = Les plasmides pUC ont également un MCS (multiple cloning site) situé dans le début du gène lacZ 58 = Dans la boite de pétri, on peut observer la différence des 2 types de plasmides : ➔ Un plasmide pUC natif apportera le gène lacZ fonctionnel, et une bactérie qui le portera, cultivée sur milieu additionnel de Xgal, deviendra bleue. ➔ Un plasmide pUC recombiné aura perdu l’intégralité de son gène lacZ et la bactérie qui le portera donnera un clone qui reste blanc (ce qui nous intéresse). Il faut évidemment que la souche bactérienne utilisée ait perdu l'activité de sa β-galactosidase, on utilise des souches délétées pour l'ensemble de l'opéron lac (lac-). = Résultat : Si on transforme des bactéries sensibles à l’ampicilline avec les plasmides obtenues, on obtient : 4.3.3 Les bactériophages = Un bactériophage est un virus de bactéries munis d’un système de pénétration et se multipliant de façon autonome dans une cellule hôte. Le bactériophage est capable de se poser à la surface de la bactérie, d’y faire un micro-trou et d’y intégrer son matériel génétique. Caractéristiques : ➔ Très bon rendement d’infection ➔ Taille d’ADN à insérer plus grand que celui d’un plasmide ➔ Maniement plus complexe (plus de critères à prendre en compte lors de la manipulation) = Il s’agit donc d’un virus bactérien dont l’infection peut avoir 2 effets mutuellement exclusifs : ➔ La lyse de la bactérie : Le virus rentre dans la bactérie, puis celle-ci éclate et meurt. Les virions sont relâchés dans le cytoplasme et en dehors de la cellule pour se propager. ➔ La lysogénie : C’est la capacité du virus à être « dormant ». Le virus va intégrer le matériel génétique de la bactérie (au niveau du chromosome) et y rester sous forme passive. Il s’agit donc d’un virus latent dans la bactérie, qui survit sans pour autant tuer son hôte. = La voie suivie dépend du dosage de plusieurs facteurs de régulation codés par le génome phagique dans les stades précoces de l’infection. De plus, un virus en lysogénie peut, à cause d’un changement environnemental ou autre, devenir par la suite un virus qui lyse la bactérie. 59 Cycle de vie d’un bactériophage : Carte génétique : ➔ ADN double brin ➔ Contient entre 40 et 50 kpb qui codent de 50 à 60 protéines différentes ➔ Les extrémités de cet ADN sont simples brins sur une longueur réduite, complémentaires l’une de l’autre, et formant des extrémités cohésives. Ces séquences sont appelées séquences cos (pour cohésives). ➔ Le passage de la forme linéaire (dans la particule phagique libre) à la forme circulaire (dans l’ADN après injection dans la cellule hôte) est due à la présence aux extrémités de la molécule linéaire de bouts collants de 12 nucléotides (les extrémités cos). ➔ Dans ce génome se trouve une région où l’on n’a jamais identifié ni mutants ni gènes, c’est la région non essentielle b2. Elle est immédiatement suivie par les gènes nécessaires pour la lysogénie mais pas pour le cycle lytique (on va enlever cette région non essentielle va être utilisée pour le changement de l'ADN). Vecteur : = Ces propriétés du bactériophage ont permis de concevoir un nouveau vecteur capable de transporter plus d’ADN étranger que les plasmides pBR et pUC. La région b2, puisqu’elle n’est pas essentielle, peut être remplacée par un fragment d’ADN d’une taille équivalente. On a alors un vecteur de remplacement de taille voisine de celle du génome naturel du bactériophage. Une banque construire à l’aide d’un bactériophage est constituée de particules phagiques (les fonctions de lysogénie ont été éliminées). Elle se présente donc comme un ensemble de plages de lyse sur un tapis bactérien. 60 Avantages des phages Désavantages des phages ➔ La taille des fragments d’ADN insérables est ➔ Nombre de sites de restriction restreints dans le supérieure à celle des plasmides (40 à 50 kb) génome des phages ➔ La transformation des bactéries (incorporation des ➔ Obligation d’empaqueter l’ADN phages) est plus efficace que pour les plasmides ➔ Contraintes de taille pour l’ADN à insérer 4.3.4 Les cosmides Propriétés générales : = Dans la recherche de vecteurs ayant une capacité plus grande, on a ensuite construit des hybrides entre les plasmides et le bactériophage : Les cosmides qui sont des vecteurs artificiels hybrides (phage lambda-plasmides). En fait, ils se comportent comme des plasmides avec des sites de restriction permettant l’insertion d’ADN étranger. Ils referment également un gène de résistance aux antibiotiques (ampicilline). De plus, un site cos d’un virus lambda a été inclus dans leur ADN circulaire, ce qui permettra au cosmide d’être empaqueté dans la tête d’un virus lambda. = Ils possèdent venant de plasmides : leur origine de réplication et un gène conférant une résistance à un antibiotique. Et venant des bactériophages ils possèdent les extrémités cos et donc l'aptitude à être emballés automatiquement dans un mélange tête à queue de phages. Avantages des cosmides Désavantages des cosmides ➔ La taille des fragments insérables peut atteindre 50 kb ➔ Obligation d'empaqueter l'ADN (insert très grand) ➔ Leur incorporation dans les bactéries (transformation) est plus efficace que pour les plasmides ➔ La sélection est plus facile 61 4.3.5 D’autres types de vecteurs : BAC, YAC, MAC = D’autres vecteurs existent, avec la possibilité de cloner des fragments d’ADN de taille élevée (au moins jusqu’à 500 kb). Les chromosomes artificiels (ou minichromosomes) sont des structures qui copient les chromosomes de la cellule hôte eucaryote et se répartissent régulièrement lors des divisions, comme les chromosomes naturels. On y retrouve donc les éléments essentiels des chromosomes : ➔ Une origine de réplication qui est en phase avec les origines chromosomiques naturelles ➔ Une région centromérique qui assure la migration correcte du minichromosome ➔ Un site unique de clonage ➔ Un ou plusieurs marqueurs de sélection = On en a construit pour les bactéries (BAC → Bacterial Artificiel Chromosome), pour la levure (YAC), et on est en train d’en mettre au point pour les mammifères (MAC). Le YAC est le chromosome le plus utilisé actuellement car il est facile de faire pousser des levures en laboratoire, et il s’agit quand même d’un eucaryote. = C’est un vecteur navette puisqu’il peut se répliquer aussi bien dans une cellule de levure que dans une cellule bactérienne. À l’état natif, c’est un plasmide circulaire qui comporte de l’ADN de 2 origines : ➔ De pBR322 : Il a reçu l’origine bactérienne de réplication (colE1) et le gène de résistance à l’ampicilline. ➔ Des chromosomes de levure : Il a reçu une origine de réplication chromosomique : Autonomous Replication Site (ARS), qui assure la reproduction de l’ADN dans une cellule de levure, et une région centromérique chromosomique (CEN). Il a aussi 2 régions télomériques d’origine chromosomique qui protégeront les extrémités du minichromosome après recombinaison. = Chaque partie du pYAC porte un marqueur de sélection utilisable dans la levure. Ce sont les formes fonctionnelles des gènes, qui codent des enzymes nécessaires dans la synthèse d’acides aminés ou de bases azotées. 62 5 Chapitre 5 : Le séquençage 5.1 Introduction = Le séquençage de l’ADN est la détermination de la succession des nucléotides le composant. Cette technique utilise les connaissances qui ont été acquises depuis une trentaine d’années sur les mécanismes de la réplication de l’ADN. C’est aujourd’hui une technique de routine pour les laboratoires de biologie (moins cher qu'avant). Utilité du séquençage : ➔ Détermination de la séquence nucléotidique d’un fragment d’ADN inconnu (et prédiction de séquences peptidiques) ➔ Vérification de la séquence d’un fragment d’ADN cloné ➔ Vérification de la séquence d’un fragment d‘ADN amplifié par PCR ➔ Mise en évidence de mutations. Par exemple, une mutation ponctuelle : une base qui change (mais compliqué de mettre ça en évidence sur PCR : sur gel d'agarose on verra un fragment plus grand mais c'est compliqué à déterminer si c'est une mutation) 3 générations de séquençage : 1) Méthode Sanger 2) Pyroséquençage, Ion torrent et Illumina (la plus utilisée) 3) Nanopore Méthode Sanger : = La méthode Sanger a été créée en 1977, et elle a pour but de faire une complétion (clonage) du génome humain (plus de 20.000 BAC/Chromosome artificiel bactérien, chacun contenant des fragments d’environ 100 kb de génome humain). Le premier séquençage fait sur l’Homme par méthode Sanger a été fait en 2003, pour environ 2,3 milliards de dollars. Cette méthode nécessite soit de passer par du clonage dans un vecteur avec amplification de bactéries, soit de passer par une amplification par PCR des cibles à étudier. 5.2 Première génération : Méthode de Sanger = Elle est basée sur la réplication in vitro du fragment d’ADN à séquencer par une polymérase car il y a besoin d’incorporation (comme pour une PCR). Elle utilise des didésoxyribonucléotides (ddNTP) qui sont différent des désoxyribonucléotides (dNTP), ils ont été modifiés chimiquement pour le séquençage. Les didésoxyribonucléotides (ddNTPs) : = Dérivés des dNTPs normaux, le groupement 3’ hydroxyle est manquant. Lorsqu’ils sont incorporés dans un brin d’ADN, ils bloquent l’élongation du brin car ils correspondent à des terminateurs de gène. 63 = En pratique, cette manipulation nécessite 4 tubes différents. Chaque tube (Eppendorf d'1,5 ml) contiendra : ➔ Le fragment d’ADN à séquencer (notre échantillon) ➔ Une amorce (marquée au fluorochrome ou au radioisotope) ➔ Une polymérase ➔ Un mélange des 4 dNTPs (En concentration supérieure par rapport aux ddNTPs) ➔ Un des 4 ddNTPs Le didésoxyribonucléotide (ddNTP) interrompt la polymérisation lorsqu’il est intégré. Radioisotope : = Isotope d'un élément chimique qui est instable et qui se décompose en émettant des radiations (on vient changer le groupement phosphate par un phosphore radioactif). Ces atomes sont instables donc émettent des particules. Utilisation d'un auto-radiogramme qui est une feuille captant dès que les particules sont présentes. = Pour réaliser cette méthode, il faut obligatoirement avoir de l’ADN pure, c’est-à-dire de l’ADN débarrassé de tous les autres composants (protéines, membrane,...). = On fait donc, en parallèle, 4 séries de copies (dans chaque tube). Dans chaque série, toutes les copies sont interrompues derrière un seul type de nucléotide (un dNTP). Comme l’insertion est aléatoire, il en résulte de nouveaux fragments d’ADN de tailles variables. 64 = Exemple : toutes les copies intermédiaires d'une série sont terminées par un G = Exercice : Prenons l’exemple d’un segment de 15 nucléotides que l’on veut séquencer : Identification de chaque fragment : = Le principe consiste donc à synthétiser toutes les copies partielles intermédiaires possibles de la molécule d'ADN. Comme les fragments synthétisés sont de différentes tailles, il ne reste plus qu’à les séparer par électrophorèse sur gel d’acrylamide avec des mailles très serrées. = Chaque réaction « A », « C », « G » et « T » sera déposée dans un puit différent. Les fragments les plus courts migrent plus vite, car ils passent plus facilement à travers les mailles du gel d’acrylamide. Le gel est ensuite visualisé par autoradiographie. 65 = Ce qui est lu correspond donc à la séquence complémentaire et antiparallèle. Méthode automatisée : séquençage capillaire = Il s’agit d’une dérive de la méthode Sanger, qui pour permet d’améliorer l’efficacité et la rapidité de la manipulation. Le principe est identique, mais les ddNTPs sont marqués par 4 fluorochromes différents (pas l'amorce qui est marquée mais les ddNTP). On peut donc tout mélanger dans un même tube, et la séparation se fait en continu sur l’électrophorèse capillaire (migration selon la taille du fragment dans un capillaire le laser est à la fin du capillaire et va permettre de l'envoyer à un détecteur). On obtient une succession de pics de couleurs différentes, chaque couleur correspondant à un nucléotide donné. = On utilise un excès de dNTPs plus un mélange de 4 ddNTPs fluorescents. Les 4 ddNTPs sont marqués différentiellement. Les produits de réactions sont chargés dans un capillaire et séparés par électrophorèse. Par caméra, la couleur de chaque bande est identifiée. Chaque pic coloré représente un nucléotide de la séquence d’ADN (les pics sont de différentes hauteurs car ça indique si des mêmes nucléotides sont présents l'un à la suite de l'autre). = Le traitement informatisé des signaux transmis pourra reconnaitre facilement la séquence correspondante.