Bioinfo 2 (1) PDF - Méthodes de Caractérisation des Protéines
Document Details
Tags
Summary
Ce document présente les différentes méthodes utilisées pour caractériser la structure des protéines, telles que la cristallographie aux rayons X, la spectroscopie RMN et la cryo-microscopie électronique, et aborde la synthèse et le pliage des protéines. Il met en avant l'importance de la bioinformatique dans l'étude des protéines, mettant l'accent sur les bases de données comme UniProt et PDB. Un aperçu des techniques de modélisation et d'analyse des structures protéiques.
Full Transcript
1. Introduction aux Méthodes de Caractérisation des Structures Protéiques Les protéines sont des macromolécules essentielles au fonctionnement des organismes vivants. Elles accomplissent une variété de fonctions biologiques, allant du soutien structurel à la catalyse d'activités biochimiques (enzym...
1. Introduction aux Méthodes de Caractérisation des Structures Protéiques Les protéines sont des macromolécules essentielles au fonctionnement des organismes vivants. Elles accomplissent une variété de fonctions biologiques, allant du soutien structurel à la catalyse d'activités biochimiques (enzymes). Comprendre la structure des protéines est crucial, car la fonction d'une protéine dépend directement de sa structure tridimensionnelle. Trois grandes méthodes sont mentionnées pour caractériser ces structures : Cristallographie aux rayons X ○ Méthode “historique” (Sanger, Kendrew, Perutz, …) ○ Bonne résulition (Angstrom) ○ Fonctionne pour des protéines de grande taille ou pour des complexes (protéine, protéine-ADN) ○ Requiert un travail de biochimie conséquent pour obtenir un cristal de haute qualité, ce qui peut représenter des années d’efforts, sans succès garanti Spectroscopie RMN (résonance magnétique nucléaire) ○ Analyse de protéines en solution ○ Fournit des informations dynamiques (flexibilité, conformations alternatives de la protéine) ○ Limitation de la taille des protéines étudiées Cryo-microscopie électronique (Cryo-EM) ○ Plus besoin de cristal ○ Nécessite beaucoup moins de quantité de protéine ○ Initialement, résolution inférieure à la cristallographie mais progrès récents → égale voire dépasse les rayons X ○ Ne fonctionne qu’avec protéines de grande taille (pour pouvoir les détecter) Ces méthodes permettent de déterminer la position précise des atomes dans une protéine, donnant ainsi accès à sa structure en trois dimensions. Cependant, ces techniques ont leurs avantages et inconvénients, comme le besoin de cristaux pour la cristallographie ou des limites de résolution pour la Cryo-EM. 2. Synthèse et Pliage des Protéines Eléments de structure : Structure primaire Séquences des acides aminés Structure secondaire Reploiement local de la chaîne des acides aminés Structures secondaires fréquentes (illustrées plus loin) ○ Hélice alpha ○ Feuillet bêta (anti-parallèle ou parallèle) Structure tertiaire Structure de la protéine dans l’espace (=structure tridimensionnelle) Résulte des interactions entre les atomes de la protéine, et d’interactions avec son environnement (cytoplasme, membrane) Structure quaternaire Structure tridimensionnelle résultant de l’agrégation de chaînes polypeptidiques en complexes protéiques Lorsque les protéines sont synthétisées dans les cellules, elles commencent comme une simple chaîne linéaire d'acides aminés (appelée structure primaire). Cette chaîne n’a pas encore de forme définie. Au fur et à mesure, cette chaîne commence à se plier en fonction des propriétés chimiques des acides aminés qui la composent (hydrophobes, hydrophiles, etc.). Ce processus est appelé repliement des protéines. Le repliement est essentiel, car la forme finale (structure tertiaire) détermine la fonction de la protéine. Deux types d’éléments structuraux se forment lors de ce processus : Hélices alpha : Structure hélicoïdale où les acides aminés sont enroulés. Feuillets bêta : Feuillets formés par des chaînes d'acides aminés étendues et maintenues ensemble par des liaisons hydrogène. Ces structures forment la structure secondaire de la protéine. Elles se regroupent ensuite pour former une structure tridimensionnelle complète, ou structure tertiaire. Certaines protéines complexes peuvent même s’assembler avec d’autres protéines pour former une structure quaternaire. 3. Protéines Intrinsèquement Désordonnées Toutes les protéines ne se replient pas de manière stable. Certaines protéines, appelées protéines intrinsèquement désordonnées, n’ont pas de structure fixe en solution. Elles peuvent adopter plusieurs conformations en fonction des interactions avec d'autres molécules ou en réponse à des changements environnementaux. Ces protéines jouent souvent des rôles importants dans la signalisation cellulaire et d’autres fonctions régulatrices. 4. Bases de Données Bioinformatiques Deux bases de données majeures sont mentionnées pour répertorier et analyser les séquences et les structures des protéines : De Swiss-prot à Uniprot-KB Dans les années 1980, Amos Bairoch crée la base de données Swiss-Prot, avec ~ 3900 protéines sur ordinateur. A la fin des s années 1990, agrandissement de l’équipe ( par suisse et européen ) UniProt Cette base de données contient des millions de séquences protéiques. Elle fournit des informations sur la fonction des protéines, leurs interactions avec d'autres molécules, et leur classification en familles de protéines. Elle est essentielle pour la recherche en biologie moléculaire et en bioinformatique. PDB (Protein Data Bank) La PDB contient des informations tridimensionnelles détaillées sur les protéines comme : Transporteurs: insertion dans la membrane et transport de petites molécules Enzymes: interactions avec un groupe de molécules (substrats) et catalyse d’une réaction qui produira d’autres molécules Polymérase de l’ADN : interaction avec l’ADN, “lecture” de sa séquence et catalyse de la biosynthèse de l’ARN. Facteurs transcriptionnels: interaction avec l’ADN, et avec la polymérase de l’ARN Ces structures sont obtenues principalement par des techniques expérimentales telles que la cristallographie aux rayons X, la RMN ou la Cryo-EM. C'est une ressource clé pour la modélisation des protéines et la prédiction de leur fonction. 5. Prédiction de la Structure Protéique à partir de la Séquence La prédiction de la structure est un des grands défis de la bioinformatique. Le document aborde l’idée qu’à partir de la séquence d'acides aminés d'une protéine (structure primaire), il est possible de prédire la structure tridimensionnelle (structure tertiaire). Pourquoi la prédiction est-elle importante ? La structure tridimensionnelle détermine la fonction d’une protéine. La prédiction permet de comprendre le rôle de protéines dont la structure n’a pas encore été résolue expérimentalement. Cependant, la prédiction des structures est un problème complexe, car les protéines peuvent adopter un très grand nombre de conformations possibles. Le calcul de la meilleure conformation, c’est-à-dire celle qui correspond à la plus faible énergie, nécessite des ressources informatiques énormes. La bioinformatique propose donc des approches heuristiques qui permettent de prédire des structures sans tester toutes les configurations possibles. Ces approches donnent une solution approximative, mais souvent très proche de la réalité. La prédiction de structures à partir de séquence a fait l’objet intense de recherche depuis les années 1990. On distingue deux types de situations 1. Il existe une séquence similaire dont la structure a été caractérisée expérimentalement → on recourt à la Modélisation par homologie. On aligne la séquence de la protéine sur la structure connue, et on adapte les positions des résidus pour tenir compte des acides aminés qui diffèrent entre les deux séquences 2. Modélisation ab initio : pour certaines protéines on ne dispose d’aucun homologue de structure connue. 6. Méthodes de Visualisation des Structures Protéiques Une fois les structures obtenues, que ce soit par des méthodes expérimentales ou par des prédictions, elles doivent être visualisées pour être comprises. Cartoon Models : Ce sont des représentations simplifiées des protéines où les hélices alpha et les feuillets bêta sont représentés par des rubans et des flèches. Ces modèles ne montrent pas la position précise des atomes, mais donnent une vue d’ensemble des éléments structuraux. Cartes électrostatiques : Ces cartes montrent les charges sur la surface de la protéine. En général, les zones chargées positivement apparaissent en bleu et les zones chargées négativement en rouge. Ces informations sont essentielles pour comprendre comment les protéines interagissent avec d'autres molécules. Critical Assessment of protein Structure Prediction (CASP) Depuis 1996, la communauté de structuralistes organise une évaluation objective de la valeur prédictive des modèles de structures protéiques, via un événement intitulé “Critical Assessment of Structure Prediction (CASP)” (évaluation critique de la prédiction de structure). Principe Des chercheurs qui viennent de caractériser expérimentalement une structure l’envoie aux organisateurs avant de la publier dans un journal. A l’ouverture du challenge, les organisateurs mettent en public les séquences de ces protéines, mais (évidemment) pas les structures. Les bioinformaticiens structuralistes utilisent leurs différentes méthodes pour prédire la structure à partir de chaque séquence. Les organisateurs mesurent ensuite le degré de correspondance entre structures expérimentales et structures prédites Ce challenge est organisé tous les deux ans depuis 1996. Quand l’IA est entré dans le jeu 7. Interactions Protéiques et Leur Rôle Fonctionnel Les protéines ne sont pas des entités isolées. Leur fonction dépend souvent de leur interaction avec d’autres molécules, telles que : Les ligands : Petites molécules qui se lient à une poche spécifique dans la protéine. Les substrats enzymatiques : Molécules sur lesquelles une enzyme agit. Les protéines sont conçues pour avoir des sites de liaison très spécifiques. Par exemple, une enzyme pourrait avoir une poche où elle fixe précisément une molécule pour catalyser une réaction chimique. La forme de cette poche, ainsi que ses propriétés électrostatiques et hydrophobes, détermine sa capacité à reconnaître et à se lier à des molécules spécifiques. 8. Exemples de Protéines Mentionnées PAX6 : Une protéine, un facteur transcriptionnel important pour le développement des yeux chez l'homme et d'autres espèces. Les mutations dans le gène codant cette protéine peuvent entraîner des anomalies graves, comme l’absence de formation de l’iris. ○ Sa séquence détermine la formation de 4 hélices alpha, et un petit feuillet beta antiparallèle ○ Deux des hélices ont la capacité de reconnaître des séquences spécifiques d’ADN (brins réverse complémentaires marqués en rose et vert sur la figure) ○ Les autres hélices de la protéine interagissent avec la polymérase de l’ARN, et régulent la transcription des gènes voisins des sites de liaison de PAX6. ○ Les mutations de PAX6 provoquent des malformations de l’oeil et la cécité (maladie aniridia: absence d’iris) ○ Nous reviendrons sur le gène PAX6 lors de prochaines séances consacrées à la structuration et la régulation des génomes, et à l’évolution biologique Protéines qui se lient à l’ADN : Certaines protéines, comme les facteurs de transcription, interagissent directement avec l’ADN en se fixant sur des séquences spécifiques. Elles jouent un rôle crucial dans la régulation des gènes. Porine : La porine du sucrose est une protéine formée en majorité par des feuillets bêta antiparallèles, dont l’agencement forme un cylindre. Cette topologie est dénommée tonneau bêta (beta barrel en anglais) ○ L’intérieur du cylindre est partiellement occupé par deux petites hélices alpha Profil hydrostatique (hautà) ○ L’extérieur du tonneau bêta est essentiellement non-polarisé (blanc) ○ L’intérieur est chargé positivement (bleu) Profil d’hydrophobicité (bas) ○ Extérieur : surfaces hydrophobes, qui stabilisent la protéine dans la membrane ○ Intérieur: ouverture traversant la membrane, surfaces intérieures hydrophiles, qui permet au sucrose de passer 9. Problèmes de Complexité en Bioinformatique La bioinformatique doit souvent faire face à des problèmes de complexité algorithmique. Un exemple est le calcul de la structure protéique : tester toutes les configurations possibles d'une protéine pour trouver celle avec la plus faible énergie demande un temps de calcul exponentiel en fonction de la taille de la protéine. Cela rend impossible le calcul exact pour de grandes protéines. C’est pourquoi on utilise des méthodes d’approximation pour réduire le temps de calcul, tout en obtenant des résultats viables. 10. Conclusion : L’importance de la Bioinformatique dans l’Étude des Protéines L’étude des structures protéiques est un domaine crucial pour comprendre les mécanismes biologiques. La bioinformatique joue un rôle clé en permettant : La prédiction des structures à partir des séquences. L’analyse des interactions entre protéines et autres molécules. La modélisation et la simulation des comportements des protéines dans différents environnements. Grâce aux bases de données comme UniProt et PDB, les chercheurs peuvent accéder à des millions de séquences et de structures, et utiliser ces informations pour des applications dans la recherche biomédicale, le développement de médicaments, et la compréhension fondamentale des processus biologiques. carte mentale feuille blanche organisation travailler weekend