Biochimie (BIOL-F208) Syllabus 2022-2023 PDF
Document Details
Uploaded by ExcellentObsidian639
2023
ALMOHAMAD Rahma
Tags
Summary
This document is a syllabus for a biochemistry course (BIOL-F208), covering protein structure, and function in detail. It outlines various protein types, their roles, and interactions, along with examples in medicine, agriculture, and industry. Topics discussed include protein evolution and significance in biological systems.
Full Transcript
ALMOHAMAD Rahma Biochimie (BIOL-F208) 2022-2023 Mr. Raussens Mme. Martin M. Kruys 7/11/22 ALMOHAMAD Rahma 7/11/22 1er COURS : 19/09/22 Chapitre 1 : Structure et biochimie de la protéine 1. Introduction Un des plus grand paradigme de la biochimie : l'information va dans UN sens. De l'ADN -(tr...
ALMOHAMAD Rahma Biochimie (BIOL-F208) 2022-2023 Mr. Raussens Mme. Martin M. Kruys 7/11/22 ALMOHAMAD Rahma 7/11/22 1er COURS : 19/09/22 Chapitre 1 : Structure et biochimie de la protéine 1. Introduction Un des plus grand paradigme de la biochimie : l'information va dans UN sens. De l'ADN -(transcription)-> ARNm-(traduction)->protéine Pourquoi est-ce important d'étudier la structure des protéines ? Alors que l'ADN est responsable du stockage de l'information génétique, une protéine c'est la cheville ouvrière de la cellule. Les protéines sont responsables de plus de 99% de l'activité biologique dans une cellule Cette activité est liée à leur structure. Un des buts de la biologie structurale est de parvenir à comprendre comment passer de la séquence en acides aminés à la structure et ensuite à̀ la fonction. Les fonctions des protéines sont très diverses : - Les enzymes : ce sont des catalyseurs biologiques qui permettent de faire toutes les réactions chimiques nécessaire dans la cellule ou hors de la cellule. - Cohésion et structure : constituant du cytosquelette mais aussi de la peau, des cartilages, tendons, muscles ... →composé de la protéine : le collagène (28 types ou plus) c'est la protéine la plus abondante dans le corps) - Senseurs et transducteurs de signal (récepteurs du goût odeurs, hormones ...) - Transport : d'un seul électrons jusqu'à des macromolécules - Mouvement : intracellulaire, cellulaire ou multicellulaire (ex. les muscles sont essentiellement constitué de protéines) - Défense : Anticorps du système immunitaire fait à partir de protéines. Mais maintenant nous avons trouvé une autre solution (COVID) →Anticorps à partir d'ARNm (c’est à dire une étape avant) très intelligent au niveau conceptuelle : Nous faisons faire la protéine qui va devenir l'antigène par nos propres cellules (en injectant l'ARNm) C'est ce que fait le virus en soit. Comme nous ne faisons faire qu'une protéine, nos cellules ne sont pas affecté mais par contre nos anticorps vont tout d'un coup percevoir la présence de l'antigène et réagir à cela en se multipliant pour nous protéger. - Régulation (régulation des gènes, activité́ de promoteur ou répresseur, des signaux intracellulaires) - Messagers (hormones et récepteurs synaptiques) - … Les protéines sont des hétéropolymères de longueur fixe. Les monomères sont constitués d'acide aminés qui sont au nombre de 20 (+2 acide aminé modifié se trouvant dans le collagène : l'hydroxylysine et hydroxyproline) et ayant des propriétés chimiques différentes. 2 ALMOHAMAD Rahma 7/11/22 C'est la chaine latéral qui va apporter les différentes fonction et propriétés chimiques. La chaîne linéaire se reploie en une conformation tridimensionnelle, conformation qui est déterminée par la séquence en acides aminés. Cette conformation tridimensionnelle composé de molécules extrêmement compacte. Les protéines ont la plus grande densité. La compaction qui mène à la structure tridimensionnelle est donc très importante. Aucune molécule d'eau s'y trouve. (solubilité) En principe, il serait possible de traduire la séquence d'un gène en une séquence d'acides aminés et à partir de cette séquence de prédire sa structure tridimensionnelle. En réalité, passer de la séquence à la structure est un problème très complexe auquel la bioinformatique s'est attelé. Séquences = structure primaire , cette séquence est suffisante et contient toutes les informations nécessaires pour trouver la structure tertiaire. Ce qui fait qu'en bio-informatique nous pouvons passer d'une structure primaire à tertiaire. Les structures des protéines peuvent être déterminées par différentes approches expérimentales. Au niveau atomique, les structures des protéines peuvent être obtenues par diffraction des rayons X ou des neutrons par des cristaux de protéines et par la RMN pour les protéines en solution. L'RMN ne peut plus donner de résultats qd la protéine devient très grande. Maintenant depuis quelques années, nous avons la Cryo-EM (microscopie électronique cryogénique). L'importance de ce domaine des sciences vient du fait que la structure d'une protéine est intrinsèquement reliée à sa fonction. L'élucidation d'une structure de protéine est donc une aide précieuse à la compréhension de sa fonction. La Trypsine fait partie de la famille des sérine protéase qui se trouve dans l'intestin et qui clive les protéine pour les digérer, elle fonctionne grâce à une triade qui permet de cliver une protéine spécialement après une Arginine ou une Lysine SAUF s’il y a une proline après (ex. si nous avons arginine—proline ça clive pas, mais si c'est arginine—autre protéine elle clive ce lien) : • Bleu→ histidine • Rouge→ aspartate • Orange→sérine • Molécule jaune→inhibiteur qui permet de fixer la protéine dans une conformation bien déterminé. Les 3 sérines protéases qui ont presque la même structure : Trypsine, chymotrypsine et élastase, leur triade (catalytique) se trouve presque au même endroit, mais elles clivent toutes les 3 à des endroits différents. La trypsine ne se superpose pas à la subtilisine comme nous pouvons l'observer alors que ce sont toutes les deux des sérines protéases et doivent avoir le même cycle catalytique. En effet, dans ce cas nous avons deux protéines tout à fait différente mais néanmoins au niveau du site actif elles ont leur triade au même endroit. Et donc même si nous avons pas la même conformation, et en regardant le cycle catalytique, on peut dire que la subtilisine est une sérine protéase ---> c’est un des nombreux exemple qui nous montre ce à quoi sert la résolution de la conformation des structures de protéines. 3 ALMOHAMAD Rahma 7/11/22 Évolution divergente et convergente : - Évolution divergente : tout en gardant la même conformation il y a eu des modifications dans les structures qui a fait que la Trypsine, chymotrypsine et l'élastase viennent probablement d'un ancêtre commun et qui ont divergé pour avoir 3 activité protéolytique différentes. Ex. d’évolution divergente : dauphins mammifère-->au fil du temps ils se retrouvent en mer - Évolution convergente : deux gènes avec deux structure de protéines complétement différente mais néanmoins, au niveau de l'activité catalytique, elles ont retrouvé la même triade catalytique et ont le même processus de fonctionnement dans leurs activité enzymatiques. L'étude de la structure des protéines n'a pas qu'un intérêt fondamental (compréhension de processus biochimiques) mais a aussi un intérêt pratique. →Intérêt potentiels : (Depuis 10-20 ans les médicaments sont de plus en plus fait à partir de protéines) En médecine et pharmacie: - Drug design pour inhiber des cibles enzymatiques spécifiques à des fins thérapeutiques. Production de protéines par des microorganismes pour traiter des maladies (ex. Insuline et diabète). En agriculture: - Même principe pour les maladies qui touchent les plantes. En industrie: - Synthèse d'enzymes pour intervenir dans des processus industriels (ex. Détergents biologiques dans les poudres à lessiver, lipases pour lyser les graisses à l'échelle industrielle). Quelques exemples : Insuline : Avant l’insuline était prélevé à partir d’animaux (porcs)→ problème de rejet de cette insuline. Maintenant, on prend le gène de l'insuline humaine on l’injecte dans une bactérie, celle-ci commence à produire l'insuline humaine. On la récolte et on en fait les doses que les patients ont besoin sans plus aucun problème de rejet car cette fois c'est la séquence de l'insuline humaine qui est prescrite. 4 ALMOHAMAD Rahma 7/11/22 Aspartame → édulcorant à la place du sucre : asparagine lié à une arginine donne du sucre alors que aucun des deux n'est sucré ; chimiquement nous pouvons le faire avec un rendement de 50% (très médiocre pour l'industriel). Nombre de protéines: ~300,000 - > 10,000,000? On a séquencé le génome humain et on a trouvé +- 300,000 gènes. Hors on sait qu'il faut plus de 300000 protéine pour faire fonctionner le corps humain. Le nombre de protéine nécessaire se situe entre 300,000-10,000,000. Nous avons 200,000 structure à haute résolution (RX, RMN, Cryo-EM, Bioinfo) connues de protéines (tout organe confondu pas seulement l'humain) dont seulement 45000 non-redondante ! Pour environ 227,339,950 séquences connues. Mais seulement 4900 structures (redondantes et 490 non redondantes presque) de protéines membranaires or les protéines membranaires représentent 25-30% du génome qui sont donc très essentiel. Donc il n'y a pratiquement pas de structures membranaire qui sont connu par haute résolution et ça reste un gros problème car les protéines mb sont la première chose qu'un produit rencontre en entrant dans la cellule. RX et RMN, processus lents et difficiles (biais possible!). Extrême diversité de structures et d'activités. Rôle de plus en plus important dans les systèmes biologiques des ensembles de protéines (interactome). Quand on étudie les gènes →c'est le génomes ; Les protéines →protéomes Une protéine fonctionne rarement seule elle doit avoir des partenaires (jusqu'à une dizaine de partenaire selon le milieu où elle se trouve). Si nous avons 10,000,000 de protéine il y aurait 100,000,000 interaction à déterminer entre ces protéines Qd on étudie ces interactions →c'est l'interactome. La bioinformatique est donc très importante pour faire tous ces réseaux d'interactions. - Transcriptomes ARNm : Pour passer de l'ADN à l'ARNm il y a des processus qui permettent de modifier l'ARN (ex. l'épissage alternative) qui font que les ARN peuvent être plus nombreux que les gènes d'ADN correspondant. - Protéome : On va traduire les ARNm en protéine et il y aurait 10,000,000 protéines. - Interactome : toutes interaction entre prot-prot et pleins d'autres choses 100,000,000 d'interactions. un protéome est l’ensemebles des protéines synthétisée par un génome 5 ALMOHAMAD Rahma 7/11/22 Pourquoi tant de protéines pour si peu de gènes? - Génération de diversité au niveau des protéines - Épissages alternatifs Intron-exon - Modifications post-traductionnelles Nous avons une diversité très importante au niveau des protéines, une même protéines peut-être diversifié par des modification post -traductionnelle et l’épissage alternatif introns-exons. 1 seul génome peut donner deux protéomes complétement différent Le protéome nous permet pas seulement connaitre toutes les protéines qui peuvent exister dans un être vivant, mais aussi savoir quelle protéine il y a dans telle type cellulaire à telle moment de son cycle cellulaire ou cycle de vie de l'être vivant. 2. Les acides aminés Il existe deux types d’acides aminés : L et D (car présence d’un C asymétrique alpha). La forme que nous utilisons est la L, quelques bactéries utilisent la forme D et cela nous permet de trouver des antibiotiques contre ces bactéries là car nous ne les avons pas. 6 ALMOHAMAD Rahma 7/11/22 En rouge c’est la chaine latérale qui nous permet de différencier chaque acide aminé. • • • • • • • • Arginine et lysine → clivé par la trypsine Histidine à PH neutre n’est pas chargé et à PH basique chargé Groupements OH/thiol/amides → Interactions polaires Glycine aa qui n’est ni L ni D Le plus grand aa → tryptophane Le plus petit →Glycine Masse moyenne (non pondéré) : 136 daltons/aa (dalton → g/mol) (ex. : 186g/mol de tryptophane) Pour un acide aminé on compte une moyenne apparente de 110 daltons (si on ne connait pas la séquence de la protéine) Exemple question examen : on a une protéine de 100 a.a quelle serait sa masse apparente sur un gel SDSpage ? On fait 100 x 110 daltons = 11000 daltons → c’est la masse apparente de la protéine. la masse d’un acide aminé est de 110 dalton Si on a quelque chose de chargé positivement que faire pour changer sa charge ? - pH acide → il y a + de protons - pH basique → moins de protons Si une fonction est capable de capter un proton à un pH en dessous de son pKa il n’y aura plus de protons, elle va tous les capter. Exemples : À pH 7.4 : - La lysine (ayant un pKa de 10.4) est chargée au niveau de -NH3+. pKa > pH - L'Arginine (ayant un pKa de 12) est tjrs chargée. pKa > pH 7 ALMOHAMAD Rahma 7/11/22 Pour l'aspartate (pKa 4.5) là c'est l'inverse, pH 7.4 est au-dessus de son pKa donc il y a moins de protons dans la solution car c'est un pH plus basique que 4.5, donc elle va relarguer son proton COO-; si le pH est en dessous de 4.5 --> elle devient COOH puisqu'elle recapte son proton. : • À 4.5 pas de charge • À 4.5 = pKa -->50/50 (mélange COO- et COOH) • Si je descends le pH en dessous de mon pKa j'ai plus de protons dans ma solution et donc la fonction va se protonée --> deviens charge +1 • Si je monte au-dessus du pKa à pH 7.4 --> moins de protons dans la solution -> déprotonation donc charge -1. Le type de pH dans une cellule : pH physiologique on peut trouver d’autre pH dans une cellule comme par exemple dans les lysosome, c’est pH 3 7.4 en général Peut-on avoir un autre pH dans une cellule ?--> dans les lysosomes par ex. pH autour de 3 On peut donc passer pour une protéine d'un pH 7 à 3. Il n' y a que des pH neutres ou acides dans la cellule ! pas de pH basique dans une cellule pKa à retenir : - Acide aminé acide : Aspartate, Glutamate et C-terminal de la protéine : pKa 4,5 - Histidine (base) : pKa 6-6,5 Le reste des pKa n'est jamais dépassé dans une cellule Pour changer la charge de l'Arginine il faudrait donc un pH supérieur à 12 dans la cellule (ça n'existe pas, il n'y aura plus de cellule). pour changer la charge d’un acide aminé, il faut avoir un pH plus élevé que le pKa donc l’argine ne pourra jamais changer de charge 8 ALMOHAMAD Rahma 7/11/22 2° il y a certaine structure qui ne sont pas compatible avec certaine structure comme la proline, glycine pour les hélice alpha Hydrophobicité Hydrophobicité = tendance à passer dans une phase hydrophobe Energie libre pour faire passer une mole de la phase aqueuse à la phase hydrophobe. Lorsqu'une protéine se reploie dans l'espace, une des premières étapes est constituée du rassemblement des acides aminés hydrophobes (pour échapper à l'environnement aqueux). - formation d'un cœur hydrophobe et exposition des acides aminés hydrophiles vers l'extérieur (surface) de la protéine. ici les molécule d’eau en surface bouge moins. donc l’entropie est plus grande dans le deuxième cas sur ce méchanisme que la membrane lipidique fonctionne 9 ALMOHAMAD Rahma 7/11/22 Les aa hydrophobes vont se rassembler entre eux et former le cœur hydrophobe de la protéine intérieur est très dense et très compacte. Effet hydrophobe : les parties hydrophobe se rassemblent pour minimiser l'interaction avec l'eau. --> effet entropique. 2 molécules qui se rassemblent pour en faire une --> moins de désordre --> à l'interface il y a tout un réseau de molécules d'eau qui vont se faire expulser et qui vont se retrouver en cœur de phase et auront une possibilité de mouvement qui est bcp plus grande. (entropie) En Thermodynamique on s'intéresse donc au système complet et pas seulement aux molécules d'huiles (qui mettent de l'ordre). Ces molécules d'eau qui entouraient les gouttes d'huiles avaient un nombre de conformation limité, mais à partir du moment où les deux gouttes d'huiles se rassemblent les molécules d'eau retrouvent toute leurs mobilité et c'est là que l'entropie augmente terriblement. C'est grâce à cela que -->la mb lipidiques, … fonctionnent. Cas des segments transmembranaires→ protéines membranaires : la structure d’une protéine membrane changent en fonction de l’hydorphibicité de la membrane cellualaire - Si un seul segment transmembranaire→entièrement hydrophobe - Si plusieurs segments transmembranaires→hélices amphipatiques Distribution spécifique des acides aminés : présence d'une interface hydrophobehydrophile. Les régions hydrophiles se rassemblent et forment un canal. 2éme COURS : 20/09/22 3° Charge L'importance n'est pas spécialement l'acide aminé en lui-même mais le résidu d'acide aminé et donc là c'est la chaine latéral qui compte→où on retrouve des groupements ionisable. Résidus d'acide aminé →aa inclus dans une protéine Au pH physiologique, les acides aminés sont des zwitterions. (Rappel→ Histidine : en dessous d’un pH 6.5 il est chargé et au-dessus de 6.5 il n'est pas chargé) Le groupement carboxyle en dessous de son pKa --> devient acide carboxylique (il a capter un proton) et au-dessus de son pKa --> il devient un carboxylate associé (il a donné son proton). Au pH physiologique, K, R sont chargés positivement. D et E sont chargés négativement. Tableau des chaines latérales ionisables: 10 ALMOHAMAD Rahma 7/11/22 Rappel des notions acide/base (important!) - - lorsque le pH de la solution est égale au pKa d'un groupe ionisable, ce groupe existe en tant que mélange 50/50 de la forme acide et de la base conjuguée. Si le pH est < que le pKa, la forme acide est prédominante. Si le pH est > au pKa, la forme basique est prédominante. 11 ALMOHAMAD Rahma 7/11/22 →1er exemple: effet du volume, de la charge et de l'hydrophobicité sur la spécificité des sérine protéases. Chymotrypsine clive après a.a. Aromatiques (F/Y/W) Trypsine clive après a.a. Chargés (Lysine/arginine) Élastase clive après a.a. Non-chargés de petite taille (A/G). →Comment ça se fait que les 3 aa (sérine, histidine, aspartate) arrivent à cliver des protéines à 3 endroit différent ? Le site catalytique garde ses 3 aa mais il change de forme : →Trypsine : frome relativement allongée et il se fait que la lysine et l'arginine sont deux aa qui sont aussi allongé dans leurs chaine latérale. CHARGE , TAILLE , HYDROPHOBICITE --> ces trois effets explique le fonctionnement de certaine protéines et comment certains changement de structure peuvent apparaitre. →2ème exemple: changement de charge et de structure en fonction du pH Lors de l'endocytose, le pH des endosomes diminue. Cela peut provoquer un changement dans la protonation de certains acides aminés. K et R ont un pKa de 10-12, toujours chargés en conditions physiologiques. H a un pKa ~6.5 et est donc particulièrement important dans certains processus où il y a un changement de pH intracellulaire : Exemple : Lorsqu'il y a endocytose, nous pouvons avoir l'endosome tardif à devenir un lysosome et là des pompes à protons vont se mettre dans la mb --> l'intérieur du lysosome va devenir nettement plus acide. (arrivant à des pH aux alentours de 3) D et E ont un pKa de ~4.5, peuvent aussi se protoner (perdre leurs charges) lors d'une diminution de pH. 12 ALMOHAMAD Rahma 7/11/22 Par ex., une protéine soluble à pH 7 peut changer de charges dans les endosomes (pH diminue) et se retrouver avec un caractère beaucoup plus hydrophobe et interagir avec la membrane lipidique. ! L'ionisation dépend aussi de l'environnement (hydrophobicité́ du milieu) ex. Un acide aminé D a un pKa de 4.5 dans l'eau (=80) mais peut avoir un pKa plus enlevé dans un milieu de cste diélectrique plus faible (ex. Phase lipidique =4). Glutamate (pKa 4.5) --> phase lipidique ! (mais il est chargé il ne peut pas être en phase lipidique) mais quand on calcule pKa = 9 (ce n'est plus un acide). C'est pas parce qu’il est dans une phase lipidique que son pKa a forcément changé. Toxine diphtérique : elle reconnait à la surface son récepteur et ce récepteur est un lipide (ganglioside) qui va être endocyté et il ne se passe rien elle reste endocyté comme ça. Là, a priori, la toxine ne pose aucun problème. Mais le problème est que le pH descendant, la toxine va devenir de plus en plus hydrophobe car elle va perdre des charges et elle devient tellement hydrophobe qu'elle peut traverser la mb. du lysosome. Une de ses sous unité (A) (sous unité B sert seulement à reconnaitre le récepteur) va pouvoir traverser la mb et va être cliver et va pouvoir interagir avec les facteurs d'élongation et cela tue la cellule. → modification de pH : change structure et fct d'une protéine (dangereux). 13 ALMOHAMAD Rahma 7/11/22 →HA : Hémagglutinine (A : neuraminidase) que l'on retrouve à la surface du virus de la grippe ( se tient sous forme de trimère) Trimère avec deux sous unités : A1(bleu) et A2 (vert) →A2 --> peptide en fin de chaine qui fusionne avec la mb. Ici aussi le virus est encapsulé dans un lysosome et au moment où le pH change : le peptide peut fusionner avec le mb du lysosome et laisse le virus entrer dans la cellule (dangereux). Sous unité HA2 protégé par sous unit HA1. Le peptide qui devait fusionner avec la mb de la cellule hôte se trouve en bas près de la mb du virus. Et donc on comprenait pas ? Car elle se trouvait de l'autre côté comment elle pouvait fusionner avec mb cellule hôte ? Les chercheurs avaient cristallisé la protéine à pH 7 (physiologique) et donc c'était sa forme avant d'être endocyté. Quelques années plus tard la même structure a été obtenue mais cette fois à pH 5 (acide). La structure en orange qui était totalement dénaturé (pH 7) devient une hélice alpha à pH 5. structure vert et beige (hélice alpha). À pH plus bas (5) ces deux hélices se mettent en prolongation l'une de l'autre et les unités HA1 se séparent et se mettent sur le côté. Et ducoup le peptide qui peut fusionner et interagir avec la mb de la cellule hôte se retrouve en haut. →On peut imaginer un ressort qui se remet en place et pose les unités comme il faut →Et donc, quand le virus se lie il n'y a rien qui se passe et c'est seulement qd le pH diminue que la sous unité HA2 va être libérer et va pouvoir interagir avec la mb de la cellule hôte et en final provoquer l'intrusion de tout le matériel génétique du virus qui va refaire d'autre virus. (Maladie grippe). 14 ALMOHAMAD Rahma 7/11/22 3. Les différentes structures d’une protéine 1er niveau de structure : la structure primaire On ne va pas étudier seulement l'AA en lui-même mais au sein d'un peptide / protéine. Une protéine est faite à partir du lien peptidique entre les acides aminés. 2 aa → acide d'un côté et amine de l'autre, la réaction va se faire et après éjection d'une molécule d'eau nous avons un lien amide qui se forme. Dans cette partie il n'y a plus de charges, les charges sont au niveau de la chaine latéral (résidu). La protéine/peptide se lie dans un sens : N-terminal en premier ----> extrémité C-terminal. Ce lien peptidique se fait au niveau du ribosome et pas de manière spontanée. D'un point de vue thermodynamique ce n'est pas le lien peptidique le plus stable mais les a.a libres qui sont les plus stable. Seulement, la barrière énergétique est tellement grande entre les 2 que une fois que le ribosome a fait le lien peptidique c'est extrêmement difficile de le défaire. Par exemple la Kératine n'est jamais dégradé. Protéines dans alpha cristallin 1, 2 .. : elles ne sont jamais remplacé on les gardent toute notre vie. Cristallin requin : 500 ans Répartition de différentes longueur des aa : →La longueur moyenne des protéines est de 350 aa. →Structure primaire (=séquence) : séquence d'a.a du N-terminal au--> C-terminal. 15 ALMOHAMAD Rahma 7/11/22 2éme niveau de structure : la structure secondaire (C-O : double liaison) Pourquoi dans le lien peptidique le lien C-N du milieu est plus court ? C-N double liaison partielle (délocalisé par l'oxygène) et donc beaucoup plus courte. 1er règle de Pauling/Corey : Le lien amide est toujours PLAN → Lien peptidique plan à 180 °, la chaine polypeptidique ne pourra pas adopter plusieurs structure. Mais elle peut faire des rotations au niveau des angles phi et psi et ont des valeurs d'angles à respecter→ L'angle oméga ne bouge pas, les angles phi et psi peuvent tourner L'angle oméga (lien peptidique) vaut en général 180° (conformation trans) seul 0.36% (116/32539 angles oméga) sont en conformation cis dans les protéines. Exceptions: certains liens peptidiques spécifiques sont parfois en conformation cis. Tyr-Pro (25%), Ser-Pro (11%), Xxx-Pro (6.5%) La flexibilité des protéines vient donc des angles phi et psi, néanmoins certaines contraintes stériques limitent aussi ces angles. Résonance du lien peptidique : Le lien peptidique est plan du fait de la délocalisation des électrons pi du carbonyle et de la paire d'électrons libres de l'azote. 16 ALMOHAMAD Rahma 7/11/22 2eme règle de Pauling/Corey : Si des atomes dans un a.a peuvent faire des liens H, ils vont tout faire pour les faire . Soit avec l'eau soit avec un autre a.a. 1) Les hélices ALPHA Aa en hélices et comme ils sont l'un au-dessus de l'autres, ils vont faire des liens Hydrogènes. Chaque a.a fait un lien H avec l'aa qui est en dessous. Les chaine latéral sont tjrs à l'extérieur de l'hélice. Propriétés : - 1 tour d’hélice : 3,6 résidus (environ 4) 1 tour (taille) : 5,4 angströms Qd on monte d'un a.a à l'autre(d’un résidu à l’autre le long de l’hélice) --> 1,5 angströms il y a un lien hydrogène entre un C=O d'un résidu et un N-H situé 4 résidus plus loin →Une hélice de 20 a.a ça fait quelle longueur ? 20 x 1,5 = 30 angströms Après une certaine longueur l'hélice alpha se courbe, pourquoi ? La courbure vient de 2 chose : les casseurs d'hélice (qui tord une hélice) --> la glycine et la proline qui n'aime pas être en hélice elle vont donc casser l'hélice (la tordre), et le solvant. 1. Proline --> chaine latéral qui reviens sur l'amine , le N (de l'amine) ne peut donc plus faire de liens H avec 4 au-dessus ou 4 en dessous et cela DESTABILISE l'hélice. 2. Une hélice qui est posé à la surface d'une protéine →l'intérieur de la protéine est hydrophobe et l'extérieur est hydrophile. Dans un milieu hydrophobe, avec une cste diélectrique très faible et des liens H qui ne sont pas exposé au solvant aqueux : les liens H sont plus fort et donc plus court. L'autre face (de l’hélice) en contact avec le milieu aqueux a des liens H plus faible et donc plus long. Et donc si les liens sont court d'un côté et long de l'autre l'hélice a tendance à se courber. 17 ALMOHAMAD Rahma 7/11/22 La majorité des hélices alpha dans les protéines globulaires sont incurvées ou tordues par rapport au modèle standard de Pauling-Corey. Ces distorsions peuvent être causées par plusieurs facteurs: • • • Le packing des hélices contre les autres éléments de structure secondaire au cœur de la protéine. des résidus proline induisent des distorsions d'environ 20 degrés par rapport à l'axe de l'hélice. Ceci est dû au fait que la proline ne peut former une hélice alpha régulière à cause de sa chaine latérale cyclique qui l'empêche aussi de former un lien H avec l'atome de N de la chaine principale. Il a été montré qu'en fait la proline empêche 2 liens H de se former car le groupement NH du résidu suivant ne peut pas former non plus un bon lien hydrogène. Solvant : Les hélices exposées ont souvent une courbure qui les éloigne du solvant. Ceci est dû au fait que les groupements C=O exposés ont tendance à pointer vers le solvant pour maximiser leur capacité à faire des liens H, i.e. ont tendance à former des liens H avec le solvant aussi bien qu'avec les groupements N-H. 18 ALMOHAMAD Rahma 7/11/22 Les différents types d'hélices : 4 tours x 3,6 résidus --> 12 + 3 = 15 aa Hélice 3.10 : (3) pour 1 tour il y a 3 aa et le liens H se fait entre i et i+3 (10) Entre le départ du lien H et la fin du lien H si on compte le long de l'hélice on a 10 atomes entre les 2 part du lien H. Hélice alpha : i + 1 --> est à 100° Hélice 3.10 : i + 1 --> 120° i+2 Les chaine latéral vont s'empiler tous les 3 aa l'un au-dessus de l'autre et là il y a des clash stérique→les hélices 3.10 ne sont pas très stable. Hélice alpha : 100°, 200°, 300°, …. Au lieu de 360° et donc l'aa juste avant ne va pas être juste au même endroit que le premier→ moins de contraintes stérique et donc plus stable. Hélice Pi : plus d'aa par tour. Les liens H se font entre i et i+5 --> résultat elle est plus large et plus courte Hélice alpha --> la plus importante L’hélice 3.10 L'hélice 3.10 n'est pas un élément de structure secondaire très courant au sein des protéines. Seulement 3.4% des résidus sont impliqués dans des hélices 3.10 (Kabsch and Sander database (1983)). Les hélices a parfois débutent ou se terminent avec un unique tour d'hélice 3.10 (un lien H), <25% des résidus en hélice 3.10 font partie de cette classification. La moyenne des angles dihédres du backbone en général diffèrent des valeurs d'une hélice 3.10 idéale (-74.0, -4.0) avec des valeurs de -71.0 et -18.0 degrés, pour phi et psi, respectivement. Cette petite différence résulte en un diamètre plus large (2.0 versus 1.9 Å) et un plus grand nombre de résidus par tour (3.2 versus 3.0). Cela permet un meilleur empilement des chaînes latérales le long de l'axe de l'hélice. Les liens H au sein d'une hélice 3.10 présentent un motif répété, le C=O du backbone du résidu i faisant un lien H avec le N-H du backbone du résidu i+3. L'infréquence de cette structure secondaire provient du fait que: - les angles phi et psi d'une hélice 3.10 idéale (-74.0, -4.0) sont situés à la limite d'une région permise de la carte de Ramachandran (phi, psi). - les dipôles des atomes des liens H du backbone ne sont pas bien alignés et s'écartent de l'axe de l'hélice (~30 degrees). - des contacts de van der Waals le long de l'axe de l'hélice peuvent provoquer des répulsions. - les chaînes latérales sont dans des positions azimuthales identiques pouvant provoquer des interférences d'ordres stériques. L’hélice pi L'hélice pi est un élément de structure secondaire extrêmement rare dans les protéines. Les liens hydrogène au sein d'une hélice pi montrent aussi un motif répété où le C=O du backbone du résidu i fait un lien hydrogène avec le N-H du backbone du résidu i+5. Comme pour les hélices 3.10, un tour d'hélice pi est parfois présent aux extrémités des hélices alpha mais des hélices pi de plus de i,i+5 résidus ne sont pas observées. 19 ALMOHAMAD Rahma 7/11/22 Particularités des hélices Helix capping : Une hélice alpha de 12 résidus contient 8 liens H, malgré le fait qu'il y ait 12 NH (donneurs) et 12 CO (accepteurs). Les extrémités N- et C-terminales d'une hélice isolée contiennent respectivement 4 NH donneurs et 4 CO accepteurs. Il a été montré que pour satisfaire les liens H, aussi non manquant, des groupements polaires sont en général présents aux extrémités des hélices. De plus, ces différentes positions aux extrémités des hélices sont sujettes à une préférence pour certains acides aminés (voir tableau ci-dessous). →Le début et la fin de l’hélice vont avoir des a.a très spécifique qui vont soit aimer être en hélice ou ne pas aimer (voir tableau ci-dessus). Le premier a.a est souvent une proline. (Rappel : Aspartate et glutamate : chargé négativement.) Les aa chargé négativement vont préférer se mettre en N-terminal de l'hélice (au début). Et vers la fin des a.a e--> une glycine Vers la fin de l’hélice on a des Lysine et arginine chargé positivement (basique, C-terminal). Vers le début a.a chargé négativement (acide, N-terminal) L'hélice se met souvent en surface de la protéine. Amphiphilicité : Des forces qui permettent à une chaîne polypeptidique de se reployer dans l'eau, les interactions avec le solvant (e.g., l'effet hydrophobe) sont censés être les plus importantes. De manière simplifiée et schématique, une protéine reployée peut être vue comme une micelle formée d'une seule chaîne qui peut rester à l'état soluble en entourant un coeur hydrophobe par une couche extérieure hydrophile. Les hélices sont souvent localisées parallèlement à la surface des protéines globulaires et servent donc de barrières entre l'intérieur (hydrophobe) et l'extérieur (hydrophile). Elles doivent donc nécessairement être amphiphilique (ou amphipathique) comportant donc une face hydrophobe (pour satisfaire le cœur de la protéine) et une face hydrophile (pour interagir favorablement avec le solvant). Structure hydrophile d'un côté et hydrophobe de l'autre , l'hélice tourne constamment Question Exam Rappel : Les aa doivent venir tous les combien d'aa pour qu'ils se place plus ou moins tous sur une face et qu'il fassent une face hydrophobe ? Tous les 4aa (3,6) pour faire un tour, pour être sur la même face il faut faire un tour d'hélice ( donc 3,6 aa) donc tt les 4 aa, (et parfois tt les 3 pour redresser l'hélice) 20 ALMOHAMAD Rahma 7/11/22 Et donc suivant l'hélice nous avons à chaque lien peptidique un mini dipôle, qui se met à travers ce lien. Tous les liens amide se place selon l'axe de l'hélice, au final tous ces dipôle s'additionne--> macro dipôle pour une hélice. En N-terminal nous aurons un excès de charge positive et en C-terminal un excès de charge négative. Dipôle de l’hélice Dans une hélice, toutes les unités peptidiques pointent dans la même direction (plus ou moins parallèle à l'axe de l'hélice) et devraient donc présenter un effet cumulatif résultant en un macrodipôle d'hélice (Hol et al., 1978). Par convention, le dipôle pointe du négatif vers le positif (oui, c'est contre-intuitif). L'effet net de ce macrodipôle en hélice est la présence d'environ +0,5 unité de charge à l'extrémité N-terminale et -0,5 unité de charge à l'extrémité C-terminale. Cela expliquerait les préférences observées des acides aminés chargés négativement à l'extrémité N-terminale et des résidus chargés positivement à l'extrémité Cterminale des hélices. En outre, on constate que les fragments de phosphate se fixent fréquemment à l'extrémité N-terminale des hélices et qu'un certain nombre d'enzymes ont leur site actif à proximité de l'extrémité N-terminale d'une hélice alpha. →Partie d'une chaîne polypeptidique (conformation étendue) montrant la direction d'un moment dipolaire amide unique (à gauche) et un dessin animé d'une hélice alpha illustrant les dipôles amides individuels (approximatifs) et le macrodipôle hélicoïdal global. Les charges partielles de l'hydrogène de l'amide et de l'oxygène du carbonyle sont indiquées en unités de la charge élémentaire contribuant à un moment dipolaire global de 3,46 unités Debye (équivalent à une charge de 0,5 unité séparée par 1,5 Angström). 2) Les feuillets béta - Hélice : entre i et i+1 nous avons 1,5 angström--> i + i+2 = 3 angström 30 angst --> 20 a.a Feuillets Beta : entre i et i+2 nous avons 7 angst , entre i et i+1 = 3,5 angst Conformation étendu, résidu tend vers l'extérieur 30 angst --> 7 aa Pauling et Corey ont dérivé un modèle pour la conformation des protéines fibreuses connues sous le nom de bêta-kératines. Dans cette conformation, le polypeptide ne forme pas une bobine. Au lieu de cela, il zigzague dans une conformation plus étendue que l'hélice alpha. Les résidus d'acides aminés dans la conformation bêta ont des angles phi négatifs et les angles psi sont positifs. Les valeurs typiques sont phi = -140 degrés et psi = 130 degrés. En revanche, les résidus en forme d'hélice alpha ont des angles phi et psi négatifs. Une section de polypeptide avec des résidus en forme de bêta est 21 ALMOHAMAD Rahma 7/11/22 appelée un brin bêta et ces brins peuvent s'associer par des interactions de liaison hydrogène de la chaîne principale pour former un feuillet bêta. La distance axiale entre les résidus adjacents est de 3,5 angströms. Il y a deux résidus par unité de répétition, ce qui donne au brin bêta un pas de 7 angströms. En comparaison, dans l'hélice alpha, la distance axiale entre les résidus adjacents n'est que de 1,5 angström. Il est clair que les polypeptides dans la conformation bêta sont beaucoup plus étendus que ceux dans la conformation hélicoïdale alpha. Feuilles bêta parallèles, antiparallèles et mixtes : Dans les feuillets bêta parallèles, les brins vont tous dans la même direction, alors que dans les feuillets antiparallèles, ils vont tous dans des directions opposées. Dans les feuillets mixtes, certains brins sont parallèles et d'autres antiparallèles. Le schéma ci-dessous représente un feuillet bêta antiparallèle à trois brins. Il met en évidence le schéma très régulier des liaisons hydrogène entre les groupes NH et CO de la chaîne principale des brins constitutifs. Le modèle de Pauling-Corey du feuillet bêta est planaire. Cependant, la plupart des feuillets bêta trouvés dans les structures radiologiques des protéines globulaires sont tordus. Cette torsion est gauchère, comme indiqué cidessous. La torsion globale du feuillet résulte d'une rotation relative de chaque résidu dans les brins de 30 degrés par acide aminé dans le sens de la droite. 22 ALMOHAMAD Rahma 7/11/22 3) Les tournants La séquence doit soit retourner à l’intérieur de la structure ou à la surface et ne peut pas s’allonger. Les tournants se trouvent très souvent à la surface. Petite structure de 4, ou parfois 5 a.a qui contiennent un nbr important de glycine et de proline et qui font des liens H entre l'a.a i , i+3, i et i +4. - Glycine --> tt angles phi et psy (plus flexible) - Proline --> par elle mm du fait de sa conformation et de sa chaine latéral qui revient sur elle, par elle-même renvoi la chaine polypeptidique de l'autre coté.(moins flexible) Les virages sont la troisième des trois structures secondaires "classiques". Environ un tiers de tous les résidus des protéines globulaires sont contenus dans des virages qui servent à inverser la direction de la chaîne polypeptidique. Cela n'est peut-être pas si surprenant, car le diamètre du domaine protéique globulaire moyen est d'environ 25 angströms (une conformation polypeptidique étendue nécessiterait environ 7 résidus pour traverser le domaine avant de devoir changer de direction). Les virages sont situés principalement à la surface des protéines et contiennent par conséquent des résidus polaires et chargés. La reconnaissance d'anticorps, la phosphorylation, la glycosylation, l'hydroxylation et l'épissage d'intron/exon se trouvent fréquemment au niveau ou à proximité des virages. Cependant, il n'est pas clair si cela est dû à une reconnaissance spécifique ou à la localisation en surface des conformations des virages. Les virages ont été identifiés pour la première fois par Venkatachalam (1968) qui en a trouvé trois types, chacun contenant une liaison hydrogène entre l'oxygène carbonyle du résidu i et l'azote amide de i+3. Ces trois types de virages sont désignés I, II et III. Le type III est simplement un tour unique d'hélice 3,10. Il existe des préférences d'acides aminés dépendant de la position pour les résidus dans les conformations de virage. Le type I peut tolérer tous les résidus en position i à i+3 à l'exception de la Pro en position i+2. La proline est favorisée en position i+1 et le gly est favorisé en position i+3 dans les virages de type I et II. Les chaînes latérales polaires de Asn, Asp, Ser et Cys occupent souvent la position i où elles peuvent se lier par hydrogène au NH du squelette du résidu i+2. Idéalement, les virages de type I' ont Gly en positions i+1 et i+2 et les virages de type II' ont Gly en position i+1 car la présence d'un atome de CB provoquerait un conflit stérique avec l'oxygène carbonyle du peptide. 23 ALMOHAMAD Rahma 7/11/22 3éme COURS : 26/9/22 Les virages inversés sont divisés en classes basées sur les angles phi et psi des résidus en position i+1 et i+2. Les types I et II illustrés dans la figure cidessus sont les virages inversés les plus courants, la différence essentielle entre eux étant l'orientation de la liaison peptidique entre les résidus en (i+1) et (i+2). Les angles de torsion des résidus (i+1) et (i+2) dans les deux types de virage se situent dans des régions distinctes du diagramme de Ramachandran. Les a.a sont des isomères de type L et donc si on prend leur image miroir → type D(existe pas chez l’homme). mais ici le tournant garde la même structure et va seulement se tourner. (table pas à connaitre) Pour un a.a on a le lien peptidique qui est plan →180° en TRANS (quasiment tt le temps sauf qq exception proline I →CIS) pour cet angle oméga. Angle Phi et Psy qui peuvent bouger et prendre des torsions différentes. 24 ALMOHAMAD Rahma 7/11/22 Tous les angles ne sont pas possible pour Phi et psi sauf pour la Glycine qui peut prendre tous les angles possibles car elle n’a qu’un H comme chaine latérale. Pour les autres a.a (en rouge valeurs importantes et en jaune valeurs encore accepté.) Hélice alpha →environ 60° en phi et 40-50° en psi La plupart des hélice alpha → main droite (parfois main gauche) On prend le Pouce comme direction de notre hélice (du N-t vers le C-t) →protéine très riche en hélice alpha→pour chaque aa on a mis un point pour les angles phi et psi et on voit qu’ils se rassemble à un mm endroit. →protéine riche en feuillet béta et on voit les angles phi et psi se rassemble en haut pour la plupart. Certains tournants peuvent ressembler à des hélices. On peut admettre que 1 ou 2 aa se trouvent en dehors de la région favorable de la carte de Ramachandran (si c’est des glycines c’est normal) mais si c’est plus d’une dizaine c’est bizarre et il faut se demandé si la protéine est bonne ou pas. Les tournants sont formé de 3 à 5 résidu avec pont H qui les relie Se trouve, souvent, à la surface des protéines. Il y a un tournant pour le ramener à l'intérieur de la structure globulaire. Il y a jusqu’à 8 types de tournants. • Image miroir peptide : (a.a)les isomère de type D n'existe pas. • Proline favorise conformation Cis. • Structure en cart en abscisse Phi et ordonné psi. Problème stérique--> phi et psi ne peuvent pas prendre toutes valeurs, il y a des contraintes stériques. • Pour la Glycine --> phi et psi peuvent prendre toutes les valeurs d'angle possible 25 ALMOHAMAD Rahma 7/11/22 Certains aa ont des préférences pour se retrouver dans des struct. Secondaire particulière. Ex : glutamate, méthionine et alanine aiment se retrouver en hélice alpha. Et ceux qui n’aiment pas se retrouver en hélice alpha → les hélix breaker : Glycine et proline (déstabilise l’hélice) Et ceux qui aiment être en feuillet béta : isoleucine, valine, tyrosine Béta Bend : région tordu sans vraiment une structure ou à la rigueur un tournant→ et on voir que les aa qui n’aimaient pas être en hélice (pro et gly) aiment être en tourant. Pour les hélices on voit que certains aa aiment être soit en N-t (aa qui sont chargé négativement) ou C-t (aa chargé positivement). La proline a un pourcentage très présent dans les tournants (alors que ce n’est pas vraiment un aa très présent dans les protéines) Important à savoir Struct. Sec = repliement local de la chaine polypeptidique 26 ALMOHAMAD Rahma 7/11/22 3éme niveau de structure : la structure tertiaire = structure tridimensionnelle →rassemblement de toutes les struct 2° en un espace tridimensionnelle pour former une struct très compacte et globulaire. Schéma très simplifié : dans la partie déroulé on voit en carré rouge les partie hydrophobes (chaine latéral non-polaire) et les chaines polaire (beige). Et donc le but de la protéine est de mettre ses parties hydrophobe à l’abri, à l’intérieur très compacté et laisser les chaines polaire vers l’extérieur pour avoir une bonne interaction avec l’eau, en tout cas le solvant aqueux qui règne dans la cellule. LES INTERACTIONS (important à savoir) Liaisons non covalentes stabilisant les protéines Les liaisons hydrogène. Note : règle de Pauling →une protéine va essayer de faire le plus de liens H possible : d’abord avec elle-même (localement) et c’est ce qui donne lieu à l’apparition de struct. 2° et ensuite à de longue distance pour former la struct. 3°. Un lien H n’a pas bcp d’énergie en soit mais regroupé en centaine (300, 400 aa : longueur moyenne d’une prot) et où chaque aa peut faire jusqu’à 3 lien H, on compte des milliers de liens H et donc cela devient très important. Les études structurales des protéines reployées montrent que les groupements susceptibles de former des liens H pratiquement toujours trouvent un partenaire. Les groupements susceptibles de former des liens H incluent les groupements carbonyl et amide de la chaîne principale ainsi que des chaînes latérales. Les groupements polaires exposés à la surface des protéines ont très souvent l'eau comme partenaire de lien H. Les groupements polaires au sein du coeur de la protéine d'habitude font des liens H entre eux. La plupart des protéines contiennent au moins quelques molécules de solvant enfouies qui font des liens H avec des groupements de chaînes latérales ou la chaîne principale à l'intérieur de la protéine. Les etudes de mutagénèse ont montré que l'élimination d'un partenaire dans un lien hydrogène est souvent déstabilisante pour une structure de protéine et que les liens hydrogène contribute généralement de l'ordre de 12 kJ/mol dans l'énergie de stabilisation d'une protéine. Les interactions hydrophobes. (ou plutôt un effet hydrophobe) Note : Il n’y a pas de force lié aux interact. Hydrophobe la seule force qui y est lié est la force de Van Der Walls. Mais ces interact. sont très importantes pour former le cœur compact et globulaire de la protéine. La protéine est ce qu’il y a de plus dense dans un corps (compaction par effet hydrophobe très important). Une force essentielle dans le reploiement des protéines implique de soustraire les chaînes latérales des acides aminés hydrophobes de leur exposition au solvant. Ceci s'accomplit en les séquestrant au sein du coeur de la protéine. De ce fait, le packing intérieur (i.e. Les forces de van der Waals) est optimisé par le choix approprié de chaînes latérales non polaires dans la séquence primaire. Exposer des groupements non polaires au solvant est entropiquement défavorable, donc le reploiement de la chaîne polypeptidique de manière à séquestrer les 27 ALMOHAMAD Rahma 7/11/22 Les interactions électrostatique : Note : on a des a.a chargé + (lysine arginine) et – (glutamate aspartate) et donc le + et – vont s’attirer. En Biochimie on appelle ces interactions des pont salins, les charge + sont tjrs lié à des NH et – sont tjrs lié aux COO-. En plus des interactions colombienne (charge à charge) il y a un lien H qui vient se former →et donc c’est pour cela qu’on parle de pont salin (très énergétique, ce ne sont pas des liens covalents). Qd il se forme à l’intérieur de la protéine, dans un environnement hydrophobe, la cste diélectrique diminue d’un facteur 20 et donc la force de ces liaisons augmentent d’un facteur 20. Normalement on ne peut pas avoir des liaisons de ce type-là dans un env. hydrophobe. Mais on voit que dans les protéine si, mais qu’en plus ce sont des interactions extrêmement STABLE du fait qu’elles sont 20 fois plus forte qu’une interact° similaire dans un env. aqueux. Ces interactions entre charges opposées de chaînes latérales sont aussi connues sous le nom de “pont salin” (Salt-bridges). Les extrémités amino et carboxyl terminales sont pleinement ionisées à pH physiologique, ainsi que les chaines latérales des Asp (-), Glu (-), Lys (+) et Arg (+). L'Histidine peut aussi être chargée (+) à pH <=6.0. L'attraction de charges opposées est modulée par la constante diélectrique de l'environnement. Les groupements chargés à la surface sont au sein d'une constante diélectrique de 78.5 et sont donc plus faible que ceux dans le cœur hydrophobe (e ~4). Donc toute interaction électrostatique enfouies est relativement forte. La présence d'ions en solution peut aussi écranter les charges électrostatiques et les affaiblir. Les interactions de Van der Waals. Note : interact° lié au cœur hydrophobe et qui sont énergétiquement faible mais en quantité nombreuse elles contribuent énormément à la stabilité de la protéine. Avantage des prot :à part les liens covalents (entre atomes et a.a) toutes les autres interactions sont faible mais tellement nombreuse que au final cela contribue bcp à la stabilité de la protéine. Interaction électrostatique : D’un côté on a les acides carboxyliques : glutamate et aspartate. Et de l’autre côté on a : Lysine : NH3+ (amine primaire) et Arginine ( groupement guanidinium (NH+)) : Les interaction entre – et + ce sont des interactions coulombiennes électrostatique classique (ex : interactions saline : sel). Mais en plus comme nous avons un NH et un CO -> on peut faire un lien H entre les deux ce qui contribue plus à la stabilité de l’interaction électrostatique. Liaison H →Pont Hydrogène → que l’on appelle pont salin. L´hydrophobicité est un effet mais force de Vander Walls c’est une vrai force. Le fait que deux choses hydrophobe se rassemble c’est les force de Vander Walls qui les attirent l’une de l’autre. Dans l’effet hydrophobe il y’a pas de force en soit. Le cœur hydrophobe compacté d'une protéine représente des interactions de van der Waals optimisées entre résidus non polaires. Bien qu'individuellement faible, ces interactions nombreuses au sein du cœur des protéines contribuent de manière significative à la stabilisation de la structure native. →En résumé, la structure est due au reploiement des différentes structures secondaires grâce aux différentes interactions non- covalentes (+ ponts disulfures). 28 ALMOHAMAD Rahma 7/11/22 Réaction d'oxydoréduction des cystéines formation de ponts disulfures : Pont Disulfure (lien covalent) Deux cystéine peuvent être oxyder en un pont disulfure. Les cystéine font des réaction redox. Donc dans un milieu oxydant, si il peut se faire( les deux Cys bien placé) le pont disulfure va se faire dans des conditions oxydantes. Dans un monde d’oxygène —> conditions oxydantes Donc l’extérieur de notre corps et à priori de nos cellules est oxydant. Si la protéine est en dehors de la cellule elle aura tendance à faire des ponts disulfure (milieu oxydant) ce qui va la stabiliser. À l’intérieur de la protéine (milieu réducteur) bcp moins de pont disulfure. Intérieur de la cellule réducteur. Tripeptide : glutathion (thiol) Cys placé bizarrement. Ce qui fait qu’à l’intérieur de la cellule —>milieu réducteur. Et donc la réaction redox a tendance à se faire à l’inverse et donc sépare le pont disulfure en ses Cys libres. (Important : intérieur d’une cellule réducteur). Protein data bank (PDB) : banque structure que l’on connaît à haute résolution 200000 (redondante) —> site important pour en apprendre sur les protéines. CATH Protein Structure Classification Introduction La base de données CATH est une classification hiérarchique par domaine des structures protéiques dans la banque de données des protéines de Brookhaven. Toutes les structures non protéiques, modèles et "C-alpha seulement" ne sont pas classées dans CATH. Seules les structures cristallines résolues à une résolution supérieure à 3,0 angströms sont prises en compte, ainsi que les structures RMN. Ce filtrage de la banque de données de Brookhaven est effectué à l'aide du programme SIFT (Michie et al, (1996)). Cette hiérarchie comporte quatre niveaux principaux : classe, architecture, topologie (famille de plis) et superfamille homologue. Chaque niveau est décrit ci-dessous, ainsi que les méthodes utilisées pour assigner les structures à une famille spécifique Domaines Les protéines multidomaines sont subdivisées en leurs domaines constitutifs à l'aide d'une procédure de consensus (Jones et al, soumis), basée sur trois algorithmes indépendants de reconnaissance des domaines (DETECTIVE (Swindells, 1995), PUU (Holm & Sander, 1994) et DOMAK (Siddiqui et Barton, 1995). Ceci permet actuellement de définir automatiquement environ 53% des protéines (c'est-à-dire celles pour lesquelles ces algorithmes sont en accord) comme des protéines à un ou plusieurs domaines. Les structures restantes se voient attribuer des définitions de domaine manuellement, en choisissant ce qui a été déterminé comme étant la meilleure attribution faite par l'un des algorithmes, une nouvelle attribution, ou une attribution alternative obtenue dans la littérature. Les protéines multidomaines sont ensuite divisées en domaines distincts. Toute la classification est effectuée sur des domaines protéiques individuels. 29 ALMOHAMAD Rahma 7/11/22 Classe, niveau C : Note : composition des protéines en hélice alpha, feuillet beta, … La classe est déterminée en fonction de la composition de la structure secondaire et de l'encombrement au sein de la structure. Elle peut être attribuée automatiquement pour plus de 90% des structures connues en utilisant la méthode de Michie et al. (1996). Pour les autres, une inspection manuelle est utilisée et, si nécessaire, des informations provenant de la littérature sont prises en compte. Trois classes principales sont reconnues : principalement-alpha, principalementbeta et alpha-beta. Cette dernière classe (alpha-beta) comprend à la fois les structures alternées alpha/beta et les structures alpha+beta, telles qu'elles ont été définies à l'origine par Levitt et Chothia (1976). Une quatrième classe est également identifiée, qui contient des domaines protéiques à faible teneur en structure secondaire. Architecture, niveau A : Note : comment les feuillet beta se mettent dans l'espace, si les hélice vont toutes dans le même sens (bundle parallèle ou antiparallèle) Ceci décrit la forme globale de la structure du domaine telle que déterminée par les orientations des structures secondaires mais ignore la connectivité entre les structures secondaires. Elle est actuellement attribuée manuellement en utilisant une description simple de l'arrangement de la structure secondaire, par exemple un tonneau ou un sandwich à trois couches. Une référence est faite à la littérature pour les architectures bien connues (par exemple le propulseur bêta ou le faisceau de quatre hélices alpha). Des procédures sont en cours de développement pour automatiser cette étape. Topologie (Famille de plis), niveau T Note : comment les structures secondaires sont connecté l’une avec l’autre. À ce niveau, les structures sont regroupées en familles de plis en fonction de la forme globale et de la connectivité des structures secondaires. Ceci est fait en utilisant l'algorithme de comparaison de structures SSAP (Taylor & Orengo (1989)). Les paramètres de regroupement des domaines dans la même famille de plis ont été déterminés par des essais empiriques dans toute la banque de données (Orengo et al. (1992), Orengo et al. (1993)). Les structures qui ont un score SSAP de 70 et où au moins 60% de la plus grande protéine correspond à la plus petite sont assignées au même niveau T ou à la même famille de plis. Certaines familles de plis sont très fortement peuplées (Orengo et al. (1994)), notamment dans les architectures sandwich à 2 couches principalement bêta et les architectures sandwich à 3 couches alpha-bêta. Afin d'apprécier plus facilement les relations structurelles au sein de ces familles, elles sont actuellement subdivisées en utilisant un seuil plus élevé sur le score SSAP (75 pour certaines familles principalement bêta et alpha-bêta, 80 pour certaines familles principalement alpha, ainsi qu'une exigence de chevauchement plus élevée (70%)). Superfamille homologue, niveau H Note : H--> homologie : si on regarde une séquence de protéine et si on essaye de l'aligner avec une autre séquence de protéine d’une autre protéine, si il y a 30% des a.a qui sont concordant, on estime que c’est une prot de la même famille(si à 80% on est casi sure que c’est la mm famille). Il existe aussi 30 ALMOHAMAD Rahma 7/11/22 des modèles de structure par homologie : si une des deux struct. est connue on va essayer d’enfiler la séquence de l’autre exactement sur la séquence de la première et ensuite on va faire une minimisation d’énergie et on va obtenir la struct de la nvelle prot qui est très homologue à la première. Ce niveau regroupe les domaines protéiques dont on pense qu'ils partagent un ancêtre commun et qui peuvent donc être décrits comme homologues. Les similarités sont d'abord identifiées par des comparaisons de séquences, puis par des comparaisons de structures à l'aide de SSAP. Les structures sont regroupées dans la même superfamille homologue si elles répondent à l'un des critères suivants : ● Identité de séquence >= 35%, 60% de la plus grande structure équivalente à la plus petite. ● Score SSAP >= 80,0 et identité de séquence >= 20%, 60% de la plus grande structure équivalente à la plus petite. ● Score SSAP >= 80,0, 60% de la plus grande structure équivalente à la plus petite, et domaines qui ont des fonctions connexes. Familles de séquences, niveau S Les structures au sein de chaque niveau H sont en outre regroupées sur l'identité de séquence. Les domaines regroupés dans les mêmes familles de séquences ont des identités de séquence >35 % (avec au moins 60 % du plus grand domaine équivalent au plus petit), ce qui indique des structures et des fonctions très similaires. - C : on regarde d’abord si c’est alpha ou béta - A : Ensuite si il y a que du alpha ou que du béta ou un mélange des deux. - T : quelle type de prot on regarde. Si on a 4 hélice alpha qui font un faisceau de 4 hélices(A) ou 4 Brin béta qui forment une clé grec(C) ou un mélange d’hélice alpha et brin béta (HéliceBrin-Hélice-Brin→ c’est ce que l’on appelle un Rossman Fold. On a à chaque fois une hélice alpha qui ramène le brin béta de l’autre coté (B). - H : encore plus de précision. 31 ALMOHAMAD Rahma 7/11/22 Famille des CATH : en mélange alpha et beta on a le TM barrel, le Sandwich (roll) → on a ceux qui ressemble à B-lactamase et flavodoxin. (juste à titre informatif pour connaitre le classement). En plus du alpha&béta on : Alpha + beta --> un domaine qui est en alpha séparé du domaine qui est en feuillet béta dans la séquence . une partie de la séquence en hélice alpha et l’autre partie en feuillet béta bien séparé. Alpha/beta --> mélangé alpha puis brin beta puis alpha ….(ex : rossman fold, sandwich) (Pour visualiser les structures des protéines :) Différentes possibilités de représentations. Rasmol (http://www.umass.edu/microbio/rasmol/) Deep View (http://us.expasy.org/spdbv/) ... Exemples de structures de protéines (sur le site) : Fichier 4 d’un Faisceau d’hélice alpha : classe 1 = ça veut dire que c’est de l’hélice alpha ; l’Architecture = 1,20 ce qu