Analisi della proteina XP_058581521.1 di Neofelis nebulosa PDF
Document Details
Uploaded by Deleted User
Paul Ferrari
Tags
Summary
This document analyzes protein XP_058581521.1 from the Neofelis nebulosa species, a mammal belonging to the Felidae family. It describes the protein as an enzyme and a study of its structure, function, and evolutionary relationships.
Full Transcript
Nome: Paul Ferrari Matricola: 332002 Analisi della proteina XP_058581521.1 di Neofelis nebulosa RIASSUNTO È stata condotta un’analisi su la proteina XP_058581521.1 appartenete all’organismo Neofelis nebulosa un mammifero appartenete alla famiglia dei felini. dalla analisi è emerso quanto segu...
Nome: Paul Ferrari Matricola: 332002 Analisi della proteina XP_058581521.1 di Neofelis nebulosa RIASSUNTO È stata condotta un’analisi su la proteina XP_058581521.1 appartenete all’organismo Neofelis nebulosa un mammifero appartenete alla famiglia dei felini. dalla analisi è emerso quanto segue: si tratta di un enzima, Aromatic-L-amino-acid decarboxylase (AADC), che catalizza la decarbossilazione della L-3,4-diidrossifenilalanina (DOPA) in Dopamina e dell’L-5-idrossitriptofano(L-5HTP) in Serotonina. utilizza come cofattore il Piridossal 5’-fosfato. La massa molecolare predetta della proteina è 56,6(KDa), inoltre la proteina risulta essere lievemente acida a seguito del punto isoelettrico con valore pari a 6.29. gli amminoacidi più abbondanti che compongono la proteina hanno la caratteristica di essere idrofobici, in particolare troviamo Leucina (Leu, L, 10,8%), Alanina (Ala, A, 9,6%), e Serina (Ser, S, 6,9%). Proteine omologhe sono presenti sia in eucarioti che nei procarioti, risultando così conservata in tutti gli organismi. Dall’allineamento multiplo le sequenze di (AADC), appartenenti ai diversi organismi i siti di legame con il substrato risultano conservati negli animali e parzialmente non conservati a livello di Funghi, Piante, Mammiferi. Mentre per i siti di legame con il cofattore risultano conservati nella quasi totalità delle sequenze e parzialmente negli archea. l’albero filogenetico mostra come le relazioni fra le sequenze analizzate sono in accordo con le relazioni evolutive tra le specie in quanto le distanze fra le varie sequenze rispettano gli standard evolutivi. INTRODUZIONE La proteina XP_058581521.1 appartiene all’organismo Neofelis nebulosa, animale mammifero appartenente all’ordine dei carnivori (Carnivora) e alla famiglia Felini (Felidae). In banca dati la proteina è descritta come Aromatic-L-amino-acid decarboxylase ed è codificata dal gene DDC. Si tratta di un enzima che catalizza la decarbossilazione della L-3,4-diidrossifenilalanina (DOPA) in dopamina e dell’L-5-idrossitriptofano(L-5HTP) in serotonina, ed utilizza come cofattore il Piridossal 5’-fosfato. In banca dati La proteina si localizza in tre siti cellulari differenti ovvero a livello della regione Citoplasmatica, Citosolica, ed in Esosoma Extracellulare. Le reazioni catalizzate dall’enzima sono: L-dopa + H + = dopamina + CO2 e 5-idrossi-L-triptofano + H + = serotonina + CO2. La cinetica di reazione dell’enzima è stata redatta mediante l’utilizzo della proteina omologa P20711 di Homo sapiens, essendo tale parametro sconosciuto in banca dati per la proteina XP_058581521.1, data quindi l’omologia si presume che svolga la medesima azione catalitica. La proteina Aromatic-L-amino-acid decarboxylase (AADC) è stata riportata nelle pubblicazioni di: Himmelreich et al. 2022, Simons et al. 2023, e Rizzi et al 2022. 1 ANALISI Il numero di accesso XP_058581521.1 corrisponde ad una sequenza di 480 Amminoacidi. Il record della proteina in formato FASTA è il seguente: >XP_058581521.1 aromatic-L-amino-acid decarboxylase [Neofelis nebulosa] MNSSEFRRRGKEMTDFVADYLDGIEGRQVYPDVQPGYLRSLVPSTAPEEPDAFEDIINDVERIIMPGVTH WHSPYFFAYFPSANSYPAMLADMLCGAIGCIGFSWAASPACTELETVMMDWLGKMLKLPEAFLAGEAGEG GGVIQGSASEATLMALLAARTKVTRRLQAASPGLTQGAIMDKLVAYSSDQAHSSVERAGLIGGVKLKAIP SDGTFAMRGSALQEAMERDKAEGLIPFFVVATLGTTSCCSFDSLLEVGPICNKEDMWLHIDAAYAGSSFI CPEFRHLLNGVEFADSFNFNPHKWMLVNFDCSAMWVKKRTDLIGAFKLDPVYLKHSHQDSGLITDYRHWQ LPLGRRFRSLKMWFVFRMYGVKGLQAYIRKHVQLAHEFEHLLHQDPRFEICAEVTLGLVCFRLKGSNKLN EALLERINGTKKIHLVPCHLRDKFVLRFAICSRTLESAHVRLAWEHISQLASDLLGAEKE La proteina è codificata da una sequenza codificante di 1.443 nucleotidi (intervallo 161-1603 della sequenza dell’mRNA, XM_058725538). La massa molecolare prevista del peptide è 56,6 KDa, il coefficiente di estinzione è 68130 M-1Cm-1 in condizioni ossidanti (con 2 ponti disolfuro), punto isoelettrico è 6.29(proteina leggermente acida). Gli amminoacidi più abbondanti hanno caratteristiche idrofobiche, in particolare leucina (L, Leu. 10,8%), alanina (Ala, A. 9,6%), e serina (Ser, S. 6,9%). Proteine omologhe sono presenti in Archea (340), Batteri (>5000), Metazoi (>5000), Funghi (1260), Piante (1299). La proteina (AADC) risulta essere conservata in tutti i gruppi di organismi. La sequenza proteica è stata confrontata con le sequenze omologhe: WP_287585693.1 da Archea (Candidatus borrarchaeum sp) WP_208099242.1 da Batterio (Nostoc sp. 106C) XP_023955732.2 da Metazoa (Chrysemys pictabellii) XP_054213346.1 da Mammifero (Homo sapiens) XP_018385799.1 da Fungo (Alternaria alternata) XP_021280365.1 da Pianta (Herrania umbratica) L'allineamento multiplo (Figura 1) mostra che vi sono regioni conservate in tutte le sequenze. La banca UniProt nel record della proteina di Homo sapiens indica come amminoacidi di legame con i substrati (L-DOPA) e (L-5HTP) (T82, H192) mentre gli amminoacidi coinvolti nel legame con il cofattore Piridossal 5’-fosfato sono: (A148, S149, T246, N300). Gli amminoacidi di legame al substrato risultano essere conservati in quasi tutte le sequenze ed indicati dal colore rosa, mentre quelli non conservati in giallo in alcune sequenze (Figura 1), T82 non risulta conservato nelle sequenze di N.nebulosa(mammifero) dove e sostituito con S cosi vale anche per le sequenze di (N.sp106c(batterio), H.umbratica(pianta), ed A.alternata(fungo)). H192 risulta conservato in tutte le sequenze in esame, ovvero (N.nebulosa, A.alternata(fungo), H.umbratica(pianta), N.sp106c(batterio), ed in C.borrarchaeum(archea)). per quanto riguarda gli amminoacidi coinvolti nel legame con il cofattore Piridossal 5’-fosfato 2 quelli conservati sono indicati in verde mentre quelli non conservati in viola. A148 risulta conservato in tutte le sequenze tranne in C.borrarchaeum(archea) dove e sostituito con G. S149 è conservato in tutte le sequenze, T246 è conservato in tutte le sequenze, N300 risulta conservato in tutte le sequenze tranne C.borrarchaeum(archea) dove è sostituito con D. In presenza dei dati raccolti è possibile esprimere che i siti di legame con il substrato nella proteina XP_058581521.1 (AADC) risultano parzialmente conservati nelle sequenze di animali e parzialmente non conservato in funghi, piante e mammiferi, mentre i siti di legame con il cofattore risultano essere conservati nella quasi totalità delle sequenze, e parzialmente negli archea. L'identità̀ percentuale media tra le sequenze di mammiferi e animali (non mammiferi) è del 59%. L'identità̀ percentuale media tra le sequenze di Animali (compresi i mammiferi) e Funghi è del 39%. L'identità̀ percentuale media tra le sequenze di Animali (compresi i mammiferi) e Piante è del 47%. L'identità̀ percentuale media tra le sequenze di Procarioti ed Eucarioti è del 24%. L’identità percentuale media tra le sequenze di eucarioti e del 52%. L'albero filogenetico (Figura 2) mostra che le relazioni evolutive tra le sequenze sono in accordo con le relazioni evolutive tra le specie. Le sequenze di animali formano un unico cluster, all’interno del quale si distinguono le sequenze dei mammiferi, la sequenza di pianta si trova ad una distanza evolutiva coerente con l’evoluzione fra specie, la sequenza di fungo si trova ad una distanza corretta da quella di mammiferi ed animali, mentre le sequenze di batterio ed archea, sono ad una corretta distanza dagli altri organismi, essendo più distanti da tutte le altre sequenze. METODI Sono stati utilizzate le banche dati: NCBI(https://www.ncbi.nlm.nih.gov/protein/XP_058581521.1), UniProt(https://www.uniprot.org/uniparc/UPI00272B34E2/entry), (link proteina omologa umana P20711)( https://www.uniprot.org/uniprotkb/P20711/entry), WikiPedia(https://en.wikipedia.org/wiki/Aromatic_L-amino_acid_decarboxylase). I parametri chimico-fisici della proteina sono stati determinati con: ProtParam(https://web.expasy.org/protparam/). Le sequenze omologhe sono state ricercate e analizzate tramite: BlastP(https://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastp&PAGE_TYPE=BlastSearch &BLAST_SPEC=&LINK_LOC=blasttab&LAST_PAGE=blastp&QUERY=XP_058581521.1), selezionando il database refseq proteins per la ricerca nei vari organismi ed impostando Max target sequences=5000 e expect treschold=1e-5. L’allineamento multiplo è stato costruito con Clustalx e visualizzato con GeneDoc. L'albero filogenetico è stato costruito con clustalx utilizzando l’algoritmo Neighbor-joining, e la correzione per le sostituzioni multiple; e visualizzato con FigTree. 3 BIBLIOGRAFIA Simons CL, Hwu WL, Zhang R, Simons MJHG, Bergkvist M, Bennison C. Long-Term Outcomes of Eladocagene Exuparvovec Compared with Standard of Care in Aromatic L-Amino Acid Decarboxylase (AADC) Deficiency: A Modelling Study. Adv Ther. 2023 Dec;40(12):5399-5414. doi: 10.1007/s12325-023-02689-6. Himmelreich N, Montioli R, Garbade SF, Kopesky J, Elsea SH, Carducci C, Voltattorni CB, Blau N. Spectrum of DDC variants causing aromatic l-amino acid decarboxylase (AADC) deficiency and pathogenicity interpretation using ACMG-AMP/ACGS recommendations. Mol Genet Metab. 2022 Dec;137(4):359-381. doi: 10.1016/j. Rizzi S, Spagnoli C, Frattini D, Pisani F, Fusco C. Clinical Features in Aromatic L-Amino Acid Decarboxylase (AADC) Deficiency: A Systematic Review. Behav Neurol. 2022 Oct11;2022:2210555. doi: 10.1155/2022/2210555 4 Figura1: l’immagine mostra l’allineamento multiplo fra la proteina oggetto di studio (AADC), con proteine omologhe provenienti, da organismi differenti. Le colonne in nero rappresentano residui conservati in tutte le sequenze, quelle ombreggiate in grigio i residui conservati nella maggior parete delle sequenze, ed in fine le colonne in bianco rappresentano sequenze non conservate. Mentre quelle marcate in rosa rappresentano gli amminoacidi del sito di legame con il substrato ovvero L-3,4-diidrossifenilalanina(L-DOPA) o L-5-idrossitriptofano(L-5HTP), tali sequenze non risultano essere conservate in tutte le proteine dell’allineamento (in giallo troviamo gli amminoacidi diversi rispetto la proteina umana), mentre in verde troviamo gli amminoacidi di legame con il cofattore ovvero il piridossal-5-fosfato, (in viola chiaro gli amminoacidi di legame al cofattore diversi dalla sequenza umana). 5 Figura 2: albero filogenetico di proteine AADC di diversi organismi, l’albero radiale senza radice è stato costruito con l’algoritmo Neighbor-joining di clustalx dopo aver corretto le sostituzioni multiple. I rami sono stati colorati in base agli organismi di appartenenza (giallo mammiferi, verde animali non mammiferi, rosa funghi, marrone archea, arancione batteri, celeste/blu piante). La barra di scala corrisponde a 0.2 mutazioni per sito 6