Bio-informatica Cursus Notes (PDF)

Summary

These notes provide an overview of bioinformatics, covering key concepts like protein structure and function, databases, and computational tools used to analyze biological data. The document explains different protein structures and factors affecting their functions. It also delves into the concept of homology and pathways.

Full Transcript

(course 5) Info podcast bioinformatie (Course 5 II) Bio-informatica Om de opdrachten in de cursus Bioinformatics volledig te begrijpen en correct te beantwoorden, is het belangrijk om de volgende concepten te beheersen: **Bioinformatica:** Dit vakgebied combineert biologie, informatica en statist...

(course 5) Info podcast bioinformatie (Course 5 II) Bio-informatica Om de opdrachten in de cursus Bioinformatics volledig te begrijpen en correct te beantwoorden, is het belangrijk om de volgende concepten te beheersen: **Bioinformatica:** Dit vakgebied combineert biologie, informatica en statistiek om biologische data te analyseren en te interpreteren. Bioinformatica tools worden gebruikt om bijvoorbeeld: - Patronen in DNA- en eiwitsequenties te identificeren. - De 3D-structuur van eiwitten te voorspellen. - De functie van genen en eiwitten te bepalen. - Evolutionaire relaties tussen organismen te bestuderen. **Databases:** Bioinformatica databases bevatten enorme hoeveelheden biologische gegevens, zoals DNA- en eiwitsequenties, 3D-structuren van eiwitten, informatie over pathways en nog veel meer. Enkele voorbeelden van databases zijn Uniprot, KEGG, PDB, en NCBI BLAST. **Eiwitstructuur en -functie:** Eiwitten zijn essentiële moleculen die een breed scala aan functies in levende organismen vervullen. De structuur van een eiwit is direct gerelateerd aan zijn functie. - **Primaire structuur:** de aminozuursequentie van het eiwit. - **Secundaire structuur:** lokale vouwingen van de polypeptideketen, zoals alfa-helices en bèta-sheets. - **Tertiaire structuur:** de 3D-structuur van het eiwit. - **Quaternaire structuur:** de structuur van een eiwitcomplex dat bestaat uit meerdere polypeptideketens. **Factoren die de eiwitfunctie beïnvloeden:** - **Aminozuursequentie:** De volgorde van aminozuren bepaalt de chemische eigenschappen van een eiwit en hoe het vouwt. - **Locatie in de cel:** Eiwitten kunnen zich in verschillende compartimenten van de cel bevinden, wat hun functie beïnvloedt. - **Interacties met andere moleculen:** Eiwitten kunnen interageren met andere eiwitten, DNA, RNA, liganden, etc. - **Post-translationele modificaties:** Eiwitten kunnen na translatie chemisch worden gemodificeerd, wat hun functie kan veranderen. - **Proteolytische klieving:** Sommige eiwitten moeten worden geknipt om actief te worden. **Homologie:** Eiwitten die een gemeenschappelijke voorouderlijke sequentie delen, worden homoloog genoemd. Herkenning: - 2 eiwitsequenties \>100 aminozuren lang en \>25% identiteit. - 2 DNA sequenties \> 100 nt lang en \> 70% identiteit - Bij een lagere % identiteit kunnen ze nog steeds homoloog zijn! - Structuur is meer geconserveerd dan sequentie, dus hoogstwaarschijnlijk hebben deze eiwitten een vergelijkbare structuur. (betekent dat de 3D-structuur van een eiwit vaak beter behouden blijft tijdens evolutie dan de aminozuursequentie) - '+' betekent vergelijkbare aminozuren. Dus ze zullen chemische en/of structurele eigenschappen delen. Homologie kan worden gebruikt om: - Evolutionaire relaties tussen eiwitten te bestuderen. - De functie van een onbekend eiwit te voorspellen op basis van zijn homologie met een bekend eiwit. - 3D-modellen van eiwitten te bouwen. Er zijn twee soorten homologie: - **Orthologie:** Homologe eiwitten in verschillende organismen die ontstaan zijn door soortvorming. Orthologe eiwitten hebben vaak een vergelijkbare functie. - **Paralogie:** Homologe eiwitten in hetzelfde organisme die ontstaan zijn door genduplicatie. Paraloge eiwitten kunnen vergelijkbare of verschillende functies hebben. **Isoform** = **geen paraloog** - Een proteïne-isoform, of \"proteïnevariant\", is een lid van een set van zeer vergelijkbare proteïnen die afkomstig zijn van een enkel gen of genfamilie en het resultaat zijn van genetische verschillen undefined **Pathways:** Een pathway is een reeks van moleculaire interacties die leiden tot een bepaald product of een verandering in de cel. - **Metabolische pathways:** Betrokken bij de synthese en afbraak van moleculen. - **Signaaltransductiepathways:** Betrokken bij de overdracht van signalen binnen en tussen cellen. - **Genetische netwerken:** Betrokken bij de regulatie van genexpressie. **Modellering en voorspelling:** Bioinformatica wordt gebruikt om de structuur en functie van eiwitten te modelleren en te voorspellen. - **Eiwitten worden gebruikt voor modellering en voorspelling in plaats van DNA** omdat de structuur van een eiwit direct gerelateerd is aan zijn functie. De DNA-sequentie bevat alleen de informatie voor de aminozuursequentie, maar niet hoe het eiwit zal vouwen. - **Multipele sequentie-uitlijning (MSA):** Wordt gebruikt om homologe sequenties te identificeren en te vergelijken. - **Topologievoorspelling:** Wordt gebruikt om te voorspellen hoe een eiwit over een membraan is gevouwen. **Tools en technieken:** - **BLAST:** Een tool om homologe sequenties te zoeken in databases. - **Uniprot:** Een database met informatie over eiwitsequenties en -functie. - **KEGG:** Een database met informatie over pathways. - **Hydropathie plot:** Een grafiek die de hydrofobiciteit van aminozuren in een eiwitsequentie weergeeft. Dit kan worden gebruikt om transmembraandomeinen te voorspellen. - **CRISPR/Cas9 en RNAi:** Technieken om genen te modificeren (overexpressie of silencing) om fenotypische eigenschappen te veranderen. - De **PDB-database (Protein Data Bank)** is een centrale opslagplaats voor 3D-structuren van biomoleculen, zoals eiwitten, DNA en RNA. **Inhoud**: Structuren bepaald via technieken zoals röntgenkristallografie, cryo-EM en NMR-spectroscopie. **Gebruik**: - Studie van eiwitstructuur en -functie. - Moleculaire modellering en geneesmiddelontwikkeling. - Begrip van biologische processen op atoomniveau. **TransMembrane prediction (TMpred)** Output: **ProtScale** voorspelt de topologie (vouwing etc) van membraaneiwitten ab initio (zonder voorafgaande kennis oftewel met sequentie van aminozuren) door de fysisch-chemische eigenschappen, zoals hydropathie, van de aminozuursequentie te analyseren. Grafiek aantoning: - Hydropathieplot: toont de hydrofobiciteit van aminozuren. Te voorspellen: - Het kan transmembraandomeinen voorspellen die zeer hydrofoob en 20-25 aa lang zijn - Het kan de aanwezigheid van een N-term signaalsequentie voorspellen, die gewoonlijk licht hydrofoob en 10-20 aa lang is - Het kan voorspellen of een proteïne een transmembraanproteïne is en hoe het over het membraan is gevouwen Voorspelling hoe eiwit over membraan vouwt (tekening): ![Afbeelding met diagram, lijn, tekst, Perceel Automatisch gegenereerde beschrijving](media/image3.png) TMD = TransMembrane Domain (deel van een eiwit dat zich door het celmembraan vouwt en vaak bestaat uit een of meerdere **transmembraan-helices)** Afbeelding met diagram, lijn, Perceel Automatisch gegenereerde beschrijving Stap 1: teken een lijn bij y = 0 (niet altijd in het midden) - y \> 0 toont hydrofobe AA-residuen - y \< 0 toont hydrofiele AA-residuen Stap 2: x-as begint bij 0? - Indien **NEE**: signaalsequentie (SS) is aanwezig maar niet weergegeven in de uitvoer. - Indien **JA**: eerste 10 AA hydrofoob (= SS) of hydrofiel (= geen SS)? - Indien SS aanwezig: N-term. **buiten** membraan Stap 3: hoeveel continue \~20-25 hydrofobe AA-regio\'s (= aantal TMD\'s)? Stap 4: daadwerkelijke tekening van proteïnetopologie (zie volgende:) ![](media/image5.png) Afbeelding met tekst, schermopname, Lettertype, lijn Automatisch gegenereerde beschrijving

Use Quizgecko on...
Browser
Browser