Genetica I PDF
Document Details

Uploaded by TolerableJoy8307
Università del Piemonte Orientale
Giampiero Valè
Tags
Summary
Il documento tratta i concetti fondamentali della genetica molecolare, concentrandosi sulla trascrizione nei procarioti e negli eucarioti, e include diagrammi utili per la comprensione. Vengono esaminate le diverse classi di RNA, i processi di maturazione e le proteine coinvolte, come la RNA polimerasi. Il documento approfondisce anche i promoter genici, le sequenze regolatrici e gli enhancer.
Full Transcript
GENETICA I Giampiero Valè Trascrizione nei procarioti e eucarioti Maturazione del RNA negli eucarioti Struttura del gene Il dogma centrale della biologia afferma che il flusso dell’informazione genetica è unidirezionale, oggi sappiamo che esistono eccezioni----- Colinearità tra sequenze del D...
GENETICA I Giampiero Valè Trascrizione nei procarioti e eucarioti Maturazione del RNA negli eucarioti Struttura del gene Il dogma centrale della biologia afferma che il flusso dell’informazione genetica è unidirezionale, oggi sappiamo che esistono eccezioni----- Colinearità tra sequenze del DNA e RNA e quelle delle proteine da loro codificate La struttura del RNA Le classi di RNA: unico RNA codificante è mRNA, tutti gli altri svolgono loro funzioni come RNA direttamente DIVERSE TIPOLOGIE DI RNA COSTITUISCONO IL TRASCRITTOMA Circa 15% del totale Circa 80% del totale Circa 2-4% del totale sito di legame al ribosoma; implicata nella MATURAZIONE del mRNA nel nucleo e nel trasporto RNA CODIFICANTI ORF Stabilizzazione, smistamento intracitoplasmatico del trascritto (localizzazione) e controllo Cap e poliA: solo efficienza sintesi proteica, contiene AAUAAA negli eucarioti, no nei procarioti, che hanno invece RNA policistronici Similitudini e differenze tra mRNA eucariotici e procariotici mRNA procariotici e eucariotici hanno emivite diverse median 5 min average 20 min average 600 min Figure 1: Measured half lives of mRNAs in E. coli, budding yeast and mouse NIH3T3 fibroblasts. (A, adapted from J. A. Bernstein et al., Proc. Natl Acad. Sci. USA 99:9697, 2002; B, adapted from Y. Wang et al., Proc. Natl Acad. Sci. USA 99:5860, 2002; C. adapted from B. Schwanhausser, Nature, 473:337, 2013). Le proteine hanno emivite diverse in diversi eucarioti Average 35 hours; histone 200 days; Average 40 min nuclear pore protein > 1 year Figure 3: Measured half lives of proteins in budding yeast and a HeLa human cancer cell line. The yeast experiment used the translation inhibitor cycloheximide which disrupts normal cell physiology. The median half life of the 4100 proteins measured in the non-dividing HeLa cell is 36 hours. (A, adapted from A. Belle et al., Proc. Natl Acad. Sci. USA 103:13004, 2006; B, adapted from S. Cambridge et al, J. Proteome Res. 10:5275, 2011.) FLUSSO INFORMAZIONE PROCARIOTI GENETICA EUCARIOTI RNA NON CODIFICANTI: rRNA e tRNA rRNA: il più abbondante (fino 80% del RNA tot nella cellula) ed è molecola predominante dei ribosomi (circa 60% in peso) Nella cellula è complessato con diverse proteine a formare subunità maggiore e minore dei ribosomi (negli euc, milioni di ribosomi/cellula) CCA Braccio accettore famiglia di piccoli trascritti (75-95 ribonucleotidi Braccio DHU Braccio TψC Braccio anticodone PROTEINE IMPLICATE NELLA TRASCRIZIONE: RNA POLIMERASI BATTERICA Una sola RNA pol con cinque subunità che formano il nucleo o core dell’enzima: due copie di una subunità chiamata alfa (α) e una copia ciascuna delle subunità beta (β), beta primo (β′) e omega (ω). Il fattore sigma (σ) controlla il legame dell’RNA polimerasi al promotore Inibita da rifampicine PROTEINE IMPLICATE NELLA TRASCRIZIONE: RNA POLIMERASI EUCARIOTI LE TRE FASI DEL PROCESSO DI TRASCRIZIONE NB RNA è sintetizzato da 5’ a 3’ NB il filamento stampo è letto in direzione 3’ a 5’ Filamento codificante (o senso) e filamento stampo In realtà al 5’ ci sono 3 gruppi fostato (vedi diapo 42) TRASCRIZIONE NEI PROCARIOTI Complesso del promotore chiuso: il DNA presenta ancora struttura a doppia elica Complesso del promotore aperto: rottura di un numero limitato di legami H tra le basi appaiate vicine al punto di inizio della trascrizione Sequenze regolatorie e sequenze consenso nel promotore Pribnow box NB QUESTE SONO LE SEQ RICONOSCIUTE DA SIGMA70 Le specifiche sequenze -35 e -10 determinano la FORZA DI UN PROMOTORE: numero di volte in cui ha inizio la trascrizione nell’unità di tempo; l’efficienza con cui RNA pol inizia trascrizione può variare di 1000 volte. FASI DELLA TRASCRIZIONE BATTERICA La sequenza consenso -35 determina la capacità di legame della RNA pol, mentre il Pribnow box controlla la velocità con cui il complesso del promotore chiuso viene convertito nel complesso del promotore aperto. Velocità di 40-50 nt al secondo Fattore rho E. coli ha sette fattori sigma: σ70 : usato in condizioni normali per trascrivere la maggior parte dei geni; σS : utilizzato quando la cellula è in condizioni di stress; σ32 : utilizzato in condizioni di shock termico; permette la trascrizione di geni che codificano per proteine che proteggono la cellula da alte e basse temperature; σE : utilizzato in condizioni di shock termico; σ54 : utilizzato quando nella cellula si ha una carenza d'azoto; σ28 (σF) : utilizzato per l'espressione dell'operone dei flagelli. TERMINAZIONE DELLA TRASCRIZIONE 6-9 nucleotidi di adenina BATTERICA Rho- Forcina 7-20 bp ricca in INDIPENDENTE coppie guanina-citosina molto stabili Questi terminatori, costituiscono circa il 50% di tutti i terminatori presenti nei procarioti TERMINAZIONE Rut=Rho utilization DELLA TRASCRIZIONE BATTERICA Rho- DIPENDENTE La proteina rho ha UN’ATTIVITÀ ELICASICA, CHE USA PER SVOLGERE L’IBRIDO RNA-DNA NELLA BOLLA DI TRASCRIZIONE, PORTANDO A TERMINE IL PROCESSO DI TRASCRIZIONE (l’attività DNA elicasi determina il distacco del mRNA dall’elica stampo del DNA) TRASCRIZIONE NEGLI EUCARIOTI Differenze con i procarioti - mRNA eucariotici sono monogenici - mRNA eucariotici sono rivestiti di proteine leganti RNA che proteggono il trascritto dall’attacco delle ribonucleasi - Il DNA degli eucarioti è strettamente impacchettato nei nucleosomi - Gli eucarioti richiedono molti fattori di trascrizione - Negli eucarioti sono presenti 5 diverse RNA polimerasi con attività specifiche - Negli eucarioti gli RNA prodotti subiscono modificazioni sia durante che dopo la trascrizione PROTEINE IMPLICATE NELLA TRASCRIZIONE EUCARIOTI: MODIFICATORI DELLA CROMATINA Modificatori della cromatina: complessi multienzimatici che possono: i) modificare il grado di interazione tra nucleosomi e DNA e ii) apportare modificazioni covalenti alle molecole CRC: ATP-dependent istoniche,rimozione/aggiunta chromatin-remodeling di gruppi acetile o metile da complexes residui di lisina degli istoni H3 e H4 o iii) sostituzioni di istoni canonici (H2A/B o H3) con varianti istoniche (H3.3 o H2A.Z) MODIFICATORI DELLA CROMATINA II MODIFICATORI DELLA CROMATINA III MODIFICAZIONI DIVERSE DELLA CROMATINA HANNO EFFETTI DIVERSIFICATI SULLA TRASCRIZIONE PROMOTORI NEI GENI EUCARIOTICI -90 determinano quando e quanto frequentemente un gene è espresso Sequenze consenso nel core del promotore Alcuni geni trascritti da RNA polII hanno solo 1 dei 2 elementi (o TATA o Inr) e qualcuno non ne ha nessuno e sono presenti elementi alternativi (DPE e BRE). In genere DPE è alternativo a Inr. STRUTTURA DEI PROMOTORI RICONOSCIUTE DA RNA POLIMERASI EUCARIOTI grandi rRNA pre-mRNA, snoRNA, alcuni miRNA, alcuni snRNA tRNA, piccoli rRNA, alcuni miRNA, alcuni snRNA ELEMENTI REGOLATIVI REMOTI: ENHANCER Possono essere localizzati a notevole distanza (anche centinaia di kb), sia a monte che a valle che talvolta all’interno del gene Lunghe fino a 200 bp contenenti siti di legame per proteine regolative che attivano la trascrizione Le proteine regolative legate dagli enhancer facilitano assemblaggio sul promotore del complesso trascrizionale: RNA pol e fattori generali di trascrizione ELEMENTI REGOLATIVI REMOTI: SILENZIATORI Possono anche legare proteine di rimodellamento della cromatina (es enzimi di metilazione istoni o deacetilasi degli istoni) con formazione di cromatina compatta inaccessibile a attivatori trascrizionali. Silencers possono anche avere come target proteine elicasi Maschera sito TATA box Geni reporter per identificare le regioni regolatorie Diverse porzioni della regione regolatoria putativa inserite a monte del gene cloramfenicolo acetiltransferasi e clonate in un vettore di espressione Esempi di geni reporter CAT, gene reporter: In presenza di CAT e di un donatore di acetile (acetilCoA marcato in C14), il cloramfenicolo viene acetilato dall'enzima producendo una miscela di molecole marcate che possono essere rivelate su TLC (cromatografia su strato sottile) o tramite autoradiografia. Gene LacZ (β-galattosidasi) Il gene LacZ codifica per la β-galattosidasi che è un enzima idrolitico che scinde i β-galattosidi es. il lattosio in glucosio e galattosio. Questo enzima provoca la colorazione delle cellule che lo esprimono quando esse si trovano in un terreno contenente X-Gal (X-galattosio) che idrolizzato genera un prodotto di colore blu (tecnica detta di screening bianco - blu). X-gal è un composto organico consistente in una molecola di galattosio legata ad un indolo sostituito. L'X-gal viene scisso dalla β-galattosidasi producendo galattosio e 5-bromo-4-cloro-3-idrossindolo. Quest'ultimo è quindi ossidato in 5,5'-dibromo-4,4'-dicloro-indaco, un composto blu insolubile Luciferasi La luciferasi è un enzima che catalizza l'ossidazione della luciferina in una reazione che, in presenza di un eccesso di ATP, ossigeno e ioni magnesio, perde energia (elettroni) sotto forma di radiazione luminosa che può essere rivelata con un luminometro. Tale reazione ha un'altissima sensibilità e ha un rapido decadimento. Il gene della luciferasi deriva dalla lucciola GFP (Green fluorescent protein) La GFP è una proteina di 238 amminoacidi della medusa Aequorea victoria. Data la sua capacità di emettere luce dopo esposizione UV, viene usata come marcatore per individuare la localizzazione di particolari proteine o per studiare l'espressione genica all'interno delle cellule. La sua struttura è organizzata in 11 foglietti β con disposizione a barile che circonda il fluoroforo. La fluorescenza intrinseca della GFP è dovuta a 3 amminoacidi (Ser-65-Tyr-66-Gly-67) che ciclizzano formando un cromoforo che ha due massimi di eccitazione: con luce UV (396 nm) luce blu (475 nm). I massimi di emissione della luce sono rispettivamente a 508 e 503 nm. PROTEINE IMPLICATE NELLA TRASCRIZIONE: FATTORI DI TRASCRIZIONE NEGLI EUCARIOTI NB: le 3 RNA pol eucariotiche non sono in grado di legare direttamente il DNA e devono essere reclutate a livello delle regioni regolative da un complesso proteico rappresentato appunto dai fattori generali di trascrizione il cui assemblaggio sul promotore del DNA avviene secondo un ordine stabilito INIZIO DELLA TRASCRIZIONE Nessuna delle 3 RNA pol eucariotiche è in grado di legare direttamente il promotore: devono intervenire i fattori generali di trascrizione TFIID: complesso multiproteico costituito da TBP e circa 12 fattori associati a TBP (TAF) ALLUNGAMENTO DELLA TRASCRIZIONE Sintesi di RNA in direzione 5’ – 3’ alla velocità di 20-25 nt/sec La RNA pol può impiegare ore per terminare la sintesi di un dato RNA (date le dimensioni notevoli dei geni eucariotici): questo richiede stabilità del complesso trascrizionale per evitare interruzioni: contributo dei fattori di allungamento che si associano alla RNA pol appena lascia il promotore TERMINAZIONE DELLA TRASCRIZIONE grandi rRNA Geni trascritti da RNA pol I: il rilascio del trascritto richiede un fattore di terminazione e implica meccanismi non molto diversi dalla terminazione Rho-dipendente tRNA, piccoli rRNA, alcuni miRNA, alcuni snRNA Geni trascritti da RNA pol III: trascrizione termina quando enzima attraversa una specifica sequenza di terminazione rappresentata da una serie di uracili (simile a terminazione intrinseca dei batteri) pre-mRNA, snoRNA, alcuni miRNA, alcuni snRNA Geni trascritti da RNA pol II: enzima procede per centinaia-migliaia di basi a valle della sequenza codificante; l’estremità 3’ è definita da un taglio su un legame fosfodiesterico effettuato quando la molecola di RNA è ancora in sintesi; il taglio è effettuato da un complesso multiproteico associato alla RNA pol su una sequenza di riconoscimento situata su RNA; al taglio fa seguito la aggiunta di circa 250 A da parte dell’enzima poli(A)-polimerasi MATURAZIONE DEL RNA NEGLI EUCARIOTI Passaggi: 1) guanilil MATURAZIONE DEL transferasi catalizza aggiunta TRASCRITTO: CAPPING di guanosina trifosfato alla estremità 5’ del mRNA; 2) guanina metiltransferasi Cap: aggiunta del nucleotide 7- catalizza aggiunta di gruppo metilguanosina al 5’ del pre-mRNA metilico a N in posizione 7 dell’anello eterociclico della da parte di un enzima specifico guanina; 3) il Cap viene aggiunto mediante la formazione di un insolito legame 5’-5’ trifosfato; Cap: i) ruolo nella esportazione del mRNA maturo al citoplasma; ii) una volta nel citoplasma, protegge il 5’; iii) permette il riconoscimento del mRNA da parte del ribosoma per avviare efficiente inizio traduzione MATURAZIONE DEL TRASCRITTO: CAPPING Altri dettagli sul Capping MATURAZIONE DEL TRASCRITTO: POLIADENILAZIONE Cleavage factor CPSF: Cleavage and polyadenilation specificity factor; CstF: cleavage stimulation factor; l’interazione tra le 2 proteine richiama altre 2 proteine (CF-I e CF-II) che effettuano fisicamente il taglio sul RNA poliA conferisce: i) agevola trasporto mRNA nel citoplasma; ii) stabilità a molti mRNA, prolungando il tempo durante il quale l’mRNA rimane intatto e disponibile alla traduzione prima di essere degradato dagli enzimi cellulari; iii) la coda di poli(A) facilita anche l’attaccamento del ribosoma all’mRNA; la coda poliA interagisce con Cap a formare un complesso RNA-proteine che agevola inizio traduzione. MATURAZIONE DEL TRASCRITTO: SPLICING Struttura di un tipico gene eucariotico costituito da 4 esoni e 3 introni MATURAZIONE DEL TRASCRITTO: SPLICING Sequenze consenso implicate nello splicing 3’ 3 elementi: 1) GU al 5’ dell’introne: sito donatore di splicing; 2) AG al 3’ dell’introne: sito accettore di splicing 3) Branch site a meno di 40 nt a monte del sito accettore (consenso: 5’-Py-N-Py-Py-Pu-A-Py-3’ MATURAZIONE DEL TRASCRITTO: SPLICING E LO SPLICEOSOMA U4, U5 e U6 formano una singola snRNP COMPLESSO MACCHINARIO RIBONUCLEOPROTEICO COSTITUITO DA 5 MOLECOLE DI RNA (snRNA)(trascritti da RNA polII e RNA polIII) E DECINE DI DIVERSE PROTEINE PER FORMARE COMPLESSI MACROMOLECOLARI DEFINITI snRNP (PICCOLE RIBONUCLEOPROTEINE NUCLEARI) Subito dopo lo splicing, un gruppo di proteine chiamate complesso di giunzione esonica (EJC) viene depositato circa 20 nucleotidi a monte di ogni giunzione esone-esone sull’mRNA. Come è fatta una snRNA che partecipa al processo di splicing Struttura dello snRNA U1: proteine diverse si associano a U1; le strutture secondarie sono essenziali per la associazione di proteine specifiche e qdi per la funzione di U1; la conformazione della forcina arancione consente il legame della proteina U1-A; quella della forcina viola il legame della proteina U1- 70K; la regione a singola elica consente il legame della proteina Sm Fenomeni di splicing aberrante nei trascritti conducono a malattie genetiche: vedremo esempi nella lezione XV (Regolazione della espressione genica negli eucarioti) AUTOSPLICING DEGLI INTRONI Alcuni introni vanno incontro a un processo di autosplicing, cioè sono in grado di staccarsi autonomamente dalla molecola di RNA di cui inizialmente facevano parte Gruppo I: si trovano in una varietà di geni, inclusi alcuni geni per l’rRNA dei protisti, alcuni geni mitocondriali dei funghi e perfino in alcuni geni di batteri e batteriofagi. Tutti si ripiegano in una struttura secondaria comune con nove gambi ad ansa che sono necessari per lo splicing Gruppo II: presenti in geni di eubatteri, archeobatteri e organelli eucarioti. Lo splicing degli introni del gruppo II si realizza attraverso un meccanismo che in parte è simile a quello dello splicing mediato dallo spliceosoma AUTOSPLICING DEGLI INTRONI: La parte intronica dell'RNA trascritto è un ribozima che catalizza la propria escissione, con meccanismo diverso a seconda che l'introne sia di I o di II gruppo (ribozima: molecola di RNA con funzioni catalitiche): Gruppo 1 Gruppo 2 UNA IPOTESI SUI VANTAGGI CONFERITI DAGLI INTRONI RIASSUMENDO, VARI PROCESSI CONDUCONO AL mRNA MATURO CHE PUO’ ESSERE ESPORTATO DAL NUCLEO NB: La acquisizione di complessi proteici che legano il Cap, il poliA o le sequenze appena congiunte di 2 esoni adiacenti segnalano il corretto completamento della fasi di maturazione del pre-mRNA; viceversa, la permanenza di un dato snRNP a livello del trascritto può segnalare splicing incompleto, escludendo il trascritto dalla esportazione nucleare EDITING DELL’RNA, PROCESSO POST-TRASCRIZIONALE A CARICO DEL mRNA MATURO Modificazione chimica della sequenza di un mRNA mediante delezione, inserzione o sostituzione di singoli nucleotidi Deaminazione sito specifica: da A a ipoxantina o da C a U Inserzione o delezione di ribonucleotidi (in particolare U) in specifiche posizioni In alcuni casi identificato il ruolo importante di RNA guida (gRNA) nel processo di editing Modificazione tessuto specifica del mRNA per apolipoproteina B mediante editing FEGATO INTESTINO Il gene per apolipoproteina B viene normalmente trascritto nel fegato e intestino umani Citidina deaminasi La proteina sintetizzata nel fegato è incorporata nelle lipoproteine a bassa densità (LDL) e serve al trasporto di lipidi e colesterolo endogeni, mentre quella dell’intestino è incorporata nei chilocromi (lipoproteine di grosse dimensioni prodotte nell’intestino) ed è usata per il trasporto nei tessuti dei lipidi assunti con la dieta STRUTTURA DEL tRNA Basi modificate che si trovano nel tRNA: prodotte per alterazione chimica delle 4 basi standard del RNA La maggior parte dei tRNA contiene da 75 a 95 nucleotidi MATURAZIONE DEL tRNA I tRNA di pro- ed eucarioti vengono trascritti sotto forma di precursori più ampi che successivamente vengono tagliati e modificati per produrre i tRNA maturi Gli introni del tRNA sono più corti di quelli che si trovano nei pre-mRNA e non hanno sequenze consenso come quelle presenti a livello delle giunzioni introne-esone dei pre-mRNA Nell’E. coli i geni per alcuni tRNA sono presenti in copia singola, mentre i geni per altri tRNA sono presenti in copie multiple; Le cellule eucarioti di solito hanno molte copie di ogni gene per il tRNA. rRNA E RIBOSOMI I ribosomi sono strutture complesse, ciascuna costituita da più di 50 proteine e molecole di RNA diverse Le cellule eucariotiche possiedono due tipi di geni per l’rRNA: un grande gene che codifica per l’rRNA 18S, l’rRNA 28S e l’rRNA 5,8S; e un piccolo gene che codifica per l’rRNA 5S. Tutti e tre gli rRNA batterici (23S, 16S e 5S) sono codificati dallo stesso tipo di gene. PROCESSAMENTO DEL rRNA L’RNA ribosomale viene processato sia nelle cellule batteriche (da enzimi) che in quelle eucariotiche (da piccoli RNA nucleolari, snoRNA) Negli eucarioti il processamento dell’rRNA e l’assemblaggio ribosomico avvengono nel nucleolo STRUTTURA DEL GENE Gene: unità di informazione genetica che consente la sintesi di un polipeptide o di una molecola di RNA In 3’, altre sequenze, es di Il promotore con le sue sequenze di poliadenilazione consentono il regolazione definisce il punto di inizio corretto completamento della della trascrizione e quale dei 2 trascrizione e che quindi fanno filamenti sarà utilizzato come anch’esse parte del gene filamento stampo Procarioti: geni i cui prodotti sono coinvolti nella stessa via metabolica sono organizzati in cluster e trascritti in un’unica molecola di mRNA policistronico; in questo caso i geni costituiscono un operone. Sono sotto il controllo di un unico promotore e quindi co-regolati Eucarioti: ogni gene è regolato da un proprio promotore e produce una molecola di mRNA monocistronico Geni dei procarioti e eucarioti semplici sono in genere più piccoli vicini tra loro Geni degli eucarioti superiori sono in genere più grandi e le distanze tra geni sono maggiori DENSITA’ GENICA IN DIVERSI ORGANISMI E’stato osservato che regioni a alta densità genica hanno > GC e geni di dimensioni dove ci sono geni piccoli, viceversa dove ci sono geni più grandi Organizzazione dei geni sui cromosomi Le regioni ad alta densità genica sono ricche in G+C, quelle a bassa densità sono ricche in A+T Sui cromosomi umani 21 e 22 ci sono rispettivamente circa 200 geni e circa 500 geni Gli introni hanno determinato un aumento delle dimensioni dei geni (I) Introni hanno determinato aumento nelle dimensioni dei geni che spesso, non essendoci corrispondente aumento delle sequenze esoniche, non si riflette in un aumento delle dimensioni degli mRNA maturi Nei geni, il contenuto in GC è abbastanza centrato sul 45-50% Nel genoma umano, il contenuto in GC è intorno al 38-40% La lunghezza degli introni è inversamente collegata al contenuto GC: - se GC è intorno al 30% la lunghezza media introni è 2300 bp - se GC è intorno al 65% la lunghezza media introni è 300 bp Variazione GC interna a 1 gene: Negli introni: GC circa 35-40%; negli esoni, GC circa 45-50% Gli introni hanno determinato un aumento delle dimensioni dei geni (II) La proporzione di sequenze introniche rispetto alle esoniche aumenta considerevolmente nei geni grandi Se i prodotti di un gene sono RNA (es rRNA) nei loro trascritti non sono presenti codoni e la sequenza di tali geni non presenta un ORF (open reading frame) I geni per gli rRNA sono organizzati in cluster sia nei pro- che negli eucarioti; vengono trascritti in una molecola di RNA unica che processata da origine alle molecole di rRNA mature Processati da enzimi Processati da snoRNP COPIA SINGOLA ORGANIZZAZIONE DEI GENI COPIE MULTIPLE: numerose copie identiche NEL GENOMA tra loro, organizzati in cluster FAMIGLIE GENICHE: geni con elevata omologia di sequenza, struttura simile e funzione correlata, organizzati in cluster GENI IN COPIE MULTIPLE Rispecchiano i casi in cui una singola copia per genoma aploide non è sufficiente a garantire adeguata quantità di prodotto genico Geni per rRNA: nell’uomo circa 300 geni in 5 cluster con 40-60 Copie multiple per: geni per rRNA, geni/cluster geni per tRNA, geni per istoni Geni per tRNA: copie multiple sia nei pro che eucarioti, anche se nn sempre organizzati in cluster; in E coli circa 100 geni, nell’uomo circa 1300 geni Organizzazione dei geni per gli istoni in diverse specie: copie multiple, però con ampia variabilità nel numero e tipo di organizzazione nelle varie specie Chr 6 umano FAMIGLIE GENICHE Geni con elevata omologia di sequenza, struttura simile e funzione correlata, organizzati in cluster, situazioni che suggeriscono una origine comune per duplicazione genica; alcuni membri della famiglia possono essere pseudogeni (copie non più funzionanti) Nelle famiglie geniche con componenti raggruppati in cluster gli pseudogeni sono generalmente ottenuti per duplicazione di membri pre-esistenti e successiva inattivazione per accumulo di mutazioni Nelle famiglie geniche con componenti interspersi nel genoma il maggior numero di copie è generalmente costituito da pseudogeni che si formano per retrotrascrizione del mRNA della copia funzionante e successiva integrazione mediante retrotrasposizione in punti cromosomici casuali (la assenza di sequenze regolatorie rende queste sequenze inattive) Geni per le globine, un esempio di famiglia genica Geni α globine chr 16 Geni β globine chr 11 Geni omologhi, ortologhi e paraloghi Geni omologhi: geni discendenti da un gene ancestrale comune i cui prodotti svolgono funzioni specifiche simili Geni ortologhi: geni omologhi presenti in specie diverse che svolgono la funzione del gene originario Geni paraloghi: geni omologhi presenti all’interno della stessa specie che formano una famiglia genica originatasi dalla duplicazione del gene capostipite Nei geni omologhi il livello di omologia è indicativo del tempo di divergenza Un esempio di famiglia genica in cui possono essere identificati i geni ortologhi e copie paraloghe è data dalla famiglia dei geni per le globine Chr 16 Chr 11 Qdi gene pre-esistente si duplica; la versione duplicata può accumulare mutazioni tanto la funzione è svolta dalla copia originale; qdi la copia duplicata può alla fine diventare uno pseudogene o codificare una funzione che, pur essendo correlata a quella originale, è diversificata Meccanismi di formazione di nuovi geni Meccanismi di divergenza di geni paraloghi Evoluzione di nuove funzioni a partire da geni paraloghi: la riorganizzazione di domini consente la formazione di diverse proteine con funzioni diversificate Un esempio di rimescolamento di esoni è dato dai diversi geni che codificano i fattori della coagulazione del sangue, proteine che hanno in comune un dominio serina proteasico; la proteina capostipite potrebbe essere stata costituita da un dominio serina proteasico e 4 domini kringle Dominio proteico con 3 ponti disolfuro GLA: carboxyglutamic acid E:EGF: epidermal growth factor Hepatocyte growth factor F1:fibronectin type 1 Tissue plasminogen activator Hepatocyte growth factor activator Urinary plasminogen F2:fibronectin type 2 activator Alcune definizioni relative alle mutazioni: Frequenza di mutazione: proporzione di mutanti in una popolazione; nel caso delle mutazioni spontanee: 10-6-10-9, in dipendenza del tipo cellulare e dell’organismo Tasso di mutazione: probabilità che una sequenza di riferimento possa subire nuove mutazioni in un intervallo di tempo definito; solitamente espresso per gene per generazione cellulare Tasso di evoluzione: numero di modificazioni per sito per anno, stima la velocità con cui una sequenza varia nel tempo; espresso come numero di modificazioni per sito per anno Mutazione e tasso di evoluzione Tasso di evoluzione: numero di modificazioni per sito per anno, stima la velocità con cui una sequenza varia nel tempo Poiché il tasso di evoluzione considera le mutazioni che vengono conservate durante l’evoluzione, non è una misura del tasso di mutazione, ma una misura delle mutazioni residue dopo l’azione della selezione naturale Stima dei tempi è ottenuta da evidenze fossili modificazioni per sito per anno Tassi di sostituzioni non sinonime e I tassi di evoluzione cambiano da gene a sinonime nei geni dei mammiferi basati gene e anche in regioni diverse dello sul confronto fra uomo e roditori stesso gene L’orologio molecolare l’orologio molecolare si basa sull’assunzione che il tasso di cambiamento nella proteina o nella sequenza del DNA sia costante. (a). Relazione fra il tasso di sostituzione amminoacidica e il tempo trascorso dalla divergenza, basato in parte sulle sequenze amminoacidiche della α-emoglobina nelle otto specie mostrate nel punto (b). Il tasso costante di evoluzione a livello proteico e di sequenze di DNA è stato impiegato come un orologio molecolare per datare gli eventi evolutivi passati. (b) Filogenesi delle otto specie rilevate al punto a e loro tempi approssimativi di divergenza basati su reperti fossili. Per esempio, si potrebbe esaminare l’enzima citocromo c in due organismi a cui le evidenze fossili attribuiscono un antenato comune 400 milioni di anni fa. Determinando quante differenze ci siano fra i due organismi nelle sequenze amminoacidiche del citocromo c, potremmo calcolare il numero di sostituzioni che hanno avuto luogo in ogni sito amminoacidico. Se si osservano 20 sostituzioni di amminoacidi, vorrà dire che dal momento in cui i due organismi si sono separati le sostituzioni sono avvenute a un tasso medio di 5 per 100 milioni di anni. Conoscendo a quale velocità scorre l’orologio molecolare possiamo utilizzare i cambiamenti molecolari nel citocromo c per datare altri eventi evolutivi: se scopriamo che il citocromo c in due altre specie si differenzia per 15 sostituzioni, il nostro orologio molecolare ci suggerirebbe che si siano separati 300 milioni di anni fa. Tasso di evoluzione delle sequenze aminoacidiche Istone H4: no differenze tra uomo e topo e solo 2 differenze tra uomo e riso; anche DNA polimerasi è molto conservata Differenze nella seq AA Qdi questo è valore tra coppie di proteine medio tra sostituzione presenti in specie diverse Aacidiche e tempo di divergenza Per un cambiamento del 1% negli AA: - 0,7-1,7 MY per immunoglobuline; - 3,3-3,7 MY per le globine; - 36 MY per collagene; - 400 MY per istoni Tempo divergenza specie diverse Tasso di evoluzione delle sequenze nucleotidiche Tasso di evoluzione elevato negli pseudogeni: 4x10-9 sostituzioni nucleotidiche per sito per anno Tasso di evoluzione nei codoni: elevato per la terza base del codone (siti sinonimi che codificano lo stesso AA); siti non sinonimi hanno invece tasso di evoluzione molto basso Siti degenerati 4 volte es terza posizione nei codoni CCT-CCC-CCA-CCG che codificano Pro hanno tasso di evoluzione più elevato rispetto ai siti degenerati 2 volte es codoni AAA-AAG che codificano Lys