Biologia Molecolare Tutto-3 PDF

Document Details

InsightfulFantasticArt

Uploaded by InsightfulFantasticArt

Tags

biologia molecolare ricombinazione omologa southern blotting cellule staminali

Summary

Questo documento discute i metodi di ricombinazione omologa in vitro e il metodo Southern blotting in biologia molecolare. Viene spiegata la strategia per identificare le cellule in cui è avvenuta la ricombinazione omologa e non quella casuale. Vengono descritti i metodi di selezione e verifica di eventi di ricombinazione.

Full Transcript

Sono molto semplici da coltivare e si possono conservare in azoto liquido per anni e annorum per...

Sono molto semplici da coltivare e si possono conservare in azoto liquido per anni e annorum per poi rimetterle in coltura. Dunque l’idea consiste che, dato che modificare l’embrione è molto complesso, si possa dissociare, dividere e selezionare una cellula che sia modificata come desiderato, la si fa crescere e riprodurre in vitro ed è utilizzata per formare un nuovo embrione. Al di sotto delle staminali si osservano altre cellule che fanno da supporto. Si favorisce l’ingresso all’interno delle cellule e poi si spera che faccia ricombinazione omoologa. Ciò nel senso che, se ci sono regioni di analogia (arancioni) può avvenire ricombinazione omologa, se man mano che si coltivano cellule si hanno danni, con rottura avendo così ricombinazione e inserimento del frammento (verde) all’interno del genoma. Non si vuole chiaramente e avere il DNA con il gene di interesse e il DNA voluto integrato in modo casuale in un’altra regione del genoma, questo perchè porta a casualità e modifiche in altri locus. Bisogna generare un DNA che favorisca il primo evento e non il secondo dunque si fa: RICOMBINAZIONE OMOLOGA IN VITRO Si fa una sostituzione mirata di un segmento di genoma endogeno con un segmento omologo di DNA esogeno. Smithies, 1985 riesce ad avere una ricombinazione omologa del gene della b-globina in ibridi di fibroblasti. La frequenza della ricombinazione omologa era però 1000 volte inferiore all’integrazione casuale. In cellule embrionali staminali la ricombinazione omologa è più efficiente (1987), scoperto da Mario Capecchi (Nobel per la medicina 2007). Proprio per il fatto che non sono specializzate e si correggono con ricombinazione omologa. Ha permesso di accelerare molto lo sviluppo per terapie. Bisogna generare una strategia che si la più efficiente per identificare le cellule in cui è avvenuta la ricombinazione omologa e non quella casuale. Consideriamo di voler fare un KNOCK-OUT in questo locus. Di fatto se si elimina il primo esone si elimina il punto in cui inizia la trascrizione, così questa non avviene. La prima cosa da fare è analizzare il locus: bisogna riconoscere l’esone e analizzare le cellule in cui è avvenuta la modificazione. Inserisco due sistemi di selezione: NEO => Si può inserire un enzima per la resistenza all’antibiotico neomicica, trattate con neomicina solitamente le cellule morirebbero, in questo caso sopravvivono. TK => Timidina Kinasi, modifica degli analoghi di nucleotidi per poterli inserire nel genoma del virus e bloccare la replicazione del DNA. Tra EcoRI e EcoRII ci sono le due regioni di omologia. Se avviene la ricombinazione dunque (indicata con delle croci) si osservano i due siti di ricombinazione, ottenendo nel genoma un locus che si presenterà con un locus modificato rispetto al wildtype, detto targeted. Se una cellula è trattata con neomicina, entra nella cellula e si lega al ribosoma bloccando così la sintesi proteica. Dopo qualche giorno la cellula non riesce a produrre le proteine necessarie e muore. Se il gene è però trattato con NEO, questo va a fosforilare l’antibiotico, che non è più in grado di legarsi al ribosoma e in questo modo la cellula sopravvive. Le cellule che esprimono la timidina chinasi al contrario moriranno in quanto questa va a fosforilare aciclovir formando un analogo del nucleotide che viene incorporato nel DNA durante al sintesi, di fatto bloccandola. Sono sfruttate queste SELEZIONI per non andare ad analizzare ogni cellula. Si dice selezione positiva la resistenza alla neomicina. Si dice selezione negativa quella alla timidin chinasi. Quando si fornisce del DNA si può integrare ENTRAMBE a caso. Pertanto si avranno: cellule in cui non è avvenuto niente TK cellule in cui è avvenuta ricombinazione µ omologa casuale, si vuole eliminare questa Nulla casuale e quindi si tratta con ganciclovir ho ora due ricombinazioni avendo un genoma neo, ma in cui viene eliminata la timidin chinasi. VERIFICARE CHE È AVVENUTA RICOMBINAZIONE In primo luogo bisogna avere la mappa di restrizione. Se si tagliasse l’intero genoma con enzima Xba1 si osserva che hanno lunghezze: 9.8 all’inizio senza ricombinazione due frammenti da 4,2 e 6 => sommati non corrispondono a quello prima della ricombinazione è dunque avvenuto qualcosa. SOUTHERN BLOTTING Serve per trovare un singolo locus nel genoma. Mi permette di identificare frammenti specifici di DNA basandosi sul fatto che il DNA è formato da due filamenti e con una sequenza complementare possono permettere di identificare il locus. Uso una piccola sequenza sintetica omologa al DNA. Si usano così delle sonde. Se ho l’evento di ricombinazione omologa troverò che l’allele è tagliato da XbaI, usando una sonda verde avrò 6kb, la sonda rossa 4,3kb. È tra le prime metodologie utilizzate in biologia molecolare per trovare la locazione di un gene in un genoma, per definire delezioni nel genoma correlate a malattie genetiche e permette di definire a livello genomico il trans gene o la delezione di in un gene nella generazione di animali transgenici. Southern fu il primo a mettere a punto le condizioni per immobilizzare il DNA su un supporto solido (membrana di nitrocellulosa o nylon). Permise di definire l’organizzazione fisica di sequenze conosciute in genomi complessi. Permise i primi clonaggi di geni eucariotici e fu alla base della scoperta degli introni. Utilizzato per studi RFLP e per fingerprinting genetico. Permette di individuare le differenze tra i diversi individui, ad esempio in genetica forense. 1. Il genoma è molto grande dunque non può essere messo di per sè in gel di agarosio dunque viene prima digerito il DNA con enzimi di restrizione, in questo caso XbaI. 2. Viene fatto migrare in gel di agarosio, i frammenti più piccoli migrano più lontano con velocità inversamente proporzionale al peso molecolare. Ottengo così il DNA separato e da qui potrei mettere una sonda per ricercare le sequenze di omologia. Per permettere le situazioni di ibridazione si impiegano però molte ore, a temperature elevate per 16/24h. In questo tempo il DNA può diffondersi in quanto l’agrosio è poroso. Ci sarebbe dunque un bel paciugo, non si capirebbe nulla. 3. Si immobilizza il DNA su un supporto solido in modo che non si possa muovere. A questo punto può essere analizzato mediante ibridazione. È messo per capillarità, in una spugna con una soluzione salina sopra la quale è messa la lastra di nitrocellulosa/nylon. Sono posti poi sopra dei tovaglioli asciutti con un peso in modo che venga richiamata l’acqua per capillarità. La soluzione salina si muove e spinge così il DNA dal gel alla membrana, sulla quale si blocca. 4. La sonda ha una sequenza di DNA uguale al nostro frammento. In vitro posso usare una DNA polimerasi con un miscuglio di nucleotidi ad esempio radioattivi, con fosforo radioattivo in alpha, per poter marcare e riconoscere la sonda. Si forniscono poi tutti gli elementi per faravvenire la duplicazione. Per riassumere si prende il DNA genomico, lo si frammenta con enzimi di restrizione e lo si separa in base al peso molecolare. Si ottengono varie barre anche non precise, in quanto ci sono frammenti di varie dimensioni, non si riescono a distinguere. Lo si trasferisce, plotting, su una membrana da gel a membrana, avendo tutto il DNA trasferito. Lo si mette in presenza della sonda di fosforo 32 e lo si lascia per 16/24h a temperature di 60° abbastanza alte che sia denaturante ma che favorisca l’appaiamento con la sonda. A questo punto si lava via l’eccesso di radioattività e si va ad analizzare questa radiazione che viene dal fosforo 32. Si confrontano poi i pesi molecolari con una scala di DNA a peso noto. Si potrebbero anche sintetizzare dei primer con la PCR specifici dell’allele bersagliato, sia interni al transgene che esterni. Se avviene ricombinazione omologa si potrà fare la PCR. Con queste cellule in cui so essere avvenuta la ricombinazione a questo punto le posso inserire nell’embrione. Queste nell’immagine sono bellissime palline di cellule staminali che vengono iniettate all’interno di una blastociste con una super mini pipetta. Così si formano le cellule dell’embrione, che essendo precoce, si mischieranno con la massa cellulare interna endogena andando poi a contribuire alla formazione dell’embrione. SELEZIONE Questi eventi hanno una frequenza bassa. Non si può rischiare di utilizzare un numero di cavie eccessivo. Dunque bisogna cercare di massimizzare il processo. La selezione si basa sulla genetica. Le cellule utilizzate provengono da maschi di topi agouti. Sono caratterizzati da cellule che contribuiscono al mantello dando un pelo biondo. È un allele dominante. Si inseriscono le cellule ricombinatesu una blastocisti che non porta il gene agouti, ma il gene nero. Quando nascono i topolini: se non ci sono geni che hanno contribuito all’embrione, avrò topi neri se hanno contribuiti avrò topolini chimera, mix di macchie tutti biondi addirittura. Si prende un maschio chimera e lo si incrocia con una topa nera, avrò un agouti dominante e nero recessivo. Se viene trasmesso il gene in eterozigosi lo si osserva. Dunque i figli nasceranno proprio in eterozigosi con fenotipo agouti. Ci si trova ad avere dei topi con inserito il pezzo di genoma con allele dominante modificato. Questi topi si possono poi incrociare tra loro ecc. tutto secondo la genetica mendeliana. Solo il 5-40% dei topi che nascono conterranno effettivamente il transgene, dipende dal grado di chimerismo (se non fosse chimerico avremmo il 50% perchè il transgene si trova in eterozigosi) 1) Southern blotting sul DNA genomico con una sonda esterna al sito di ricombinazione (come in ES) 2) PCR sul DNA genomico con primers che analizzano la regione di ricombinazione (come in ES) Il DNA genomico viene purificato da un pezzettino di tessuto di ogni topo nato dopo iniezione dei transgene, processo assolutamente semplice e non doloroso. RICOMBINAZIONE OMOLOGA: Sostituzione mirata di un segmento di genoma endogeno con un segmento omologo di DNA esogeno 1) KNOCK-OUT: Il gene targeting può servire a sostituire il gene endogeno con una copia non funzionale: allele nullo 2) KNOCK-IN: il gene targeting presenta piccoli cambiamenti sito-specifici: analisi funzionale di mutazioni KNOCK IN Mutazione puntiforme => varia una base, se si trova nella regione codificante si ha una variazione della sequenza aminoacidica diversa portando a una proteina mutata con una conformazione completamente diversa, che può essere correlata a malattie genetiche. Wild type Mutante Problema = Come faccio ad inserire in una sequanza di DNA una mutazione a mio piacimento? Per replicare il DNA servono DNA polimerasi, nucleotidi, ioni, ecc. e il primer, che può essere come visto sintetizzato in laboratorio. Avendo il primer (rosso), voglio inserire una trasversione (T —> G) , dunque una mutazione puntiforme. La polimerasi ha bisogno di un aggancio in 3’ per poter lavorare. La molecola rossa si appaia dappertutto tranne per una piccola differenza. Andando a fare il calcolo della temperatura di appaiamento con la regola di Wallace, li calcolo tutti i nucleotidi tranne per questo nucleotide differente. Uso una temperatura leggermente più bassa e la polimerasi lavora. Si ottiene una molecola di nuova sintesi. Ne ottengo grandi quantità dai batteri, ed è tutto metilato. In vitro ho generato così un DNA emimetilato. Se si usa un enzima detto DpnI, ovvero un enzima di restrizione che lavora su DNA solo se metilato, allora si elimina tutto il wild type parentale, conservando solo quello di nuova sintesi, riuscendo a inserire una mutazione nel nuovo plasmide. COSTRUTTO PER GENERARE KNOCK-IN Si osserva il locus wild type e il vettore, targeting vector, consideriamo di voler inserire una mutazione nell’esone 1, bisogna avere la sequenza in vitro utilizzando mutagenesi. Viene inserita la mutazione (rosso) e viene messo il gene della neomicina (neo) all’interno dell’intero e. Avviene sempre la ricombinazione. Dopo aver bersagliato il locus si osserva l’esone 1 mutato, il gene della neomicina nell’introne, che verrà rimosso quando verrà sintetizzata la neomicina e in questo modo si otterrà una proteina con la mutazione. KNOCK-OUT CONDIZIONALE A volte la completa perdita di funzione, mutazione, di un gene può essere letale molto precocemente e pertanto ciò impedisce di studiare le funzione di questo gene. E' possibile sempre mediante ricombinazione omologa inserire sequenze che permettano di eliminare frammenti del genoma usando le ricombinasti. È utilizzato quando generalmente la mutazione è letale e non ci sarebbero altri modi per analizzarlo. Si possono generare modelli animali in cui il gene viene inattivato solo nel tessuto di interesse e nel momento desiderato. SISTEMA Cre-LoxP: 1) Cre è una ricombinasi del batterifago P1. 2) Riconosce sul DNA siti di 34bp (chiamati loxP), che comprendono due ripetizioni invertite di 13bp che fiancheggiano un elemento centrale di 8bp. Funziona bene in mammifero perchè la sua temperatura ottimale è di 37° C, dunque temperatura animale. Facendo esprimere la Cre ricombinasi si può tagliare così il DNA a piacimento. So che se si elimina il gene, non si sviluppa l’embrione. Dunque va fatto il knock-out solo in alcuni tessuti, oppure sviluppata una certa fase del tessuto embrionale. Bisogna sempre lavorare con il DNA il vitro e poi generare cellule staminali. Sono esperimenti molto lunghi. Si ha il locus e si vuole eliminare l’esone 1. Si osserva il targeting vector. Si inserisce il gene della neomicina nell’introne e si modifica, sempre con clonaggio ed enzimi di restrizione, a monte e a valle dell’esone 1, delle sequenze che corrispondono ai locus P. Dopo ricombinazione, l’esone 1 viene quindi fiancheggiato da due sequenze loxP. Per ora il gene si esprime in modo normale, ma viene definito locus flowed. Se si fa esprimere la Cre ricombinasi solo in una zona, questa appaierà loxP, e dunque si perde l’esone 1 solo in quella zona. Rimarrà sempre l’impronta col sito loxP dove è avvenuto il taglio con la Cre ricombinasi. Questo permette ad esempio di mettere ad esempio in un animale che esprime Cre ricombinasi in tutti i tessuti. Questa non riesce a entrare nel nucleo. Dunque i fattori di trascrizione che legano ad esempio gli estrogeni, sono detti inducibili perchè dopo essere stati studiati si è osservato che sono normalmente nel citoplasma, quando arriva l’ormone questi entrano nel nucleo. Esistono dunque delle forme di Cre che sono state accoppiate a fattori di trascrizione per essere inseriti nel nucleo. Si può quindi trattare il topolino con estrogeni e far entrare così Cre nel nucleo. Si può così indurre ricombinazione sito specifica solo nel momento in cui si tratta con estrogeni. Se invece ho le freccerete nelle direzioni opposte, dunque sempre ricombinasi ma una opposta all’altra. Succede che la Cre ricombinasi legando le due freccerete queste verranno invertite. Si inverte dunque la regione del genoma. Altra idea è inserire ATG, ovvero il primo codone per la proteina. Se si usa Cre si può togliere il codone di stop e si può andare ad accendere il gene solo quando si vuole. Ci sono oggi tantissime linee di topi disponibili, che esprimono la Cre ricombinasi già in tessuti specifici, ovvero i topi di èlite. Si riesce così a fare la delezione di un gene solo in tessuti specifici in particolari cellule. Trasposoni RECAP La timidità chinasi è un'enzima virale che una cellula normalmente non esprime, quindi se faccio inserire il ciclovir che è una molecola che simula i nucleotidi ma non ha fosfati quindi non può essere usata dalla DNA pol. Se la cellula eucariotica esprime questo enzima virale (dell' herpes) va a fosforilare questa molecola, che ha ora 3 fosfati, la DNApol lo riconosce e lo inserisce nella catena, ma non è proprio un nucleotide e non ha OH in 3' quindi non riesce a continuare a inserire nucleotidi e blocca la sintesi del DNA. Questo porta alla morte della cellula. Per chimera si intende questo animale che non ha patrimonio genetico eterozigote, ha parti diverse con patrimoni genetici diversi. Sono cellule con patrimonio genetico diverso dato dalle diverse cellule, poi se questo nella sua gonade ha il gene , donerà l'aguti con il locus del gene delle cellule modificate. I patrimoni genetici delle vari parti dell'animale sono diversi. ELEMENTI TRASPONIBILI: sono sequenze che hanno la capacità di muoversi da un sito all'altro del genoma, su un batterio sullo stesso cromosoma, la trasposizione avviene da un sito donatore su un sito accettore di cui il trasposone ha scarsa selettività. Si muovono nel genoma in modo quasi casuale, DNA fincheggiante portando a ristrutturazioni del genoma che sono state alla base dell'evoluzione, infatti una grandissima parte del nostro genoma è composta da elementi trasponibili. Che effetti biologici possono avere? Diffusione di sequenze del genoma Modificazione delle proprietà dei geni: mutazioni per inserzione Generazione di nuove isoforme proteiche, può portare ad un nuovo dominio proteico Riarrangiamenti cromosomici Sono cambiamenti abbastanza importanti concluderà la lezione per farci vedere come meccanismi simili a quelli della trascrizione sono alla base della produzione delle globuline. Possiamo avere: Trasposoni a DNA Retrotrasposoni LTR : dei retrovirus Retrotrasposoni poli-A Un elemento trasposto può essere riconosciuto dalla presenza di sequenze ripetute da entrambe le parti. Possono avere anche delle sequenze terminali invertite che sono i siti di legame degli enzimi che attuano la trasposizione. Possono presentare DNA trasposasi, per i retrovirus le integrasi. Alcuni si chiamano a DNA perchè i Retrotrasposoni hanno invece un intermedio a RNA. Le sequenze blu che si vedono nella foto superiore, sono sempre presenti perchè sono alla base del riconoscimento del trasposone. Sono esattamente la stessa sequenze, e non sono palindromiche. Questo effetto è alla base del meccanismo di trasposizione, vediamo come taglia la trasposasi: in maniera sfalsata lasciando sequenze protrudenti in 5’. Avendo 3’ libero poi, vengono replicate dalla DNA polimerasi e la ligasi, in questo moo nel sito in cui sono sfalsate avremo 2 sequenze ripetute identiche che vanno nella stesa direzione. Usa come stampo il filmanti protrudente in 5’ TRASPOSONI A DNA Sono sequenze mobili tramite trasposizione conservativa, replicativa o non replicativa, che possono andarsi ad integrare in dei geni e possono portare a mutazioni. Sono stati i primi scoperti da Barbara McClitoock, che negli anni ‘40 notò che le pannocchie di mais avevano chicchi di colori diversi, quindi notò che nei geni della colorazione del mais si trovavano elementi identici, molto ripetuti, in giro per il genoma. Noi umani presentiamo sopratutto retrovirus, i trasposoni solo il 3% del genoma. Si osservano i due siti duplicati del sito bersaglio. Si hanno due frecce verdi in direzione opposta che sono le sequenze terminali che vengono legate dalla trasposasi. La trasposasi può essere trascritta direttamente dal trasposone che così è indipendente, si produce da solo l’enzima per spostarsi. Esistono poi trasposoni non indipendenti che non la producono, hanno sequenze 3’ invertite per il riconoscimento della trasposasi ma non regioni per trascriverla. TRASPOSIZIONE NON REPLICATIVA Da un sito donatore viene tagliato via il DNA e viene inserito in un sito ricevente. Nel momento in cui viene tagliato via il DNA si genera un danno per taglio a doppio filamento che verrà ricucito, entrano in gioco i meccanismi di riparo al DNA per double strand break. 1. Il DNA con le ripetizioni invertite viene scisso 2. Si genera il complesso del trasposoma che porta al taglio di entrambi i filamenti, che possono andare ad integrarsi nel sito bersaglio con il filamento sfalsato, ho due 3’ liberi. 3. Porta alla molecola intermedia in cui viene lasciato aperto il sito in 3’ per l’aggancio della DNA pol per il riparo al DNA per andare a riempire la regione mancante. 4. La ligasi chiude il tutto. Come taglia la trasposasi? Non utilizza come le integrasi che erano serina o tirosina ricombinasi che formavano un intermedio tra proteina e DNA. La trasposasi attua un vero e proprio taglio, con attività esonucleasica senza intermedio. Per quanto riguarda il taglio il 3’ del filamento superiore va a rompere il legame fosfodiesterico del filamento per una reazione detta di transesterificazione. Con verde è indicato il trasposone in blu invece il DNA. Il verde ha l’OH in 3’ libero e utilizzando questo va ad attaccare il fosfato in 5’, tagliando e lasciando un ossidrile libero sul DNA bersaglio, fa così da aggancio alla polimerasi che andrà a riempire il GAP. Diversi trasposoni utilizzano diverse trasposasi e hanno tipologie diverse di taglio. 1. TRASPOSONE 7 = taglia come visto in precedenza, la trasposasi taglia il doppio filamento e i va ad inserire. In grigio rima il DNA non trasferito con taglio a doppio filamento che va riparato con sistemi di riparazione del DNA. 2. TRASPOSONE 5-10 (intermedio a forcina) = la trasposasi qui non è in grado di tagliare entrambi i filamenti, lo fa solo lasciando OH 3’ del trasposone libero, questo va a legare il filamento opposto per transesterificazione con quello superiore generando una forcina. Il DNA non trasposto è esattamente come questo, verrà riparato con i sistemi di riparo. La trasposasi ha la capacità, quando raggiunge il filamento di DNA in cui va a trasferirsi, di aprire la forcina dove andrà ad attaccarsi. 3. TRASPOSASI HERMES = la trasposasi non è in grado di tagliare entrambi i filamenti, quindi taglia l’inizio del filamento superiore e la fine del filamento inferiore, quindi l’OH rimane nel DNA non trasposto, sarà questo OH che va ad attaccare il filamento inferiore per transesterificazione formando le forcine nel DNA non trasposto. Quindi andrà a trasporsi nel filamento bersaglio. Questo meccanismo è alla base delle immunoglobuline delle cellule nel nostro sangue. Struttura del trasposone Le due regioni vengono dette IR ovvero Inverted Region. Sono due regioni legate alla trasposasi, sono i direzione opposta, quando arriva la trasposasi si metteranno parallele in modo tale da excidere 20bp. IS = Insertion Region, è l’intero elemento. Sono i più semplici elementi trasponibili comprensivi di IR, la lunghezza media è di 1000-1500 BPG. La trasposasi può essere espressa e possiamo avere la produzione della proteina trasposasi perchè in questa regione c’è anche l’attività del promotore per la trascrizione dei geni nei procarioti. I TRASPOSONI COMPOSTI sono più semplici. Hanno 2 IS e in mezzo dei geni, vanno dalle 2000 alle 16000bp, abbiamo visto tn5 e tn10 che hanno forcine nel trasposone, portano il gene di resistenza alla tetraciclina ed. Il più comune trasposone negli eucarioti è la famiglia dei Tc1 o mariner che si trovano nei C. Elegans e Drosophila. TRASPOSIZIONE REPLICATIVA Il sito donatore non perde la sequenza di DNA ma la conserva e avremo quella copia anche nel DNA ricevente. Sono poco comuni negli eucarioti, gli organismi in cui è più comune il suo utilizzo sono i procarioti attivati da fagi. In questo meccanismo non è sufficiente la trasposasi ma serve anche una resolvasi. La trasposasi taglia solo alla fine del trasposone del filamento superiore e all’inizio del trasposone del filamento inferiore. Quindi si generano degli ossidrili che possono andare ad attaccare per transesterificazione il DNA bersaglio, dunque non abbiamo mai il distacco del trasposone dal DNa donatore, avviene prima. Avviene la trasposizione prima del distacco, otteniamo un intermedio in cui abbiamo legato con un unico filamento i due DNA: donatore e bersaglio. A questo punto c’è una DNApol che per andare a riparare il DNA andrà a copiare, utilizzare o il filamento superiore o quello inferiore come stampo. In rosso è DNA di nuova sintesi in cui viene copiato il trasposone. Poi la resolvasi apre il DNA e avremo quindi nel cromosoma batterico due copie del trasposone. Trasposone/complesso synaptico: taglio (nick) DNA ospite 3’OH attacco al sito bersaglio Dopo il trasferimento del filamento Formazione di una struttura con due ramificazione che può fungere da forca replicativa (direzione de-novo sintesi 5’-3’ = extensions of 3’ends) La replicazione termina sulla seconda forca e produce due copie del trasposone trasposizione + duplicazione del trasposone. RETROTRASPOSONI LTR (Long Terminal Repeats) Sono quelli che si incontrano quando si parla di retrovirus. Sono caratterizzati da due ripetizioni terminali invertite alle due estremità, sono sequenze di DNA identiche ripetute. Hanno poi il sito di integrazione ripetuto in blu, come prima, che si genera nel momento in cui il trasposone entra nel sito bersaglio per taglio asimmetrico. Dal punto di vista di struttura assomigliano a quello dei trasposoni a DNA, ma non c’è all’interno trasposasi ma c’è enzima integrasi e enzima RT ossia RetroTrascrittasi. Cos’è la retrotranscittasi? Abbiamo incontrato un enzima con attività retrotrascrittasica, ovvero la telomerasi terC, che usava una subunità tre come stampo. La retrotrascrittasi è dunque una DNA polimerasi che utilizza come stampo l’RNA, ma è a tutti gli effetti una DNA polimerasi. Se si ha un RNA messaggero e si ha bisogno di utilizzarlo come stampo, molto spesso da esso può essere generato un DNA copia che viene detto cDNA. Si può usare un primer sintetico perchè essendo una DNApol ha bisogno di un innesco. In laboratorio dunque si va ad eliminare l’RNA con RNAasi H, in grado di degradare un RNA solo se appaiato ad un DNA (ricordatelo per l’esame). Con queste scoperte di base si può eliminare l’RNA, la retrotrascrittasi trascrive ancora un po’ formando una forcina e offrendo un primer a cui si appaia la DNApol, e quindi forma uno stampo a DNA. I trasposoni si basano sul fatto che c’è un promotore che permette alla cellula di trascrivere un RNA dal trasposone che potrà essere utilizzato per poi essere trasportato mediante retrotrascrittasi, espressa direttamente dal Retrotrasposone, che viene trascritto direttamente dal cDNA. Abbiamo cDNA, ossidrili liberi, che attacca il DNA bersaglio, si integra e avendo un elemento di DNA verd con OH libero si può integrare. Si ha bisogno dunque della retrotrascrittasi per ottenere cDNA e per integrarlo nel sito bersaglio tramite un’integrasi. Come funziona per il primer? Ha sequenze ripetute invertite ai due lati, identiche, chiamate U3 R U5. Una di queste sequenze si appaia perfettamente alla sequenza di un RNAt: in particolare quest'ultimo si appaia alle regioni ripetute e fa da primer, la retrotrscittasi inizia a copiare. Si forma quindi una molecola che ha una parte di DNA e il resto RNA. La parte al DNA è identico all'altra regione e comincia a agire in quella direzione generando una molecola di DNA, il RNA verrà degradato e potrà essere generata una molecola a doppio filamento. A questo punto abbiamo il DNA che può andare a integrarsi. I domini catalitici delle integrasi retrovirali e la trasposasi sono molto simili, hanno foglietti beta al centro e alpha eliche attorno, dunque il meccanismo d’azione sarà simile. RETROTRASPOSONI POLI-A Hanno ai due lati le due sequenze ripetute e all’interno le sequenze orf1 e orf2, queste sono dei geni che producono proteine. ORF1 produce RNA binding protein che lega RNA ORF2 ha attivitò di trascrittasi inversa ed endonucleasi, produce retrotrascittasi e endonucleasi. La parte terminale del trasposone ha una sequenza ricca in A nel filamento superiore, per questo sono dette poli-A. Usano un meccanismo detto TRASCRIZIONE INVERSA, innescata dal sito bersaglio. L’RNA codifica per due proteine che portano l’RNA sul bersaglio. Dopo il taglio il 3’OH del DNA fa da primer e RNA da template. I siti ricci di T sono preferenziale perchè così la coda di poli-A si può appaiare. La parte terminale del trapsosone ha una sequenza in AAA nel filamento superiore e TTT nel filamento inferiore. L’inizio della trasposizione è simile ai trasposoni retrovirus L’RNA ha sequenze all’interno che permette di agganciare delle proteine che lui stesso fa tradurre. Per retrotrascrivere abbiamo detto che ORF2 ha bisogno di un primer: allora prima il trasposone va al sito bersaglio e poi va a trascrivere. Il sito bersaglio che ricerca il trasposone sono sequenze che hanno anche qui sequenze AAA sopra e TTT nel filamento inferiore. Quando questo complesso RNA ORF1 ORF2 raggiugne il sito di trascrizione, ORF con attività esonucleasica taglia e si genera un 3’ libero dopo le T che fa da innesco per la retrotrascrittasi. C’è l’unità retrotrascrittasica, si genera cDNA che verrà poi integrato. Rimane sempre sequenza con tante A che deriva dal trasposone, e le T provenienti dal sito bersaglio. SEQUENZE LINE E SINE Gli elementi LINE (long interspersed...) sono il 20% del nostro genoma umano. Sono chiamati anche retrotrasposoni non virali. Formano due classi: LINE (long interspersed nuclear elements) = circa 6kb, sono autonomi e producono le proteine per la trasposizione di retrotrasposoni non autonomi SINE (short interspersed nuclear elements). SINE sono più corti, 100-400bp, e privi di ORF, un esempio è la sequenza Alu. Hanno struttura simile ai geni: un promotore e poliA. Nel genoma esistono retropseudogeni (geni processati) che derivano da mRNA e vengono trasposti grazie a proteine codificate da LINE (poco efficiente perchè si legano ad alta affinità a RNA LINE) Prima del sequenziamento del genoma umano (avvenuto nel 2001), i genetisti caratterizzavano le diverse regioni del genoma ricercando regioni in cui c’erano questi elementi ripetuti perchè permettevano di mappare le regioni. In particolar modo c’è un elemento SINE che è circa il 10% e sono queste sequenze Alu e sono più di 1 milione nel genoma. È caratterizzata dal sito di restrizione Alu che taglia in AGCT. Questo elemento viene trascritto con le tante A alla fine, va alla ricerca di un sito con tante T, utilizza l’integrasi di un LINE per tagliare, le T offrono 3’ OH come innesco per la retrotrascrizione e l’inserimento di questo elemento nel genoma. I trasposoni non sono molto precisi ma sono frequenze abbastanza frequenti, quindi non hanno la capacità di integrarsi in un sito specifico, ma hanno permesso a molti ricercatori di andare ad utilizzarli per fare inserire in modo casuale nel genoma delle sequenze per attivare dei geni. SLEEPING BEAUTY Il sistema meglio utilizzato nei trasposoni è detto Sleeping Beauty, rimane nascosto fino alla sua attivazione, fino a quando non fa esprimere la trasposasi. Il trasposone si inserisce causalmente all’interno di un gene per inattivarlo con l’inserimento di un trasposone. Utilizzato anche per studiare linee di animali con l’inserimento di questo trasposone. Attualmente il sistema Sleeping Beauty è abbastanza utilizzato e controllato. Funziona come il gene per la resistenza alla neomicina. Si va a spaccare l’esone generando un knock out dell’espressione di un gene. VARIABILITÀ DELLE IMMUNOGLOBULINE Gli anticorpi nelle nostre cellule vengono generati mediante RICOMBINAZIONE SOMATICA. Non sono cellule germinali, ma del tessuto sanguigno, fanno una ricombinazione non omologa, senza crossing over. Si basa su meccanismi dei trasposoni. Ogni individuo può produrre milioni di anticorpi diversi. Ma il numero di loci per le immuno globuline è molto limitato. Ma ci sono anticorpi diversi. Ci sono due geni diversi per ogni anticorpo: catena leggera e catena pesante. Ci sono delle regioni variabili in questi loci che possono portare un certo grado di variabilità negli anticorpi. Un anticorpo viene rappresentato a forma di Y con distinto in catena pesante e catena leggera, legati con ponti disolfuro. Ora ci concentriamo nella parte tra la pesante e la leggera dove c’è il riconoscimento da parte dell’anticorpo con l’antigene, questa può dare variabilità. Si ha quindi una grande variabilità di anticorpi da soli due geni, e ciò è legato dalla zona che va a riconoscere la cellula bersaglio. Il locus k (regione genomica dove c’è il gene per la produzione delle catene leggere degli anticorpi) è caratterizzato da una ventina di regioni con sequenza leggermente diversa che si chiamano regioni V e 4 regioni J e una regione C sempre costante (quest’ultima che non fa parte della riconoscimento del bersaglio). Ci può essere la combinazione di: una regione V con una regione J e con la C, portando ad esempio ad un mRNA processato V3J3C4. Comunque sia combinando le varie regioni non si possono comunque avere milioni di anticorpi diversi come li si hanno. Se guardiamo il locus della catena pesante abbiamo 20 catene V 12 regioni D 4 regioni J + C. Anche in questo caso si hanno solo 4800 diverse sequenze proteiche, non abbiamo sempre i milioni che effettivamente si hanno. Cosa accade allora? Nel momento in cui una regione V si unisce ad una D ed ad una J ed alla C, per poterle unire ci deve essere una ricombinazione che è mediata da delle ricombinasi RAG1 e RAG2 (ricombination activating gene) queste riconoscono sequenze segnale organizzate come ripetizioni inveriate adiacenti a segmenti genici che devono essere uniti. Tra regione V e regione J ci sono delle sequenze con frecce, sequenze che vengono legate dalle proteine RAG che possono permettere la ricombinazione perchè abbiamo sequenze identiche. Queste porzioni possono essere legate da ricombinasi. Perchè si genera questa variabilità? Le RAG agiscono non tagliando i due filamenti in contemporanea ma (COME HERMES) si taglia il filamento superiore all’inizio della regione da eliminare e il filamento inferiore alla fine della regione che deve essere eliminata.L’OH libero attacca il filamento opposto generando le forcine, la parte in mezzo è la regione che verrà eliminata. Si ha poi apertura della forcina, unione dei segmenti codificanti e la regione centrale viene eliminata. Si devono quindi risaldare le due estremità: intervengono quindi i sistemi di riparo al DNA e in particolare modo da Artemide (attivata dalla fosforilazione della pk,) ha attività nucleasica quindi riesce a tagliare la forcina fino a trovare regione di omologia. Si vanno a reclutare ligasi e pol per attivare il riapro. Poiché c’è riparo con non homologous end joining si hanno delle DIFFERENZE NEL RIPARO, DA QUI I MILIONI DI IMMONUGLOBULINE DIVERSE. Le immonuglobuline e la loro variabilità derivano dalla ricombinazione di parti diverse già presenti nel genoma ma soprattutto dal riparo e dalle differenze provocate da questo con il non homologous end joining. Quindi in sintesi: 1. La regione genomica del locus delle immunoglobuline della catena leggera 2. La RAG va a tagliare un solo filamento e l'OH in 3'chiude a forcina 3. La porzione gialla (D) e la porzione rosa che è J 4 Il DNA viene eliminato 5. Devono risaldarsi le estremità, essendo a forcina devono intervenire i sistemi di riparo del DNA in particolare ARTEMIDE 6. Ku70 e ku80 riconosce le regioni, la chinasi TK fosforila Artemide che avrà attività nucleasi a che ritaglia la forcina 7. Riconosce una regione di omologia vengono reclutate le DNA pol e DNA ligasi che danno il riparo 8. Ad ogni evento di ricombinazione da parte della RAG con la NHEJ porta a milioni di immunoglobuline diverse con un'enorme variabilità Trascrizione Dal DNA viene prodotto un messaggero per poter codificare il codice per produrre proteine, ovvero l’RNA. RNA POLIMERASI L’enzima che effettua la trascrizione da DNA a RNA è la RNA polimerasi. Forma legami fosfodiesterici in modo molto simile alle DNA pol, per questo non vediamo approfonditamente la cosa. Per polimerizzare non ha bisogno di un primer ma di sequenze specifiche, formando legami a idrogeno in cui può intervenire anche il metile con interazioni idrofobiche ( per questo si ha U al posto di T), che caratterizzano il PROMOTORE. Non è in grado di riconoscere lei stessa le sequenze, ha bisogno di FATTORI DI TRASCRIZIONE L’RNA si deve polimerizzare su uno stampo di DNA. C’è dunque bisogno che si apra la doppia elica per formare una forca di trascrizione. Vengono portati nel sito dei ribonucleotidi per l’assemblaggio. All’interno del sistema si forma un sistema ibrido DNA-RNA che si deve staccare in modo che il DNA torni a formare il doppio filamento. È dunque un sistema transitorio che si romperà formando la molecola singola di RNA. L’RNA svolge ruoli molto importanti in vari compartimenti della cellula e permette anche che più molecole dello stesso RNA vengano trascritte contemporaneamente. Si agganciano dunque più RNA polimerasi per trascrivere lo stesso filamento. La RNA polimerasi è meno accurata della DNA polimerasi e può inserire un errore ogni 1000 nucleotidi. Dato che l’RNA è una molecola di transizione, una molecola molto instabile che si degrada con facilità, anche se una molecola ha un errore verranno prodotte al massimo alcune proteine scorrette che la cellula andrà a eliminare. Se invece il danno avviene nel DNA questo si conserva e viene riprodotto, per questo deve essere più fedele. La trascrizione copia solo alcune porzioni del genoma e produce molte copie contemporaneamente, la maggior parte di questo. prodotto non codifica per delle proteine. Quando si attiva un promotore sono prodotte molte copie di questo locus. MECCANISMO L’RNA è polimerizzato da 5’ a 3’. Anche in questo caso avviene lo stesso tipo di reazione della polimerizzazione dell’RNA, grazie a ioni positivi nel sito catalitico per poter muovere le cariche e fare l’attacco. STRUTTURA RNA Le molecole di RNA sono a filamento singolo e possono assumere varie strutture, ben distinguibili da quelle del DNA. Come il DNA dunque può formare una sorta di doppia elica, con un buco al centro. Gli appaiamenti tra le basi avvengono similmente, ma al posto della T si trova una U. Il solco maggiore dell’RNA è più grande perchè è un importante punto di interazione. Spesso acquisisce strutture a forcina, la struttura ad appaiamento della forcina è a doppia elica nella parte iniziale, nella parte finale le basi non si appaiano ma possono formare delle interazioni non classiche. PROCARIOTI STRUTTURA RNA POLIMERASI È composta da 5 subunità: 2 subunità alfa 1 subunità ß e 1 subunità ß’ che formano una sorta di chela all’interno del quale c’è lo ione magnesio per permettere la polimerizzazione 1 subunità omega che non si sa bene che faccia. INIZIO L’RNA polimerasi deve essere indirizzata nel punto di inizio, regione +1 dell’esone, della trascrizione, la precisione dell’attacco viene data dalle regioni che si trovano a monte. Ci sono infatti sequenze specifiche nel DNA a monte che indirizzano l’arrivo della RNA polimerasi. Questa però essendo la stessa per tutti i geni non le permette di riconoscere le sequenze. Il riconoscimento del promotore è infatti dato da fattori di trascrizione. In particolare sigma70 è detto iniziatore. Deve esserci poi la capacità dell’RNA polimerasi di aprire una bolla, in modo che un filamento di DNA faccia da stampo e l’altro venga messo lontano in un canale della proteina per non essere copiato. L’RNA viene poi trascritto 5’-3’, per avere l’ossidrile libero. Per trascrivere il frammento al contrario basterà che un’altra RNA polimerasi si leghi lineamento complementare. Per convenzione il filamento superiore 5’-3’, da sinistra a destra, è quello che corrisponde all’RNA messaggero. Nel momento in cui si apre la bolla, l’RNA polimerasi leggerà il frammento inferiore. In questo modo si ottiene l’RNA corrispondente al frammento superiore. Ci sono due promotori per entrambi i filamenti, per entrambe le direzioni, dunque possono essere trascritti gli RNA in entrambe le direzioni, come avevamo accennato per ColE1. In base a dove si lega la polimerasi si formano due filamenti complementari. FORZA DI PROMOTORE => livello di espressione di un gene, numero di trascritti iniziati in un dato intervallo di tempo. Dipende da: affinità della RNA polimerasi per il promotore efficienza di isomerizzazione rapidità movimento su DNA della RNA polimerasi sequenza del promotore Il promotore forte dunque vuol dire che produce molte molecole nell’unità di tempo. SEQUENZE DI UN PROMOTORE Un promotore batterico ha delle sequenze comuni fra i diversi procarioti. Ha scoperto che ci sono delle sequenze a -10 e -35 in particolare, che sono parzialmente conservate e sono dette SEQUENZE CONSENSO. -10 => il primo nucleotide è al 100% T, all’80% nel secondo ci sta una A, poi capita a volte altra A, al 70% A o T, infine al 100% c’è A, poi o T o A di nuovo. Dunque sono molto importanti la prima T e la A, in quanto sono basi molto importanti per l’interazione con sigma70, quindi se ci sono mutazioni in queste sequenze si hanno molti problemi. Queste sono le due basi più importanti, le altre sembrano esserlo meno. -35 => gli ultimi due nucleotidi sono sempre T, il terzultimo quasi sempre G In molti geni si trova poi un elemento UP, che lega RNA polimerasi. INTERAZIONE CON SIGMA70 Sigma 70 è la proteina che permette di legarsi in modo da inserire nel sito catalitico alla posizione 1. Ha diversi domini, in particolare si legano: dominio 2 alla sequenza -10 dominio 4 alla sequenza -35 Le sequenze sono dunque così conservate per permettere questo appaiamento, si parla dunque di OLOENZIMA quando si associa alla RNApol. Dal punto di vista proteico sono alpha—eliche. Vanno a formare interazioni tra amminoacidi e donatori/accettori. Ha un particolare loop dell’elica. Riesce a entrare all’interno del solco maggiore, a non del minore. Questa è una classica struttura generale per fattori di trascrizione dei batteri. Per questo c’è conservazione dei diversi geni di escherichia coli. Il fattore sigma è il fattore di inizio che riconosce sequenze specifiche e permette all’oloenzima della RNA polimerasi di iniziare solo da sequenze specifiche, non rimane attaccato durante la trascrizione. Si deve poi togliere sigme70 togliendo “il freno a mano” per poi poter trascrivere fino alla terminazione. CICLO Bisogna che il complesso passi da chiuso ad aperto. Non è necessaria energia per questo cambiamento strutturale dell’enzima. Una volta entrato e legato sigma70, si ferisce la doppia elica per esporre il filamento stampo. Il melting tra le pozioni è molto piccolo, -11 +2. Vengono così aperti pochi nucleotidi. Serve un modo per tenerli aperti e trascrivere RNA, anche in questo caso entra in gioco sigma70, in particolare il suo domino 2. Nel momento in cui entra in una conformazione più termofavorevole e vengono aperti i legami a idrogeno, sigma70 provoca il ribaltamento delle basi. Alcune basi vengono così ribaltate e non possono più appaiarsi, permettendo così di tenere aperta la bolla di trascrizione. Una volta fatto questo il filamento che non deve essere trascritto viene inserito in un canale detto non template. Rimane invece disponibile sul sito catalitico il filamento da noi definito inferiore. RNA polimerasi non usa primer, Il primo nucleotide è spesso una A L’enzima forma interazioni specifiche con il primo e secondo nucleotide per permettere la polimerizzazione di nucleotidi successivi, l’interazioni avviene con sigma. Proprio grazie a queste interazioni può non avere un primer. L’isomerizzazione è facilitata dallo spostamento delle regioni di sigma che hanno delle cariche negative. È dunque sigma che regola l’attacco del primo nucleotide. MOVIMENTO RNA POLIMERASI È stato visto che ci sono spesso RNA abortivi, di una decina di nucleotidi, la regione della bolla deve tornare all’inizio e riprendere fino a che non riesce ad evadere. Ci sono tre ipotesi su come l’RNA si possa muovere nonostante sigma. Passaggio Transiente = fa diversi filamenti di DNA abortivo A bruco = cambia conformazione allungandosi permettendo lo spaio per i primi 10 nucleotidi Accartocciamento = genera minore interazione con sigma, la più accreditata sapendo che l’acido nucleico è flessibile, inizia a trascrivere, viene fatto un ripiegamento fino a quando l’RNA non riesce a sganciare sigma70. ALLUNGAMENTO Nucleotide dopo nucleotide inizia ad essere sintetizzato RNA. Vengono attaccati una decina di nucleotidi fino a quando l’RNA nascente coperto da sigma 70 riesce a infilarsi nel canale e spiazzare sigma70, così che la RNA polimerasi possa evadere. Si pensa dunque che sia l’RNA quando entra nel canale riesce ad abbassare l’interazione. Dunque è l’RNA nascente a spiazzare sigma70. In ogni momento solamente 8-9 nucleotidi della catena di RNA rimangono appaiati allo stampo perchè si stacca ed esce dal canale di uscita dell’RNA. Anche l’RNA polimerasi ha un po’ di attività di correzione: Editing pirofosforolitico = nel sito attivo il ribonucleotide scorretto viene rimosso tramite reincorporazione del pirofosfato Editing idrolitico = torna indietro e rimuove il ribonucleotide scorretto Non ha un sito apposito ma cerca di fare tutto lì, per questo non è molto efficiente. In caso di danno al DNA la RNA polimerasi si blocca e deve essere rimossa. Qui interviene TRCF (transcription-repair coupling factor) che ha attività ATPasica e spinge via la polimerasi dal sito di stallo. Questo è dunque un fattore che accoppia la trascrizione al danno del DNA, TERMINAZIONE La RNA polimerasi potrebbe rimanere legata a lungo, ma sarebbe dispendioso inutilmente. C’è un segnale di stop in modo che si generino molecole di RNA più o meno della dimensione del gene. Le sequenze di questi siti di terminazione hanno regioni complementari, che formano delle forcine. Queste vengono riconosciute da proteine. Ci sono il sistema: Terminatori intrinseci = la sequenza invertita che forma la forcina ha effetto sull’RNA che è a singolo filamento e questa struttura causa il dissolvimento del complesso di allungamento. Si forma una forcina con una serie di U che si legano con solo due legami a idrogeno. Questa viene legata da proteine specifiche come NusA. Si lega questa proteina che favorisce il distacco dell’RNA polimerasi. Rho dipendente = Rho è una proteina con 6 subunità che riconosce una sequenza detta rut, che viene legata dalla proteina con attività elicasica permettendo il distacco con utilizzo di ATP. RHO INDIPENDENTE RHO DIPENDENTE EUCARIOTI Ogni gene viene trascritto diverse volte in punti differenti da diverse molecole di RNA nello stesso istante. A differenza dei procarioti, traduzione e trascrizione avvengono in momenti differenti. RNA POLIMERASI È composta dalle 10 o più subunità. Si possono osservare una porzione conservata, e la forma a chela (proprio questa particolarmente conservata). La reazione di polimerizzazione avviene in modo identico tra procarioti ed eucarioti, ciò che varia sono i fattori della trascrizione. Il sito attivo è tra le subunità più grandi. Negli eucarioti esistono forme di RNA molto differenti, anche di tipi in più rispetto a procarioti. Questi sono di fatto trascritti da diversi RNA polimerasi. Negli eucarioti sono presenti tre diverse RNA polimerasi (I, Il e III) ciascuna delle quali svolge compiti specifici: la RNA polimerasi I trascrive i geni per la sintesi degli RNA ribosomiali; la RNA polimerasi II trascrive i geni per la sintesi degli mRNA; la RNA polimerasi III sintetizza i tRNA e altri piccoli RNA (miRNA) implicati in diversi processi, tra cui lo splicing. PROMOTORI Abbiamo visto che i procarioti per sistemare queste regioni genomiche di DNA a monte del sito di trascrizione per indirizzare la RNA polimerasi agisce il fattore sigma70, con i domini per legare alpha-eliche nelle regioni -10 e -35, questo costituisce un segnale per posizionarsi. Anche i promotori eucariotici hanno sequenze caratteristiche. Gli eucarioti non ne hanno solo uno, ma per iniziare la trascrizione la RNA polimerasi lega i FATTORI GENERALI DI TRASCRIZIONE, per legarsi al promotore. Inoltre necessiterà di una serie di fattori per modificare la cromatina e modificare e spostare i nucleosomi. TATA box a -25 —> non sempre è presente BRE = riconosce il fattore TFIIB a -32 DCE = downstream core element, dunque a valle DPE = downstream promoter element TATA BOX Si chiama in questo modo in quanto ricca di T e A. Si vanno ad osservare le sequenze consenso, ovvero analizzando vari promotori diversi i nucleotidi maggiormente conservati. Per la TataBox si osserva che l’83% ha T, 97% A, 93% T, 85%A , 63/37% A/T, 88% A. Non tutti i nucleotidi sono ingaggiati per formare nuovi legami con la proteina, sono alcuni sono coinvolti per il consenso. Gli idrogeni che sporgono dal solco minore e maggiore vanno a formare il legame con le proteine Le sequenze consenso legano i seguenti fattori di trascrizione: ETFIID è ASSEMBLAGGIO COMPLESSO Il primo evento che viene riconosciuto è quello di legame tra la TATA Binding Protein alla TATA box. In realtà la TBP non è sola, ma è un complesso di varie proteine che nel complesso si chiamano TFIID. È infatti composta da TAF, ovvero TBP-associated factors che legano lnr e DPE/DCE, e TPB. La TBP lega il DNA nel solco minore. Usa i foglietti beta per sistemarsi nel solco minore, per allargarlo, ha poi due loop proteici per piegare il DNA di 90°. Questa sequenza essendo ricca di appaiamenti T e A permette il ripiegamento della molecole, essendo più flessibile e con meno legami. Se si ponesse nel solco maggiore non potrebbe piegarsi. TFIID lega l’elemento BRE che si trova a monte, si lega a sinistra e si allunga a destra, andando a prendere le due parti che si sono ripiegate. Potrebbe muoversi in posizione opposta ma vorrebbe dire che si lega a un promotore sul filamento opposto. Successivamente sono reclutati TFIIA e TFIIB, una volta che arriva questa richiama TFIIF , che fa si che si ripieghi dalla parte giusta, e fa da ponte di riconoscimento di altri fattori di trascrizione. TFIIB è una proteina che interagisce con TBP e si dispone in modo asimmetrico per favorire unidirezionalità nella trascrizione, da sinistra a destra usando il filamento inferiore come stampo. Questi elementi promotoriali indicano in che direzione deve avvenire la trascrizione. La porzione allungata di TFIIB si deve legare a TBP per poter reclutare la DNA polimerasi e indicarle la direzione da seguire per trascrivere. Il legame della TFIIF con la polimerasi stabilizza il complesso TFIIB-TBP-DNA ed e’ necessario per reclutare TFIIE che recluta la TFIIH che ha ben 10 subunita’ – la subunita’ con attivita’ ATP-asica media il melting del DNA, che scatta l’ inizio della trascrizione. Dopo l’arrivo di queste si può parlare di complesso di pre-inizio. A questo punto deve avvenire l’apertura del DNA per utilizzare uno dei due filamenti come stampo. ISOMERIZAZIONE A COMPLESSO APERTO C’è bisogno di ATP e viene tutto mediato da TFIIH. Anche questa non è una singola proteina ma è composta da diverse subunità. In particolare: XPD, XPB = sono elicasi che rompono legami a idrogeno per formare la bolla, è ATP dipendente -> ATPasi CDK7, MAT1 = sono kinasi per il carbonio terminale della RNA polimerasi. Queste subunità di TFIIH sono anche coinvolte nella riparazione dei mismatch. TFIIB si inserisce nel solco della RNA polimerasi II per poter stabilizzare il complesso aperto e tenerlo tale. (Come abbiamo visto). Solo pochi nucleotidi entrano in contatto per permettere l’apertura della bolla. C’è un numero limitato di legami a idrogeno fra la proteina e il solco minore: la maggior parte della specificita’ e’ data da due copie di catene laterali di fenilalanina che si intercalano fra le basi di entrambe le estremita’ della sequenza TATA e che imponogono un forte ripiegamento del DNA. Il filamento che non viene replicato viene poi mandato in un canale specifico. COMPLESSO MEDIATORE Gli attivatori aiutano il reclutamento della polimerasi al promotore e ne stabilizzano il legame. L’interazione spesso avviene con il complesso mediatore. Il mediatore è associato alla subunità maggiore della polimerasi attraverso una superficie di legame, e presenta altre superfici per l’interazione con gli attivatori legati al DNA, come TFIIH. È infatti composto da numerosissime subunità. Diversi attivatori interagiscono con diverse subunità del mediatore. FATTORI DI ALLUNGAMENTO Per l’evasione dal promotore, dunque la PolII si deve liberare della maggior parte dei fattori di inizio, devono essere reclutati altri fattori che favoriscano l’allungamento. Gli enzimi sono reclutati dalla coda carbossiterminale. C’è fosforilazione in posizione 5 da parte della CDK, reclutata da TFIIH, andando a fosforilare per prima la serina. In questo modo cambia la conformazione e avviene il distacco dai fattori di inizio. Subito dopo l’inizio della trascrizione la RNA polimerasi va frequentemente in stallo, devono intervenire altri fattori di allungamento per eliminare molecole differenti. Ci sono molte CDK per permettere di continuare a trascrivere. C’è dunque una sequenzialità di fosforilazioni, prima per staccarla, poi per mantenerla. FACT Altro aspetto caratteristico della trascrizione negli eucarioti è che il DNA è organizzato in cromatina con nucleosomi. Man mano che RNA polimerasi HZBHZA trascrive, bisogna che venga eliminato il nucleosoma e poi che venga ricostruito. Ci sono particolari chaperon che smontano i nucleosomi nella regione che deve essere trascritta e riformarli nella regione in cui sono già stati trascritti. Sono detti FACT, ovvero facilitates chromatin testoni transcription. In particolare sono stati trovati degli eterodimeri composti da Spt16 e SSRP1. DNA DURANTE LA TRASCRIZIONE Quando si comincia a svolgere un po’, si espongono subito H2A e H2B come dimeri. È facile vedere come si staccano. Non c’è più il DNA avvolto e dunque o interviene Chaperon, o dato che il DNA è flessibile, la parte già trascritta si avvicina e si aggancia immediatamente ricostituendo subito il nucleosoma senza aver bisogno della mediazione di Chaperon. La RNA polimerasi II polimerizza circa 40nt al secondo. POLIMERASI I e III La transcizione iniziata da PolI e PolIII è analoga a PolII ma inizia da promotori distinti. In comune utilizzano la TBP per trascrivere dei geni per l’RNA. Polimerasi I = va a trascrivere un unico gene percursore dell’RNA ribosiomale, che è espresso a livello più alto di qualunque altro gene. Trascrive 13000 nucleotidi che verrà tagliato in RNA 18S (subunità minore), 5,8S e 28S per la subunità maggiore. Nel nucleofilo poi subisce delle modificazioni. Polimerasi III = sintetizza tRNA, snRNA, 5S rRNA, SINE, etc. La maggioranza dei promotori della Pol III si trova a valle del sito d' inizio (che e' insolito). Il promotore per il gene codificante il tRNA e' ad esempio composto da due regioni: Box A e Box B. Maturazione RNA Le sequenze promotoriali che abbiamo visto sono consensi, possono essere diverse e meglio favorire i legami della trascrizione. Quindi possono esserci promotori più forti o più deboli in base a quanti RNA producono in quantità di tempo. Come distinguere RNA messaggero in eucarioti e procarioti? Nei procarioti spesso ci sono RNA policistronici, ovvero da un unico filamento vengono prodotte più proteine. La regolazione di una proteina vedrà vista meglio quando parleremo dell’ operone lattosio Negli eucarioti l’RNA viene modificato. Sono RNA monocistronici. Ci sono dei geni che non devono essere tradotti, ovvero gli introni. L' mRNA eucariotico, prima di essere trasportato fuori dal nucleo per essere tradotto, passa attraverso una serie di modificazioni che lo trasformano nella sua forma matura. L' mRNA eucariotico e' subordinato essenzialmente a tre tipi di modificazioni coinvolti nella maturazione dell' mRNA: capping, splicing e poliadenilazione. Il processo del capping al 5' avviene durante la fase di allungamento descritta nel capitolo precedente. Dopo la trascrizione ,invece, avviene il processo di splicing. L' mRNA che e' passato attraverso il processo di capping ma non e' stato ancora soggetto allo splicing viene detto pre- mRNA (o mRNA precursore). La poliadenilazione al 3' e' invece conessa strettamente con la terminazione della trascrizione. Dopo queste modificazioni l' mRNA maturo e' pronto per essere tradotto. CAPPING Negli eucarioti all’estremità 5’ deve essere aggiunta una coda di poliadeninguanina, guanine metilate. L’enzima RNA trifosfatasi elimina il primo fosfato in 5’. Viene portato un nucleotide Guanina, GTP, grazie alla Guanil transferasi. Si forma un legame tra due gruppi fosfati, dunque un legame fosfoanidridico. Non può essere degradato da un normale enzima RNAasi, ed è poco riconoscibile. Inoltre la guanina attaccata viene modificata dalla metil transferasi con aggiunta di un metile. Questa modificazione è molto importante per la traslazione più che per la stabilità. Avviene spesso anche una seconda metilazione del primo nucleotide trascritto, ovvero A, con metilazione in 6. POLIADENILAZIONE Nel genoma non si osserva questa coda di poli-A in 3’. È una cosa che si trova solo nell’RNA perchè modificazione post-trascrizionale, è una cosa in più. CTD della polII è coinvolto nel reclutamento degli enzimi necessari. Viene riconosciuta una sequenza di poliadenilazione che recluta degli enzimi: - RNAasi che taglia l’RNA nascente dalla polimerasi detta CSTF cleavage stimulation factor - CPSF cleavage and polyadenylation specificity factor aggiunge le A Queste due riconoscono una sequenza specifica = AAUAAA (ricordatela) Questa sequenza è presente nel genoma, ed è detta poli A signal. C’è poi dopo 10-30 nucleotidi, una sequenza CA. A valle si trova poi una regione ricca di U o GU. I due fattori riconoscono la sequenza per il taglio. Viene reclutata PAP, ovvero polyA polymerase, un enzima in grado di polimerizzare in assenza di stampo. Queste A sono poi protette da una proteina poly-A- binding-protein, proteggendo così tutta la coda 3’ del messaggero. Di fatto, l'enzima non si ferma immediatamente dopo che l’RNA è stato tagliato e poliadenilato. Continua a scorrere lungo il DNA, generando una seconda molecola di RNA che può essere lunga anche diverse centinaia di nucleotidi. Solo allora, la polimerasi si stacca dallo stampo, rilasciando il nuovo RNA che viene degradato senza che lasci mai il nucleo. MODELLI DI TERMINAZIONE DELLA TRASCRIZIONE Modello a siluro => quando si forma un’estremità senza CAP, l’RNAasi non può degradarlo, perchè è stato subito modificato, a questo punto il complesso si stacca. Non procede la trascrizione. La proteina CPSF infatti non lega da subito AAUAA, ma e' associata al corpo della RNA Poli. Quando si sposta dalla PolIII alla sequenza, causa lo stallo della RNA Poli ed il suo distacco. Modello allosterico => prevede un cambiamento conformazionale della polimerasi che ne diminuirebbe di molto la processivita’ e che indurrebbe conseguentemente la terminazione. Questo cambiamento potrebbe essere conseguenza del rilascio di proteine che prima c’erano sulla CTD o dall’ interazione della CTD con delle proteine. Può avvenire se non è priva di CAP. SPLICING Consiste nella rimozione degli introni dal pre-mRNA per formare il messaggero. Il pre-RNA ha sempre Regione codificante la proteina UTR in 5’ UTR in 3’ untraslated region Il codone di stop è sempre nell’ultimo esone. ATG non è sempre nel primo esone invece. I Primi esoni producono regioni non traslate. Hanno scoperto l’esistenza degli introni utilizzando la microscopia elettronica facendo appaiare DNA e RNA. Si osserva che in alcune zone si ha un buon appaiamento, ma che in generale si formano numerose anse in cui non si può appaiare ( oltre al non appaiamento della coda di poli-A). Gli esoni sono generalmente lunghi un 100aio di paia di basi. Si possono trovare in numero diverso nei geni. Gli introni possono avere dimensioni molto differenti. I più frequenti nell’uomo hanno 100-2000 paia di basi. Sono dunque generalmente più grandi degli esoni e di dimensione molto varia. Si trovano spesso al loro interno delle regioni regolatorie. Gli introni sono caratterizzate da alcune sequenze specifiche che permettono lo splicing. C’è una sequenza di 11 pirimidine che termina con AG nel sito di splicing 3’. È detto sito accettore. C’è poi una A, detta punto di ramificazione. Il sito di splicing 5’ è caratterizzato da GU ed è detto sito donatore. Avvengono due reazioni di transesterificazione che vanno favorite. Il 5’ di A del punto di ramificazione è impegnato nel legame fosfodiesterico così come 3’. 2’OH è invece disponibile per andare ad attaccare il fosfato tra le 2 G nell’estremità 5’ dell’introne portando alla formazione del cappio. I due esoni si legano con legame fosfodiesterico , grazie a OH-3’ che si è liberato, attaccando il fosfato del sito di splicing 3’, il cappio viene eliminato e l’intero e è lasciato uscire come gruppo uscente. Il tutto è regolato dallo SPLICEOSOMA, costituito da 150 proteine e 5RNA non codificanti. Idrolizza ATP. Si chiamano snRNPs = small ribonuclease proteins Le proteine prendono il nome dai vari RNA nucleari che andranno da fare ufficialmente da catalizzatori. Gli RNA sono = U1, U2, U4, U5, U6 Le snRNPs riconoscono il sito di splicing e il punto di ramificazione, portano i siti vicini, catalizzano il taglio e la giunzione. L’RNA forma dei loop con regioni di complementarietà. La sequenza U1 si aggancia perfettamente al sito di splicing 5’, sono sequenze conservate in tutte le regioni esoni-introni, e lo scherma. La proteina U2AF ha due subunita’, una legata al segmento polipirimidinico e l’altra al sito di splicing 3’. La prima aiuta la proteina BBP a legarsi al punto di ramificazione. Questo complesso e’ chiamato complesso precoce E. U2AF aiuta a reclutare e formare il legame di snRNP U2 al punto di ramificazione ( A si appaia con U del messaggero, dopo c’è lo stretching delle pirimidina)e la rimozione di BBP. Quest' interazione con U2 spinge fuori il residuo A, che è l’unico a non appaiarsi, e crea una protuberanza: in questo modo, A diventa non accopiata, esposta e disponibile per la reazione con il sito di splicing 5' (prima transesterificazione). Questo si chiama complesso A. Ora bisogna riarrangiare il complesso A: le snRNPs U4 e U6, insieme alla snRNP U5, formano la particella a tre snRNP, dove U5 e' legata alle altre due mediante interazione proteina proteina. La particella si unisce al complesso A che diventa ora complesso B. A questo punto U1 e' rimpiazzato da U6 al sito di splicing 5': questo implica la rottura del legame RNA-RNA fra il pre-mRNA e U1, in quanto non si appaia perfettamente e si forma una regione non schermata e protetta da RNA e proteina. Questo sito viene occupato poi da U6. Ora che l' assemblaggio e' completato, inizia la catalisi che avviene nel modo seguente: U4 viene eliminato dal complesso grazie a U5, fatto che permette l'interazione fra U6 e U2. Quest' interazione forma il sito attivo della catalisi, ma assicura anche che il substrato (pre-mRNA) venga posizionato correttamente. La formazione del sito attivo avvicina il sito di splicing 5' e il punto di ramificazione favorendo la transesterificazione tra A e G ottenendo il complesso C. La seconda reazione e' aiutata invece dall' snRNP U5 che fa avvenire una transesterificazione tra 5’ e 3’, avvicina i due esoni ed elimina gli introni. Alla fine, il complesso viene rilasciato. Tutto ciò avviene durante la trascrizione, questo rende il processo estremamente preciso ed efficiente. Trascrizione e splicing sono correlati e ciò è stato dimostrato andando a vedere il DNA poly-A e i fattori di splicing e si trovano nelle stesse zone. Il posizionamento di U2AF e U1 viene favorito da particolari proteine SR, ricche di Ser e Arg, che legano ESE, ovvero exonic splicing enancher. Queste sono riconosciute da sequenze specifiche che si trovano sugli esoni, cross exon ricognition complex. Le proteine SR hanno dei foglietti beta che possono interagire con l’mRNA. Ci sono dunque piccole sequenze per i fattori che facilitano lo splicing, è garantita in questo modo la precisione. SPLICEOSOMA ALTERNATIVO Non sempre sono quelle di prima le sequenze riconosciute. Ci sono geni che usano un apparato minore, meno utilizzato. Ci sono U11 e U12 che svolgono le medesime funzioni di U1 e U2 ma riconoscono sequenze diverse, ovvero AU e AC relativamente. U4 e U6, anche se hanno lo stesso nome come nel modello canonico, sono in realta’ snRNPs diverse da quelle originali. U5 e’ invece uguale in entrambe le varianti. Questo spliceosoma riconosce introni rari con sequenze consenso diverse (sono pero’ contenuti in cca. 800 geni umani). Anche se le sequenze sono diverse, il meccanismo chimico è esattamente uguale a quello descritto per la variante standard. Si e’ anche scoperto che mutazioni su snRNA minori siano associate a patologie genetiche rare nell’ uomo. MUTAZIONI Mutazioni in componenti dello splicing dello spliceosoma AT-AC causano nanismo con microcefalia e osteodisplasia Mutazioni in eterozigosi in proteine del complesso U4-U5-U6 causano Retinite Pigmentosa Mutazioni al gene SMN1 (survival motor neuron) che codifica un componente ubiquitario per lo splicing causano Atrofia Muscolare Spinale (SMA) 15% delle mutazioni puntiformi patologiche modificano sequenze di splicing Mutazioni che attivano un sito criptico di splicing possono inattivare il gene Lo Splicing dell’mRNA 2.0 Se si parla di due esoni si ha un sito di splicing al 5’ e un sito di splicing al 3’, tra questi si trova un branch site caratterizzato dalla presenza di una “A” e preceduto da uno stretch di pirimidine. L’apparato maggiore di splicing utilizza come etichetta una sequenza GU al sito donatore di splicing 5’ e uno di AG al sito accettore 3’. Avviene quindi l’ingaggio delle particelle di splicing U1 e U2, C’è anche un apparato minore che ha come etichette AU al donatore e AC all’accettore. Sono coinvolte in questo caso U11 e U12. All’esponente 4 non c’è la coda poliA, ma il sito di riconoscimento di poliadenilazione. Ci sono diversi siti di inizio trascrizione, per cui possono essere trascritti tutti gli esoni, oppure il trascritto può essere più breve a causa della presenza di diversi promotori. Storicamente i ricercatori avevano caratterizzato moltissime proteine nelle cellule eucariotiche, ad esempio nelle elude umane si sapeva che i promotori fossero regolati in modo differente. In diverse cellule (insulina cellule beta isola largheras e glucagone nel latte) esistono fattori di trascrizione specifici. Una volta fatto il sequenziamento del genoma umano (2001), hanno osservato la presenza di pochi geni, poco più di 20000. La grande variabilità di proteine del genoma deriva da altri meccanismi, tra cui proprio lo splicing alternativo. Il preRNA è uguale al DNA stampo, contiene anche gli introni. mRNA maturo può avere inclusi tutti gli esoni, e questo porterebbe a una proteina specifica con tutti i domini proteici codificati: i domini caratterizzano le diverse funzioni della proteina (diverse subunità che costituiscono varie unità che si legano). Se avviene lo splicing alternativo l’esone 4 potrebbe essere perso e quindi la proteina prodotta perde il dominio corrispondente. Se viene perso l’esone 4 si ha un terzo tipo di proteina diversa ancora. Da un solo gene si possono avere ad esempio 3 proteine diverse, e proprio da questo deriva la grande variabilità delle proteine nonostante il numero limitato di geni. GENE TROPONINA = La troponina è una proteina presente nelle cellule muscolari, in particolare è legata al citoscheletro. Presenta due isomerie: Alpha = incluso esone 3 e non 4 Beta = incluso esone 4 e non 3 1. INGOMBRO STERICO DELLE PARTICELLE DI SPLICING All’inizio degli introni ci sono etichette per legare i fattori o le particelle di splicing, dunque può avvenire lo splicing tra tutti. Se un introne è troppo piccolo non ha lo spazio sufficiente per ospitare sia U1 che U2. se al sito 5’ si è legato U1 può fare lo splicing solo con l’introne successivo, viene così eliminato l’esone 3 —> troponina alpha se al sito 5’ è legato invece U2, non c’è spazio per U1, lo splicing avviene con l’intero e precedente, eliminando l’esone 4. —> troponina beta 2. COMBINAZIONE DI SITI DI TAGLIO PRIMARI E SECONDARI Se negli introni si alterano etichette appartenenti all’apparato maggiore e quello minore si ha uno splicing alternativo, perchè le due particelle non possono collaborare insieme in quanto appartengono a due apparati di splicing diversi. L’intero e intermedio inizia con il maggiore e termina con il minore, lo splicing tra i due non riuscita ad avvenire. Ogni apparato di splicing lavora bene solo con il proprio fattore corrispondente: U1 con U2 e U11 con U12. Dunque lo splicing tra esone 2 e 3 non potrebbe avvenire. Si possono ottenere due isoforme: U1 si lega al sito donatore, si usa l’etichetta GU dell’intero e centrale e AG del successivo, si usa l’apparato maggiore e si elimina l’esone seguente. Si utilizza l’etichetta AC nel sito accettore e AU del precedente, si usa l’appparato minore e si elimina l’esone precedente. 3. DECADIMENTO MEDIATO DA UN CODONE NON SENSO Questo meccanismo fa si’ che siano stabili solo gli mRNA con uno dei due esoni (mai con nessuno o con entrambi). Questo meccanismo si verifica quando l’ unione di entrambi gli esoni porta a un mRNA con un codone di terminazione prematuro (questi messaggeri vengono dunque distrutti). REGOLAZIONE Lo splicing alternativo è reglato dalla presenza di sequenze negli esoni e negli introni che legano proteine che facilitano lo splicing detti ENANCHER ESE (Exonic Splicing Enhancer) o proteine che sfavoriscono lo splicing detti SILENCER ESS (Exonic Splicing Silencer). Il fatto di poter far legare in modo piuttosto preciso i fattori come U2 (U2AF) è legato proprio a delle proteine che interagsicono con l’apparato si splicing, andando a posizionarlo in modo preciso oppure andando a interferire con esso. Le proteine SR legano le enancher, hanno un dominio ricco di arginina e serina che interagisce con l’apparato di splicing per posizionarlo in modo preciso. Quelle che mancano di questo dominio sono i silencer e intereriscono con l’apparato. Le proteine hnRNP invece legano i silencer. Ci può essere un trascritto primario dove viene legato il primo introne su sito di splicing. Se in altre cellule viene espresso il repressore esso interferisce con lo splicing e non avviene. L’espressione o meno dei fattori che interagscono portano al differenziamento cellualre. Se invece sono espressi gli enancher viene favorito l’apparato di splicing tra eosne 1 ed esone 2. Se non è epsresso lo splicing avviene ma più raramente. Un attivatore molto comune è SC35 che è una piccola proteina. Queste esono modificazioni post trascrizionali che partono dal pre-mRNA. EDITING RNA Altro meccanismo di reolazione che permette di regolare in modo fine e di esprimere anche isoforme diverse è l’editing dell’RNA. Sono modificazioni che RNA subisce. Gli mRNA sono altamente modifcati all’interno del nucleo, non è una molecola stabile. Esistono diversi enzimi tra cui: cidine deamminasi che agiscono sul mRNA, questo può portare ad una lettura del codice genetico diversa. Gene: apolipoproteina-B Esiste un pre-mRAN che ha al centro nell’esone una sequenza CAA, se la C viene deamminata diventa un UAA che è un codone non senso o codone di STOP. Il pre-mRNA subisce lo splicing, la modificazione avviene sull’mRNA maturo. Se l’enzima non agisce mRNA porta una proteina nel fegato di 4563 aa che è molto lunga, dove CAA codifica per la glutammina. Nell’intestino invece la proteina che si forma è la meta, è lunga 2153 aa perché nell’

Use Quizgecko on...
Browser
Browser