Biologia Molecolare Tutto - PDF
Document Details
Uploaded by InsightfulFantasticArt
Tags
Summary
This document provides a detailed overview of molecular biology, focusing on transcription processes and the role of RNA polymerase in producing RNA from DNA templates. It explores the mechanisms involved and the structural differences between RNA and DNA.
Full Transcript
Trascrizione Dal DNA viene prodotto un messaggero per poter codificare il codice per produrre proteine, ovvero l’RNA. RNA POLIMERASI L’enzima che effettua la trascrizione da DNA a RNA è la RNA polimerasi. Forma legami fosfodiesterici in modo molto sim...
Trascrizione Dal DNA viene prodotto un messaggero per poter codificare il codice per produrre proteine, ovvero l’RNA. RNA POLIMERASI L’enzima che effettua la trascrizione da DNA a RNA è la RNA polimerasi. Forma legami fosfodiesterici in modo molto simile alle DNA pol, per questo non vediamo approfonditamente la cosa. Per polimerizzare non ha bisogno di un primer ma di sequenze specifiche, formando legami a idrogeno in cui può intervenire anche il metile con interazioni idrofobiche ( per questo si ha U al posto di T), che caratterizzano il PROMOTORE. Non è in grado di riconoscere lei stessa le sequenze, ha bisogno di FATTORI DI TRASCRIZIONE L’RNA si deve polimerizzare su uno stampo di DNA. C’è dunque bisogno che si apra la doppia elica per formare una forca di trascrizione. Vengono portati nel sito dei ribonucleotidi per l’assemblaggio. All’interno del sistema si forma un sistema ibrido DNA-RNA che si deve staccare in modo che il DNA torni a formare il doppio filamento. È dunque un sistema transitorio che si romperà formando la molecola singola di RNA. L’RNA svolge ruoli molto importanti in vari compartimenti della cellula e permette anche che più molecole dello stesso RNA vengano trascritte contemporaneamente. Si agganciano dunque più RNA polimerasi per trascrivere lo stesso filamento. La RNA polimerasi è meno accurata della DNA polimerasi e può inserire un errore ogni 1000 nucleotidi. Dato che l’RNA è una molecola di transizione, una molecola molto instabile che si degrada con facilità, anche se una molecola ha un errore verranno prodotte al massimo alcune proteine scorrette che la cellula andrà a eliminare. Se invece il danno avviene nel DNA questo si conserva e viene riprodotto, per questo deve essere più fedele. La trascrizione copia solo alcune porzioni del genoma e produce molte copie contemporaneamente, la maggior parte di questo. prodotto non codifica per delle proteine. Quando si attiva un promotore sono prodotte molte copie di questo locus. MECCANISMO L’RNA è polimerizzato da 5’ a 3’. Anche in questo caso avviene lo stesso tipo di reazione della polimerizzazione dell’RNA, grazie a ioni positivi nel sito catalitico per poter muovere le cariche e fare l’attacco. STRUTTURA RNA Le molecole di RNA sono a filamento singolo e possono assumere varie strutture, ben distinguibili da quelle del DNA. Come il DNA dunque può formare una sorta di doppia elica, con un buco al centro. Gli appaiamenti tra le basi avvengono similmente, ma al posto della T si trova una U. Il solco maggiore dell’RNA è più grande perchè è un importante punto di interazione. Spesso acquisisce strutture a forcina, la struttura ad appaiamento della forcina è a doppia elica nella parte iniziale, nella parte finale le basi non si appaiano ma possono formare delle interazioni non classiche. PROCARIOTI STRUTTURA RNA POLIMERASI È composta da 5 subunità: 2 subunità alfa 1 subunità ß e 1 subunità ß’ che formano una sorta di chela all’interno del quale c’è lo ione magnesio per permettere la polimerizzazione 1 subunità omega che non si sa bene che faccia. INIZIO L’RNA polimerasi deve essere indirizzata nel punto di inizio, regione +1 dell’esone, della trascrizione, la precisione dell’attacco viene data dalle regioni che si trovano a monte. Ci sono infatti sequenze specifiche nel DNA a monte che indirizzano l’arrivo della RNA polimerasi. Questa però essendo la stessa per tutti i geni non le permette di riconoscere le sequenze. Il riconoscimento del promotore è infatti dato da fattori di trascrizione. In particolare sigma70 è detto iniziatore. Deve esserci poi la capacità dell’RNA polimerasi di aprire una bolla, in modo che un filamento di DNA faccia da stampo e l’altro venga messo lontano in un canale della proteina per non essere copiato. L’RNA viene poi trascritto 5’-3’, per avere l’ossidrile libero. Per trascrivere il frammento al contrario basterà che un’altra RNA polimerasi si leghi lineamento complementare. Per convenzione il filamento superiore 5’-3’, da sinistra a destra, è quello che corrisponde all’RNA messaggero. Nel momento in cui si apre la bolla, l’RNA polimerasi leggerà il frammento inferiore. In questo modo si ottiene l’RNA corrispondente al frammento superiore. Ci sono due promotori per entrambi i filamenti, per entrambe le direzioni, dunque possono essere trascritti gli RNA in entrambe le direzioni, come avevamo accennato per ColE1. In base a dove si lega la polimerasi si formano due filamenti complementari. FORZA DI PROMOTORE => livello di espressione di un gene, numero di trascritti iniziati in un dato intervallo di tempo. Dipende da: affinità della RNA polimerasi per il promotore efficienza di isomerizzazione rapidità movimento su DNA della RNA polimerasi sequenza del promotore Il promotore forte dunque vuol dire che produce molte molecole nell’unità di tempo. SEQUENZE DI UN PROMOTORE Un promotore batterico ha delle sequenze comuni fra i diversi procarioti. Ha scoperto che ci sono delle sequenze a -10 e -35 in particolare, che sono parzialmente conservate e sono dette SEQUENZE CONSENSO. -10 => il primo nucleotide è al 100% T, all’80% nel secondo ci sta una A, poi capita a volte altra A, al 70% A o T, infine al 100% c’è A, poi o T o A di nuovo. Dunque sono molto importanti la prima T e la A, in quanto sono basi molto importanti per l’interazione con sigma70, quindi se ci sono mutazioni in queste sequenze si hanno molti problemi. Queste sono le due basi più importanti, le altre sembrano esserlo meno. -35 => gli ultimi due nucleotidi sono sempre T, il terzultimo quasi sempre G In molti geni si trova poi un elemento UP, che lega RNA polimerasi. INTERAZIONE CON SIGMA70 Sigma 70 è la proteina che permette di legarsi in modo da inserire nel sito catalitico alla posizione 1. Ha diversi domini, in particolare si legano: dominio 2 alla sequenza -10 dominio 4 alla sequenza -35 Le sequenze sono dunque così conservate per permettere questo appaiamento, si parla dunque di OLOENZIMA quando si associa alla RNApol. Dal punto di vista proteico sono alpha—eliche. Vanno a formare interazioni tra amminoacidi e donatori/accettori. Ha un particolare loop dell’elica. Riesce a entrare all’interno del solco maggiore, a non del minore. Questa è una classica struttura generale per fattori di trascrizione dei batteri. Per questo c’è conservazione dei diversi geni di escherichia coli. Il fattore sigma è il fattore di inizio che riconosce sequenze specifiche e permette all’oloenzima della RNA polimerasi di iniziare solo da sequenze specifiche, non rimane attaccato durante la trascrizione. Si deve poi togliere sigme70 togliendo “il freno a mano” per poi poter trascrivere fino alla terminazione. CICLO Bisogna che il complesso passi da chiuso ad aperto. Non è necessaria energia per questo cambiamento strutturale dell’enzima. Una volta entrato e legato sigma70, si ferisce la doppia elica per esporre il filamento stampo. Il melting tra le pozioni è molto piccolo, -11 +2. Vengono così aperti pochi nucleotidi. Serve un modo per tenerli aperti e trascrivere RNA, anche in questo caso entra in gioco sigma70, in particolare il suo domino 2. Nel momento in cui entra in una conformazione più termofavorevole e vengono aperti i legami a idrogeno, sigma70 provoca il ribaltamento delle basi. Alcune basi vengono così ribaltate e non possono più appaiarsi, permettendo così di tenere aperta la bolla di trascrizione. Una volta fatto questo il filamento che non deve essere trascritto viene inserito in un canale detto non template. Rimane invece disponibile sul sito catalitico il filamento da noi definito inferiore. RNA polimerasi non usa primer, Il primo nucleotide è spesso una A L’enzima forma interazioni specifiche con il primo e secondo nucleotide per permettere la polimerizzazione di nucleotidi successivi, l’interazioni avviene con sigma. Proprio grazie a queste interazioni può non avere un primer. L’isomerizzazione è facilitata dallo spostamento delle regioni di sigma che hanno delle cariche negative. È dunque sigma che regola l’attacco del primo nucleotide. MOVIMENTO RNA POLIMERASI È stato visto che ci sono spesso RNA abortivi, di una decina di nucleotidi, la regione della bolla deve tornare all’inizio e riprendere fino a che non riesce ad evadere. Ci sono tre ipotesi su come l’RNA si possa muovere nonostante sigma. Passaggio Transiente = fa diversi filamenti di DNA abortivo A bruco = cambia conformazione allungandosi permettendo lo spaio per i primi 10 nucleotidi Accartocciamento = genera minore interazione con sigma, la più accreditata sapendo che l’acido nucleico è flessibile, inizia a trascrivere, viene fatto un ripiegamento fino a quando l’RNA non riesce a sganciare sigma70. ALLUNGAMENTO Nucleotide dopo nucleotide inizia ad essere sintetizzato RNA. Vengono attaccati una decina di nucleotidi fino a quando l’RNA nascente coperto da sigma 70 riesce a infilarsi nel canale e spiazzare sigma70, così che la RNA polimerasi possa evadere. Si pensa dunque che sia l’RNA quando entra nel canale riesce ad abbassare l’interazione. Dunque è l’RNA nascente a spiazzare sigma70. In ogni momento solamente 8-9 nucleotidi della catena di RNA rimangono appaiati allo stampo perchè si stacca ed esce dal canale di uscita dell’RNA. Anche l’RNA polimerasi ha un po’ di attività di correzione: Editing pirofosforolitico = nel sito attivo il ribonucleotide scorretto viene rimosso tramite reincorporazione del pirofosfato Editing idrolitico = torna indietro e rimuove il ribonucleotide scorretto Non ha un sito apposito ma cerca di fare tutto lì, per questo non è molto efficiente. In caso di danno al DNA la RNA polimerasi si blocca e deve essere rimossa. Qui interviene TRCF (transcription-repair coupling factor) che ha attività ATPasica e spinge via la polimerasi dal sito di stallo. Questo è dunque un fattore che accoppia la trascrizione al danno del DNA, TERMINAZIONE La RNA polimerasi potrebbe rimanere legata a lungo, ma sarebbe dispendioso inutilmente. C’è un segnale di stop in modo che si generino molecole di RNA più o meno della dimensione del gene. Le sequenze di questi siti di terminazione hanno regioni complementari, che formano delle forcine. Queste vengono riconosciute da proteine. Ci sono il sistema: Terminatori intrinseci = la sequenza invertita che forma la forcina ha effetto sull’RNA che è a singolo filamento e questa struttura causa il dissolvimento del complesso di allungamento. Si forma una forcina con una serie di U che si legano con solo due legami a idrogeno. Questa viene legata da proteine specifiche come NusA. Si lega questa proteina che favorisce il distacco dell’RNA polimerasi. Rho dipendente = Rho è una proteina con 6 subunità che riconosce una sequenza detta rut, che viene legata dalla proteina con attività elicasica permettendo il distacco con utilizzo di ATP. RHO INDIPENDENTE RHO DIPENDENTE EUCARIOTI Ogni gene viene trascritto diverse volte in punti differenti da diverse molecole di RNA nello stesso istante. A differenza dei procarioti, traduzione e trascrizione avvengono in momenti differenti. RNA POLIMERASI È composta dalle 10 o più subunità. Si possono osservare una porzione conservata, e la forma a chela (proprio questa particolarmente conservata). La reazione di polimerizzazione avviene in modo identico tra procarioti ed eucarioti, ciò che varia sono i fattori della trascrizione. Il sito attivo è tra le subunità più grandi. Negli eucarioti esistono forme di RNA molto differenti, anche di tipi in più rispetto a procarioti. Questi sono di fatto trascritti da diversi RNA polimerasi. Negli eucarioti sono presenti tre diverse RNA polimerasi (I, Il e III) ciascuna delle quali svolge compiti specifici: la RNA polimerasi I trascrive i geni per la sintesi degli RNA ribosomiali; la RNA polimerasi II trascrive i geni per la sintesi degli mRNA; la RNA polimerasi III sintetizza i tRNA e altri piccoli RNA (miRNA) implicati in diversi processi, tra cui lo splicing. PROMOTORI Abbiamo visto che i procarioti per sistemare queste regioni genomiche di DNA a monte del sito di trascrizione per indirizzare la RNA polimerasi agisce il fattore sigma70, con i domini per legare alpha-eliche nelle regioni -10 e -35, questo costituisce un segnale per posizionarsi. Anche i promotori eucariotici hanno sequenze caratteristiche. Gli eucarioti non ne hanno solo uno, ma per iniziare la trascrizione la RNA polimerasi lega i FATTORI GENERALI DI TRASCRIZIONE, per legarsi al promotore. Inoltre necessiterà di una serie di fattori per modificare la cromatina e modificare e spostare i nucleosomi. TATA box a -25 —> non sempre è presente BRE = riconosce il fattore TFIIB a -32 DCE = downstream core element, dunque a valle DPE = downstream promoter element TATA BOX Si chiama in questo modo in quanto ricca di T e A. Si vanno ad osservare le sequenze consenso, ovvero analizzando vari promotori diversi i nucleotidi maggiormente conservati. Per la TataBox si osserva che l’83% ha T, 97% A, 93% T, 85%A , 63/37% A/T, 88% A. Non tutti i nucleotidi sono ingaggiati per formare nuovi legami con la proteina, sono alcuni sono coinvolti per il consenso. Gli idrogeni che sporgono dal solco minore e maggiore vanno a formare il legame con le proteine Le sequenze consenso legano i seguenti fattori di trascrizione: ETFIID è ASSEMBLAGGIO COMPLESSO Il primo evento che viene riconosciuto è quello di legame tra la TATA Binding Protein alla TATA box. In realtà la TBP non è sola, ma è un complesso di varie proteine che nel complesso si chiamano TFIID. È infatti composta da TAF, ovvero TBP-associated factors che legano lnr e DPE/DCE, e TPB. La TBP lega il DNA nel solco minore. Usa i foglietti beta per sistemarsi nel solco minore, per allargarlo, ha poi due loop proteici per piegare il DNA di 90°. Questa sequenza essendo ricca di appaiamenti T e A permette il ripiegamento della molecole, essendo più flessibile e con meno legami. Se si ponesse nel solco maggiore non potrebbe piegarsi. TFIID lega l’elemento BRE che si trova a monte, si lega a sinistra e si allunga a destra, andando a prendere le due parti che si sono ripiegate. Potrebbe muoversi in posizione opposta ma vorrebbe dire che si lega a un promotore sul filamento opposto. Successivamente sono reclutati TFIIA e TFIIB, una volta che arriva questa richiama TFIIF , che fa si che si ripieghi dalla parte giusta, e fa da ponte di riconoscimento di altri fattori di trascrizione. TFIIB è una proteina che interagisce con TBP e si dispone in modo asimmetrico per favorire unidirezionalità nella trascrizione, da sinistra a destra usando il filamento inferiore come stampo. Questi elementi promotoriali indicano in che direzione deve avvenire la trascrizione. La porzione allungata di TFIIB si deve legare a TBP per poter reclutare la DNA polimerasi e indicarle la direzione da seguire per trascrivere. Il legame della TFIIF con la polimerasi stabilizza il complesso TFIIB-TBP-DNA ed e’ necessario per reclutare TFIIE che recluta la TFIIH che ha ben 10 subunita’ – la subunita’ con attivita’ ATP-asica media il melting del DNA, che scatta l’ inizio della trascrizione. Dopo l’arrivo di queste si può parlare di complesso di pre-inizio. A questo punto deve avvenire l’apertura del DNA per utilizzare uno dei due filamenti come stampo. ISOMERIZAZIONE A COMPLESSO APERTO C’è bisogno di ATP e viene tutto mediato da TFIIH. Anche questa non è una singola proteina ma è composta da diverse subunità. In particolare: XPD, XPB = sono elicasi che rompono legami a idrogeno per formare la bolla, è ATP dipendente -> ATPasi CDK7, MAT1 = sono kinasi per il carbonio terminale della RNA polimerasi. Queste subunità di TFIIH sono anche coinvolte nella riparazione dei mismatch. TFIIB si inserisce nel solco della RNA polimerasi II per poter stabilizzare il complesso aperto e tenerlo tale. (Come abbiamo visto). Solo pochi nucleotidi entrano in contatto per permettere l’apertura della bolla. C’è un numero limitato di legami a idrogeno fra la proteina e il solco minore: la maggior parte della specificita’ e’ data da due copie di catene laterali di fenilalanina che si intercalano fra le basi di entrambe le estremita’ della sequenza TATA e che imponogono un forte ripiegamento del DNA. Il filamento che non viene replicato viene poi mandato in un canale specifico. COMPLESSO MEDIATORE Gli attivatori aiutano il reclutamento della polimerasi al promotore e ne stabilizzano il legame. L’interazione spesso avviene con il complesso mediatore. Il mediatore è associato alla subunità maggiore della polimerasi attraverso una superficie di legame, e presenta altre superfici per l’interazione con gli attivatori legati al DNA, come TFIIH. È infatti composto da numerosissime subunità. Diversi attivatori interagiscono con diverse subunità del mediatore. FATTORI DI ALLUNGAMENTO Per l’evasione dal promotore, dunque la PolII si deve liberare della maggior parte dei fattori di inizio, devono essere reclutati altri fattori che favoriscano l’allungamento. Gli enzimi sono reclutati dalla coda carbossiterminale. C’è fosforilazione in posizione 5 da parte della CDK, reclutata da TFIIH, andando a fosforilare per prima la serina. In questo modo cambia la conformazione e avviene il distacco dai fattori di inizio. Subito dopo l’inizio della trascrizione la RNA polimerasi va frequentemente in stallo, devono intervenire altri fattori di allungamento per eliminare molecole differenti. Ci sono molte CDK per permettere di continuare a trascrivere. C’è dunque una sequenzialità di fosforilazioni, prima per staccarla, poi per mantenerla. FACT Altro aspetto caratteristico della trascrizione negli eucarioti è che il DNA è organizzato in cromatina con nucleosomi. Man mano che RNA polimerasi HZBHZA trascrive, bisogna che venga eliminato il nucleosoma e poi che venga ricostruito. Ci sono particolari chaperon che smontano i nucleosomi nella regione che deve essere trascritta e riformarli nella regione in cui sono già stati trascritti. Sono detti FACT, ovvero facilitates chromatin testoni transcription. In particolare sono stati trovati degli eterodimeri composti da Spt16 e SSRP1. DNA DURANTE LA TRASCRIZIONE Quando si comincia a svolgere un po’, si espongono subito H2A e H2B come dimeri. È facile vedere come si staccano. Non c’è più il DNA avvolto e dunque o interviene Chaperon, o dato che il DNA è flessibile, la parte già trascritta si avvicina e si aggancia immediatamente ricostituendo subito il nucleosoma senza aver bisogno della mediazione di Chaperon. La RNA polimerasi II polimerizza circa 40nt al secondo. POLIMERASI I e III La transcizione iniziata da PolI e PolIII è analoga a PolII ma inizia da promotori distinti. In comune utilizzano la TBP per trascrivere dei geni per l’RNA. Polimerasi I = va a trascrivere un unico gene percursore dell’RNA ribosiomale, che è espresso a livello più alto di qualunque altro gene. Trascrive 13000 nucleotidi che verrà tagliato in RNA 18S (subunità minore), 5,8S e 28S per la subunità maggiore. Nel nucleofilo poi subisce delle modificazioni. Polimerasi III = sintetizza tRNA, snRNA, 5S rRNA, SINE, etc. La maggioranza dei promotori della Pol III si trova a valle del sito d' inizio (che e' insolito). Il promotore per il gene codificante il tRNA e' ad esempio composto da due regioni: Box A e Box B. Maturazione RNA Le sequenze promotoriali che abbiamo visto sono consensi, possono essere diverse e meglio favorire i legami della trascrizione. Quindi possono esserci promotori più forti o più deboli in base a quanti RNA producono in quantità di tempo. Come distinguere RNA messaggero in eucarioti e procarioti? Nei procarioti spesso ci sono RNA policistronici, ovvero da un unico filamento vengono prodotte più proteine. La regolazione di una proteina vedrà vista meglio quando parleremo dell’ operone lattosio Negli eucarioti l’RNA viene modificato. Sono RNA monocistronici. Ci sono dei geni che non devono essere tradotti, ovvero gli introni. L' mRNA eucariotico, prima di essere trasportato fuori dal nucleo per essere tradotto, passa attraverso una serie di modificazioni che lo trasformano nella sua forma matura. L' mRNA eucariotico e' subordinato essenzialmente a tre tipi di modificazioni coinvolti nella maturazione dell' mRNA: capping, splicing e poliadenilazione. Il processo del capping al 5' avviene durante la fase di allungamento descritta nel capitolo precedente. Dopo la trascrizione ,invece, avviene il processo di splicing. L' mRNA che e' passato attraverso il processo di capping ma non e' stato ancora soggetto allo splicing viene detto pre- mRNA (o mRNA precursore). La poliadenilazione al 3' e' invece conessa strettamente con la terminazione della trascrizione. Dopo queste modificazioni l' mRNA maturo e' pronto per essere tradotto. CAPPING Negli eucarioti all’estremità 5’ deve essere aggiunta una coda di poliadeninguanina, guanine metilate. L’enzima RNA trifosfatasi elimina il primo fosfato in 5’. Viene portato un nucleotide Guanina, GTP, grazie alla Guanil transferasi. Si forma un legame tra due gruppi fosfati, dunque un legame fosfoanidridico. Non può essere degradato da un normale enzima RNAasi, ed è poco riconoscibile. Inoltre la guanina attaccata viene modificata dalla metil transferasi con aggiunta di un metile. Questa modificazione è molto importante per la traslazione più che per la stabilità. Avviene spesso anche una seconda metilazione del primo nucleotide trascritto, ovvero A, con metilazione in 6. POLIADENILAZIONE Nel genoma non si osserva questa coda di poli-A in 3’. È una cosa che si trova solo nell’RNA perchè modificazione post-trascrizionale, è una cosa in più. CTD della polII è coinvolto nel reclutamento degli enzimi necessari. Viene riconosciuta una sequenza di poliadenilazione che recluta degli enzimi: - RNAasi che taglia l’RNA nascente dalla polimerasi detta CSTF cleavage stimulation factor - CPSF cleavage and polyadenylation specificity factor aggiunge le A Queste due riconoscono una sequenza specifica = AAUAAA (ricordatela) Questa sequenza è presente nel genoma, ed è detta poli A signal. C’è poi dopo 10-30 nucleotidi, una sequenza CA. A valle si trova poi una regione ricca di U o GU. I due fattori riconoscono la sequenza per il taglio. Viene reclutata PAP, ovvero polyA polymerase, un enzima in grado di polimerizzare in assenza di stampo. Queste A sono poi protette da una proteina poly-A- binding-protein, proteggendo così tutta la coda 3’ del messaggero. Di fatto, l'enzima non si ferma immediatamente dopo che l’RNA è stato tagliato e poliadenilato. Continua a scorrere lungo il DNA, generando una seconda molecola di RNA che può essere lunga anche diverse centinaia di nucleotidi. Solo allora, la polimerasi si stacca dallo stampo, rilasciando il nuovo RNA che viene degradato senza che lasci mai il nucleo. MODELLI DI TERMINAZIONE DELLA TRASCRIZIONE Modello a siluro => quando si forma un’estremità senza CAP, l’RNAasi non può degradarlo, perchè è stato subito modificato, a questo punto il complesso si stacca. Non procede la trascrizione. La proteina CPSF infatti non lega da subito AAUAA, ma e' associata al corpo della RNA Poli. Quando si sposta dalla PolIII alla sequenza, causa lo stallo della RNA Poli ed il suo distacco. Modello allosterico => prevede un cambiamento conformazionale della polimerasi che ne diminuirebbe di molto la processivita’ e che indurrebbe conseguentemente la terminazione. Questo cambiamento potrebbe essere conseguenza del rilascio di proteine che prima c’erano sulla CTD o dall’ interazione della CTD con delle proteine. Può avvenire se non è priva di CAP. SPLICING Consiste nella rimozione degli introni dal pre-mRNA per formare il messaggero. Il pre-RNA ha sempre Regione codificante la proteina UTR in 5’ UTR in 3’ untraslated region Il codone di stop è sempre nell’ultimo esone. ATG non è sempre nel primo esone invece. I Primi esoni producono regioni non traslate. Hanno scoperto l’esistenza degli introni utilizzando la microscopia elettronica facendo appaiare DNA e RNA. Si osserva che in alcune zone si ha un buon appaiamento, ma che in generale si formano numerose anse in cui non si può appaiare ( oltre al non appaiamento della coda di poli-A). Gli esoni sono generalmente lunghi un 100aio di paia di basi. Si possono trovare in numero diverso nei geni. Gli introni possono avere dimensioni molto differenti. I più frequenti nell’uomo hanno 100-2000 paia di basi. Sono dunque generalmente più grandi degli esoni e di dimensione molto varia. Si trovano spesso al loro interno delle regioni regolatorie. Gli introni sono caratterizzate da alcune sequenze specifiche che permettono lo splicing. C’è una sequenza di 11 pirimidine che termina con AG nel sito di splicing 3’. È detto sito accettore. C’è poi una A, detta punto di ramificazione. Il sito di splicing 5’ è caratterizzato da GU ed è detto sito donatore. Avvengono due reazioni di transesterificazione che vanno favorite. Il 5’ di A del punto di ramificazione è impegnato nel legame fosfodiesterico così come 3’. 2’OH è invece disponibile per andare ad attaccare il fosfato tra le 2 G nell’estremità 5’ dell’introne portando alla formazione del cappio. I due esoni si legano con legame fosfodiesterico , grazie a OH-3’ che si è liberato, attaccando il fosfato del sito di splicing 3’, il cappio viene eliminato e l’intero e è lasciato uscire come gruppo uscente. Il tutto è regolato dallo SPLICEOSOMA, costituito da 150 proteine e 5RNA non codificanti. Idrolizza ATP. Si chiamano snRNPs = small ribonuclease proteins Le proteine prendono il nome dai vari RNA nucleari che andranno da fare ufficialmente da catalizzatori. Gli RNA sono = U1, U2, U4, U5, U6 Le snRNPs riconoscono il sito di splicing e il punto di ramificazione, portano i siti vicini, catalizzano il taglio e la giunzione. L’RNA forma dei loop con regioni di complementarietà. La sequenza U1 si aggancia perfettamente al sito di splicing 5’, sono sequenze conservate in tutte le regioni esoni-introni, e lo scherma. La proteina U2AF ha due subunita’, una legata al segmento polipirimidinico e l’altra al sito di splicing 3’. La prima aiuta la proteina BBP a legarsi al punto di ramificazione. Questo complesso e’ chiamato complesso precoce E. U2AF aiuta a reclutare e formare il legame di snRNP U2 al punto di ramificazione ( A si appaia con U del messaggero, dopo c’è lo stretching delle pirimidina)e la rimozione di BBP. Quest' interazione con U2 spinge fuori il residuo A, che è l’unico a non appaiarsi, e crea una protuberanza: in questo modo, A diventa non accopiata, esposta e disponibile per la reazione con il sito di splicing 5' (prima transesterificazione). Questo si chiama complesso A. Ora bisogna riarrangiare il complesso A: le snRNPs U4 e U6, insieme alla snRNP U5, formano la particella a tre snRNP, dove U5 e' legata alle altre due mediante interazione proteina proteina. La particella si unisce al complesso A che diventa ora complesso B. A questo punto U1 e' rimpiazzato da U6 al sito di splicing 5': questo implica la rottura del legame RNA-RNA fra il pre-mRNA e U1, in quanto non si appaia perfettamente e si forma una regione non schermata e protetta da RNA e proteina. Questo sito viene occupato poi da U6. Ora che l' assemblaggio e' completato, inizia la catalisi che avviene nel modo seguente: U4 viene eliminato dal complesso grazie a U5, fatto che permette l'interazione fra U6 e U2. Quest' interazione forma il sito attivo della catalisi, ma assicura anche che il substrato (pre-mRNA) venga posizionato correttamente. La formazione del sito attivo avvicina il sito di splicing 5' e il punto di ramificazione favorendo la transesterificazione tra A e G ottenendo il complesso C. La seconda reazione e' aiutata invece dall' snRNP U5 che fa avvenire una transesterificazione tra 5’ e 3’, avvicina i due esoni ed elimina gli introni. Alla fine, il complesso viene rilasciato. Tutto ciò avviene durante la trascrizione, questo rende il processo estremamente preciso ed efficiente. Trascrizione e splicing sono correlati e ciò è stato dimostrato andando a vedere il DNA poly-A e i fattori di splicing e si trovano nelle stesse zone. Il posizionamento di U2AF e U1 viene favorito da particolari proteine SR, ricche di Ser e Arg, che legano ESE, ovvero exonic splicing enancher. Queste sono riconosciute da sequenze specifiche che si trovano sugli esoni, cross exon ricognition complex. Le proteine SR hanno dei foglietti beta che possono interagire con l’mRNA. Ci sono dunque piccole sequenze per i fattori che facilitano lo splicing, è garantita in questo modo la precisione. SPLICEOSOMA ALTERNATIVO Non sempre sono quelle di prima le sequenze riconosciute. Ci sono geni che usano un apparato minore, meno utilizzato. Ci sono U11 e U12 che svolgono le medesime funzioni di U1 e U2 ma riconoscono sequenze diverse, ovvero AU e AC relativamente. U4 e U6, anche se hanno lo stesso nome come nel modello canonico, sono in realta’ snRNPs diverse da quelle originali. U5 e’ invece uguale in entrambe le varianti. Questo spliceosoma riconosce introni rari con sequenze consenso diverse (sono pero’ contenuti in cca. 800 geni umani). Anche se le sequenze sono diverse, il meccanismo chimico è esattamente uguale a quello descritto per la variante standard. Si e’ anche scoperto che mutazioni su snRNA minori siano associate a patologie genetiche rare nell’ uomo. MUTAZIONI Mutazioni in componenti dello splicing dello spliceosoma AT-AC causano nanismo con microcefalia e osteodisplasia Mutazioni in eterozigosi in proteine del complesso U4-U5-U6 causano Retinite Pigmentosa Mutazioni al gene SMN1 (survival motor neuron) che codifica un componente ubiquitario per lo splicing causano Atrofia Muscolare Spinale (SMA) 15% delle mutazioni puntiformi patologiche modificano sequenze di splicing Mutazioni che attivano un sito criptico di splicing possono inattivare il gene Lo Splicing dell’mRNA 2.0 Se si parla di due esoni si ha un sito di splicing al 5’ e un sito di splicing al 3’, tra questi si trova un branch site caratterizzato dalla presenza di una “A” e preceduto da uno stretch di pirimidine. L’apparato maggiore di splicing utilizza come etichetta una sequenza GU al sito donatore di splicing 5’ e uno di AG al sito accettore 3’. Avviene quindi l’ingaggio delle particelle di splicing U1 e U2, C’è anche un apparato minore che ha come etichette AU al donatore e AC all’accettore. Sono coinvolte in questo caso U11 e U12. All’esponente 4 non c’è la coda poliA, ma il sito di riconoscimento di poliadenilazione. Ci sono diversi siti di inizio trascrizione, per cui possono essere trascritti tutti gli esoni, oppure il trascritto può essere più breve a causa della presenza di diversi promotori. Storicamente i ricercatori avevano caratterizzato moltissime proteine nelle cellule eucariotiche, ad esempio nelle elude umane si sapeva che i promotori fossero regolati in modo differente. In diverse cellule (insulina cellule beta isola largheras e glucagone nel latte) esistono fattori di trascrizione specifici. Una volta fatto il sequenziamento del genoma umano (2001), hanno osservato la presenza di pochi geni, poco più di 20000. La grande variabilità di proteine del genoma deriva da altri meccanismi, tra cui proprio lo splicing alternativo. Il preRNA è uguale al DNA stampo, contiene anche gli introni. mRNA maturo può avere inclusi tutti gli esoni, e questo porterebbe a una proteina specifica con tutti i domini proteici codificati: i domini caratterizzano le diverse funzioni della proteina (diverse subunità che costituiscono varie unità che si legano). Se avviene lo splicing alternativo l’esone 4 potrebbe essere perso e quindi la proteina prodotta perde il dominio corrispondente. Se viene perso l’esone 4 si ha un terzo tipo di proteina diversa ancora. Da un solo gene si possono avere ad esempio 3 proteine diverse, e proprio da questo deriva la grande variabilità delle proteine nonostante il numero limitato di geni. GENE TROPONINA = La troponina è una proteina presente nelle cellule muscolari, in particolare è legata al citoscheletro. Presenta due isomerie: Alpha = incluso esone 3 e non 4 Beta = incluso esone 4 e non 3 1. INGOMBRO STERICO DELLE PARTICELLE DI SPLICING All’inizio degli introni ci sono etichette per legare i fattori o le particelle di splicing, dunque può avvenire lo splicing tra tutti. Se un introne è troppo piccolo non ha lo spazio sufficiente per ospitare sia U1 che U2. se al sito 5’ si è legato U1 può fare lo splicing solo con l’introne successivo, viene così eliminato l’esone 3 —> troponina alpha se al sito 5’ è legato invece U2, non c’è spazio per U1, lo splicing avviene con l’intero e precedente, eliminando l’esone 4. —> troponina beta 2. COMBINAZIONE DI SITI DI TAGLIO PRIMARI E SECONDARI Se negli introni si alterano etichette appartenenti all’apparato maggiore e quello minore si ha uno splicing alternativo, perchè le due particelle non possono collaborare insieme in quanto appartengono a due apparati di splicing diversi. L’intero e intermedio inizia con il maggiore e termina con il minore, lo splicing tra i due non riuscita ad avvenire. Ogni apparato di splicing lavora bene solo con il proprio fattore corrispondente: U1 con U2 e U11 con U12. Dunque lo splicing tra esone 2 e 3 non potrebbe avvenire. Si possono ottenere due isoforme: U1 si lega al sito donatore, si usa l’etichetta GU dell’intero e centrale e AG del successivo, si usa l’apparato maggiore e si elimina l’esone seguente. Si utilizza l’etichetta AC nel sito accettore e AU del precedente, si usa l’appparato minore e si elimina l’esone precedente. 3. DECADIMENTO MEDIATO DA UN CODONE NON SENSO Questo meccanismo fa si’ che siano stabili solo gli mRNA con uno dei due esoni (mai con nessuno o con entrambi). Questo meccanismo si verifica quando l’ unione di entrambi gli esoni porta a un mRNA con un codone di terminazione prematuro (questi messaggeri vengono dunque distrutti). REGOLAZIONE Lo splicing alternativo è reglato dalla presenza di sequenze negli esoni e negli introni che legano proteine che facilitano lo splicing detti ENANCHER ESE (Exonic Splicing Enhancer) o proteine che sfavoriscono lo splicing detti SILENCER ESS (Exonic Splicing Silencer). Il fatto di poter far legare in modo piuttosto preciso i fattori come U2 (U2AF) è legato proprio a delle proteine che interagsicono con l’apparato si splicing, andando a posizionarlo in modo preciso oppure andando a interferire con esso. Le proteine SR legano le enancher, hanno un dominio ricco di arginina e serina che interagisce con l’apparato di splicing per posizionarlo in modo preciso. Quelle che mancano di questo dominio sono i silencer e intereriscono con l’apparato. Le proteine hnRNP invece legano i silencer. Ci può essere un trascritto primario dove viene legato il primo introne su sito di splicing. Se in altre cellule viene espresso il repressore esso interferisce con lo splicing e non avviene. L’espressione o meno dei fattori che interagscono portano al differenziamento cellualre. Se invece sono espressi gli enancher viene favorito l’apparato di splicing tra eosne 1 ed esone 2. Se non è epsresso lo splicing avviene ma più raramente. Un attivatore molto comune è SC35 che è una piccola proteina. Queste esono modificazioni post trascrizionali che partono dal pre-mRNA. EDITING RNA Altro meccanismo di reolazione che permette di regolare in modo fine e di esprimere anche isoforme diverse è l’editing dell’RNA. Sono modificazioni che RNA subisce. Gli mRNA sono altamente modifcati all’interno del nucleo, non è una molecola stabile. Esistono diversi enzimi tra cui: cidine deamminasi che agiscono sul mRNA, questo può portare ad una lettura del codice genetico diversa. Gene: apolipoproteina-B Esiste un pre-mRAN che ha al centro nell’esone una sequenza CAA, se la C viene deamminata diventa un UAA che è un codone non senso o codone di STOP. Il pre-mRNA subisce lo splicing, la modificazione avviene sull’mRNA maturo. Se l’enzima non agisce mRNA porta una proteina nel fegato di 4563 aa che è molto lunga, dove CAA codifica per la glutammina. Nell’intestino invece la proteina che si forma è la meta, è lunga 2153 aa perché nell’intestino è attivata la citidina deamminasi che deammina la C di CAA e si ottiene così una proteina piccola. Perché non viene degradato il messaggero data la prsenza del codone di stop prematuro? Perché la modificazione avviene dopo lo splicing, se fosse avvenuta priam allora sarebbe stato degradato, NMD. L’altra base che può essere deamminata è l’adenina. Perendo il gruppo amminico della adenina porta aauna base detta inosina, I. Mentre A si appaia solo con la U, la inosina è molto più promiscua, riesce ad appaiarsi con tutte le altre basi azotate a parte la G. Quando nel RNA messaggero isintroduce una I, il codone con la I può essere letto da tanti anticodoni diversi durante la traduzione. Queste diverse combinazioni permettono la produzione di faramci diversi in particolari neurotrasmettitori—> recettore del glutammato. Se avviene l’editing sulla A si ottiene una I che porta all’appaiamento con transfer che portano l’arginina e non la glutammina. Nella cellula in cui non c’è stato editing i recettori per il glutammato lo legano e fanno passare ioni calcio modificando il potenziale della cellula. Nel caso in cui invece è avvenuto editing si trova un’arginina che porta una craica positiva e abbassa la fuzionalità del canale per gli ioni calcio. Analogamente il recettore della serotonina se viene variato in tutti e tre i suoi aminoacidi allora il recettore perde tutta la funzioanlità. Variandolo solamente alcune basi si modula la funzionalità del recettore. Con uno stesso gene si possono includere o non includere domini proteici andando a variare un aa rispetto ad un altro per variare la funzionalità nelle cellule. TRASPORTO mRNA NEL CITOPLASMA L’mRNA per uscire dal nucleo deve passare attraverso il poro nucleare. Le sequenze degli mRNA sono tra le più varie, dopo aggiunta della poliA si legano le PoliA bounding porteine. Alcuni fattori di splicing rimangono ancora legati alla giunzione deglie esoni —> sono questi a facilitare il trasporto dal nucleo al citoplasma, quando esce si dissociano e poi sono degradati. La cellula riesce a trasportare facilmente il RNA nel citoplasma quando a questo sono legate delle proteine: PolA bounding protein; Particelle di splicing; Questa scoperta che l’RNA messaggero rimane legato alle proteine dello splicing può sembrare una curiosità ma invece per le biotecnologie è molto importante per la produzoine di proteine in cellule eucariotiche. Prima: clonare con ezimi di restrizione e poi si utilizza un promotore eucariorico, poi ATG e poi la sequenza TAA e infine il segnale di poliA. Adesso: promotore del primo esone, piccolo introne e poi il cDNA clonato—> molto più efficiente e più produzione di proteine in cellule eucariotiche. ATG può essere anche nel primo esone, si possono mettere anche esoni non codificanti non importa.