Trascrizione del DNA in RNA: Biologia Molecolare PDF
Document Details
Uploaded by InsightfulFantasticArt
Tags
Summary
Questo documento descrive il processo di trascrizione del DNA in RNA, con particolare attenzione al ruolo della RNA polimerasi, ai fattori di trascrizione e al meccanismo di allungamento. Vengono analizzati i momenti chiave del processo dalla polimerizzazione dei nucleotidi alla struttura dell'RNA. Inoltre, viene messo in luce la differenza di complessità tra la trascrizione in procarioti e l'importanza di mantenere la fedeltà del processo.
Full Transcript
Trascrizione Dal DNA viene prodotto un messaggero per poter codificare il codice per produrre proteine, ovvero l’RNA. RNA POLIMERASI L’enzima che effettua la trascrizione da DNA a RNA è la RNA polimerasi. Forma legami fosfodiesterici in modo molto sim...
Trascrizione Dal DNA viene prodotto un messaggero per poter codificare il codice per produrre proteine, ovvero l’RNA. RNA POLIMERASI L’enzima che effettua la trascrizione da DNA a RNA è la RNA polimerasi. Forma legami fosfodiesterici in modo molto simile alle DNA pol, per questo non vediamo approfonditamente la cosa. Per polimerizzare non ha bisogno di un primer ma di sequenze specifiche, formando legami a idrogeno in cui può intervenire anche il metile con interazioni idrofobiche ( per questo si ha U al posto di T), che caratterizzano il PROMOTORE. Non è in grado di riconoscere lei stessa le sequenze, ha bisogno di FATTORI DI TRASCRIZIONE L’RNA si deve polimerizzare su uno stampo di DNA. C’è dunque bisogno che si apra la doppia elica per formare una forca di trascrizione. Vengono portati nel sito dei ribonucleotidi per l’assemblaggio. All’interno del sistema si forma un sistema ibrido DNA-RNA che si deve staccare in modo che il DNA torni a formare il doppio filamento. È dunque un sistema transitorio che si romperà formando la molecola singola di RNA. L’RNA svolge ruoli molto importanti in vari compartimenti della cellula e permette anche che più molecole dello stesso RNA vengano trascritte contemporaneamente. Si agganciano dunque più RNA polimerasi per trascrivere lo stesso filamento. La RNA polimerasi è meno accurata della DNA polimerasi e può inserire un errore ogni 1000 nucleotidi. Dato che l’RNA è una molecola di transizione, una molecola molto instabile che si degrada con facilità, anche se una molecola ha un errore verranno prodotte al massimo alcune proteine scorrette che la cellula andrà a eliminare. Se invece il danno avviene nel DNA questo si conserva e viene riprodotto, per questo deve essere più fedele. La trascrizione copia solo alcune porzioni del genoma e produce molte copie contemporaneamente, la maggior parte di questo. prodotto non codifica per delle proteine. Quando si attiva un promotore sono prodotte molte copie di questo locus. MECCANISMO L’RNA è polimerizzato da 5’ a 3’. Anche in questo caso avviene lo stesso tipo di reazione della polimerizzazione dell’RNA, grazie a ioni positivi nel sito catalitico per poter muovere le cariche e fare l’attacco. STRUTTURA RNA Le molecole di RNA sono a filamento singolo e possono assumere varie strutture, ben distinguibili da quelle del DNA. Come il DNA dunque può formare una sorta di doppia elica, con un buco al centro. Gli appaiamenti tra le basi avvengono similmente, ma al posto della T si trova una U. Il solco maggiore dell’RNA è più grande perchè è un importante punto di interazione. Spesso acquisisce strutture a forcina, la struttura ad appaiamento della forcina è a doppia elica nella parte iniziale, nella parte finale le basi non si appaiano ma possono formare delle interazioni non classiche. PROCARIOTI STRUTTURA RNA POLIMERASI È composta da 5 subunità: 2 subunità alfa 1 subunità ß e 1 subunità ß’ che formano una sorta di chela all’interno del quale c’è lo ione magnesio per permettere la polimerizzazione 1 subunità omega che non si sa bene che faccia. INIZIO L’RNA polimerasi deve essere indirizzata nel punto di inizio, regione +1 dell’esone, della trascrizione, la precisione dell’attacco viene data dalle regioni che si trovano a monte. Ci sono infatti sequenze specifiche nel DNA a monte che indirizzano l’arrivo della RNA polimerasi. Questa però essendo la stessa per tutti i geni non le permette di riconoscere le sequenze. Il riconoscimento del promotore è infatti dato da fattori di trascrizione. In particolare sigma70 è detto iniziatore. Deve esserci poi la capacità dell’RNA polimerasi di aprire una bolla, in modo che un filamento di DNA faccia da stampo e l’altro venga messo lontano in un canale della proteina per non essere copiato. L’RNA viene poi trascritto 5’-3’, per avere l’ossidrile libero. Per trascrivere il frammento al contrario basterà che un’altra RNA polimerasi si leghi lineamento complementare. Per convenzione il filamento superiore 5’-3’, da sinistra a destra, è quello che corrisponde all’RNA messaggero. Nel momento in cui si apre la bolla, l’RNA polimerasi leggerà il frammento inferiore. In questo modo si ottiene l’RNA corrispondente al frammento superiore. Ci sono due promotori per entrambi i filamenti, per entrambe le direzioni, dunque possono essere trascritti gli RNA in entrambe le direzioni, come avevamo accennato per ColE1. In base a dove si lega la polimerasi si formano due filamenti complementari. FORZA DI PROMOTORE => livello di espressione di un gene, numero di trascritti iniziati in un dato intervallo di tempo. Dipende da: affinità della RNA polimerasi per il promotore efficienza di isomerizzazione rapidità movimento su DNA della RNA polimerasi sequenza del promotore Il promotore forte dunque vuol dire che produce molte molecole nell’unità di tempo. SEQUENZE DI UN PROMOTORE Un promotore batterico ha delle sequenze comuni fra i diversi procarioti. Ha scoperto che ci sono delle sequenze a -10 e -35 in particolare, che sono parzialmente conservate e sono dette SEQUENZE CONSENSO. -10 => il primo nucleotide è al 100% T, all’80% nel secondo ci sta una A, poi capita a volte altra A, al 70% A o T, infine al 100% c’è A, poi o T o A di nuovo. Dunque sono molto importanti la prima T e la A, in quanto sono basi molto importanti per l’interazione con sigma70, quindi se ci sono mutazioni in queste sequenze si hanno molti problemi. Queste sono le due basi più importanti, le altre sembrano esserlo meno. -35 => gli ultimi due nucleotidi sono sempre T, il terzultimo quasi sempre G In molti geni si trova poi un elemento UP, che lega RNA polimerasi. INTERAZIONE CON SIGMA70 Sigma 70 è la proteina che permette di legarsi in modo da inserire nel sito catalitico alla posizione 1. Ha diversi domini, in particolare si legano: dominio 2 alla sequenza -10 dominio 4 alla sequenza -35 Le sequenze sono dunque così conservate per permettere questo appaiamento, si parla dunque di OLOENZIMA quando si associa alla RNApol. Dal punto di vista proteico sono alpha—eliche. Vanno a formare interazioni tra amminoacidi e donatori/accettori. Ha un particolare loop dell’elica. Riesce a entrare all’interno del solco maggiore, a non del minore. Questa è una classica struttura generale per fattori di trascrizione dei batteri. Per questo c’è conservazione dei diversi geni di escherichia coli. Il fattore sigma è il fattore di inizio che riconosce sequenze specifiche e permette all’oloenzima della RNA polimerasi di iniziare solo da sequenze specifiche, non rimane attaccato durante la trascrizione. Si deve poi togliere sigme70 togliendo “il freno a mano” per poi poter trascrivere fino alla terminazione. CICLO Bisogna che il complesso passi da chiuso ad aperto. Non è necessaria energia per questo cambiamento strutturale dell’enzima. Una volta entrato e legato sigma70, si ferisce la doppia elica per esporre il filamento stampo. Il melting tra le pozioni è molto piccolo, -11 +2. Vengono così aperti pochi nucleotidi. Serve un modo per tenerli aperti e trascrivere RNA, anche in questo caso entra in gioco sigma70, in particolare il suo domino 2. Nel momento in cui entra in una conformazione più termofavorevole e vengono aperti i legami a idrogeno, sigma70 provoca il ribaltamento delle basi. Alcune basi vengono così ribaltate e non possono più appaiarsi, permettendo così di tenere aperta la bolla di trascrizione. Una volta fatto questo il filamento che non deve essere trascritto viene inserito in un canale detto non template. Rimane invece disponibile sul sito catalitico il filamento da noi definito inferiore. RNA polimerasi non usa primer, Il primo nucleotide è spesso una A L’enzima forma interazioni specifiche con il primo e secondo nucleotide per permettere la polimerizzazione di nucleotidi successivi, l’interazioni avviene con sigma. Proprio grazie a queste interazioni può non avere un primer. L’isomerizzazione è facilitata dallo spostamento delle regioni di sigma che hanno delle cariche negative. È dunque sigma che regola l’attacco del primo nucleotide. MOVIMENTO RNA POLIMERASI È stato visto che ci sono spesso RNA abortivi, di una decina di nucleotidi, la regione della bolla deve tornare all’inizio e riprendere fino a che non riesce ad evadere. Ci sono tre ipotesi su come l’RNA si possa muovere nonostante sigma. Passaggio Transiente = fa diversi filamenti di DNA abortivo A bruco = cambia conformazione allungandosi permettendo lo spaio per i primi 10 nucleotidi Accartocciamento = genera minore interazione con sigma, la più accreditata sapendo che l’acido nucleico è flessibile, inizia a trascrivere, viene fatto un ripiegamento fino a quando l’RNA non riesce a sganciare sigma70. ALLUNGAMENTO Nucleotide dopo nucleotide inizia ad essere sintetizzato RNA. Vengono attaccati una decina di nucleotidi fino a quando l’RNA nascente coperto da sigma 70 riesce a infilarsi nel canale e spiazzare sigma70, così che la RNA polimerasi possa evadere. Si pensa dunque che sia l’RNA quando entra nel canale riesce ad abbassare l’interazione. Dunque è l’RNA nascente a spiazzare sigma70. In ogni momento solamente 8-9 nucleotidi della catena di RNA rimangono appaiati allo stampo perchè si stacca ed esce dal canale di uscita dell’RNA. Anche l’RNA polimerasi ha un po’ di attività di correzione: Editing pirofosforolitico = nel sito attivo il ribonucleotide scorretto viene rimosso tramite reincorporazione del pirofosfato Editing idrolitico = torna indietro e rimuove il ribonucleotide scorretto Non ha un sito apposito ma cerca di fare tutto lì, per questo non è molto efficiente. In caso di danno al DNA la RNA polimerasi si blocca e deve essere rimossa. Qui interviene TRCF (transcription-repair coupling factor) che ha attività ATPasica e spinge via la polimerasi dal sito di stallo. Questo è dunque un fattore che accoppia la trascrizione al danno del DNA, TERMINAZIONE La RNA polimerasi potrebbe rimanere legata a lungo, ma sarebbe dispendioso inutilmente. C’è un segnale di stop in modo che si generino molecole di RNA più o meno della dimensione del gene. Le sequenze di questi siti di terminazione hanno regioni complementari, che formano delle forcine. Queste vengono riconosciute da proteine. Ci sono il sistema: Terminatori intrinseci = la sequenza invertita che forma la forcina ha effetto sull’RNA che è a singolo filamento e questa struttura causa il dissolvimento del complesso di allungamento. Si forma una forcina con una serie di U che si legano con solo due legami a idrogeno. Questa viene legata da proteine specifiche come NusA. Si lega questa proteina che favorisce il distacco dell’RNA polimerasi. Rho dipendente = Rho è una proteina con 6 subunità che riconosce una sequenza detta rut, che viene legata dalla proteina con attività elicasica permettendo il distacco con utilizzo di ATP. RHO INDIPENDENTE RHO DIPENDENTE EUCARIOTI Ogni gene viene trascritto diverse volte in punti differenti da diverse molecole di RNA nello stesso istante. A differenza dei procarioti, traduzione e trascrizione avvengono in momenti differenti. RNA POLIMERASI È composta dalle 10 o più subunità. Si possono osservare una porzione conservata, e la forma a chela (proprio questa particolarmente conservata). La reazione di polimerizzazione avviene in modo identico tra procarioti ed eucarioti, ciò che varia sono i fattori della trascrizione. Il sito attivo è tra le subunità più grandi. Negli eucarioti esistono forme di RNA molto differenti, anche di tipi in più rispetto a procarioti. Questi sono di fatto trascritti da diversi RNA polimerasi. Negli eucarioti sono presenti tre diverse RNA polimerasi (I, Il e III) ciascuna delle quali svolge compiti specifici: la RNA polimerasi I trascrive i geni per la sintesi degli RNA ribosomiali; la RNA polimerasi II trascrive i geni per la sintesi degli mRNA; la RNA polimerasi III sintetizza i tRNA e altri piccoli RNA (miRNA) implicati in diversi processi, tra cui lo splicing. PROMOTORI Abbiamo visto che i procarioti per sistemare queste regioni genomiche di DNA a monte del sito di trascrizione per indirizzare la RNA polimerasi agisce il fattore sigma70, con i domini per legare alpha-eliche nelle regioni -10 e -35, questo costituisce un segnale per posizionarsi. Anche i promotori eucariotici hanno sequenze caratteristiche. Gli eucarioti non ne hanno solo uno, ma per iniziare la trascrizione la RNA polimerasi lega i FATTORI GENERALI DI TRASCRIZIONE, per legarsi al promotore. Inoltre necessiterà di una serie di fattori per modificare la cromatina e modificare e spostare i nucleosomi. TATA box a -25 —> non sempre è presente BRE = riconosce il fattore TFIIB a -32 DCE = downstream core element, dunque a valle DPE = downstream promoter element TATA BOX Si chiama in questo modo in quanto ricca di T e A. Si vanno ad osservare le sequenze consenso, ovvero analizzando vari promotori diversi i nucleotidi maggiormente conservati. Per la TataBox si osserva che l’83% ha T, 97% A, 93% T, 85%A , 63/37% A/T, 88% A. Non tutti i nucleotidi sono ingaggiati per formare nuovi legami con la proteina, sono alcuni sono coinvolti per il consenso. Gli idrogeni che sporgono dal solco minore e maggiore vanno a formare il legame con le proteine Le sequenze consenso legano i seguenti fattori di trascrizione: ETFIID è ASSEMBLAGGIO COMPLESSO Il primo evento che viene riconosciuto è quello di legame tra la TATA Binding Protein alla TATA box. In realtà la TBP non è sola, ma è un complesso di varie proteine che nel complesso si chiamano TFIID. È infatti composta da TAF, ovvero TBP-associated factors che legano lnr e DPE/DCE, e TPB. La TBP lega il DNA nel solco minore. Usa i foglietti beta per sistemarsi nel solco minore, per allargarlo, ha poi due loop proteici per piegare il DNA di 90°. Questa sequenza essendo ricca di appaiamenti T e A permette il ripiegamento della molecole, essendo più flessibile e con meno legami. Se si ponesse nel solco maggiore non potrebbe piegarsi. TFIID lega l’elemento BRE che si trova a monte, si lega a sinistra e si allunga a destra, andando a prendere le due parti che si sono ripiegate. Potrebbe muoversi in posizione opposta ma vorrebbe dire che si lega a un promotore sul filamento opposto. Successivamente sono reclutati TFIIA e TFIIB, una volta che arriva questa richiama TFIIF , che fa si che si ripieghi dalla parte giusta, e fa da ponte di riconoscimento di altri fattori di trascrizione. TFIIB è una proteina che interagisce con TBP e si dispone in modo asimmetrico per favorire unidirezionalità nella trascrizione, da sinistra a destra usando il filamento inferiore come stampo. Questi elementi promotoriali indicano in che direzione deve avvenire la trascrizione. La porzione allungata di TFIIB si deve legare a TBP per poter reclutare la DNA polimerasi e indicarle la direzione da seguire per trascrivere. Il legame della TFIIF con la polimerasi stabilizza il complesso TFIIB-TBP-DNA ed e’ necessario per reclutare TFIIE che recluta la TFIIH che ha ben 10 subunita’ – la subunita’ con attivita’ ATP-asica media il melting del DNA, che scatta l’ inizio della trascrizione. Dopo l’arrivo di queste si può parlare di complesso di pre-inizio. A questo punto deve avvenire l’apertura del DNA per utilizzare uno dei due filamenti come stampo. ISOMERIZAZIONE A COMPLESSO APERTO C’è bisogno di ATP e viene tutto mediato da TFIIH. Anche questa non è una singola proteina ma è composta da diverse subunità. In particolare: XPD, XPB = sono elicasi che rompono legami a idrogeno per formare la bolla, è ATP dipendente -> ATPasi CDK7, MAT1 = sono kinasi per il carbonio terminale della RNA polimerasi. Queste subunità di TFIIH sono anche coinvolte nella riparazione dei mismatch. TFIIB si inserisce nel solco della RNA polimerasi II per poter stabilizzare il complesso aperto e tenerlo tale. (Come abbiamo visto). Solo pochi nucleotidi entrano in contatto per permettere l’apertura della bolla. C’è un numero limitato di legami a idrogeno fra la proteina e il solco minore: la maggior parte della specificita’ e’ data da due copie di catene laterali di fenilalanina che si intercalano fra le basi di entrambe le estremita’ della sequenza TATA e che imponogono un forte ripiegamento del DNA. Il filamento che non viene replicato viene poi mandato in un canale specifico. COMPLESSO MEDIATORE Gli attivatori aiutano il reclutamento della polimerasi al promotore e ne stabilizzano il legame. L’interazione spesso avviene con il complesso mediatore. Il mediatore è associato alla subunità maggiore della polimerasi attraverso una superficie di legame, e presenta altre superfici per l’interazione con gli attivatori legati al DNA, come TFIIH. È infatti composto da numerosissime subunità. Diversi attivatori interagiscono con diverse subunità del mediatore. FATTORI DI ALLUNGAMENTO Per l’evasione dal promotore, dunque la PolII si deve liberare della maggior parte dei fattori di inizio, devono essere reclutati altri fattori che favoriscano l’allungamento. Gli enzimi sono reclutati dalla coda carbossiterminale. C’è fosforilazione in posizione 5 da parte della CDK, reclutata da TFIIH, andando a fosforilare per prima la serina. In questo modo cambia la conformazione e avviene il distacco dai fattori di inizio. Subito dopo l’inizio della trascrizione la RNA polimerasi va frequentemente in stallo, devono intervenire altri fattori di allungamento per eliminare molecole differenti. Ci sono molte CDK per permettere di continuare a trascrivere. C’è dunque una sequenzialità di fosforilazioni, prima per staccarla, poi per mantenerla. FACT Altro aspetto caratteristico della trascrizione negli eucarioti è che il DNA è organizzato in cromatina con nucleosomi. Man mano che RNA polimerasi HZBHZA trascrive, bisogna che venga eliminato il nucleosoma e poi che venga ricostruito. Ci sono particolari chaperon che smontano i nucleosomi nella regione che deve essere trascritta e riformarli nella regione in cui sono già stati trascritti. Sono detti FACT, ovvero facilitates chromatin testoni transcription. In particolare sono stati trovati degli eterodimeri composti da Spt16 e SSRP1. DNA DURANTE LA TRASCRIZIONE Quando si comincia a svolgere un po’, si espongono subito H2A e H2B come dimeri. È facile vedere come si staccano. Non c’è più il DNA avvolto e dunque o interviene Chaperon, o dato che il DNA è flessibile, la parte già trascritta si avvicina e si aggancia immediatamente ricostituendo subito il nucleosoma senza aver bisogno della mediazione di Chaperon. La RNA polimerasi II polimerizza circa 40nt al secondo. POLIMERASI I e III La transcizione iniziata da PolI e PolIII è analoga a PolII ma inizia da promotori distinti. In comune utilizzano la TBP per trascrivere dei geni per l’RNA. Polimerasi I = va a trascrivere un unico gene percursore dell’RNA ribosiomale, che è espresso a livello più alto di qualunque altro gene. Trascrive 13000 nucleotidi che verrà tagliato in RNA 18S (subunità minore), 5,8S e 28S per la subunità maggiore. Nel nucleofilo poi subisce delle modificazioni. Polimerasi III = sintetizza tRNA, snRNA, 5S rRNA, SINE, etc. La maggioranza dei promotori della Pol III si trova a valle del sito d' inizio (che e' insolito). Il promotore per il gene codificante il tRNA e' ad esempio composto da due regioni: Box A e Box B. Maturazione RNA Le sequenze promotoriali che abbiamo visto sono consensi, possono essere diverse e meglio favorire i legami della trascrizione. Quindi possono esserci promotori più forti o più deboli in base a quanti RNA producono in quantità di tempo. Come distinguere RNA messaggero in eucarioti e procarioti? Nei procarioti spesso ci sono RNA policistronici, ovvero da un unico filamento vengono prodotte più proteine. La regolazione di una proteina vedrà vista meglio quando parleremo dell’ operone lattosio Negli eucarioti l’RNA viene modificato. Sono RNA monocistronici. Ci sono dei geni che non devono essere tradotti, ovvero gli introni. L' mRNA eucariotico, prima di essere trasportato fuori dal nucleo per essere tradotto, passa attraverso una serie di modificazioni che lo trasformano nella sua forma matura. L' mRNA eucariotico e' subordinato essenzialmente a tre tipi di modificazioni coinvolti nella maturazione dell' mRNA: capping, splicing e poliadenilazione. Il processo del capping al 5' avviene durante la fase di allungamento descritta nel capitolo precedente. Dopo la trascrizione ,invece, avviene il processo di splicing. L' mRNA che e' passato attraverso il processo di capping ma non e' stato ancora soggetto allo splicing viene detto pre- mRNA (o mRNA precursore). La poliadenilazione al 3' e' invece conessa strettamente con la terminazione della trascrizione. Dopo queste modificazioni l' mRNA maturo e' pronto per essere tradotto. CAPPING Negli eucarioti all’estremità 5’ deve essere aggiunta una coda di poliadeninguanina, guanine metilate. L’enzima RNA trifosfatasi elimina il primo fosfato in 5’. Viene portato un nucleotide Guanina, GTP, grazie alla Guanil transferasi. Si forma un legame tra due gruppi fosfati, dunque un legame fosfoanidridico. Non può essere degradato da un normale enzima RNAasi, ed è poco riconoscibile. Inoltre la guanina attaccata viene modificata dalla metil transferasi con aggiunta di un metile. Questa modificazione è molto importante per la traslazione più che per la stabilità. Avviene spesso anche una seconda metilazione del primo nucleotide trascritto, ovvero A, con metilazione in 6. POLIADENILAZIONE Nel genoma non si osserva questa coda di poli-A in 3’. È una cosa che si trova solo nell’RNA perchè modificazione post-trascrizionale, è una cosa in più. CTD della polII è coinvolto nel reclutamento degli enzimi necessari. Viene riconosciuta una sequenza di poliadenilazione che recluta degli enzimi: - RNAasi che taglia l’RNA nascente dalla polimerasi detta CSTF cleavage stimulation factor - CPSF cleavage and polyadenylation specificity factor aggiunge le A Queste due riconoscono una sequenza specifica = AAUAAA (ricordatela) Questa sequenza è presente nel genoma, ed è detta poli A signal. C’è poi dopo 10-30 nucleotidi, una sequenza CA. A valle si trova poi una regione ricca di U o GU. I due fattori riconoscono la sequenza per il taglio. Viene reclutata PAP, ovvero polyA polymerase, un enzima in grado di polimerizzare in assenza di stampo. Queste A sono poi protette da una proteina poly-A- binding-protein, proteggendo così tutta la coda 3’ del messaggero. Di fatto, l'enzima non si ferma immediatamente dopo che l’RNA è stato tagliato e poliadenilato. Continua a scorrere lungo il DNA, generando una seconda molecola di RNA che può essere lunga anche diverse centinaia di nucleotidi. Solo allora, la polimerasi si stacca dallo stampo, rilasciando il nuovo RNA che viene degradato senza che lasci mai il nucleo. MODELLI DI TERMINAZIONE DELLA TRASCRIZIONE Modello a siluro => quando si forma un’estremità senza CAP, l’RNAasi non può degradarlo, perchè è stato subito modificato, a questo punto il complesso si stacca. Non procede la trascrizione. La proteina CPSF infatti non lega da subito AAUAA, ma e' associata al corpo della RNA Poli. Quando si sposta dalla PolIII alla sequenza, causa lo stallo della RNA Poli ed il suo distacco. Modello allosterico => prevede un cambiamento conformazionale della polimerasi che ne diminuirebbe di molto la processivita’ e che indurrebbe conseguentemente la terminazione. Questo cambiamento potrebbe essere conseguenza del rilascio di proteine che prima c’erano sulla CTD o dall’ interazione della CTD con delle proteine. Può avvenire se non è priva di CAP. SPLICING Consiste nella rimozione degli introni dal pre-mRNA per formare il messaggero. Il pre-RNA ha sempre Regione codificante la proteina UTR in 5’ UTR in 3’ untraslated region Il codone di stop è sempre nell’ultimo esone. ATG non è sempre nel primo esone invece. I Primi esoni producono regioni non traslate. Hanno scoperto l’esistenza degli introni utilizzando la microscopia elettronica facendo appaiare DNA e RNA. Si osserva che in alcune zone si ha un buon appaiamento, ma che in generale si formano numerose anse in cui non si può appaiare ( oltre al non appaiamento della coda di poli-A). Gli esoni sono generalmente lunghi un 100aio di paia di basi. Si possono trovare in numero diverso nei geni. Gli introni possono avere dimensioni molto differenti. I più frequenti nell’uomo hanno 100-2000 paia di basi. Sono dunque generalmente più grandi degli esoni e di dimensione molto varia. Si trovano spesso al loro interno delle regioni regolatorie. Gli introni sono caratterizzate da alcune sequenze specifiche che permettono lo splicing. C’è una sequenza di 11 pirimidine che termina con AG nel sito di splicing 3’. È detto sito accettore. C’è poi una A, detta punto di ramificazione. Il sito di splicing 5’ è caratterizzato da GU ed è detto sito donatore. Avvengono due reazioni di transesterificazione che vanno favorite. Il 5’ di A del punto di ramificazione è impegnato nel legame fosfodiesterico così come 3’. 2’OH è invece disponibile per andare ad attaccare il fosfato tra le 2 G nell’estremità 5’ dell’introne portando alla formazione del cappio. I due esoni si legano con legame fosfodiesterico , grazie a OH-3’ che si è liberato, attaccando il fosfato del sito di splicing 3’, il cappio viene eliminato e l’intero e è lasciato uscire come gruppo uscente. Il tutto è regolato dallo SPLICEOSOMA, costituito da 150 proteine e 5RNA non codificanti. Idrolizza ATP. Si chiamano snRNPs = small ribonuclease proteins Le proteine prendono il nome dai vari RNA nucleari che andranno da fare ufficialmente da catalizzatori. Gli RNA sono = U1, U2, U4, U5, U6 Le snRNPs riconoscono il sito di splicing e il punto di ramificazione, portano i siti vicini, catalizzano il taglio e la giunzione. L’RNA forma dei loop con regioni di complementarietà. La sequenza U1 si aggancia perfettamente al sito di splicing 5’, sono sequenze conservate in tutte le regioni esoni-introni, e lo scherma. La proteina U2AF ha due subunita’, una legata al segmento polipirimidinico e l’altra al sito di splicing 3’. La prima aiuta la proteina BBP a legarsi al punto di ramificazione. Questo complesso e’ chiamato complesso precoce E. U2AF aiuta a reclutare e formare il legame di snRNP U2 al punto di ramificazione ( A si appaia con U del messaggero, dopo c’è lo stretching delle pirimidina)e la rimozione di BBP. Quest' interazione con U2 spinge fuori il residuo A, che è l’unico a non appaiarsi, e crea una protuberanza: in questo modo, A diventa non accopiata, esposta e disponibile per la reazione con il sito di splicing 5' (prima transesterificazione). Questo si chiama complesso A. Ora bisogna riarrangiare il complesso A: le snRNPs U4 e U6, insieme alla snRNP U5, formano la particella a tre snRNP, dove U5 e' legata alle altre due mediante interazione proteina proteina. La particella si unisce al complesso A che diventa ora complesso B. A questo punto U1 e' rimpiazzato da U6 al sito di splicing 5': questo implica la rottura del legame RNA-RNA fra il pre-mRNA e U1, in quanto non si appaia perfettamente e si forma una regione non schermata e protetta da RNA e proteina. Questo sito viene occupato poi da U6. Ora che l' assemblaggio e' completato, inizia la catalisi che avviene nel modo seguente: U4 viene eliminato dal complesso grazie a U5, fatto che permette l'interazione fra U6 e U2. Quest' interazione forma il sito attivo della catalisi, ma assicura anche che il substrato (pre-mRNA) venga posizionato correttamente. La formazione del sito attivo avvicina il sito di splicing 5' e il punto di ramificazione favorendo la transesterificazione tra A e G ottenendo il complesso C. La seconda reazione e' aiutata invece dall' snRNP U5 che fa avvenire una transesterificazione tra 5’ e 3’, avvicina i due esoni ed elimina gli introni. Alla fine, il complesso viene rilasciato. Tutto ciò avviene durante la trascrizione, questo rende il processo estremamente preciso ed efficiente. Trascrizione e splicing sono correlati e ciò è stato dimostrato andando a vedere il DNA poly-A e i fattori di splicing e si trovano nelle stesse zone. Il posizionamento di U2AF e U1 viene favorito da particolari proteine SR, ricche di Ser e Arg, che legano ESE, ovvero exonic splicing enancher. Queste sono riconosciute da sequenze specifiche che si trovano sugli esoni, cross exon ricognition complex. Le proteine SR hanno dei foglietti beta che possono interagire con l’mRNA. Ci sono dunque piccole sequenze per i fattori che facilitano lo splicing, è garantita in questo modo la precisione. SPLICEOSOMA ALTERNATIVO Non sempre sono quelle di prima le sequenze riconosciute. Ci sono geni che usano un apparato minore, meno utilizzato. Ci sono U11 e U12 che svolgono le medesime funzioni di U1 e U2 ma riconoscono sequenze diverse, ovvero AU e AC relativamente. U4 e U6, anche se hanno lo stesso nome come nel modello canonico, sono in realta’ snRNPs diverse da quelle originali. U5 e’ invece uguale in entrambe le varianti. Questo spliceosoma riconosce introni rari con sequenze consenso diverse (sono pero’ contenuti in cca. 800 geni umani). Anche se le sequenze sono diverse, il meccanismo chimico è esattamente uguale a quello descritto per la variante standard. Si e’ anche scoperto che mutazioni su snRNA minori siano associate a patologie genetiche rare nell’ uomo. MUTAZIONI Mutazioni in componenti dello splicing dello spliceosoma AT-AC causano nanismo con microcefalia e osteodisplasia Mutazioni in eterozigosi in proteine del complesso U4-U5-U6 causano Retinite Pigmentosa Mutazioni al gene SMN1 (survival motor neuron) che codifica un componente ubiquitario per lo splicing causano Atrofia Muscolare Spinale (SMA) 15% delle mutazioni puntiformi patologiche modificano sequenze di splicing Mutazioni che attivano un sito criptico di splicing possono inattivare il gene Lo Splicing dell’mRNA 2.0 Se si parla di due esoni si ha un sito di splicing al 5’ e un sito di splicing al 3’, tra questi si trova un branch site caratterizzato dalla presenza di una “A” e preceduto da uno stretch di pirimidine. L’apparato maggiore di splicing utilizza come etichetta una sequenza GU al sito donatore di splicing 5’ e uno di AG al sito accettore 3’. Avviene quindi l’ingaggio delle particelle di splicing U1 e U2, C’è anche un apparato minore che ha come etichette AU al donatore e AC all’accettore. Sono coinvolte in questo caso U11 e U12. All’esponente 4 non c’è la coda poliA, ma il sito di riconoscimento di poliadenilazione. Ci sono diversi siti di inizio trascrizione, per cui possono essere trascritti tutti gli esoni, oppure il trascritto può essere più breve a causa della presenza di diversi promotori. Storicamente i ricercatori avevano caratterizzato moltissime proteine nelle cellule eucariotiche, ad esempio nelle elude umane si sapeva che i promotori fossero regolati in modo differente. In diverse cellule (insulina cellule beta isola largheras e glucagone nel latte) esistono fattori di trascrizione specifici. Una volta fatto il sequenziamento del genoma umano (2001), hanno osservato la presenza di pochi geni, poco più di 20000. La grande variabilità di proteine del genoma deriva da altri meccanismi, tra cui proprio lo splicing alternativo. Il preRNA è uguale al DNA stampo, contiene anche gli introni. mRNA maturo può avere inclusi tutti gli esoni, e questo porterebbe a una proteina specifica con tutti i domini proteici codificati: i domini caratterizzano le diverse funzioni della proteina (diverse subunità che costituiscono varie unità che si legano). Se avviene lo splicing alternativo l’esone 4 potrebbe essere perso e quindi la proteina prodotta perde il dominio corrispondente. Se viene perso l’esone 4 si ha un terzo tipo di proteina diversa ancora. Da un solo gene si possono avere ad esempio 3 proteine diverse, e proprio da questo deriva la grande variabilità delle proteine nonostante il numero limitato di geni. GENE TROPONINA = La troponina è una proteina presente nelle cellule muscolari, in particolare è legata al citoscheletro. Presenta due isomerie: Alpha = incluso esone 3 e non 4 Beta = incluso esone 4 e non 3 1. INGOMBRO STERICO DELLE PARTICELLE DI SPLICING All’inizio degli introni ci sono etichette per legare i fattori o le particelle di splicing, dunque può avvenire lo splicing tra tutti. Se un introne è troppo piccolo non ha lo spazio sufficiente per ospitare sia U1 che U2. se al sito 5’ si è legato U1 può fare lo splicing solo con l’introne successivo, viene così eliminato l’esone 3 —> troponina alpha se al sito 5’ è legato invece U2, non c’è spazio per U1, lo splicing avviene con l’intero e precedente, eliminando l’esone 4. —> troponina beta 2. COMBINAZIONE DI SITI DI TAGLIO PRIMARI E SECONDARI Se negli introni si alterano etichette appartenenti all’apparato maggiore e quello minore si ha uno splicing alternativo, perchè le due particelle non possono collaborare insieme in quanto appartengono a due apparati di splicing diversi. L’intero e intermedio inizia con il maggiore e termina con il minore, lo splicing tra i due non riuscita ad avvenire. Ogni apparato di splicing lavora bene solo con il proprio fattore corrispondente: U1 con U2 e U11 con U12. Dunque lo splicing tra esone 2 e 3 non potrebbe avvenire. Si possono ottenere due isoforme: U1 si lega al sito donatore, si usa l’etichetta GU dell’intero e centrale e AG del successivo, si usa l’apparato maggiore e si elimina l’esone seguente. Si utilizza l’etichetta AC nel sito accettore e AU del precedente, si usa l’appparato minore e si elimina l’esone precedente. 3. DECADIMENTO MEDIATO DA UN CODONE NON SENSO Questo meccanismo fa si’ che siano stabili solo gli mRNA con uno dei due esoni (mai con nessuno o con entrambi). Questo meccanismo si verifica quando l’ unione di entrambi gli esoni porta a un mRNA con un codone di terminazione prematuro (questi messaggeri vengono dunque distrutti). REGOLAZIONE Lo splicing alternativo è reglato dalla presenza di sequenze negli esoni e negli introni che legano proteine che facilitano lo splicing detti ENANCHER ESE (Exonic Splicing Enhancer) o proteine che sfavoriscono lo splicing detti SILENCER ESS (Exonic Splicing Silencer). Il fatto di poter far legare in modo piuttosto preciso i fattori come U2 (U2AF) è legato proprio a delle proteine che interagsicono con l’apparato si splicing, andando a posizionarlo in modo preciso oppure andando a interferire con esso. Le proteine SR legano le enancher, hanno un dominio ricco di arginina e serina che interagisce con l’apparato di splicing per posizionarlo in modo preciso. Quelle che mancano di questo dominio sono i silencer e intereriscono con l’apparato. Le proteine hnRNP invece legano i silencer. Ci può essere un trascritto primario dove viene legato il primo introne su sito di splicing. Se in altre cellule viene espresso il repressore esso interferisce con lo splicing e non avviene. L’espressione o meno dei fattori che interagscono portano al differenziamento cellualre. Se invece sono espressi gli enancher viene favorito l’apparato di splicing tra eosne 1 ed esone 2. Se non è epsresso lo splicing avviene ma più raramente. Un attivatore molto comune è SC35 che è una piccola proteina. Queste esono modificazioni post trascrizionali che partono dal pre-mRNA. EDITING RNA Altro meccanismo di reolazione che permette di regolare in modo fine e di esprimere anche isoforme diverse è l’editing dell’RNA. Sono modificazioni che RNA subisce. Gli mRNA sono altamente modifcati all’interno del nucleo, non è una molecola stabile. Esistono diversi enzimi tra cui: cidine deamminasi che agiscono sul mRNA, questo può portare ad una lettura del codice genetico diversa. Gene: apolipoproteina-B Esiste un pre-mRAN che ha al centro nell’esone una sequenza CAA, se la C viene deamminata diventa un UAA che è un codone non senso o codone di STOP. Il pre-mRNA subisce lo splicing, la modificazione avviene sull’mRNA maturo. Se l’enzima non agisce mRNA porta una proteina nel fegato di 4563 aa che è molto lunga, dove CAA codifica per la glutammina. Nell’intestino invece la proteina che si forma è la meta, è lunga 2153 aa perché nell’intestino è attivata la citidina deamminasi che deammina la C di CAA e si ottiene così una proteina piccola. Perché non viene degradato il messaggero data la prsenza del codone di stop prematuro? Perché la modificazione avviene dopo lo splicing, se fosse avvenuta priam allora sarebbe stato degradato, NMD. L’altra base che può essere deamminata è l’adenina. Perendo il gruppo amminico della adenina porta aauna base detta inosina, I. Mentre A si appaia solo con la U, la inosina è molto più promiscua, riesce ad appaiarsi con tutte le altre basi azotate a parte la G. Quando nel RNA messaggero isintroduce una I, il codone con la I può essere letto da tanti anticodoni diversi durante la traduzione. Queste diverse combinazioni permettono la produzione di faramci diversi in particolari neurotrasmettitori—> recettore del glutammato. Se avviene l’editing sulla A si ottiene una I che porta all’appaiamento con transfer che portano l’arginina e non la glutammina. Nella cellula in cui non c’è stato editing i recettori per il glutammato lo legano e fanno passare ioni calcio modificando il potenziale della cellula. Nel caso in cui invece è avvenuto editing si trova un’arginina che porta una craica positiva e abbassa la fuzionalità del canale per gli ioni calcio. Analogamente il recettore della serotonina se viene variato in tutti e tre i suoi aminoacidi allora il recettore perde tutta la funzioanlità. Variandolo solamente alcune basi si modula la funzionalità del recettore. Con uno stesso gene si possono includere o non includere domini proteici andando a variare un aa rispetto ad un altro per variare la funzionalità nelle cellule. TRASPORTO mRNA NEL CITOPLASMA L’mRNA per uscire dal nucleo deve passare attraverso il poro nucleare. Le sequenze degli mRNA sono tra le più varie, dopo aggiunta della poliA si legano le PoliA bounding porteine. Alcuni fattori di splicing rimangono ancora legati alla giunzione deglie esoni —> sono questi a facilitare il trasporto dal nucleo al citoplasma, quando esce si dissociano e poi sono degradati. La cellula riesce a trasportare facilmente il RNA nel citoplasma quando a questo sono legate delle proteine: PolA bounding protein; Particelle di splicing; Questa scoperta che l’RNA messaggero rimane legato alle proteine dello splicing può sembrare una curiosità ma invece per le biotecnologie è molto importante per la produzoine di proteine in cellule eucariotiche. Prima: clonare con ezimi di restrizione e poi si utilizza un promotore eucariorico, poi ATG e poi la sequenza TAA e infine il segnale di poliA. Adesso: promotore del primo esone, piccolo introne e poi il cDNA clonato—> molto più efficiente e più produzione di proteine in cellule eucariotiche. ATG può essere anche nel primo esone, si possono mettere anche esoni non codificanti non importa. Analisi dell’mRNA Le tecniche che andremo ad analizzare sono: Northern Blotting RT-PCR Whole-Mount ISH Section ISH Microarrays In silicio PURIFICAZIONE RNA L’enzima RNAasi che degrada RNA è presente dappertutto ed è molto stabile (mettendolo a 120° in autoclave per esempio, rimane ancora attivo, mentre la DNAasi si denatura), e non richiede cofattore per essere attiva pertanto bisogna lavorare in condizioni altamente controllate per evitare comunque di degradare RNA. RNA infatti essendo a singolo filamento è molto delicato. Si limano i tessuti o cellule in una soluzione che denatura le ribonucleasi senza danneggiare l’acido nucleico. Si usa un denaturante delle proteine come il guanidinio tiocianato. Ci si ritrova dunque ad avere l’RNA totale che contiene: tRNA, rRNA, mRNA, ecc. Si osservano nella tabella le percentuali dei tipi di RNA che si ottengono e da quali polimerasi sono prodotti. Gli rRNA sono spesso trascritti in tutte le cellule in modo simile, in quanto senza ribosomi la cellula non sopravvive, l’RNAm è quello che varia in una cellula in base alle caratteristiche. Inoltre in basi agli stimoli diversi che può ricevere una cellula, questa comincia a esprimere in modo diverso alcuni geni, e questa è una delle analisi che più si fanno in laboratorio, ovvero quali differenze ci sono nelle regolazioni geniche in risposta a stimoli. Come si studiano? Bisogna separare il 5% di mRNA dal resto 95% di tRNA e rRNAs. Si può usare un oligonucleotide di poli-T legato a una particolare sferina. È possibile usare delle colonne supporto per separare le molecole, ad esempio come la cromatografia su strato sottile. Molecole come agarosio possono essere molecole con una carica positiva (o negativa) che possono così interagire con DNA mentre altre componenti della cellula se ne vanno, si usa poi una concentrazione salina per spezzare questo legame che si è venuto a formare. Nel nostro caso si fa una cosa simile detta CROMATOGRAFIA DI AFFINITÀ. Si hanno delle sferuline in ferro in una colonna, legate a un oligonucleotide formato da sequenze di molte T e le si mettono nella soluzione di RNA totale. L’RNA che termina con una coda di poli- A può così legarsi. Effettuo ora un lavaggio. Per separare queste sferine poi, nel caso in cui queste siano per l’appunto in ferro, possono trattenerle grazie a un magnete, e in questo modo posso poi rimuovere tutto il resto. Dunque la purificazione dell’RNA avviene per affinità con un oligonucleotide legato a sferetta in ferro. IBRIDAZIONE - NORTHERN BLOTTING Gli acidi nucleici hanno la possibilità grazie alla complementarietà delle basi di formare dei duplex. Questo rende molto semplice la loro analisi, poichè basta usare una sequenza specifica per un determinato aminoacido, che non è presente in nessun altro, chiaramente non si può usare la coda di poli-A che è presente in tutti gli RNA. Si utilizza così una sonda, che va marcata, in modo da usare metodologie simili al Southern Blotting. Si può infatti usare: radioattività, sistema enzimatico o fluorescenza per renderle facilmente rilevabili. Si generano dunque piccole molecole rilevabili e visibili in un qualche modo. Il tutto deve essere fisato. La sonda viene fatta col DNA proprio per renderla semplice da maneggiare Si genera del DNA complementare all’RNA messaggero e in questo modo si permette l’ibridazione. La marcatura per radioattività si effettua marcando il fosforo in alpha con fosforo radioattivo isotopo 32. Questo viene usato per replicare il DNA utilizzando specifici primer generando molecole che ogni tanto presenteranno un nucleotide radioattivo. Viene marcato il fosforo in alpha poichè giustamente sarà l’unico che rimarrà attaccato nel DNA nascente. Si ottengono dunque dei labled probe (sonda marcata). L’appaiamento si basa sulla TEMPERATURA. La temperatura di melting, definita già per i primer, è la temperatura a cui la sonda e il suo bersaglio sono dissociati o associati al 50%. La regola di Wallance quando le sequenza sono >40 bp, non si può utilizzare. La temperatura viene calcolata in questo modo, che vale anche per sequenza più corte. Tm = 81.5°C + 16.6logM + 0.41(%G+C) M = la forza ionica del tampone utilizzato espressa in moli/litro, dunque la molarità del tampone su cui si fa la reazione, meno è salino più il probe tende a distaccarsi. Per sonde lunghe di solito si usa una temperatura di ibridazione pari a Tm - 25°C. Esempio Tampone 500mM e G+C 50%: Tm= 81.5+16.6(-0,3)+0.41(50%)-25= 72°C Se è più ricco di G e C chiaramente si hanno molti legami a idrogeno e vanno compensati. Considerando sequenze lunghe potrebbero esserci regioni simili in regioni differenti, dunque bisogna fare in modo che la sonda si appai in modo specifico e non aspeifico. Viene stabilita la temperatura più alta che si possa usare, poi si lavora sulla salinità, in quanto più bassa è la concentrazione salina, più specifico è l’appaiamento e si evita maggiormente appaiamento aspecifico. STRINGENZA = Specificità con cui una sonda si lega (si ibrida) ad una determinata sequenza bersaglio complementare. Ad alta stringenza la sonda si potrà ibridare soltanto ad una sequenza ESATTAMENTE COMPLEMENTARE. Si aumenta la stringenza aumentando la temperatura e riducendo la salinità. A bassa stringenza l’ibridazione potrà avvenire anche con sequenze parzialmente complementari. Dipende dalle condizioni: temperatura e salinità delle soluzioni di ibridazione e lavaggio Il NOTHERN BLOTTING, definito tale in seguito alla scoperta del Southern, ci permette di definire la grandezza del trascritto evidenziando splicing alternativi. Permette di definire la grandezza del trascritto evidenziando differenze nei siti di inizio trascrizione o di poliadenilazione Analisi del gene di interesse e paragone di espressione in diversi tessuti o diverse linee cellulari. È un metodo quantitativo. Se bisogna fare l’ibridazione e si ha l’RNA messo sul gel di agarosio, dunque separati in base alla grandezza, bisogna immobilizzare l’RNA dopo la migrazione esattamente come per il southern blotting, la soluzione è un po’ diversa ma il concetto è lo stesso. Per capillarità è così posta una soluzione in basso, una spugna, il gel sopra la membrana e delle carte da filtro asciutte che richiamano verso l’alto la soluzione per capillarità, così l’RNA è richiamato e viene bloccato. Posso così fare l’ibridazione in presenza di sonda radioattiva, si lava per togliere l’eccesso e si va ad osservare. L’osservazione può essere fatta con autoradiografia che riconosce la radioattività del fosforo. In basso si vede come si presenta facendo migrare in presenza di gel di agarosio il bromuro di etidio, con colorazione rosa. Si osserva che si possono distinguere gli RNA ribosomiali e l’RNA messaggero migrato per un gene specifico. Si osserva una banda radioattiva in cui è avvenuta ibridazione. In alcune regioni di certi tessuti dunque posso osservare che si trova in quantità differenti e questo ci permette di quantizzarlo. In questo caso si osservano vari siti di poliadenilazione. Vengono disegnate diverse sonde per i diversi siti per poter osservare i diversi splicing alternativi. Nel Nothern Blotting nella seconda sonda specifica per tutte, si osservano 3 siti. Se si usa quella specifica per la molecola più lunga si osserverà solo una banda. In base a dove si è pianificata la sonda, ci permette di osservare vari tipi di RNA oppure uno solo. PCR Richiede due primer che possano appaiarsi o al filamento superiore o al filamento inferiore. L’RNA messaggero ha un unico filamento dunque non si può fare la PCR; è però molto comodo analizzarlo con questa tecnica, in quanto per il Northern impiega qualche giorno e si utilizzano molecole radioattive, mentre con PCR ci mette solo mezza giornata. Si deve utilizzare un cDNA, ovvero DNA complementare che deriva da RNA retrotrascritti. La retrotrascrizione si basa sulle proprietà delle DNA polimerasi RNA dipendenti ricavate da retrovirus come l’AMV, virus della mieloblastosi aviaria o il MuLV, virus della leucemia murina di Moloney. Si può pensare di utilizzare un primer con retrotrascrittasi che lo copia. Si deve poi usare una RNAasi per degradare RNA (una molto usata è RNAasiH). La retrotrascrittasi continua a lavorare bene da sola, dunque non c’è bisogno di un ulteriore primer in 5’. Si forma una forcina e la polimerasi si agggancia per sintetizzare il secondo filamento. Uso poi una nucleasi per svolgere il loop e si ottiene il cDNA copia originale del mRNA. Posso usare degli oligo primer di dT, oppure dei random primer, generati casualmente e ottenendo speci di DNA differenti, ma spesso molto efficienti in quanto si agganciano in conformazioni strane che permettono di retrotrascriverlo. L’RNA scompare ma si ottiene la copia di DNA che si potrà così utilizzare per la PCR, il filamento superiore/inferiore si appaia. SCELTA DI UN PRIMER Bisogna tenere conto che a volte non si ottiene un ottima purificazione, quindi si può rischiare di amplificare RNA genomico e non RNA messaggero. Si fanno quindi delle PCR molto piccole 100-200bp in modo che sia molto veloce e molto efficiente. Normalmente per evitare di fare una detection del genomico invece che del messaggero, i primer non sono messi su un esone, ma su due esoni diversi. In questo modo se si appaiano su quello genomico, amplificando in tempi molto brevi, in modo che non riesca ad amplificare due esoni molto lontani. Normalmente si fa una REAL TIME PCR QUANTITATIVA Lo strumento rileva ad ogni ciclo di PCR quanto amplificato si è generato. All’inizio avendo dato lo stampo è difficile definire quanto se ne è ottenuto. Misurando ciclo dopo ciclo si può osservare il raggiungimento della saturazione grazie alla curva di saturazione. Si seguono le molecole di amplificato grazie all’uso del SYBR green per monitorare la sintesi del DNA. SYBR green è un colorante che si lega al DNA a doppio filamento ma non al DNA a singolo filamento e viene usato per monitorare la sintesi del DNA durante le reazioni real-time PCR. Quando si lega al DNA a doppio filamento emette una fluorescenza molto superiore di quella del bromuro di etidio. Si usa SYBR green anche perché il rapporto della fluorescenza in presenza di DNA a doppio filamento e della fluorescenza in presenza di DNA a filamento singolo è molto superiore del rapporto con bromuro di etidio. Si utilizza un termociclatore in cui vi è un raggio laser che va ad analizzare campione per campione ad ogni ciclo misurando quanta fluorescenza viene emessa. Qualunque DNA può essere quantizzato. Al primo ciclo da una molecola se ne dovrebbero produrre 2, ma non sappiamo quante molecole ci sono, quindi osserviamo all’inizio comunque un minimo di fluorescenza, si definisce comunque un ciclo soglia, ovvero il ciclo in cui viene rivelata una frequenza. Il numero dei cicli necessari perché un campione raggiunga il suo Ct è inversamente proporzionale al numero di copie target presente inizialmente. Il calcolo della quantità di DNA dei campioni incogniti viene effettuata determinando il ciclo della PCR (ciclo soglia, Ct) a cui viene raggiunto il valore soglia di fluorescenza del reporter e dove cioè i segnali di amplificazione specifici sono separabili da quelli del rumore di fondo del sistema. Ci basiamo sopratutto sul Ct in quanto è il primo momento in cui si può rilevare un determinato gene. Questa tecnica è quantitativa poiché si confronta la quantità di un trascritto rispetto ad un trascritto ubiquitario (es. RNA ribosomale o b-actina). Maggiore è il numero di molecole di un particolare cDNA presenti all’inizio della reazione prima verrà rilevato il segnale della fluorescenza dell’intercalante. Il confronto viene fatto quando la reazione è in fase esponenziale Esempio quantizzazione relativa Dal gene dell’actina presente in tutte le cellule, posso andare a quantizzare le quantità iniziali. Andando a rilevare il ciclo soglia di un gene housekeeping si può andare a rilevare quanto cDNA era stato generato, vado poi a rilevare il gene di interesse. Il rosso è quello che si vede prima, nel rosso si vede meno. Non è così banale dire che il rosso ne ha più del nero. Vado a calcolare bene la differenza. Diciamo che il numero di molecole di RNA messaggero nei due tessuti e 2 e 4. Per ogni gene avrò 2 e 4 cDNA, nel momento in cui copio con retrotrascrizione ho le quantità relative. Vado avanti con la PCR e tutto raddoppia. Per rilevare la differenza il ciclo soglia è al raggiungimento di 32 molecole di PCR prodotte e amplificate. Nel tessuto 2 il 32 è raggiunto al primo ciclo per il primer, nell’1 al primo. Il gene di interesse relativamente al terzo e al quarto. Calcolo dunque la differenza fra i cicli soglia per i primer del gene di interesse e di normalizzazione, ottenendo lo stesso risultato. Ciò vuol dire che sono espressi nello step modo. Senza normalizzazione avrei detto che erano differenti. Se inseriscono i dati in un grafico: il più basso indicherebbe il più espresso, per questo viene espresso come 2 alla meno deltaCt, in modo da osservare la colonna più alta come il gene più espresso, a livello visivo rende molto meglio. Il numero dei cicli necessari perché un campione raggiunga il suo Ct è inversamente proporzionale al numero di copie target presente inizialmente La PCR quantitativa riesce a dirci dunque QUANTE moelcole ci sono. Utilizza delle sonde fluorogeniche rispetto a coloranti che legano il DNA che danno una specifica ibridazione tra la sonda ed il DNA da analizzare. Da un lato ha un fluorocromo, dall’altra una molecola che ferma il fluorocromo in modo che non si veda la fluorescenza. La quantizzazione non viene influenzata da amplificazioni non specifiche dovute a legame non specifico del primer o dimerizzazione dei primer. Possibilità di marcarle con fluorocromi diversi e distinguibili. Con l’utilizzo di fluorocromi diversi l’amplificazione di due sequenze diverse può venire analizzata in contemporanea in un’unica reazione di PCR. Lo svantaggio delle sonde fluorogeniche è la necessità di sintetizzare sonde specifiche per ogni gene da analizzare e ciò è molto costoso. Quando però è sviluppato un protocollo preciso è altamente sensibile. All’inizio dell’amplificazione si appaiano i primer a 5’-3’, viene disegnata una sonda complementare al gene da analizzare che abbia un fluorocromo e una molecola detta quencher che ferma la fluorescenza. L’estensione dal primer al 5’ spiazza la sonda e la stacca, viene poi idrolizzata. Il fluorocromo si allontana così dall’’inibitore e si può sviluppare in questo modo la fluorescenza. Dunque sono molecole che solo quando si spezzano diventano fluorescenti. È detta TAQ PCR. Il 79% della sequenza del genoma umano presenta siti unici quindi è possibile disegnare sonde specifiche a parte in regioni ripetute. IBRIDAZIONE IN SITU DELL’mRNA Non è per niente quantitativa ma permette di individuare in un embrione o in un tessuto quali cellule producono quel determinato gene. Essendo fatta in tessuti ci sono poche molecole di RNA, dunque si devono trovare le condizioni migliori possibili, si utilizza quindi una sonda a RNA. 1. La sonda viene trascritta come RNA antisenso cioè complementare all’mRNA del gene da analizzare. Durante la trascrizione con la RNA polimerasi viene incorporato un nucleotide marcato: l’UTP è modificato con digossigenina (in situ non radioattiva) o con 35S (in situ radioattiva). 2. Gli embrioni o le sezioni di tessuti vengono ibridati con una sonda di RNA antisenso marcata con digossigenina. 3. In seguito si tratta il campione con un anticorpo anti-digossigenina che la lega marcato con l’enzima fosfatasi alcalina. 4. Il campione viene poi trattato con un substrato per questo enzima che forma un precipitato colorato che marca indelebilmente le cellule che esprimono il gene di interesse. Perchè una sonda di RNA? Il tasso di ibridazione e la stabilità dell’associazione tra sonda e molecola bersaglio sono più elevate negli ibridi RNA/RNA, rispetto a quelli DNA/RNA o DNA/DNA. Viene trascritta con RNA polimerasi che non necessita di un primer per iniziare la trascrizione. Si utilizzano RNA polimerasi (T3, T7, SP6) derivate da fagi che si legano a sequenze specifiche promotoriali più forti dei promotori di E.coli permettendo la sintesi di alte quantità di RNA. I virus hanno l’RNA polimerasi che è un’unica proteina e si lega a promotori di circa 20 nucleotidi. Esempio Questo è il vettore della pBluescript. A monte e a valle ha i promotori per queste RNA polimerasi, sono già generati dai biotecnologi con tutte le basi per effettuare i nostri esperimenti. Si ragionerà su quale promotore lavorare per avere la sonda complementare all’RNA messaggero. Bisogna utilizzare la RNA polimerasi che lega il cDNA da T3. Per avere una molecola che si appaia all’RNA messaggero alle molecole avrò bisogno di una sequenza corrispondente al filamento inferiore che si agganci al superiore. Viene denaturato, RNA polimerasi si aggancia, utilizzerà da 3’ a 5’ e genererà una sonda complementare. UTP modificata Esistono due livelli di analisi: 1. Ibridazione in situ su embrioni interi (Whole mount) = Solo a stadi precoci di sviluppo 2. Ibridazione in situ su sezioni = Su embrioni interi o tessuti anche adulti Come posso caratterizzare TUTTI i geni espressi da un particolare tessuto? È possibile analizzare tutti gli RNA prodotti con un unico esperimento ovvero attraverso il TRASCRITTOMA. I microarrays cDNA permettono l’analisi in contemporanea di un gran numero di geni: codificano per proteine (solo il 3-5% dell’RNA costituisce il mRNA) Contengono in uno spazio piccolissimo delle sonde che posso ibridare l’intero trascrittoma umano = circa 20.000 geni che corrispondono in modo specifico a tutti i geni trascritti. Sono state dunque generate delle sequenze specifiche per questo e vengono immobilizzate su un supporto frammenti di circa 100bp, corrispondenti a una singola sequenza e si osserva dove si lega RNA. Viene poi effettuata retrotrascrizione con cDNA. Si analizza poi con un raggio laser facendo dei confronti con questo esperimento semplice. Il computer poi riconosce le diverse sonde e sequenze attribuendole ai geni. Esistono chip commerciali con numerosissimi oligonucleotidi per poter osservare trascrittomi umani o di altre specie e le diverse forme. Si può ad esempio confrontare i geni espressi nel genoma tumorale e nel genoma normale, osservando cosa si spegne o cosa si accende di differente. DATABASE Si possono poi andare a utilizzare i database, che contengono sequenze del genoma e le informazioni dei trascritti. PROGETTO IMAGE È un progetto degli anni 90’’/2000 e hanno preso RNAm di cuore, cervello e fegato e hanno generato il genoteca, ovvero hanno sequenziato del cDNA, andando ad osservare cosa era espresso nei diversi tessuti. Questo perchè il genoma è lo stesso ma l’espressione è diversa. Hanno trovato quindi cose in comune e cose differenti. Sono stati sequenziati milioni di cDNA, con laboratori di tutto il mondo coinvolti. Questo ha permesso la realizzazione di un database in cui si trova l’espressione di geni specifici per i tessuti e per dei tumori. Questi sono definiti EST, ovvero expressed sequence tags. Ci sono due depositi dbEST e RIKEN. Da questi si può ricavare : Esempio La rhodopsina espressa nei bastoncelli della retina si trova oltre che nell’occhio, nel muscolo, cosa mai minimamente pensata. L’actina si trova invece praticamente ovunque. Ecc. Da queste possiamo direttamente, se necessario, andare a vedere se questo è espresso nel nostro tessuto. Traduzione & Sintesi Proteica La trascrizione è il porcesso per cui da una molecola di DNA si ottiene una molecola di RNA, spesso si parla della trascrizione degli mRNA che sono quelli che codificano per le proteine. La traduzione è il processo di lettura dell’informazione codificata in un mRNA per sintetizzare la catena polipeptidica. Il DNA ha solo 4 tipi di base azotate: 4 diversi tipi di nucleotidi dalla cui combinazione si ottiene la grande variabilità dei geni; le proteine invece derivano dalla combinazione dei 20 aa. CODICE GENETICO Per capire qual’è il codice genetico, quindi come sono organizzate le sequenze di basi del RNA che codificano per una aminoacido, si sono fatti vari esperimenti che hanno dimostrato che le combinazioni di 3 nucleotidi danno 64 combinazioni sufficienti per i 20 aminoacidi—> il codice genetico è organizzato in triplette. Una volta acquisite le conoscenze per sintetizzare in vitro piccole sequenza di DNA, le triplette, traducendole si ottiene un solo aminoacido questo perchè una tripletta codifica per un solo aminoacido. Se in vitro il sistema di lettura inizia dal primo nucleotide allora si ha l’alternanza di aminoacidi scritta nel DNA. Se si considerano letture diverse delle triplette allora si avrà una sequenza diversa di aminoacidi, tutta a scalare. Per conoscere in modo preciso il codice si introdussero delle molecole per la lettura di sequenze piccolissime di 3 nucleotidi, il legame con il ribosoma e il transfer però non era facilitato per cui 52°. Nella sequenza dell’mRNA solamente 2 aminoacidi sono codificati da un'unica tripletta: la metionina è codificata dalla sequenza AUG—> sempre il primo aminoacido delle proteine; Il triptofano invece è codificato da UGG; Altre sequenze specifiche sono quelle dei 3 codoni di Stop o non senso che sono: UAA UGA UAG CODICE DEGENERE Gli altri aminoacidi sono codificati da diversi codoni: in tutti questi ciò che varia tra i diversi codoni è solamente l’ultima base della tripletta—>è la terza base è quella meno stringente nell’interazione codone- anticodone. La Valina è codificata da 4 possibili sequenze, tutte iniziano con GU variano la terza base. L’Aspartato e l’Acido glutammico sono codificate da sequenze dove i primi due nucleotidi sono uguali, GA, cambia il terzo. La natura ha introdotto i primi due nucleotidi, che sono i più stringenti, in comune ai codoni che codificano per un determinato aminoacido, nel caso avvenisse una mutazione nel terzo nucleotide nel codone o non si ha un cambiamento dell’aminoacido oppure, nel caso in cui comporti l’introduzione di un aminoacido diverso, spesso esso non ha una carica diversa da quello originale e quindi l’impatto della mutazione sulla proteina è spesso silente o comunque non causa danni gravi—>si hanno dei polimorfismi, sono delle variazioni che però portano a generare la stessa proteina. Nei mitocondri il codice genetico è leggermente diverso, ad esempio un codone di stop nella cellula nel mitocondrio diventa codificante per il triptofano. Qualunque RNA messaggero si trova nei databse pubblici ma poiché non è possibile sequenziare direttamente RNA messaggero bisogna sintetizzare il suo cDNA. I database pubblici segnalano la sequenza della metionina e del codone di stop. Sequenza sonic hedgehog solitamente le sequenze di mRNA viene sempre presentano come sequenza di cDNA. Partendo dall’ ATG al codone di stop, la ORF, open reading frame, permette di leggere codone dopo codone predicendo la sequenza del RNA. Dalla sequenza della proteina non si può sapere qual è la vera sequenza del gene proprio per il vacillamento delle terza base—> ci sono tanti possibili codoni che sono validi per lo stesso aminoacido. Quando si ha un qualunque DNA, esso ha 3 cornici di lettura, ORF: 1. Se la lettura, da parte del ribosoma, inizia dal primo nucleotide, AUG, si ha una cornice di lettura aperta, ogni 3 nucleotidi, dalla metionina al codone di stop; 2. Se la lettura, da parte del ribosoma, iniziasse dal secondo nucleotide si avrebbe un codone di stop, un po di aminoacidi, e poi un altro codone di stop—> non si ha una cornice di lettura aperta; 3. Se la lettura, da parte del ribosoma, inizia dal terzo nucleotide, si ha una cornice aperta MUTAZIONI FRAME-SHIFT Le mutazioni possono rompere le cornici di lettura: si può avere una mutazione che porta ad una delezione di un nucleotide sfalsando tutta la cornice di lettura: questo comporta la presenza di diversi aminoacidi diversi e quindi la sintesi di una proteina diversa. Lo stesso vale se viene aggiunto un nucleotide, viene sfalsato tutto—> con l’inserzione di un nucleotide, errore nella replicazione del DNA, si ottiene un proteina mutata. Se varia una base come, ad esempio, nella mutazione dell’anemia falciforme, nel gene dell’emoglobina c’è solo una base diversa dal genotipo wilde type che però porta un cambiamento dall’acido glutammico ad una valina che tende a fare aggregare all’interno dei globuli rossi. Inoltre, variazione di un nucleotide può portare alla inserzione di un codone di stop derivato da un errore di replicazione. RNA TRANSFER Regola: una tripletta corrisponde un solo aminoacido, ma un aminoacido può essere codficato da triplette diverse. Fu Francis Crick che, nel 1955, cercò di capire come la tripletta si abbina ad una aminoacido. È difficile che sia l’aminoacido stesso a riconoscere la tripletta in modo diretto—> ci deve essere un acido nucleico che può appaiare le basi in modo specifico, la molecola adattatore è appunto un RNA transfer. I tRNA vengono trascritti negli eucarioti dall’RNA polimerasi 3 , con promotori forti. Nel genoma si hanno più di 400 geni diversi raggruppati in 49 famiglie che portano a molti transfer. Se si tolgono i 3 codoni di STOP che non legano un RNA: rimangono 61 codoni per 20 aminoacidi—> ogni aminoacido può avere più transfer che lo caricano. I transfer per la serina ad esempio possono avere diversi anticodoni e legano diversi codoni dell’mRNA. Il 15 % dell’RNA trascritto è RNA transfer contro il 5% di mRNA. Nel 1957 Zamecnik e Mahlon dimostraronoche i tRNA sono molecole di RNA a cui è legato un aminoacido in 3’. Questà estremità del tRNA termina sempre con CCA ed è alla adenina che si lega l’aminoacido. La ansa si chiama D perché i nucleotidi sono stati modificati a diidrouridina, è stato ridotto. Ansa PSI perché è l’ansia della pseudouridina dove il ribosio lega il carbonio in 5 Ansa dell’anticodone Stelo accettore che lega l’aminoacido Dunque i tRNA sono spesso rappresentati con una struttura a trifoglio, piuttosto semplicistica, le anse si creano con dovuto appaiamento delle basi complementari in determinate posizioni. Ansa D perché i nucleotidi sono statu modificati con a diidrouridina; Ansa PSI perché i nucleotidi sono modificati con la pseudo-uridina dove il ribosio lega il carbonio in 5’; Ansa dell’anticodone con le 3 basi esposte, Stelo accettore; Queste modificazioni avvengono nel nucleolo, successivamente il tRNA viene trasportato nel citoplasma. In realtà il tRNA nei processi ha un forma a L capovolta dove l’ansa D e l’ansa PSI sono una vicina all’altra e l’anticodone si trova in basso. Le tre basi dell’anticodone sono parallele tra di loro e possono così interagire con il codone dell’mRNA, così posizionate le prime due hanno una poca libertà di movimento, la terza invece dato che si trova proprio nel punto di ripiegamento è un po’ più libera e può vacillare. La traduzione richiede due passaggi di decodificazione: Appaiare l’aminoacido corretto alla sequenza in 3’ del tRNA; Legame tra codone ed anticodone di tRNA carico; ABBINAMENTO DELL’AMINOACIDO CORRETTO SUL t-RNA Questa è l’unica fase della sintesi proteica che richiede ATP, l’energia viene spesa per formare il legame acilico tra tRNA e il suo aminoacido. 1. L’aminoacido ha il un gruppo carbossilico che attacca il fosfato in alfa dell’ATP formando un legame intermedio, aminoacido adenilato. Il pirofosfato ottenuto viene degradato. 2. Questo intermedio, gruppocarbossili-fosfato, viene attaccato dall’ossidrile in 3’ della adenina in 3’ della sequenza CCA del tRNA. 3. L’aminoacido viene trasferito sul tRNA formando il legame acilico tra l’estremità 3’ del tRNA e aminoacido. Esistono in realtà due classi di enzimi che catalizzano la reazione: Enzimi che legano l’aminoacido in 2’ OH del ribosio; Enzimi che legano l’aminoacido in 3’ OH del ribosio; L’RNA ha il ribosio e non il deossiribosio quindi ha due gruppi OH disponibili. L’enzima che se ne occupa è l’aminoacil-tRNA sintetasi ha un sito di legame per l’aminoacido e per l’ATP. Come prima reazione catalizza il trasferimento di AMP della ATP sull’aminoacido e sul carbossile. Successivamente ADP viene rilasciato e l’aminoacido-AMP viene legato al transfer. Esiste un aminoacil-tRNA sintesi per ogni aminoacido, è specifico. Al contrario, più transfer possono legare lo stesso aminoacido. La specificità arriva dal fatto che si hanno diversi anticodoni, sono detti tRNA isoaccettori, legano allo stesso modo l’amminoacido pur avendo anticodoni leggermente diversi. Ci sono molti nucleotidi nello stesso accettore ed essi sono chiavi per il riconoscimento del corretto aminoacido. - Nucleotidi adiacenti a quelli in posizione 3 e 70 sono identici, non la sequenza CCA, ma la porzione adiacente spesso è identica in modo che lo stesso enzima carica lo stesso aminoacido. Tre transfer isoacettori che legano con il legame acilico l’aminoacido. Essendo isoaccettori gli anticodoni sono leggermente diversi—> quello che varia è la prima base dell’anticodone (si legge sempre da 5’ a 3’). La prima base dell’anticodone è quella che varia e corrisponde alla terza base del codone perché sono rovesciati dato che si devono appaiare. Poiché è l’aminoacil-tRNA sintetasi che controlla l’appaiamento corretto aminoacido-tRNA, ci devono essere degli altri punti della traduzione in cui avviene il riconoscimento. C’è una parte vicina al braccio CCA che è molto conservata, il riconoscimento avviene in particolare grazie allo stelo accettore (transfer isoaccettori). APPAIAMENTO t-RNA ISOACCETTORI Normalmente l’mRNA viene scritto con 5’ a sinistra e 3’ a destra, mentre il tRNA al contrario. Un transfer si può appaiare in modo perfetto con l’mRNA oppure avere un appaiamento wobble pairing ovvero c’è un tentennamento del transfer sul codone—> dato che le prime due basi del codone siano molto conservate, il sistema di lettura del ribosoma permette un appaiamento perfetto dei primi due nucleotidi il terzo può essere tentennante. I legami ad H tra codone ed anticodone sono pochi ma vengono stabilizzati e perciò è permessa anche la lettura di transfer che non sia appaiano perfettamente Man mano che si sequenziavano i transfer si è notato che spesso nell’anticodone c’era una base diversa: inosina, deriva dalla adenina mediante idrolisi del gruppo amminico che viene sostituito con un gruppo chetonico. Essa è abbastanza presente nei transfer e favorisce il wobble, fatto dalla prima base dell’anticodone e la terza del codone —> l’inosina può appaiarsi quasi con tutti gli altri nucleotidi a parte la G, guanina. Questa base da grande possibilità al transfer di appaiarsi con diversi codoni che presentano basi differenti tra loro, se c’è una G l’inosina però non riesce ad appaiarsi. L’inosina è una purina, doppio anello, perciò si appaia preferibilmente con U, uracile, e C, citosina, che sono pirimidine, ma si appaia bene anche con la A, adenina. La G, guanina, normalmente si appaia con la C, citosina, ma nel caso del tentennamento riesce ad appaiarsi anche con U, uracile. L’U, uracile, si appaia con A, adenina, e con la G, guanina; La A, adenina, si può appaiare solo con U, uracile L’inosina, I, si può appaiare con A, adenina, U, uracile e C, citosina; Sono sempre un purina con le due diverse pirimidine e la pirimidina con due diverse purine. Come mai è la prima base dell’anticodone che si appaia con la terza base del codone? Le basi dell’anticodone sono parallele tra di loro e si trovano in una regione con una certa restrizione sterica derivante dalla loro conformazione. La prima base dell’anticodone può accomodare un numero di legami ad idrogeno leggermente non classici perché essa si trova in corrispondenza di un punto di ripiegamento. Il tentennamento si spiega guardando la struttura del transfer. SINTESI PROTEICA In questo processo ci sono 3 RNA che hanno un ruolo chiave: 1. mRNA che porta la copia in singolo filamento del DNA, può essere letto a triplette partendo dalla tripletta AUG fornisce la cornice di lettura ed è aperto dalla prima tripletta a al codone di stop; 2. tRNA è un adattatore che permette di leggere i codoni a livello del braccio dell’anticodone e di appaiare il corretto aa, che è mediato dalla aminacil-tRNA-sintetasi. => devi saperlo bene 3. Ribosomal-RNA o rRNA: sono chiave nella sintesi proteica per varie funzioni tra cui formare il legame peptidico. Nella sintesi delle proteine si associa a proteine per formare i ribosomi strutture che funzionano come macchine per la sintesi; All’interno del RIBOSOMA gli aminoacidi vengono uniti dal legame peptidico per formare la proteina. Come si distinguono le dimensioni degli rRNA e delle due subunità? L’unità di misura è chiamata Svedberg, ovvero è un unità che si basa sulla loro disposizione dopo essere stati