Appunti di Biologia Molecolare PDF
Document Details
Uploaded by HalcyonCadmium3611
Università degli Studi di Ferrara
2023
Mirko Pinotti
Tags
Summary
Questi appunti di biologia molecolare descrivono la struttura del DNA, i nucleotidi e le basi azotate. L'autore spiega le diverse forme del DNA, inclusa la forma B e la forma A, e discute l'importanza dell'ibridazione degli acidi nucleici. Sono appunti accademici di biologia molecolare del prof. Mirko Pinotti dell'anno accademico 2022/2023.
Full Transcript
1 IL DNA NUCLEOTIDI I nucleotidi rappresentano una famiglia di molecole che non comprende solamente quelle degli acidi nucleici (ad esempio anche l’ATP è un nucleotide). Hanno una struttura comune: Uno zucchero (desossiribosio o ribosio) a 5 atomi di carbonio che in soluzione acquosa...
1 IL DNA NUCLEOTIDI I nucleotidi rappresentano una famiglia di molecole che non comprende solamente quelle degli acidi nucleici (ad esempio anche l’ATP è un nucleotide). Hanno una struttura comune: Uno zucchero (desossiribosio o ribosio) a 5 atomi di carbonio che in soluzione acquosa acquista la configurazione eterociclica. Viene numerato secondo le posizioni 1’, 2’, 3’, 4’ e 5’ (numerazione convenzionale che distingue lo zucchero dalla base azotata). Una base azotata, composta da vari atomi e legata allo zucchero tramite un legame N-glicosidico. Essa presenta una numerazione normale e, pertanto, distinta da quella utilizzata per indicare lo zucchero. Un gruppo fosfato, che funge da ponte fra i nucleotidi. Zucchero Aldo-pentoso con forma eterociclica. Il tipo di zucchero (ribosio o desossiribosio) determina la struttura e il nome dell’acido nucleico a cui appartiene. La principale differenza tra DNA ed RNA riguarda la presenza o meno di un gruppo OH nello zucchero che lo costituisce. Nel DNA manca l’ossigeno in posizione 2’, mentre nell’RNA è presente. La posizione dell’OH nell’RNA non solo è incompatibile con la struttura a doppia elica del DNA descritta da Watson e Crick, ma comporta anche profonde implicazioni alla base della “fedeltà” della DNA polimerasi. Nello spazio tridimensionale gli zuccheri assumono conformazioni diverse in relazione alla rotazione determinata dai legami e, pertanto, non ne è necessaria la rottura affinché questo avvenga. La configurazione invece rappresenta una forma alternativa di una molecola che richiede però la rottura di un legame covalente, spesso attraverso attività enzimatica. Basi azotate Sono tendenzialmente idrofobiche e questo spiega perché esse, poste in ambiente acquoso, siano posizionate all’interno della doppia catena. Appartengono a due famiglie: Purine → formate da due anelli eterociclici a 9 atomi (Adenina e Guanina) Pirimidine → formate da un anello singolo a 6 atomi (Citosina e Timina/Uracile). L’uracile ha quasi la stessa disposizione dei gruppi funzionali della timina, tranne per la presenza del gruppo metilico della timina in posizione 3. Che senso ha la differenza tra timina e uracile su DNA e RNA? Dal punto di vista strutturale, timina e uracile non causano particolari distorsioni (hanno la stessa conformazione e si appaiano con la stessa base), ma il danno più comune che possono subire gli acidi nucleici è causato dalla deaminazione ossidativa, alla quale va in contro più frequentemente la citosina. Tale processo causa la sostituzione del gruppo amminico NH2 con un doppio legame fra carbonio e ossigeno, trasformando così la citosina in uracile, che non rappresenta una base propria del DNA. Esistono, però, enzimi di riparazione del DNA che intercettano l’uracile nel DNA e lo rimuovono. BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 2 In soluzione acquosa le basi possono assumere diverse configurazioni tautomeriche. Ogni base ha una forma tautomerica stabile, che determina gli appaiamenti di Watson e Crick, ma è possibile che assuma una forma tautomerica diversa. Questo porta i suoi gruppi funzionali a formare combinazioni strane che mimano la forma tautomerica stabile di un’altra base. La DNA polimerasi, quindi, può appaiare una base sbagliata solo perché ha la forma di quella che dovrebbe essere teoricamente inserita. La conversione tautomerica è uno dei meccanismi che inducono in errore la DNA polimerasi più frequentemente. Esistono però a valle dei meccanismi di correzione delle bozze che correggono l’appaiamento sbagliato.. I gruppi A-T formano solo due legami a idrogeno mentre C-G ne formano tre. Non a caso i punti in cui comincia la duplicazione del DNA corrispondo ai legami fra A-T (più semplici da denaturare). Il maggior contributo alla stabilità della molecola di DNA, però, non è dato dai legami a idrogeno ma è dettato dal fatto che le basi azotate sono impilate fra loro, esercitando la cosiddetta forza di impilamento (interazioni fra le basi). FORMA B DEL DNA Si tratta della forma descritta da Watson e Crick, che rappresenta la classica doppia catena polinucleotidica, antiparallela, perché i due filamenti sono orientati in direzione 5’-3’ e 3’-5’ (la lettura dei filamenti però avviene sempre in direzione 5’-3’) e complementare, poiché le basi azotate, perpendicolari all’asse della doppia elica, creano e rispettano gli appaiamenti canonici di Watson e Crick (A-T e C-G) e hanno tutte lo stesso ingombro sterico. Tali appaiamenti determinano un diametro costante di 20 A e contribuiscono alla stabilità della doppia elica attraverso la formazione di legami a idrogeno. I gruppi A-T formano solo due legami a idrogeno mentre C-G ne formano tre. Non a caso, infatti, i punti in cui comincia la duplicazione del DNA corrispondo ai legami fra A-T (più semplici da denaturare). Un altro aspetto fondamentale per la stabilizzazione della molecola di DNA è il fatto che le basi azotate siano impilate l’una sull’altra, esercitando la cosiddetta forza di impilamento (interazioni fra le basi). Le basi non sono sovrapposte, ma sfalsate fra loro di 36°, quindi per fare un giro completo dell’elica B abbiamo bisogno di 10,5 nucleotidi. Si dice che le due catene si avvolgano fra loro in maniera destrorsa. L’angolo formato dalla protrusione dei due zuccheri è di circa 120°. Quando le due catene si avvolgono con i legami fosfodiesterici formano due solchi: uno maggiore e uno minore, che espongono all’ambiente acquoso le basi azotate per permettere alle proteine di avere accesso all’informazione contenuta nel DNA. Pertanto, al tempo T0, l’informazione contenuta nella doppia elica del DNA è situata nei solchi. Ma qual è la differenza fra i due solchi? Tutte le proteine che devono interagire con il DNA accedono all’informazione attraverso il solco maggiore, che è più informativo del solco minore perché è molto più specifico rispetto ad esso. A livello del solco maggiore i gruppi funzionali ai quali accede una proteina, vengono distinti più precisamente da essa, permettendole così di riconoscere l’appaiamento corretto. Per mostrare la differenza fra i due solchi facciamo un esempio: se abbiamo un appaiamento G-C allora avremo, in corrispondenza del solco minore, due estremità che potranno accettare legami idrogeno e un’estremità che potrà fungere da donatore. Se invece abbiamo una sequenza C-G la situazione sarà esattamente speculare e donatori e accettori di legami idrogeno risultano disposti nello stesso modo rispetto al precedente accoppiamento. Nel solco BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 3 minore, pertanto, i gruppi funzionali risultano indistinguibili alla proteina. A livello del solco maggiore, invece, l’informazione risulta più precisa, poiché accettori e donatori di legami idrogeno sono speculari ma disposti in ordine opposto. Le proteine, quindi, riconoscono le sequenze specifiche interagendo con la doppia elica del DNA accedendo al solco maggiore, tramite una regione che ha un’alfa elica (destrorsa) che inseriscono trasversalmente al solco maggiore e con i suoi amminoacidi è in grado di leggere le informazioni contenute nella doppia elica del DNA. Alcuni ordini di grandezza - Periodicità: 10 paia di basi per giro d’elica - Passo d’elica: 34 A - Lunghezza del genoma umano: circa 2 metri, all’interno di una cellula eucariotica FORMA A DEL DNA Esistono numerose varianti alla forma B del DNA perché ogni volta che abbiamo un legame singolo sono possibili diverse rotazioni, anche se con particolari vincoli. La forma A è più tozza, il diametro è più grande, il passo dell'elica include più basi, i solchi sono anche meno definiti. Pertanto, l’interazione delle proteine è meno specifica. Troviamo questa forma in alcune condizioni particolari: Quando il DNA è legato a proteine o enzimi Tutte le volte in cui troviamo delle doppie eliche ibride di DNA ed RNA Nel caso dell’RNA double stranded. Esiste una terza forma detta forma Z, ma è molto rara e non si sa molto bene quale sia il suo significato fisiologico: essa si ottiene nel caso in cui ci sia alternanza fra purine e pirimidine e il suo andamento è addirittura sinistrorso. NUCLEIC ACID HYBRIDIZATION Le basi azotate assorbono la luce ultravioletta. Se si posiziona del DNA in soluzione e lo si bombarda con della luce ad una certa lunghezza d’onda, il DNA è in grado di assorbire la luce UV ad una lunghezza d’onda di 260 nm. Esiste uno strumento chiamato spettrofotometro utilizzato per misurare l'intensità delle lunghezze d'onda in uno spettro di luce rispetto all'intensità della luce proveniente da una sorgente standard. Questo dispositivo permette di inserire il DNA in una provetta (cuvetta) attraverso la quale passa una luce UV a 260 nm. Dall'altra parte la lunghezza d'onda sarà ovviamente minore e lo spettrofotometro misura la luce che passa attraverso il doppio filamento del DNA. BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 4 Esiste una diretta proporzionalità fra l'aumento della luce assorbita e la concentrazione del DNA. Effetto ipercromico → Tanto più le basi azotate sono accessibili ed esposte alla luce ultravioletta, tanto più sarà elevato l'assorbimento. Per denaturazione del DNA si intende quel processo che porta alla separazione delle due catene. Ciò può avvenire in laboratorio ma accade anche fisiologicamente all’interno della cellula durante la duplicazione del DNA. Il processo si può effettuare in maniera fisica, attraverso l’innalzamento della temperatura, o con agenti chimici che vanno ad interferire con i componenti idrofobici (es. l’urea). Se partiamo da una temperatura di 40°C, abbiamo un doppio filamento chiuso. Appena raggiungiamo una temperatura leggermente più alta di 70°C, la doppia elica inizia a cambiare la sua forma fino ad un punto in cui cede totalmente e molto velocemente i due filamenti si separano, principalmente in corrispondenza degli accoppiamenti A-T (legami più facili da rompere). La temperatura alla quale il 50% del DNA è denaturato si chiama Temperatura di fusione (Tm) che dipende dalle caratteristiche del doppio filamento: tanto più un'elica è ricca di appaiamenti G-C (3 legami idrogeno), tanto più resistente sarà la denaturazione e la Tm sarà maggiore. È anche importante la lunghezza complessiva del doppio filamento. Inoltre, tanto più è elevata la concentrazione salina, tanto più l’elica risulta stabile e non si separa, perché vengono minimizzate le repulsioni elettrostatiche. L'ibridazione tra acidi nucleici è l'opposto della denaturazione: se abbiamo in soluzione due doppie eliche identiche, le denaturiamo alzando la temperatura, e poi la riabbassiamo, è possibile che i due filamenti possano riassociarsi? Certo che sì. Se si ha una sequenza di DNA e la si vuole ibridare tramite l’utilizzo di una sonda è necessario compiere i vari esperimenti ad una temperatura poco inferiore alla Tm. Infatti, al di sopra della Tm l’elica non si appaia e operando molto sotto si rischia di compiere appaiamenti sbagliati. STRUTTURA DELL’RNA La differenza principale fra DNA e RNA, oltre alla presenza dell’uracile al posto della timina, è la presenza del gruppo OH nell'RNA in posizione 2', che lo rende molto più instabile del DNA se inserito in soluzione acquosa. Questa instabilità intrinseca è spiegata dal fatto che l'RNA, in condizioni alcaline, può andare incontro ad una reazione intramolecolare non catalizzata e quindi spontanea: l'OH in 2' compie un attacco nucleofilo sul fosforo del legame fosfodiesterico rompendo lo scheletro fosfodiesterico e provocando la rottura dell'RNA. Questo è anche uno dei modi per eliminare l'RNA da una provetta in cui abbiamo sia DNA che RNA. Questo OH in 2' è anche quello che permette alla DNA polimerasi di discriminare i desossiribonucleotidi che deve usare per la duplicazione dai ribonucleotidi, comunque presenti nel nucleo, ma che non vanno utilizzati per la duplicazione del DNA. Il DNA all'interno del nucleo si trova sotto forma di doppio filamento a formare la doppia elica, l'RNA, nella stragrande maggioranza dei casi, lo troviamo a singolo filamento. Per quanto riguarda l'RNA, il fatto che sia un filamento singolo non significa che non possa formare delle strutture anche molto più complesse rispetto al DNA, poiché all'interno del singolo filamento di RNA possono essere presenti delle zone con complementarietà di basi. Esempi di strutture di RNA sono ad esempio la forcina (stem BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 5 loop), le gemme, ma anche le anse. A differenza del DNA in cui si rispetta sempre la complementarietà di basi, sull'RNA, siccome non c'è nessun vincolo per ottenere una struttura a scala a chiocciola, troviamo anche delle interazioni non convenzionali: interazioni a tre filamenti o appaiamenti non canonici (interazioni G-U ma anche appaiamenti a tre basi come U-A-U, cosa impossibile sul DNA). Tutte le volte che l'RNA forma degli appaiamenti e quindi una doppia elica, quella doppia elica non sarà mai molto definita e avrà sempre una conformazione A. Elettroforesi del DNA L'elettroforesi rappresenta una tecnica di laboratorio tramite la quale è possibile separare, all'interno di una matrice porosa (gel di agarosio), delle molecole di DNA a seconda della loro dimensione, facendole passare attraverso questa matrice porosa poiché trainate da un campo elettrico. Il sistema è formato da un pozzetto (dove si inseriscono i frammenti di DNA, digeriti tramite l’utilizzo di enzimi di restrizione), una zona centrale in cui si inserisce il gel (immerso in un contenitore contenente una soluzione salina) e che dovrà essere attraversata dal DNA e due zone in cui andranno inseriti degli elettrodi. Essendo il DNA negativo, applicando un campo elettrico a tutto il sistema tramite i due elettrodi, esso si muoverà verso il polo positivo. Il DNA migrerà con una velocità che dipende sia dal campo elettrico che dalla lunghezza del frammento: tanto più il frammento di DNA è piccolo e più migrerà velocemente. Ma se il DNA è invisibile all'occhio nudo com'è possibile vederlo sul gel? Mentre questo viene preparato, si inserisce un reagente, il bromuro di etidio (molecola planare) che è capace di intercalarsi nella doppia elica del DNA. Il bromuro di etidio, quando è intercalato, riesce ad assorbire la luce UV e ad immetterla nel visibile. Quindi il ricercatore cosa fa? Prende il gel in cui il DNA non è visibile, lo mette su una sorgente di raggi UV (trans illuminatore) in modo da eccitare il bromuro di etidio che, quindi, emetterà nel visibile. Si procede a questo punto con la denaturazione del DNA, necessaria per la successiva ibridazione delle singole catene di DNA con la sonda marcata. La denaturazione in genere viene fatta attraverso l’immersione del gel in una soluzione di NaOH (idrossido di sodio) per circa 15 minuti. Dopo il trattamento denaturante, l'NaOH viene rimosso e il gel viene immerso in un tampone di neutralizzazione. Successivamente viene applicata una tecnica denominata southern blotting, che permette di trasferire i frammenti di DNA dal gel di agarosio su un filtro di nitrocellulosa, che riesce a legare gli acidi nucleici in maniera irreversibile. Il filtro di nitrocellulosa viene posizionato al di sopra del gel e viene attribuita al filtro una carica positiva (viene spostato l’elettrodo). Sopra di questo, poi, viene posta una pila di fogli assorbenti. Per capillarità la soluzione tenderà ad attraversare il gel, il foglio di nitrocellulosa e risalirà nei fogli assorbenti e i frammenti si trasferiranno sul filtro BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 6 nelle stesse posizioni in cui erano all’interno del gel. Il foglio di nitrocellulosa viene quindi inserito in una soluzione contenente una sonda marcata che ibridizza con sequenze di DNA complementari presenti sul foglio, identificandole. Sono presenti altri metodi di rilevamento simili, ma che prevedono l’utilizzo di RNA (northern blotting) o di proteine (western blotting). ENDONULEASI ed ESONUCLEASI Esonucleasi → rompono i legami fosfodiesterici alle estremità della molecola di acido nucleico, da cui rimuovono uno o più nucleotidi Endonucleasi (o enzimi di restrizione) → rompono i legami fosfodiesterici all’interno delle molecole di acido nucleico. Rappresentano la chiave di volta per i ricercatori, soprattutto per quanto riguarda le tecniche del DNA ricombinante. Gli enzimi di restrizione sono di origine batterica e si occupano di tagliare il DNA esogeno (dei batteriofagi) per evitare infezioni (meccanismo di difesa). Esistono tre famiglie di endonucleasi. Tutte riconoscono una sequenza bersaglio (corta e palindromica), tramite la quale si legano al DNA (N.B: riconoscono il DNA a doppia elica): Endonucleasi di tipo II → le più comuni. Riconoscono la sequenza di DNA e tagliano al suo interno in maniera sempre riproducibile e sempre allo stesso modo. Che questa sequenza sia su una doppia catena umana, vegetale o artificiale, l’enzima taglia sempre e comunque allo stesso modo. Così facendo, è sempre possibile predire l’estremità che viene prodotta. Il taglio, compiuto tramite un attacco nucleofilo, avviene solo su uno strand. Se io metto le estremità tagliate vicine, essendo complementari, tendono a riformare i legami idrogeno per rinaturarsi (“sticky ends”). Si possono, quindi, predire anche le estremità che si generano, potendo così decidere quali frammenti mettere vicini favorendo fra loro un riconoscimento (= produzione di DNA ricombinante). Endonucleasi di tipo I e III → riconoscono sempre una sequenza specifica, tuttavia tagliano fuori dalla sequenza che hanno riconosciuto: alcuni tagliano in prossimità, altri tagliano anche a distanza di molte basi. Ciò comporta il fatto che le sequenze tagliate non siano compatibili e che pertanto non si possano usare per le tecniche del DNA ricombinante. Qual è il meccanismo di azione di una endonucleasi? Abbiamo visto come il taglio effettuato da questi enzimi avvenga tramite un attacco nucleofilo. Una molecola d'acqua compie l'attacco nucleofilo sul legame fosfodiesterico da rompere: l'ossigeno lo fa sul fosforo (in 5’) che è parzialmente positivo. Ovviamente il fosforo non può avere 6 legami, per cui deve rompere un legame, ovvero quello fosfodiesterico, andando quindi a spezzare la catena di nucleotidi. Nel sito attivo dell'enzima, a rendere prono l'ossigeno a fare l'attacco, sono dei cationi bivalenti che si coordinano con l'H2O (tendendo a deprotonare l'ossigeno rendendolo prono a fare l'attacco). All'interno del sito attivo dell'enzima è presente uno ione Mg che aiuta ad attivare una molecola d'H2O. BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 7 Ma come fa l'enzima a tagliare all'interno della sua sequenza specifica e non da altre parti? Per capirlo è necessario guardare la sequenza che viene riconosciuta dall’enzima EcoRV, isolato da specifiche linee di Escherichia coli. EcoRV riconosce la sequenza 5'-----GATATC-----3'. Se la guardiamo nella doppia elica, essa mostra una struttura che ha un riarrangiamento con simmetria rotazionale binaria: significa che, vista da entrambe le parti, è simmetrica. In effetti capita che l'enzima debba agire e tagliare entrambi gli strands. Non a caso la maggior parte di questi enzimi agisce sotto forma di dimero. Nel caso dell'enzima EcoRV succede una cosa strana. Se andassimo a vedere l'affinità (la forza con cui la proteina lega il DNA) di EcoRV con la sequenza giusta rispetto alle altre sequenze, troveremmo che EcoRV lega più o meno con la stessa forza la sequenza giusta e quelle sbagliate. Come fa a distinguerle? La spiegazione sta nella capacità dell'enzima di portare l’elica a cambiamenti conformazionali se la sequenza è giusta e di non portarla a nessun cambiamento se la sequenza non è corretta. Quindi, se la sequenza è quella giusta si generano delle interazioni, ovvero dei legami idrogeno fra gli amminoacidi e lo scheletro di DNA. Queste forti interazioni provocano una distorsione del sito di riconoscimento e solo distorcendo le due catene (nelle regioni più facili, dove ci sono gli appaiamenti A – T), il legame fosfodiesterico che riceverà la rottura si trova nel sito attivo di ogni monomero dell'enzima. Questo spiega la specificità di questa famiglia di enzimi. Se invece il DNA non ha la precisa sequenza di riconoscimento, il legame avviene lo stesso, più o meno con la stessa affinità. Tuttavia, la mancanza di quella rete di interazioni proteina-DNA non distorce la doppia elica e non posiziona il legame da tagliare vicino all'ossigeno che farà l'attacco nucleofilo. Nella maggior parte dei casi è questo il meccanismo delle endonucleasi, in altri casi è proprio l'affinità della proteina per la sequenza specifica che è molto maggiore rispetto a sequenze differenti. Gli scenari, quindi, sono molteplici e dipendono dagli enzimi che usiamo. Ma perché la endonucleasi, in condizioni fisiologiche, taglia il DNA esogeno automaticamente e non quello del padrone (endogeno), anche se le sequenze riconosciute dalla endonucleasi sono uguale per entrambi i DNA? Perché nel caso di EcoRI o EcoRV, Escherichia coli possiede sia l'enzima di restrizione per riconoscere la sequenza da tagliare, sia una metilasi (protezione) che metila la sequenza 5'----- GAATTC-----3'. Escherichia coli ha sia la forbice che l'antidoto per quella forbice: Escherichia coli mantiene metilate le sue sequenze riconosciute dall'enzima di restrizione in modo tale che l'endonucleasi possa effettuare il taglio sulla sequenza che riconosce solo quando non è metilata (quello esogeno). Ma come fa una semplice metilazione a proteggere tutto questo meccanismo? Se in quel punto preciso, dove dovrebbe avvenire la distorsione ad opera della endonucleasi, ho il gruppo metilico, esso interferisce con la giusta rete di interazione proteina-DNA, impedendo appunto la distorsione. TOPOLOGIA DEL DNA Nei batteri il DNA è circolare (nella maggior parte dei casi), quindi non ha estremità. Tuttavia, anche quello eucariotico, anche se lineare, è complessato (legato) con proteine e quindi non può permettersi di ruotare (presenta delle strutture blindate). Il concetto portante della topologia del DNA è che sia che esso sia circolare sia che esso sia lineare e complessato con proteine, rappresenta una struttura topologicamente definita. Se localmente denaturo il DNA e determino, così, l’apertura della doppia elica, provoco delle distorsioni che alla fine si traducono in superavvolgimenti negativi (sia nel caso di un DNA lineare eucariotico, sia nel caso di un DNA circolare batterico) ed essa tende spontaneamente ad aprirsi. In natura il DNA è superavvolto (sottoforma di cromatina) e fisiologicamente, nelle nostre cellule, si trova superavvolto negativamente, per favorirne l’apertura. BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 8 Esiste una formula che spiega l’equilibrio tra l’apertura e i superavvolgimenti: Lk = Tw + Wr. Il linking number (numero di legame) è un parametro della topologia del DNA dato dalla somma di altri due parametri: 1. Il primo è il Twist (Tw) ovvero il numero di volte che un filamento passa attorno all'altro. Esempio: se un filamento è composto da 250 coppie di basi, basta dividerle per 10,5 (ovvero il numero di nucleotidi in un giro) e otteniamo quante volte un filamento passa attorno all'altro. 2. Il secondo rappresenta il contorcimento (Wr), ovvero il numero di superavvolgimenti che si formano (numero di volte che la doppia elica si avvolge su se stessa). Nella forma rilassata (nessun ripiegamento), ad esempio, è pari a 0. Il DNA è sempre tenuto prono, in modo tale da facilitare il lavoro agli enzimi che lo apriranno per formare la bolla di duplicazione. In condizioni fisiologiche, quindi in vivo, il DNA è superavvolto negativamente, proprio per essere pronto ad aprirsi facilmente per avvantaggiare il lavoro degli enzimi. Al contrario, con dei super avvolgimenti positivi il DNA non è per niente incline ad essere aperto: è il caso, ad esempio, dei batteri estremofili ovvero quelli che vivono in condizioni estremamente difficili. Dopo un certo punto, però, ci sarebbero talmente tanti superavvolgimenti che non si potrebbe più procedere. In queste situazioni intervengono degli enzimi, chiamati topoisomerasi, che rilassano il DNA per facilitare l’avanzamento della forca replicativa, modificando così il grado di superavvolgimento del DNA. Le topoisomerasi sono gli unici enzimi che tagliando uno o due filamenti e facendoli passare uno attorno all'altro, sono in grado di cambiare il Lk, ovvero le caratteristiche topologiche del DNA. Della famiglia delle topoisomerasi conosciamo: 1. Topoisomerasi 1 → è formata da un core centrale che lega il DNA e da un sito attivo contenente un residuo di tirosina. L’enzima lega il DNA nella cavità centrale e opera la rottura di uno dei due filamenti mediante la rottura del legame fosfodiesterico, compiendo un attacco nucleofilo. L’energia liberata dalla rottura del legame viene conservata mediante la formazione di un nuovo legame (temporaneo) che coinvolge il gruppo fosfato del DNA e la tirosina. A questo punto l’enzima cambia conformazione e determina la rotazione del filamento libero intorno al filamento integro, cambiando il Lk di un’unità. Al termine del processo l’enzima ripristina il legame fosfodiesterico ricavando l’energia dall’idrolisi del precedente legame temporaneo. 2. Topoisomerasi 2 → formata da due subunità che possiedono un sito attivo di tirosina e taglia entrambi i filamenti cambiando il Lk di due unità. LA CROMATINA La cromatina è la forma condensata del DNA, necessaria per poterlo inserire all'interno del nucleo in maniera organizzata. Esso è comunque organizzato in maniera tale da poter essere letto, duplicato e trascritto. Ovviamente tutto ciò negli eucarioti ha anche un risvolto negativo, ovvero quello di rendere illeggibile il DNA alle proteine o ad altre molecole che dovrebbero interagire con esso (essendo tutto condensato). La cromatina, quindi, regola la trascrizione del DNA. BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 9 All’interno del nucleo di una cellula sono presenti zone molto condensate, in cui la cromatina prende il nome di eterocromatina, e zone poco condensate in cui è presente eucromatina. Naturalmente è più semplice trascrivere un gene in una regione in cui la cromatina è poco condensata, perché è più accessibile. Di contro, anche la semplice condensazione del DNA è un metodo per modulare l'espressività del DNA. Importante è ricordare che negli eucarioti, la condensazione del DNA dipende dalla fase in cui si trova la cellula: nell'interfase la cromatina è rilassata; quando la cellula va in mitosi la cromatina, dopo essere stata duplicata, si condensa al massimo formando le classiche strutture tipiche della mitosi: i cromosomi. Abbiamo già detto che in interfase la cromatina è decondensata: la forma più rilassata della cromatina ha un diametro di 10 nm ed assomiglia ad una collana di perle (eucromatina). Le “palline” della collana di perle sono i nucleosomi ovvero l'unità elementare della cromatina. Il livello di condensazione successivo comporta l’aumento del diametro del DNA da 10 nm a 30nm e già in questo passaggio l'accessibilità delle proteine al DNA è inferiore. Il nucleosoma è una struttura composta da un'unità centrale proteica (core-istonico) discoidale e attorno al core-istonico il DNA a doppio filamento si avvolge facendo circa 1,65 giri. Tra due nucleosomi naturalmente c'è un filamento a doppia catena di DNA che viene chiamato DNA linker. Questi 1,65 giri sono composti da circa 147 paia di basi. Il DNA linker ha una sequenza variabile che si aggira attorno qualche decina di nucleotidi. Ma qual è la composizione del core-istonico? È un ottamero, composto quindi da 8 subunità proteiche (istoni) che interagiscono fra di loro con interazioni deboli. Queste interazioni deboli rendono facile il disassemblamento degli ottameri, durante la duplicazione (hanno un grande ingombro sterico che impedirebbe la replicazione). I vecchi nucleosomi hanno memoria di cos’erano e che modificazioni avevano, mentre quelli nuovi non lo sanno. Il disassemblamento è funzionale perché successivamente il nucleosoma si riassembla con porzioni vecchie e nuove; quindi, la distribuzione dei vecchi istoni facilita la propagazione delle modificazioni parentali. Gli istoni sono di 5 tipi: 1. H1 (interviene in un livello di condensazione superiore alla collana di perle) 2. H2A 3. H2B 4. H3 5. H4 Le proteine istoniche sono piccole (massimo un paio di centinaia di amminoacidi) e presentano una grande percentuale di amminoacidi carichi positivamente (lisina e arginina). Sono carichi positivamente perché attorno a loro è presente il DNA, che è carico negativamente per via dello scheletro fosfodiesterico: in questo modo essi si attraggono a vicenda. Il core-istonico è quindi formato da 2 H2A, 2 H2B, 2 H3 e 2 H4 (8 istoni in totale). Se guardiamo dal punto di vista evolutivo queste proteine, esse sono le più conservate. L'altro aspetto da considerare è la composizione delle proteine istoniche, perché in esse possiamo riconoscere una struttura che vede la presenza di una regione centrale simile tra i 4 istoni e dalla regione centrale si dipartono delle code cariche positivamente: la coda che protrude di più dalle code istoniche è la regione N-terminale. BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 10 Come si assembla la cromatina Al tempo t0 le proteine istoniche devono interagire con il DNA, per fare in modo che esso si distorca e si avvolga attorno agli istoni. È importante ricordare che le sub-unità istoniche non intervengono in maniera indipendente e singola, ma si preformano dei complessi istonici di due tipi: si generano subito due eterodimeri H2A-H2B e successivamente subentra un eterotetramero H3-H4. Qual è l'ordine attraverso il quale si assemblano sul DNA nudo? Il primo che interviene è il tetramero H3, H4 che si complessa con il DNA lineare nudo e attraverso questa interazione il tetramero H3-H4 comincia a piegare attorno a sè il DNA. Come fa il tetramero H3-H4 a distorcere la doppia catena? Lo fa perché le proteine istoniche H3 e H4 ingaggiano numerose interazioni con il DNA, sia con lo scheletro fosfodiesterico, sia stabilendo numerosi ponti H con il solco minore della doppia elica e queste interazioni forzano la curvatura del DNA e facilitano l’assemblaggio del nucleosoma. Solo successivamente interverranno i due eterodimeri H2A-H2B a formare il core-istonico, tramite interazioni proteina-proteina fra i due istoni. Senza le code N-terminali l’ottamero si può formare lo stesso. Che importanza hanno, quindi, queste code? In un core-istonico abbiamo 8 code N-terminali che protrudono fuori dalla struttura istonica, formando dei “denti” che fanno in modo che il DNA sia vincolato e non possa scivolare via. Al DNA che si avvolge attorno al disco istonico vengono imposti superavvolgimenti negativi in maniera tale che sia prono ad aprirsi localmente (come dimostrato dal concetto relativo alla topologia del DNA). Per ora il filamento a 10 nm è la forma meno condensata del DNA (ordine di grandezza 6x): questa è l'eucromatina. Nel passaggio da 10 nm al filamento a 30 nm (verso l’eterocromatina), interviene il quinto istone, ovvero l'H1. L'istone H1, che non appartiene all’ottamero istonico, interviene in maniera singola andando ad interagire con il DNA nella regione centrale del nucleosoma e con uno dei due tratti di DNA linker. Esso, infatti, sceglie uno dei due linker e lo avvicina all'altro, avvicinando quindi tra di loro i nucleosomi e rendendo il tutto più condensato e impacchettato. Ecco qui che siamo passati ad una fibra a 30 nm. Questo passaggio ci porta ad una fibra che ha un ordine di grandezza 40x rispetto alla condensazione del DNA lineare nudo. BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 11 Sono presenti due modelli che descrivono la struttura a 30 nm: A Solenoide (visto in sezione trasversale esso ha la forma di un sole) A Zig-zag. Insieme all’istone H1, contribuiscono a mantenere condensata la struttura a 30 nm anche le code istoniche, che protrudono dal core-istonico e fanno in modo che un nucleosoma interagisca con in nucleosomi adiacenti (code istoniche a prevalente carica positiva, creano interazioni con il DNA avvolto a nucleosomi adiacenti, che è negativo). Tutte le volte che verrà favorita l'interazione fra un nucleosoma e quelli vicini, la cromatina sarà condensata; tutte le volte che si interferirà con le interazioni delle code N-terminali con i nucleosomi vicini, la cromatina verrà decondensata. Naturalmente intervengono altre proteine che rendono conto dell'impacchettamento in strutture superiori, per poi formare i cromosomi lineari veri e propri. Lo scaffold cromosomico è l'impalcatura del DNA, sul quale il DNA stesso, con le fibre a 30 nm, si avvolge formando dei domini ad ansa, che rappresentano il 3° livello di condensazione, raggiungendo così un diametro di 300 nm. Se facciamo uno zoom sulle anse (che sono composte da 50 o 100 kbasi) notiamo delle unità trascrizionali distinte, ovvero dei geni. A livello delle anse il DNA può essere condensato o meno e in alcuni punti può anche essere spacchettato e non complessato agli istoni. Assieme alle proteine che compongono lo scaffold cromosomico, troviamo anche delle proteine con attività isomerasiche (topoisomerasi) che rimuovono i superavvolgimenti dove necessario. Tutto questo processo risulta altamente dinamico e l’accessibilità del DNA nei nucleosomi cambia con le diverse esigenze della cellula. Uno srotolamento più o meno rilevante del DNA, senza distacco, può liberare siti di legame specifici per certe proteine. In generale, più i siti sono interni al nucleosoma, meno sono accessibili. Molti complessi proteici influenzano il posizionamento dei nucleosomi e le interazioni DNA-istoni e vengono chiamati complessi di rimodellamento dei nucleosomi. Questi complessi sono in grado di spostare gli istoni, di far scivolare i nucleosomi e di rendere accessibili delle zone del DNA (che prima non lo erano) per la trascrizione. Questi complessi sono molto grandi, possiedono fino a 14 sub-unità e sono ATP dipendenti. Esistono delle regioni in cui i nucleosomi sono posti in maniera casuale, così come esistono regioni in cui i nucleosomi sono saldamente posizionati, in modo ordinato, a livello delle regioni regolatrici, per rendere appunto più accessibile delle zone per l'espressione genica. Come faccio a determinare se i nucleosomi sono posizionati casualmente o in modo ordinato in certe regioni specifiche? Partendo dal presupposto che si lavora sempre su grandi numeri, il sito di accesso per una proteina è maggiormente accessibile sul DNA linker, piuttosto che nel DNA arrotolato al BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 12 nucleosoma. Dal momento che non si può vedere una proteina che si lega, ma sono visibili solo gli effetti che questa provoca legandosi, per mappare tutti i punti in cui si lega una proteina, posso tagliare il DNA attraverso endonucleasi aspecifiche che tagliano il DNA a prescindere dalla sequenza. Se i nucleosomi fossero in posizioni random, utilizzando una nucleasi e liberando i frammenti di DNA che si sono generati, otterrei una serie di frammenti casuali che, tramite l’elettroforesi su gel apparrebbero non allineati, ma posizionati in maniera casuale. Se invece i nucleosomi sono posizionati regolarmente, non ho più punti di taglio casuali, ma in ogni cellula i punti di taglio saranno gli stessi, così come i frammenti che si generano (ottengo frammenti allineati nell’elettroforesi). CODE ISTONICHE E MODULAZIONE DELL’ESPRESSIONE GENICA Abbiamo detto che le code istoniche hanno due importanti compiti: il primo è di protrudere e bloccare il DNA imponendo superavvogimenti negativi che rendono il DNA prono all'apertura locale; il secondo è che le code istoniche protrudono dal core per fare interagire i nucleosomi fra di loro stabilizzando l'eterocromatina della fibra a 30 nm. Questo equilibrio vede un ruolo chiave nelle code istoniche, in che modo? Ricordiamo che le code istoniche possiedono amminoacidi carichi positivamente. Le catene laterali degli amminoacidi che compongono le code istoniche possono andare in contro a modificazioni biochimiche reversibili, che rendono queste code meno prone ad interagire con i nucleosomi vicini (sfavorendo così la fibra a 30 nm e favorendo quella a 10 nm). Possono esserci almeno 3 tipi di modificazioni covalenti: 1. Acetilazione → in condizioni normali la lisina è carica positivamente e in condizioni fisiologiche ingaggia con la cromatina delle interazioni elettrostatiche. Esistono a livello della cromatina degli enzimi (acetil-transferasi) che sono in grado di modificare la catena laterale della lisina aggiungendo un gruppo acetile, secondo un processo che prende il nome di acetilazione delle catene laterali delle code istoniche, che neutralizza la carica positiva della lisina. Qual è l'effetto dell'acetilazione della lisina? Se prima la lisina interagiva con le catene negative stabilizzando le fibre a 30 nm, nel momento in cui la lisina viene acetilata, non ha più la carica positiva e non può più ingaggiare quel legame ionico della fibra a 30 nm, favorendo così la decondensazione della cromatina in quel punto, arrivando alla fibra a 10 nm. Le deacetilasi, invece, sono enzimi che eliminano il gruppo acetile, favorendo la ricomparsa della carica positiva e la ricondensazione della cromatina 2. Metilazione → processo che avviene tramite enzimi denominati metil-transferasi che aggiungono gruppi metilici agli istoni e le demetilasi li rimuovono, andando a favorire o sfavorire la condensazione e quindi l'espressione genica 3. Fosforilazione. È stato fatto solamente l’esempio della lisina, ma ovviamente tutte le code istoniche possono essere modificate in più punti e anche contemporaneamente e in modo diversi. Il codice di modifica delle code istoniche è tutt'altro che banale ed è ancora in fase di comprensione. A seconda di quale sia la firma (il profilo di modificazione degli amminoacidi dei vari istoni) noi abbiamo un network di interazioni che può favorire o sfavorire la condensazione nel punto in cui è avvenuta la modificazione, rendendo accessibili o inaccessibili sequenze geniche ben definite. Esistono due meccanismi di modifica dei nucleosomi che influenzano l'impacchettamento della cromatina: BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 13 1. Meccanismo diretto → attraverso metilazioni, fosforilazioni e acetilazioni degli amminoacidi delle code istoniche. Esempio: l’enzima acetiltransferasi viene reclutato da una proteina e trasferisce un gruppo acetilico sulle lisine, modificando i nucleosomi e aumentando l’accessibilità del DNA legato. Ciò cambia localmente la struttura della fibra da 30 nm a 10 nm. Questa modificazione è già sufficiente a decondensare la cromatina, rendendo accessibili regioni del DNA a cui possono legarsi altri elementi per la trascrizione. 2. Meccanismo indiretto → le lisine cariche positivamente vengono acetilate, in modo da avere un primo effetto di decondensazione, che tuttavia potrebbe essere insufficiente. Esistono dei complessi macromolecolari che contengono proteine con regioni specifiche (= domini funzionali), in grado di riconoscere la regione acetilata o metilata. Questi domini funzionali che riconoscono le code acetilate delle lisine si chiamano bromodomini. Molto spesso queste proteine contenenti bromodomini, contengono complessi di rimodellamento della cromatina, che vanno poi a rimodellare la cromatina solo dopo aver riconosciuto l'acetilazione. Alla pari del meccanismo delle acetilazioni, un altro metodo indiretto vede come protagoniste le metilazioni con le metiltransferasi, in cui sono presenti regioni chiamate cromodomini, che riconoscono le regioni metilate. Ci sono elementi di sequenza sul promotore a cui si legano fattori sequenza-specifici (fattori di trascrizione) tramite una regione chiamata DNA binding-protein. Si possono instaurare interazioni proteina-proteina che reclutano l’RNA polimerasi per la trascrizione. Quindi il fatto che una proteina si trovi in un punto specifico del DNA, non significa che essa sia in grado di riconoscere quella specifica sequenza. Se lo fa si tratta di un meccanismo diretto (la proteina contiene un DNA binding-protein o RNA binding-protein e riconosce direttamente la sequenza), se non lo fa si tratta di un meccanismo indiretto (qualcuno prima di lei riconosce quella sequenza e recluta la proteina). LA REPLICAZIONE DEL DNA Prima parte DISASSEMBLAGGIO DEGLI ISTONI Assumiamo che in un punto qualsiasi ci sia la sequenza di inizio della duplicazione, ovvero il punto in cui il DNA a doppio filamento dovrà essere denaturato localmente per formare la forca replicativa. In questo punto intervengono vari enzimi e si forma una regione con l'elica aperta, ma sia avanti che dietro il DNA è avvolto ai nucleosomi. Cosa capita? Subito agli estremi della forca replicativa, si assemblano delle macchine molecolari, ovvero i replisomi, complessi di enzimi e proteine che BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 14 risolvono le difficoltà strutturali e chimiche della replicazione del DNA. Se la DNA polimerasi avanza, infatti, non potrà permettersi di aprire il DNA avvolto ai nucleosomi e capita che avanti gli istoni devono essere rimossi e dietro il DNA deve essere nuovamente avvolto attorno agli istoni. Ma come viene disassemblato il core istonico? Stessa cosa dell'assemblamento ma al contrario: esso si disassembla in 2 eterodimeri H2A, H2B e eterotetrameri H3, H4. Nel riassemblaggio degli istoni (in parallelo alla duplicazione del DNA) sarà anche necessaria una sintesi di nuovi istoni. Dove si assemblano? In che modo? Quando si riassemblano i core istonici sui nuovi filamenti appena duplicati, c'è un rimescolamento casuale tra tutti gli eterodimeri ed eterotetrameri che abbiamo a disposizione. Che senso ha il rimescolamento? E come fa la cellula a sapere dove mettere l'istone e quindi a capire quale regione del DNA deve essere condensata e quale no, per modulare l'espressione genica? Gli istoni vecchi hanno le code istoniche modificate, mentre quelli nuovi no. Rimescolando il tutto, ci portiamo dietro, mantenendo le modifiche covalenti sulle code istoniche vecchie, la memoria di come erano configurate le code istoniche prima della duplicazione, in maniera tale da ricordare anche il grado di condensazione di ogni singolo tratto di DNA. Rimescolando infatti, il risultato è quello di avere una memoria delle modificazioni delle code istoniche. Questo processo si chiama imprinting: una volta che la cromatina è stata modificata e condensata, fornisce informazioni alle doppie eliche figlie su come era prima. DNA POLIMERASI La DNA polimerasi, per lavorare, ha bisogno di uno stampo (templato), ovvero di un singolo filamento che verrà utilizzato per sintetizzare il filamento nuovo. Inoltre, essa non è in grado di partire ex novo (a differenza dell’RNA polimerasi), ma necessita di un innesco, ovvero una regione a doppio filamento chiamata giunzione innesco-stampo. Questa regione è formata da due componenti: lo stampo è costituito dal DNA a singolo filamento, mentre l’innesco/primer è complementare allo stampo (ma molto più corto), antiparallelo e deve terminare con un gruppo 3’-OH. Questa estremità verrà allungata man mano che i nucleotidi saranno aggiunti, mentre l’estremità 5’ rimane blindata. In questo modo la DNA polimerasi estende il 3' copiando dallo stampo ed aggiungendo di volta in volta la base complementare secondo le regole dell'appaiamento di Watson e Crick. Ecco, quindi, la direzione d'estensione della DNA polimerasi, che avanza in 5'-3'. In questa attività, ovviamente, la DNA polimerasi ha bisogno dei monomeri, ovvero dei nucleotidi trifosfato, formati dalla base azotata complementare al templato, dal desossiribosio e da 3 fosfati legati al 5'. Questi 3 fosfati sono: il più vicino allo zucchero si chiama fosfato-α, quello in mezzo si chiama fosfato-ꞵ e l'ultimo si chiama fosfato- 𝛾. Come funziona la DNA polimerasi? Come fa ad aggiungere un nucleotide alla volta? È necessario che gli ultimi nucleotidi sul 3' dell'innesco siano perfettamente appaiati, altrimenti la DNA polimerasi si blocca e non riesce più a proseguire. Assumendo che nel sito attivo della DNA polimerasi arrivi l'adenina, il meccanismo è il solito, ovvero quello di un attacco nucleofilo: l'ossigeno dell'innesco (in 3’) compie l'attacco nucleofilo sul fosfato-α, rompendo il legame fra fosfato-α e ꞵ, liberando pirofosfato BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 15 e formando il legame fosfodiesterico. Appena il pirofosfato si genera, viene idrolizzato dalla pirofosfatasi inorganica che lo idrolizza in due molecole di fosfato. Questa è la ragione per cui questa reazione è irreversibile e favorita termodinamicamente. STRUTTURA DELLA DNA POLIMERASI L’enzima DNA polimerasi assomiglia ad una mano destra parzialmente chiusa, in cui sono identificabili tre componenti: il palmo, le dita e il pollice. Palmo Il palmo è composto da un foglietto ꞵ e in esso risiede il sito attivo (complementare alla base dello stampo) della DNA polimerasi, dove sono presenti i principali elementi del sito catalitico. In questa regione si trova la giunzione innesco-stampo ed è il luogo in cui vengono aggiunti i nucleotidi. Il ruolo catalitico del palmo della DNA polimerasi è quello di contribuire a mantenere la stabilità del complesso giunzione innesco-stampo. L’OH del 3’ del ribosio non sarebbe prono a fare attacchi nucleofili, ma lo è nel sito attivo, il quale contiene di norma due cationi magnesio (positivi), tenuti saldamente nel sito attivo in posizioni precise dove si coordinano con degli aspartici che sono carichi negativamente: 1. Il primo catione minimizza e scherma le cariche negative degli ossigeni del nucleotide attraverso due modi: da una parte scherma le cariche negative del nucleotide entrante (che altrimenti si respingerebbe con le cariche negative del DNA che deve essere polimerizzato) e dall'altra parte stabilizza il nucleotide stesso (presenta il ribosio senza l’ossigeno in 2’). Tutto ciò avviene con un milione di nucleotidi al secondo 2. Il secondo catione magnesio si coordina con l'OH del 3' del ribosio e rende l’O prono a fare l'attacco nucleofilo sul fosfato α. Oltre al suo ruolo catalitico, il palmo controlla anche l’appaiamento delle basi che sono appena state polimerizzate. Questa regione della polimerasi forma con le paia di basi numerosi legami idrogeno attraverso il solco minore della doppia elica neosintetizzata. Questi contatti non dipendono dalla specificità delle basi, ma si formano solamente se i nucleotidi appena incorporati si appaiano correttamente. Gli appaiamenti scorretti in questa regione ostacolano proprio i contatti nel solco minore e abbassano drasticamente la velocità di polimerizzazione. Nel caso in cui ci sia un appaiamento scorretto subentra una nucleasi con funzione di “lettore e correttore di bozze” che rimuove i nucleotidi mal appaiati (argomento approfondito più avanti). Dita Struttura ad α-elica con proteine dinamiche. Esse rappresentano la prima regione che viene in contatto con il nucleotide entrante. Sono costituite, infatti, da un anello aromatico che ben si sposa con le basi azotate (tramite interazioni idrofobiche) e presenta anche amminoacidi positivi (lisina, arginina) che accolgono e accompagnano il nucleotide entrante carico negativamente, per poi stabilizzarlo. Se l’appaiamento è corretto, la base corretta viene accolta e le dita si muovono per racchiuderla e trattenerla, permettendo agli ioni magnesio di favorire l’attacco nucleofilo del 3’ sul fosfato α. La struttura delle dita, inoltre, impone sul templato un ripiegamento di 90°, tra il nucleotide complementare a quello entrante e quello successivo (sorta di allontanamento per ridurre il margine di errore negli appaiamenti). BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 16 Pollice Il pollice non è direttamente coinvolto nella catalisi, ma interagisce con il DNA neosintetizzato esercitando un ruolo prettamente strutturale. Questa interazione serve principalmente a due scopi: - Mantenere in corretta posizione la giunzione innesco stampo man mano che la polimerasi avanza, attraverso interazioni con lo scheletro fosfodiesterico del solco minore - Stabilizza il complesso fra la DNA polimerasi e il substrato PROCESSIVITA’ DELLA DNA POLIMERASI La funzione stabilizzatrice svolta principalmente dal pollice della DNA polimerasi rende questo enzima particolarmente processivo. Con il concetto di processività si intende la capacità della DNA polimerasi di aggiungere nucleotidi rimanendo ben salda alla giunzione innesco-stampo, senza mai staccarsi. Oltre alla funzione stabilizzatrice del pollice, un ulteriore aumento della processività è reso possibile dall’interazione della polimerasi con altre proteine accessorie, come le sliding clamps (pinze accessorie) che, con la loro tipica forma a “ciambella” tengono la DNA polimerasi in sede fino al termine della polimerizzazione. Quando la polimerasi ha terminato, questa pinza di apre come un “anellino”. FEDELTA’ DELLA DNA POLIMERASI È importantissimo che la DNA polimerasi sia estremamente fedele, perché se così non fosse ci sarebbero delle distorsioni nella doppia elica del DNA che porterebbero la DNA polimerasi a non procedere nella polimerizzazione e ad agire per correggere gli errori. Assumiamo che sul templato ci sia la sequenza ATC. La DNA polimerasi deve estendere l’innesco aggiungendo, dopo il 3’, una T complementare alla A del templato, in direzione 5’-3’. In che modo la DNA polimerasi riesce ad appaiare solo la A e non le altre basi? La soluzione è proprio nel sito attivo. Se il nucleotide entrante è quello corretto (complementare), per come è conformato il sito attivo della DNA polimerasi esso si incastra alla perfezione e avviene la cosiddetta catalisi per prossimità. Vengono a formarsi delle interazioni spontanee di Watson e Crick tra le basi complementari, che permettono la formazione di un attacco nucleofilo e la DNA polimerasi potrà continuare il suo lavoro. Se il nucleotide non è quello corretto la reazione non avviene, a causa di un mancato allineamento e di un elevato ingombro sterico dei nucleotidi. BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 17 La DNA polimerasi ha una frequenza di errore che si aggira attorno a 10-5 nucleotidi (un errore ogni 100.000 nucleotidi), che risulta troppo elevata. Quindi è necessario applicare un altro meccanismo che aumenti l’efficienza di appaiamento dell’enzima. Uno dei meccanismi che inganna maggiormente la DNA polimerasi è la conversione delle basi nella loro forma tautomerica. Per questa ragione, la maggior parte delle DNA polimerasi possiede, vicino al sito attivo, un’attività di “correzione delle bozze” (proofreading activity), che porta la frequenza di errore a 10-7 (un errore ogni 10.000.000). Se, quindi, si ha un errore legato alla DNA polimerasi o ad un danneggiamento del DNA, subentra il meccanismo di correzione di bozze. Assumiamo che avvenga uno scorretto appaiamento dell'ultima base: si produce una giunzione innesco-stampo distorta, che riduce la velocità di polimerizzazione della DNA polimerasi, mentre aumenta la velocità di correzione delle bozze. Quando la DNA polimerasi rileva la presenza di un appaiamento scorretto, la giunzione innesco-stampo viene destabilizzata e perde affinità per il sito attivo della DNA polimerasi, mentre l'estremità 3’ a singolo filamento acquista affinità per una regione vicina, ovvero il sito attivo dell’esonucleasi dove avviene la correzione delle bozze. A questo livello c'è una attività esonucleasica in direzione 3'-5' che rimuove dal filamento nuovo alcuni nucleotidi fino a quando non troverà il corretto appaiamento della doppia elica. Nel momento in cui ha rimosso i nucleotidi (incluso quello errato) si rigenera una giunzione innesco-stampo corretta che ha l'opportuna affinità per il sito attivo della polimerasi. La giunzione innesco stampo corretta, quindi, torna nel sito attivo e la polimerizzazione continua. LA PCR La PCR, ovvero la reazione a catena della polimerasi (Polymerase Chain Reaction), rappresenta un metodo utilizzato per amplificare particolari segmenti di DNA in vitro. La PCR utilizza l’enzima DNA polimerasi che sintetizza il DNA (in direzione 5’-3’) su uno stampo a singolo filamento, a partire da due oligonucleotidi (o primer) di innesco complementari e antiparalleli rispetto alle sequenze che vogliamo replicare. Per fare in modo che i primer si appaino al DNA che ho in provetta, sarà necessario denaturare il DNA, in modo da ottenere un singolo strand. La PCR, infatti, funziona per cicli: se parto da un double strand DNA, la prima fase corrisponderà alla sua denaturazione, per permettere la separazione dei due filamenti e quindi l’appaiamento dei primer. Il DNA viene denaturato portandolo ad una temperatura compresa fra 94°C e 96°C e la doppia catena si apre. Nella provetta con il DNA denaturato è presente una quantità spropositata di primer, ma a 95° questi non si appaiano. Il passaggio successivo, quindi, è quello di abbassare la temperatura per permettere ai primer di appaiarsi (fase di annealing). La temperatura viene portata a 55°C e i primer andranno ad appaiarsi nella regione in cui trovano complementarietà (si lavora sempre a temperature leggermente inferiori, tipo 54-53°C). Il prossimo passaggio richiede di far lavorare la DNA polimerasi (termostabile, derivata da batteri termostabili → es. Taq polimerasi). Infine, la temperatura viene innalzata fino a 68°C e a polimerasi può estendere il frammento di interesse. BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 18 Il primo ciclo di PCR, però, non è quello produttivo, poiché si formeranno frammenti più lunghi di quelli che ci interessano realmente. Nel secondo ciclo i filamenti stampo sono di più e, denaturando la doppia catena, si ottengono 4 filamenti. Quando la DNA polimerasi estende il primer legato ad uno dei due filamenti neosintetizzati durante il precedente ciclo di sintesi, la polimerasi procede fino alla fine dello stampo e poi si stacca. Pertanto, in questo secondo ciclo, verrà sintetizzato del DNA lungo quanto le sequenza da amplificare desiderata. In seguito, ulteriori cicli di denaturazione, di innesco e di sintesi del DNA daranno origine a molecole di DNA che corrispondono all’intervallo di sequenza delimitato dai primer. La provetta, quindi, si arricchisce di frammenti con la lunghezza corretta, fino ad averne una quantità apprezzabile. Se la DNA polimerasi è fedele, otterremo delle sequenze identiche a quelle che avevamo sul genoma. L’andamento della PCR ha una fase esponenziale (2n) e ad un certo punto raggiunge un plateau, in cui otteniamo circa 10/12 copie di DNA. Il volume delle provette usate in laboratorio è di circa 25-50 μL, in modo da poter sfruttare la capacità termica dell’acqua: provette piccole permettono di alzare e abbassare la temperatura dell’acqua più velocemente (se voglio produrre più velocemente copie del genoma non aumento il volume delle provette ma il numero). Quindi, in un DNA molto concentrato, appena si alza la temperatura per denaturare il DNA e poi la si riabbassa a 55°C, nel passaggio da 95°C BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 19 a 55°C, alcuni frammenti si riappaiano come prima. Inoltre, il fatto che la PCR non proceda all’infinito, è determinato anche dalla quantità di primer che abbiamo a disposizione e dall’attività della Taq polimerasi I primer non sono né corti, perché altrimenti sarebbero aspecifici e non sono nemmeno costituiti da più di 30 nucleotidi, perché la tm sarebbe talmente elevata che non potremmo mai lavorare a temperature così alte. L’ideale sarebbe che tutti i primer avessero la stessa tm. Il prodotto della PCR Il prodotto della PCR è chiamato amplicone. Ma come facciamo a sapere che il frammento ottenuto sia quello corretto? Innanzitutto si fa un’elettroforesi su gel: all’interno dei pozzetti inserisco l’amplicone e dei controlli che rendano credibile il risultato della PCR. In particolare, ci sarà un controllo positivo costituito da un campione che contiene con certezza la sequenza di interesse, e un controllo negativo che rappresenta ciò che non bisogna ottenere con la PCR (se ottengo il controllo negativo significa che la mia PCR è stata contaminata). Una volta fatta l’elettroforesi, quindi, si ottiene la banda corrispondente al controllo positivo, ma come faccio a sapere che la banda ottenuta ha esattamente lo stesso numero di paia di basi del controllo positivo? Ci sono alcuni parametri da considerare quando si svolge un’elettroforesi su gel: voltaggio del campo elettrico, concentrazione salina della soluzione tampone, percentuale di concentrazione del gel (più è concentrato e più le maglie sono strette), il tempo, le dimensioni. Pertanto, è necessario un “paletto” che, considerati specifici parametri, mi dica esattamente da quante paia di basi è composta la mia sequenza. A questo scopo vengono utilizzati dei marcatori di dimensioni, ovvero una serie di frammenti di DNA a doppia catena, di cui conosciamo le dimensioni. Spesso, però, il frammento di interesse non coincide esattamente con il nostro marcatore e siccome non c’è una perfetta linearità nella “corsa” dei frammenti di DNA, non esiste una formula che mi permetta di calcolare esattamente il numero di basi, ad esempio attraverso una semplice proporzione. Dobbiamo quindi costruire degli assi cartesiani dove la variabile indipendente (x) è rappresentata dalla dimensione dei frammenti, mentre la variabile dipendente (y) è rappresentata dalla migrazione intesa come distanza a partire dal pozzetto (unità di misura in cm). L’andamento della funzione che otteniamo sul grafico non è necessariamente lineare, ma ci permette di ottenere una curva di calibrazione. Quindi, prendendo il nostro frammento ottenuto dalla PCR, sapendo di quanti centimetri ha migrato dal pozzetto e interpolando la curva, otteniamo il numero di basi da cui esso è composto. Questo ragionamento può essere applicato anche a RNA e proteine. OVERLAP PCR Si tratta di una variante della PCR, utilizzata principalmente per inserire specifiche mutazioni (sostituzioni, inserzioni o delezioni) in specifici punti all’interno di una sequenza di DNA. Per inserire una mutazione in una sequenza di DNA, viene realizzato uno specifico primer, definito primer chimerico. Il primer chimerico può contenere una singola sostituzione di una base o una nuova sequenza aggiunta in posizione 5’ (in 3’ deve essere, invece, complementare per potersi attaccare al filamento stampo e per permettere alla DNA polimerasi di sintetizzare un nuovo filamento). Quindi, si sfrutta la capacità di questi oligonucleotidi di appaiarsi al filamento di DNA anche se la sequenza non è perfettamente complementare. Una volta che il primer chimerico si è attaccato al templato, la DNA polimerasi può procedere con l’aggiunta dei nucleotidi complementari, inserendo anche quelli complementari alla sequenza mutata. Così facendo si produce una molecola a doppio filamento con un BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 20 errore (mismatch). Il doppio filamento creatosi, formato da un filamento contenente la mutazione e uno originario, viene denaturato e un secondo primer si attacca al filamento di DNA neosintetizzato, contenente il primo primer. La replicazione prosegue per produrre filamenti della sequenza desiderata, contenenti la mutazione. Mutagenesi Processo attraverso cui si cambia la sequenza nucleotidica che porta ad un cambio della sequenza amminoacidica. Si sfrutta l’appaiamento del primer con un mismatch tenendo la temperatura di annealing più bassa rispetto all’ideale. Dal secondo ciclo in poi il cambio indotto verrà incorporato. I due filamenti con mutagenesi sono complementari nelle regioni dei primer, quindi c’è la possibilità che si appaino dopo che è avvenuta la denaturazione (si generano due eteroduplex) → la regione di overlap sono i primer. PCR QUANTITATIVA: REAL-TIME PCR Consideriamo di avere due provette: 1. Una provetta x, con 103 copie di DNA 2. Una provetta y con 104 copie di DNA Faccio la PCR e dopo 30/35 cicli si raggiunge il plateau. Quando sequenzio il gene con elettroforesi ottengo una banda che è l’amplicone. Se poi faccio la densitometria delle bande, siccome è stato raggiunto il plateau, la densità delle bande sarà identica. Quindi, facendo una PCR a plateau, non posso accorgermi se in una provetta fosse presente più o meno materiale in partenza. Se è vero che al plateau si raggiunge lo stesso numero di copie per 25 μL di soluzione, osservando invece la quantità di amplicone lontano dal plateau si possono notare alcune differenze. Se l’andamento è esponenziale per entrambe le quantità di materiale e siccome entrambe raggiungono 1012 copie, la provetta y arriva prima a plateau, poiché possiede un numero di copie di genoma di un ordine di grandezza superiore rispetto alla provetta x (PCR semiquantitativa). Durante la PCR in corso (prima del raggiungimento del plateau) si possono prelevare alcuni microlitri di soluzione che, se caricati sull’elettroforesi, mostrano come a seconda del numero di cicli effettuati (15, 20, 25, 30) si possono ottenere bande con diverse densità per le due provette. Quindi, solo lavorando a cicli lontani dal plateau si può determinare quale delle due provette contenesse più materiale. Durante la fase esponenziale della PCR, la quantità di copie prodotte è proporzionale al numero di copie di partenza; ciò è rilevabile grazie alla misurazione in “tempo reale” della fluorescenza emessa da fluorofori usati per marcare gli ampliconi durante l’amplificazione. Il principio base della PCR quantitativa è che maggiore è il numero delle “molecole stampo” presenti all’inizio della reazione e minore sarà il numero di cicli necessari per raggiungere un determinato valore minimo di ammontare di prodotto (Cycle threshold = ciclo soglia → momento in cui lo strumento rileva la fluorescenza e dipende dalla quantità del materiale di partenza). Quindi c’è un’inversa proporzionalità tra il numero di molecole di partenza e il tempo necessario per raggiungere il ciclo soglia. BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 21 Come vengono marcati gli ampliconi? Esistono due sistemi: Più economico e meno preciso → si utilizzano dei coloranti fluorescenti (DNA Binding Dyes) non specifici, che si legano al solco minore del DNA e la lunghezza d’onda emessa dal colorante viene identificata dal macchinario usato durante la PCR. Dopo l’annealing dei primer, si legano poche molecole fluorescenti alla doppia elica, ma non in corrispondenza di sequenze specifiche, bensì in punti qualunque del DNA. Durante l’elongazione, quindi, si verifica un aumento di fluorescenza che corrisponde all’aumento del numero di copie dell’amplicone, portando così ad una sovrastima della fluorescenza. Più costoso e accurato → sfrutta sistemi sequenza-specifici. Con questo metodo è possibile misurare solo un amplicone target: accanto ai due primer canonici della PCR viene aggiungo un terzo corto oligonucleotide, ovvero una sonda (probe), marcata e disegnata per ibridare specificamente, attraverso interazioni di Watson e Crick, l’amplicone bersaglio. La sonda ha 2 gruppi chimici legati: 1. Una molecola fluorescente (fluoroforo) con capacità di emettere fluorescenza a una determinata lunghezza d’onda 2. Un quencher che assorbe la luce emessa dal fluoroforo e quindi lo maschera Per cui, quando le due molecole sono vicine, non c’è fluorescenza. Durante la fase di annealing la sonda si appaia, così come si appaia il primer che dà la giunzione innesco- stampo della polimerasi. Ad un certo punto la DNA polimerasi incontra la sonda e siccome possiede attività esonucleasica (5’>3’) degrada la sonda e libera il fluoroforo dal quencher, permettendo conseguentemente l’emissione luminosa. L’approccio quantitativo può essere di due tipi: Assoluto → questo approccio si usa tutte le volte che abbiamo a disposizione del genoma (ad esempio virale) di cui conosciamo esattamente la concentrazione assoluta, ovvero il numero di copie. Si utilizza una curva di calibrazione derivata da diluizioni seriali di uno standard di riferimento (può essere un frammento di dsDNA o ssDNA prodotti in vitro e che ricalchi la sequenza di interesse). La curva di calibrazione si ottiene attraverso un grafico dove la variabile indipendente (x) è rappresentata dal numero di copie e la variabile dipendente (y) è il numero di cicli, compreso il ciclo soglia. Si deve essere certi, tuttavia, che l'efficienza della PCR sia la stessa per i campioni noti e per quelli incogniti Relativo → è un metodo più semplice, che richiede la quantificazione dell’espressione di geni di controllo (o geni costitutivi) per normalizzare l’espressione del gene studiato (target). I risultati dell’elaborazione, quindi, non sono espressi come quantità di mRNA/DNA presenti nel campione, ma come rapporto tra target/controllo. Tuttavia, la selezione dei geni di controllo adatti può causare problemi, poiché possono non essere espressi ugualmente attraverso tutti i campioni incogniti. Se si fa una PCR quantitativa (solo dopo aver retro-trascritto l’RNA in DNA, altrimenti non posso fare la PCR), si usa la sonda specifica e si verifica dopo quanti cicli si ha il ciclo soglia, chi, fra il target e il controllo, ha il ciclo soglia inferiore è possibile che abbia il gene espresso di più, ma non si ha nessuna garanzia che nelle due condizioni di partenza si avesse lo stesso numero di cellule. A questo proposito subentra il processo di normalizzazione, che si pone come obiettivo quello di minimizzare gli errori dovuti a differenti quantità nei materiali di partenza. La tecnica della PCR quantitativa relativa parte dal presupposto che se ho un gene target di cui voglio verificare l’espressione, lo confronto (lo normalizzo = mettere a denominatore la quantità) con l’espressione di un gene ubiquitario, di controllo (gene housekeeping). Quindi, co-amplifichiamo BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 22 un gene esogeno (housekeeping) con il nostro target, in modo da normalizzarlo. L’housekeeping è sempre lo stesso, ciò che cambia sono le curve prima e dopo il trattamento. DIGITAL PCR Evoluzione della PCR: Endpoint PCR (prima generazione) Real-time PCR (seconda generazione) Digital droppler PCR (terza generazione) Invece che avvenire in provetta, esiste un macchinario che prende la soluzione della PCR ed emulsiona i 25μL facendoli diventare goccioline da 1 picolitro che contengono un solo templato che può essere modificato. È molto costosa. SEQUENZIAMENTO GENICO (sequenziamento di Sanger) Come sfruttare la PCR per sequenziare il DNA? Si sfrutta una reazione simile alla PCR, chiamata “primer extension” in cui si utilizza un primer solo. Accanto ai nucleotidi trifosfato comuni della PCR viene inserito un nucleotide anonimo che manca dell’ossigeno sia in 3’ che in 2’ (dideossinucleotide). Al deossinucleotide manca, invece, l’ossigeno solo in 2’. Se, durante il processo, entra il deossinucleotide (quello classico) che ha l’ossigeno in 3’, la polimerizzazione può proseguire. Se la polimerasi incorpora il dideossinucleotide, nel passaggio successivo non si po' continuare la sintesi, perché manca l’ossigeno in 3’ per l’attacco nucleofilo. Quindi il dideossinucleotide è un terminatore, oltre il quale non si possono più polimerizzare i nucleotidi. A seconda del dideossinucleotide che la polimerasi aggiunge (con A,T,C o G) avremo frammenti di lunghezze diverse a partire dallo stesso stampo. Mettendo i frammenti in elettroforesi si ottiene la sequenza complementare al filamento stampo. BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 23 Seconda parte Se in vitro la replicazione del DNA risulta relativamente semplice, in vivo la situazione è un po’ più complessa. In vivo, la DNA polimerasi è affiancata da un complesso di enzimi e proteine chiamato replisoma, dove ognuno svolge un compito ben preciso per favorire la replicazione del DNA. L’origine di duplicazione corrisponde ad un punto, all’interno del cromosoma, in cui proteine sequenza-specifiche denaturano localmente l’elica (principalmente in corrispondenza di A-T) creando una bolla replicativa. Le “estremità” della bolla replicativa vengono chiamate forcelle replicative, le quali avanzano in maniera simultanea sia a destra che a sinistra. Nella maggior parte dei procarioti il DNA è circolare e l’origine di replicazione è una sola, quindi le forcelle replicative saranno due. Saranno presenti due replisomi (uno per ogni forca) e ad un certo punto queste si incontreranno (non ci sono estremità). La duplicazione del DNA circolare, se le due forche replicative avanzano con la stessa velocità, terminerà dalla parte opposta alla formazione della forca di replicazione. I cromosomi eucariotici lineari e molto estesi, invece, hanno più origini di replicazione, in modo che la replicazione parta in più punti contemporaneamente e si svolga in linea con le tempistiche. Primasi (RNA polimerasi) Come è già stato sottolineato più volte, la DNA polimerasi non è in grado di sintetizzare ex novo un filamento di DNA, ma necessita di un aiuto. Essa, pertanto, sfrutta l’aiuto di una RNA polimerasi, la primasi, che deposita alcuni piccoli primer (5-10 nucleotidi) sui due filamenti denaturati. I primer hanno una direzionalità e devono essere appaiati in maniera antiparallela. Siccome la DNA polimerasi lavora in direzione 5’>3’, sintetizzando nucleotidi sul filamento guida (leading strand), il problema sorge nella sintesi dei filamenti orientati in direzione opposta, quindi 3’>5’ (lagging strand). Essi, infatti, possono essere duplicati solo quando alcune primasi inseriscono, a momenti alterni, dei primer ai quali la DNA polimerasi si può legare per sintetizzare. Attraverso questo meccanismo si formano dei frammenti di DNA chiamati frammenti di Okazaki, più lunghi nei batteri (1kbase) e più corti negli eucarioti (alcune centinaia di nucleotidi). Quindi, se nel filamento guida è richiesto un unico primer a RNA, la sintesi del filamento discontinuo è possibile a patto che venga sintetizzato un primer per ogni frammento di Okazaki. È anche vero che tanto più la primasi deposita i primer e tanto più corti saranno i frammenti di Okazaki. Negli eucarioti, ad esempio, la DNA polimerasi deposita 1000 nucleotidi al secondo. Affinché la replicazione del DNA sia completa, è necessario che su entrambi i filamenti (continuo e discontinuo) vengano rimossi i primer utilizzati per la sintesi e che vengano sostituiti con desossiribonucleotidi. A questo proposito subentra un meccanismo, che può essere comparato ad un meccanismo di riparazione, che rimuove i primer di RNA e li rimpiazza con BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 24 frammenti di DNA. Il compito è affidato all’enzima RNasi H (H significa “ibrido”, RNA:DNA hybrid) che rimuove tutti il primer, eccetto l’ultimo ribonucleotide legato covalentemente al nucleotide di inizio del DNA, il quale viene rimosso da un’attività esonucleasica. La rimozione dei primer provoca la formazione di gap sul dsDNA e proprio in corrispondenza di questi vuoti si trova una giunzione innesco-stampo che permette alla DNA polimerasi di agganciarsi e di riempire i gap fino a quando non si ricostituisce un doppio filamento, formando così un DNA completo. Per questo meccanismo vengono usate DNA polimerasi poco processive, poiché devono essere sintetizzati solamente una decina di nucleotidi. DNA elicasi Le DNA polimerasi generalmente non sono in grado di separare i due filamenti del DNA appaiati. Pertanto, a livello della forcella replicativa, agisce una particolare classe di enzimi, le DNA elicasi, che catalizzano la separazione dei due filamenti operando attraverso meccanismi ATP-dipendenti. Si tratta di proteine esameriche a forma di anello, con un foro centrale di diametro 13 A, che circondano uno dei due filamenti vicino alla forcella replicativa dove è presente la giunzione fra il singolo e il doppio filamento. Sono proteine che operano in modo altamente processivo, rimanendo legate al filamento di DNA fino alla fine del loro lavoro. Ma l’elicasi come fa a legarsi ad un singolo filamento se l’elica è ancora chiusa e quindi doppia (diametro circa 20 A)? Qualcuno prima di lei riconosce l’origine di replicazione, distorce l’elica e la apre leggermente, per permettere all’elicasi di inserirsi e di procedere. Ciascuna delle 6 subunità dell’elicasi possiede un’ansa proteica, che lega un fosfato dello scheletro del DNA e i due ribosi adiacenti. Ogni subunità si trova in uno stadio diverso nel processo di traslocazione del DNA. Nell’insieme le interazioni tra le diverse subunità e il DNA rivelano come il movimento coordinato di queste anse proteiche possa tirare il ssDNA facendolo passare attraverso il poro centrale dell’elicasi. Una subunità inizia con il legare il ssDNA in cima alla struttura, quindi l’ansa di legame al DNA con successivi cambiamenti di conformazione si muove verso il basso portando con sé il DNA legato. La conformazione più in alto è legata all’ATP, quella centrale all’ADP e quella in basso non è legata a nessun nucleotide. Mano a mano che una singola subunità lega, idrolizza e rilascia ATP, passando dalla conformazione in alto a quella mediana e a quella in basso. Nell’insieme possiamo immaginare che l’elicasi abbia sei mani che tirano una fune spostandosi di volta in volta. BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 25 Single-strand binding proteins Una volta che l’elicasi ha separato i due filamenti il single strand “nudo” potrebbe rischiare di formare strutture secondarie e appaiamenti interni che bisogna evitare. Per questa ragione esiste una famiglia di proteine, chiamate Single-strand binding proteins (SSBP) che si legano in maniera aspecifica al single strand e lo stabilizzano. Questa stabilizzazione avviene grazie alla formazione di un legame cooperativo tra le varie SSB. Una volta che la DNA polimerasi arriva in prossimità delle SSB le spiazza (non ci stanno nel suo sito attivo). Topoisomerasi Le estremità del DNA non ruotano (sono blindate) quindi aprendo pian piano il DNA si formano dei superavvolgimenti a valle della forca replicativa. Per evitare che questi superavvolgimenti ostacolino il processo di separazione e, conseguentemente anche la duplicazione del DNA, la rimozione di questi e il rilassamento del DNA viene effettuata da topoisomerasi. Sliding clamp L'ultimo componente del replisoma è la pinza scorrevole (o sliding clamp) ovvero una proteina isomerica con un foro centrale di poco più di 20 A (diametro della doppia catena) che viene caricata sulla doppia catena a livello della giunzione innesco-stampo. In questo modo rimane ancorata e con interazioni proteina- proteina tiene attaccata la DNA polimerasi e la rende estremamente processiva. SPECIALIZZAZIONE DELLE DNA POLIMERASI Procarioti DNA polimerasi III → coinvolta nella replicazione del cromosoma. Aggiunge nucleotidi sia sul filamento guida che su quello in ritardo. È altamente processiva DNA polimerasi I → coinvolta nella riparazione e parziale rimozione dei primer a RNA, grazie alla sua attività 5’ esonucleasica. È poco processiva (aggiunge solo 20-100 nucleotidi alla volta) DNA polimerasi II → coinvolta nei meccanismi di riparazione del DNA Eucarioti Sono conosciute decine di altre DNA polimerasi. Noi considereremo solo: DNA polimerasi 𝜺 → lavora sul filamento guida DNA polimerasi 𝜹 → lavora sul filamento in ritardo DNA polimerasi 𝜶/primasi → coinvolta nell’inizio di nuove catene. È composta da 4 subunità: a due di queste è associata l’attività polimerasica, mentre le altre due hanno attività primasica L’alta processività della DNA polimerasi a livello della forcella replicativa assicura una rapida duplicazione dei cromosomi. Gli esperimenti in vitro hanno evidenziato come la DNA polimerasi, in assenza di altre proteine, risulterebbe poco processiva e tenderebbe a staccarsi dal filamento ogni 100 BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 26 bp. Per questa ragione, un elemento fondamentale per l’elevata processività della polimerasi a livello della forcella replicativa è dato dalla sua associazione con una proteina chiamata sliding clamp (pinza scorrevole) un omoesamero “a ciambella” costituito da un foro centrale in grado di abbracciare il doppio filamento di DNA. Essa viene caricata da un complesso proteico chiamato “posizionatore della sliding clamp”, attraverso un meccanismo ATP- dipendente, a livello della giunzione innesco-stampo, dove troviamo la massima affinità fra la pinza scorrevole e la DNA polimerasi, aumentando così in modo sostanziale la processività della DNA polimerasi. Nel momento in cui il complesso pinza scorrevole-DNA polimerasi termina la sintesi del nuovo filamento (sia quello veloce che quello in ritardo), la DNA polimerasi perde affinità per la pinza scorrevole. Il caricatore della sliding clamp rimuove la sliding clamp dal DNA senza necessità di idrolisi dell’ATP, ma semplicemente modificando la conformazione della pinza senza alterarne la composizione chimica. La presenza di un dsDNA induce un cambio conformazionale che riduce l’affinità della polimerasi per la sliding clamp. La DNA polimerasi viene, quindi, rilasciata e può legarsi ad un’altra giunzione primer-stampo per iniziare un nuovo ciclo di polimerizzazione. Inoltre, il caricatore della sliding clamp e la DNA polimerasi non possono interagire contemporaneamente con una pinza scorrevole, poiché queste proteine riconoscono lo stesso sito di legame sulla sliding clamp. Di conseguenza, se questa proteina è legata alla DNA polimerasi non può essere rimossa dal DNA. La pinza scorrevole è una delle strutture proteiche più conservate nel tempo. SINTESI DEL DNA: IL MODELLO A TROMBONE A livello della forca di replicazione i filamenti leading e lagging sono sintetizzati simultaneamente, cosa che porta all’importante vantaggio di limitare la quantità di ssDNA presente nella cellula durante la replicazione. Per coordinare la replicazione di entrambi i filamenti molte DNA polimerasi operano in corrispondenza della forcella replicativa. In E. coli l’azione coordinata di queste polimerasi è facilitata dal legame fisico che le tiene unite in un grande complesso multiproteico chiamato DNA Pol III oloenzima (oloenzima è un termine generico per indicare un complesso multiproteico in cui una proteina con attività catalitica è associata ad ulteriori componenti che incrementano e regolano la sua funzione). Il complesso multiproteico è costituito da tre copie della DNA polimerasi III e un caricatore della sliding clamp, il quale possiede tre copie della proteina 𝜏 che legano, attraverso dei bracci flessibili, le tre polimerasi. Di queste tre polimerasi, una insiste e duplica in maniera continua il filamento guida mentre le altre due si alternano nella replicazione del filamento in ritardo. Come possono le molteplici DNA polimerasi rimanere associate all’altezza della forcella replicativa mentre la sintesi del DNA avviene contemporaneamente su entrambi i filamenti stampo? Un modello che può spiegare questo meccanismo è chiamato “modello a trombone” e sfrutta la flessibilità della molecola di DNA e della proteina 𝜏. Il nome del modello deriva dal fatto che si genera un’ansa di ssDNA che somiglia ad uno stantuffo di una tromba. Quest’ansa si allunga e si accorcia ed è formata proprio dal filamento in ritardo. Sul filamento leader, man mano che il filamento si apre grazie all’enzima elicasi, la DNA polimerasi passa e sintetizza nucleotidi fino alla fine. A livello del filamento in ritardo, invece, la DNA BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 27 primasi si associa ripetutamente con l’elicasi e sintetizza un nuovo primer a RNA sul filamento discontinuo. Subito dopo la sintesi di un nuovo primer a RNA, il caricatore della sliding clamp assembla una sliding clamp in corrispondenza della giunzione primer-stampo appena formatasi. La seconda DNA Pol III del filamento discontinuo, non impegnata, riconosce rapidamente la sliding clamp caricata sul DNA in corrispondenza della giunzione primer-stampo e inizia a sintetizzare un nuovo frammento di Okazaki. Quando la prima DNA Pol III del discontinuo raggiunge l’estremità dello stampo su cui sta producendo il frammento di Okazaki, essa viene rilasciata dalla sliding clamp e sarà disponibile per il riconoscimento del prossimo complesso fra primer a RNA e sliding clamp. Questo modello propone, dunque, che le due DNA polimerasi del filamento discontinuo, inizino alternativamente la sintesi dei nuovi frammenti di Okazaki. BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 28 Sebbene venga chiamato “filamento lento”, il coinvolgimento di due polimerasi che operano in parallelo, fanno in modo che la replicazione su questo filamento sia comparabile a quella sul filamento leader, facendo sì, quindi, che il replisoma avanzi alla stessa velocità. Interazioni fra le proteine della forcella replicativa L’interazione più importante fra le proteine del replisoma di E. coli è quella fra la DNA elicasi e la DNA Pol III oloenzima. Questa grande affinità, mediata dalla subunità 𝜏 del caricatore della sliding clamp, forma un complesso stabile fra queste due proteine. Questa associazione, inoltre, stimola l’attività dell’elicasi, aumentandone la velocità di progressione di dieci volte. Di conseguenza, la DNA elicasi rallenta la sua velocità di separazione dei due filamenti quando si trova separata dalla DNA polimerasi. L’attività dell’elicasi accoppiata a quella della DNA polimerasi impedisce all’elica di “sfuggire” dall’oloenzima e quindi funziona come un sistema di coordinazione. Al contrario, la primasi interagisce con la elicasi in maniera debole. Sebbene questa interazione sia relativamente debole, essa stimola il funzionamento della primasi di circa 1000 volte. Dopo la sintesi di un primer, la primasi viene rilasciata dall’elicasi nell’ambiente circostante. La debolezza dell’interazione fra l’elicasi e la primasi è importante perché permette di regolare la lunghezza dei frammenti di Okazaki. Una più elevata forza di associazione determinerebbe una sintesi più frequente degli inneschi sul filamento discontinuo e conseguentemente frammenti di Okazaki più corti. Al contrario, un’interazione più debole porterebbe a frammenti più lunghi. Nei procarioti la primasi sintetizza un primer ogni secondo, lungo 1 kb. INIZIO DELLA REPLICAZIONE Se non ci fosse nessun tipo di controllo, una volta duplicato il DNA (e quindi anche il punto dal quale la duplicazione comincia), la duplicazione partirebbe nuovamente. È importante che non riparta subito perché dovrà farlo solo quando le cellule saranno divise, quindi il numero dei cromosomi e il numero di cellule deve essere mantenuto bilanciato. Procarioti Nei batteri (come E. coli) esiste una regione chiamata replicatore (oriC) che al suo interno possiede una sequenza ben specifica, riconosciuta da una proteina sequenza-specifica, chiamata origine di replicazione ed è ricca di appaiamenti A-T. La proteina che riconosce il replicatore si chiama iniziatore (DnaA nell'E. coli) e attraverso un suo dominio è capace di inserire una alpha elica nella doppia elica del DNA e attraverso l'interazione con legami reversibili del solco maggiore, riconosce specifiche sequenze nel replicatore. La proteina DnaA, interagendo con una sequenza specifica del replicatore, distorce l’elica permettendole di aprirsi localmente, in corrispondenza degli appaiamenti A-T. A questo punto DnaA inizia la fase del reclutamento delle componenti del replisoma: due elicasi, una per ogni forca e le SSBP. L'elicasi recluta a sua volta la primasi che deposita i primer, generando una giunzione innesco stampo che richiama il caricatore della pinza scorrevole e le tre subunità della DNA Pol III e la replicazione può partire. Cosa previene che la replicazione riparta subito dopo? Uno dei meccanismi che impedisce alla replicazione di ripartire subito riguarda la metilazione. (Il dna parentale è completamente metilato ed è prono all’interazione con il dna a. il dna di nuova sintesi è emi-metilato al quale si lega la seq-a). Il genoma di E. coli è estesamente metilato grazie ad un enzima BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 29 chiamato Dam metiltransferasi, che aggiunge un gruppo metilico alla A che fa parte della sequenza GATC. Normalmente tutte le sequenze GATC presenti nel genoma sono metilate. Questo stato viene modificato dopo la replicazione. Infatti, i residui di A sul filamento di neosintesi non sono metilati, per cui avremo metilazione soltanto su un filamento. Quindi, il filamento parentale è metilato, mentre l’altro, quello neosintetizzato è emimetilato. In questa condizione di emimetilazione, oriC non è più il bersaglio dell’enzima DnaA, ma viene riconosciuto dal suo alter-ego, ovvero la proteina SeqA, che possiede una forte affinità per la sequenza GATC soltanto quando è emimetilata. Qual è il compito di SeqA? SeqA svolge due importanti ruoli, che servono per ritardare l'inizio della duplicazione: Impedisce l'associazione di DnaA su oriC e quindi l’inizio di un nuovo ciclo replicativo Rallenta l'azione di Dam metiltransferasi in maniera tale da diminuire la velocità di metilazione della sequenza GATC. Esiste anche un terzo meccanismo, secondo cui DnaA, agisce solo se è legata all'ATP. Tuttavia, una volta legato il replicatore necessario per l’inizio della replicazione, l’ATP viene idrolizzata e convertita in ADP. Inoltre, le sliding clamp caricate, come conseguenza dell’inizio della replicazione, richiamano una proteina che stimola l’idrolisi dell’ATP in ADP. In questo modo la DnaA viene resa inattiva. Ci sarà bisogno di un meccanismo lento detto di “scambio del nucleotide” in cui la DnaA scarica ADP e si ricarica di ATP. Lo scambio di una molecola di ADP con una di ATP è un processo lento, che ritarda così la formazione del complesso DnaA-ATP necessario per l’inizio della replicazione. Solo dopo che la metilazione è stata ripristinata, SeqA non si legherà più, DnaA carica nuova ATP e la replicazione riparte. Eucarioti Gli eventi della divisione cellulare negli eucarioti avvengono a tempi stabiliti durante il ciclo cellulare. La replicazione avviene soltanto durante la fase S del ciclo e in questa fase tutto il DNA della cellula deve essere replicato esattamente una volta. Affinché ciascun cromosoma sia completamente replicato durante ogni fase S deve essere attivato un numero sufficiente di origini di replicazione (si stima che sui nostri cromosomi sia presente un replicatore ogni 30mila paia di basi circa). Non necessariamente tutte le potenziali origini di replicazione, però, devono essere utilizzate; al contrario, se ne venissero attivate troppo poche, parte del cromosoma potrebbe non essere replicato. Fasi della divisione cellulare: Fase G1 Fase S Fase G2 Mitosi Interfase: fase in cui la cellula non si divide Il concetto principale è che l'interazione, quindi il riconoscimento dei replicatori, è un processo distinto dalla loro attivazione e dall’inizio della replicazione, in quanto questi due eventi avvengono in fasi diverse. Durante la fase G1 si legano ai replicatori dei complessi di pre-inizio, costituiti dalla proteina ORC, da un’elicasi e dal caricatore dell’elicasi. È importante sapere che qui l'elicasi è caricata attorno ad entrambi i filamenti, ma per funzionare essa deve essere avvolta solo attorno al singolo filamento. Durante questa fase i complessi di pre-inizio sono inattivi e solo quando la cellula transiterà in fase S verranno attivati. BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 30 Quello che cambia dalla fase G1 alla fase S è che in quest’ultima aumentano i livelli di una classe di proteine dette chinasi ciclina dipendenti (CDK). In fase S, l'aumento dei livelli di CDK porta alla fosforilazione, da parte di questa proteina, di numerosi bersagli, tra i quali il caricatore dell'elicasi e l'elicasi. Il cambiamento di conformazione dell'elicasi fa sì che essa si avvolga solo ad un unico filamento in modo da poterlo denaturare formando la bolla replicativa (gli eventi che si susseguono successivamente sono uguali ai procarioti). Il caricamento dell'elicasi avviene, quindi, in fase G1, dove il complesso di pre-inizio è defosforilato; la sua attivazione, invece, avviene in fase S, dove l’aumento di CDK porta alla fosforilazione del complesso. Tuttavia, le componenti che costituiscono il complesso, possono legarsi al replicatore solo quando sono defosforilate. Quando vengono fosforilate e parte la replicazione, non possono più legarsi. BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 31 IL COMPLETAMENTO DELLA REPLICAZIONE Il completamento della replicazione del DNA richiede una specifica serie di eventi, che risultano diversi a seconda che i cromosomi siano circolari o lineari. Per un cromosoma circolare, il complesso proteico che opera in corrispondenza della forcella può replicare l’intera molecola (le due forche replicative avanzano fino a quando si incontrano). Al contrario, la replicazione delle estremità di un cromosoma lineare non può essere completata dal complesso replicativo descritto precedentemente. Il problema sussiste sui cromosomi lineari e in particolare sulle estremità dei cromosomi lineari, ovvero i telomeri. Tale problema non si presenta nella replicazione del filamento guida, poiché in questo caso un singolo primer interno innesca la sintesi di un tratto di DNA che può estendersi fino all’estremità 5’ dello stampo. Al contrario, la necessità di primer multipli per replicare il filamento discontinuo, determina l’impossibilità di ottenere una molecola di DNA neosintetizzata che raggiunga l’estremità del suo stampo. Infatti, anche se ipoteticamente l’ultimo primer di un frammento di Okazaki fosse posizionato in corrispondenza dell’ultimo nucleotide dello stampo, una volta rimosso il primer rimarrebbe una corta regione di ssDNA non replicato con un 3’-OH libero. A lungo andare, con le varie duplicazioni del DNA, avremmo un progressivo accorciamento dei cromosomi, cosa che alla fine porterebbe ad una progressiva perdita di materiale genetico e alla morte della cellula. Alcuni organismi, come alcuni batteri, virus batterici e cellule superiori, risolvono il problema usando come primer una proteina al posto di un RNA per l’ultimo frammento di Okazaki. In questo caso la “proteina primer” lega il filamento discontinuo e usa un amminoacido che fornisce un OH in grado di rimpiazzare il 3’-OH normalmente fornito dal primer. Per fare ciò la proteina primer si lega covalentemente all’estremità 5’ del cromosoma. Negli eucarioti superiori, invece, il problema viene risolto dalla telomerasi, un enzima formato da diverse subunità proteiche e da una parte di RNA (complesso ribonucleoproteico). Essa fa parte della famiglia delle DNA polimerasi e, come ogni polimerasi, agisce allungando l’estremità 3’ del suo BIOLOGIA MOLECOLARE – Prof. Mirko Pinotti (anno accademico 2022/2023) 32 substrato. Però, a differenza della maggior parte delle DNA polimerasi, la telomerasi non necessita di uno stampo esogeno per aggiungere nuovi nucleotidi, ma la componente di RNA da cui è costituita funziona come stampo endogeno per aggiungere sequenze telomeriche all’estremità 3’ del cromosoma. La telomerasi allunga il singolo filamento a partire dal 3’-OH aggiungendo delle sequenze di nucleotidi non codificanti, usando appunto il proprio RNA come stampo. La telomerasi, quindi, appartiene ad una classe di DNA polimerasi che utilizza un’attività enzimatica di trascrittasi inversa, per cui retrotrascrive l’RNA in DNA, contrariamente a quanto accade nella reazione convenzionale di trascrizione. Meccanismo d’azione della telomerasi La sequenza dei telomeri eucariotici è una sequenza che prevede la ripetizione di corte sequenze di 6 nucleotidi tipo 5’-TTAGGG-3’. La telomerasi usa la componente a RNA per