Dispense di Biologia Molecolare - PDF

1 Introduzione alla materia LA BIOLOGIA MOLECOLARE: ha come oggetto di studio la conservazione e il trasferimento dell’informazione, e l’azione concertata dei componenti molecolari che cooperano in una serie elaborata di processi per portare in vita l’informazione contenuta nel genoma. In pratica è la scienza che studia a livello molecolare i fenomeni biologici come: - struttura degli acidi nucleici - informazioni in esso contenute - le basi molecolari dell’espressione dei geni e della loro regolazione - le interazioni tra le macromolecole La biologia molecolare è alla base di tutte le biotecnologie, della Biologia dei Sistemi e della Biologia Computazionale (bioinformatica). Si affianca alla biochimica e alla genetica. Nei primi anni 50 Chargaff condusse una serie di esperimenti sulla composizione degli acidi nucleici e scoprì una regola fondamentale, ovvero che non contenevano uguale composizione dei 4 nucleotidi ma che A=T e G=C. Ovvero che per ogni adenina ci sarà una timina e per ogni guanina una citosina, deducendo così il loro appaiamento. Come fece a capire ciò? Con esperimenti di tipo biochimico di cromatografia, tecnica separativa che permette di separare le molecole (come elettroforesi e centrifugazione). Prese dna di homo sapiens, drosophila, e.coli, mais, neurosopora crassa. Dopo l’estrazione sottopose il dna a cromatografia andando a quantificare le 4 basi diverse. Osservò che le A hanno la stessa percentuale delle T e le G la stessa delle C. Ciascuna specie ha un contenuto diverso delle varie basi. REGOLE DI CHARGAFF - La composizione di basi varia da una specie all’altra - Le molecole di dna della stessa specie, da tessuti diversi, hanno la stessa quantità di basi - Tutte le nostre cellule hanno stesso genoma che non si modifica con l’età, stato di nutrizione o variazioni ambientali - In tutte le molecole il numero di residui di guanina è uguale a quelli di citosina, così come per adenina e timina. Quindi la somma delle purine è pari alla somma delle pirimidine (A+G=T+C). STRUTTURA DNA 2 La classica struttura elicoidale è stata scoperta grazie a esperimenti di diffrazione a raggi x condotti da Rosalind Franklin (che morì a 37 anni a causa dell’esposizione alle radiazioni) e Wilkins (1953). I raggi x sono radiazioni mutagene che hanno capacità di rompere dna, perciò estremamente pericolose. L’immagine di diffrazione ottenuta suggeriva periodicità all’interno della molecola e portò all’ipotesi che si trattasse di un’elica. Proprio in quegli anni, inoltre, nell’ambito della biochimica si stava studiando l’alfa-elica tipica della struttura secondaria delle proteine (lei dice “l’elica va di moda in quegli anni”). Le osservazioni di Chargaff, Franklin, Crick che immaginò l’elica e Watson che immaginò i legami a idrogeno, portarono alla definizione definitiva della doppia elica nell’articolo su Nature del 1953. NUCLEOTIDI E ACIDI NUCLEICI Gli acidi nucleici, che sono dna e rna, sono costituiti da catena polinucleotidiche. Sono dei polimeri di monomeri chiamati nucleotidi. Un nucleotide è formato da: - uno zucchero, pentoso (ribosio o desossiribosio) - Una base azotata, chiamata così perchè l’anello eterociclico presenta carbonio e azoto - Uno o più gruppi fosfato. Le basi azotate sono le strutture appunto di base degli acidi nucleici e si dividono in pirimidine e purine, Le pirimidine hanno un solo anello eterociclico, aggiungendo altri gruppi otterremo citosina, uracile e timina. Le purine hanno doppio anello eterociclico (condensazione con anello imidazolico, la numerazione degli atomi cambia, azoto 1 e azoto 9 sono importanti per legame con lo zucchero), aggiungendo altri gruppi otterremo adenina e guanina. Essendo cicliche le basi azotate sono aromatiche, ovvero hanno gli elettroni delocalizzati. Altre basi importanti che si ritrovano in natura (soprattutto nell’rna) sono derivati purinici come ipoxantina, xantina e acido urico. PROPRIETÀ DELLE PURINE E DELLE PIRIMIDINE Le principali proprietà che caratterizzano le basi azotate sono tre e hanno ripercussioni sulla struttura degli acidi nucleici: - tautomeria - Dissociazione acido-base - Forte assorbanza della luce uv TAUTOMERIA: la tautomeria è una forma di isomeria di composti organici che caratterizza le purine e le pirimidine. In particolare adenina e citosina possono trovarsi in forma amminica (NH2) o imminica (NH) in cui ci sono cambiamenti anche nei doppi legami; guanina e timina invece hanno forma chetonica o enolica (un ossigeno diventa un gruppo alcolico). A ph neutro, come quello intracellulare, l’equilibrio tra le due forme è spostato al 99% verso la forma chetonica e amminica, cambiando il ph ovviamente cambierà l’equilibrio. 3 La variazione tra forme tautomeriche ha conseguenze notevoli sulle capacità di accoppiamento delle basi: passando dalla forma amminica alla forma imminica l’azoto del ciclo diventa donatore di idrogeni e l’altro acettore; per esempio la citosina non può più formare tre legami con la guanina e viceversa. Perciò si dice che la tautomeria è la prima causa endogena di mutazioni, di cambiamento di basi. ASSORBANZA DELLA LUCE: le basi azotate sono composti idrofobici debolmente basici e poco solubili a ph neutro. Per effetto della risonanza risultano essere planari e capaci di assorbire nell’UV con un massimo di assorbimento a 260 nm circa per tutti i nucleotidi. Tramite lo strumento dello spettrofotometro si potrà disegnare un grafico che è detto spettro di assorbimento: sull’asse x è indicata la lunghezza d’onda della luce incidente, sull’asse delle ordinate la capacità di assorbimento della sostanza. L’assorbimento delle basi cambia, aumenta e raggiunge picco a 260nm, per poi diminuire. È importante capire a che ph ci troviamo, quando infatti c’è cambiamento di ph, cambia forma tautomerica e quindi capacità di assorbimento. I PENTOSI DEI NUCLEOTIDI Il ribosio e il desossiribosio sono molecole a 5 atomi di carbonio, nei nucleotidi vengono visti in forma furanosica e non lineare (con il quinto atomo di carbonio fuori dal ciclo). Al deossiribosio manca un ossigeno in posizione carbonio 2’ (l’indice “primo” si riferisce ai carboni degli zuccheri, non delle basi). Esistono anche molecole “dideossi” a cui mancano un altro ossigeno ancora, quello del carbonio 3’: sono molecole molto usate in farmacologia perchè molecole potenti per l’inibizione della replicazione. L’OH in posizione 3’ infatti è importantissimo per il legame fosfodiesterico. Lo zucchero può avere conformazione increspata, endo o eso (importante per struttura secondaria del dna). Il ribosio nella catena polinucleotidica diventa un punto di instabilità perché bastano lievi condizioni leggermente alcaline per farlo degradare (cosa che non succede nel dna). L’ossigeno in più che ha il ribosio è destabilizzante, confligge anche con l’ossigeno vicino. I NUCLEOSIDI Mettendo insieme base azotata e zucchero formiamo i nucleosidi come adenosina, guanosina, cisidina (praticamente si aggiunge -idina alla radice del nome della pririmidina e -osina alla radice del nome della purina). Importante il legame n-glicosidico tra l’azoto 1 della pririmidina e l’azoto 9 della purina con il carbonio 1. Intorno a questo legame la base azotata può ruotare come una bandiera: infatti può trovarsi in conformazione syn o anti. La base azotata con gli atomi rivolti dalla stessa parte rispetto allo zucchero è in conformazione syn, se ruotata di 180° allora anti. Le pririmidine di solito sono in conformazione anti perchè l’ossigeno andrebbe a interagire elettrostaticamente con l’ossigeno dello zucchero. 4 I NUCLEOTIDI Nucleosidi più fosfati danno i nucleotidi. Possiamo avere nucleosidi mono/di/trifosfati. Il primo gruppo fosfato che si lega si chiama fosfato in alfa (legato al carbonio 5’ in alto) ed è quello che rimane nella catena nucleotidica, gli altri si legano a quello in alfa e vengono chiamati fosfati in beta e in gamma. I nucleotidi non si trovano solo negli acidi nucleici ma anche in NADH, NADPH con adenina, zucchero e fosfato; in FAD. Questi coenzimi sono fondamentali nel metabolismo. Quindi c’è collegamento tra metabolismo e ciò che accade nel nucleo. ATP e GTP anche fondamentali (GTP usato nelle reazioni dove ci sono dei cambi conformazionali delle proteine, ATP nel 90% delle reazioni invece); ancora CTP (nel metabolismo dei fosfolipidi) e UTP (nella glicosilazione delle proteine); AMP ciclico. LEGAME FOSFODIESTERE I vari nucleotidi sono legati tra loro mediante il gruppo fosfato che va legare l’–OH in posizione 3’ di un nucleotide con il carbonio 5’ del nucleotide successivo, formando quindi il legame fosfodiesterico, che stabilisce la polarità della catena. Dunque, l’orientamento parte dal 5’, dove ci sarà un gruppo fosfato, per arrivare al 3’, dove ci sarà un –OH. La polarità della catena nucleotidica sarà sempre 5’-3’. Il filamento è costituito da un’alternanza di gruppi fosfato e zuccheri, con le basi azotate verso l’interno della doppia elica. I legami a idrogeno si stabiliscono tra: - Timina e Adenina: 2 legami a idrogeno; - Citosina e Guanina: 3 legami a idrogeno. Il filamento di gruppi fosfato e zuccheri è la parte polare della catena che ha caratteristiche idrofiliche e si stabilisce all’esterno, mentre le basi azotate hanno caratteristiche idrofobiche e si stabiliscono all’interno della doppia elica. Infatti, quando si stabiliscono i legami a idrogeno tra le basi azotate, unendo due filamenti antiparalleli di DNA con polarità opposta, l’interno della molecola è idrofobico. 5 L’alternanza fosfato-zucchero porta alla formazione di una zona (di colore rosso) con proprietà polari, anzi elettrostatiche, perché ci sono delle cariche elettriche, perché sia gli zuccheri ma soprattutto i fosfati hanno un’affinità per l'acqua e sono molecole tutte idrofiliche; se guardiamo invece all'interno, dove stanno le basi azotate e dove si stabiliscono legami a idrogeno, questa zona sarà idrofobica; quindi, non è consentito all'acqua di stare all’interno. Questa non è una rappresentazione realistica di come è fatto il DNA, che non è così lineare ma assume conformazione a doppia elica, che è risultante di tutte le forze, attrattive e repulsive, che stanno all'interno di queste due catene nucleotidiche. All'interno della doppia elica ci sono delle forze che stabilizzano i legami idrogeno e poi ci sono una serie di interazioni idrofobiche. Le basi azotate formano anelli impilati l'uno sull'altro, questo impilamento costituisce le forze di stacking, un tipo di interazione debole, molto importanti perché additive: quanto più lunga è la molecola, tanto più questa forza di stacking stabilizza la molecola. La carica negativa di un gruppo fosfato determina una forza repulsiva sia con il fosfato successivo ma anche con i fosfati dell'altra catena. Esse destabilizzano la struttura perché si respingono (essendo dello stesso segno). La sommatoria delle forze stabilizzanti e di quelle destabilizzanti determina la formazione della doppia elica come la si conosce. Il passo dell’elica corrisponde a un giro di elica che, nell’elica classica, corrisponde a 10,5 paia di basi (bp – base pair) ossia 34Å. La distanza tra una coppia di basi e l’altra è di 3,4Å e il diametro è di 20Å. Guardando di profilo la struttura del DNA si nota l’alternanza di due solchi (o scanalature), uno maggiore (22Å) e uno minore (12Å). A livello del solco maggiore c'è la possibilità che le proteine o altre molecole come, per esempio, RNA facciano capolino all'interno, e vadano a stabilire dei legami con le basi azotate all'interno della doppia elica. Questi solchi sono come dei punti di accesso all'interno delle basi azotate; infatti, noi 6 vedremo che ci sono una serie di proteine, ad esempio, i fattori di trascrizione, delle proteine che devono interagire con il DNA e determinano un'attivazione, una repressione come fanno questi fattori di trascrizione a riconoscere esattamente quella specifica sequenza? lo fanno perché spesso nei fattori di trascrizione ci sono dei domini proteici, ovvero piccole parti di proteina solitamente di 30, 50, 60 AA, solitamente ad alfa elica (ma non solo), che stabiliscono interazioni a livello del solco maggiore del DNA, perché ad esempio qui ci possono essere delle arginine, che hanno delle code molto lunghe che vanno a riconoscere degli aminoacidi all’interno. Se tagliassimo il DNA a fette e lo guardassimo dall'alto vedremmo delle A (accettore di legami idrogeno) e ci sono idrogeni che possono essere donati. A seconda del solco maggiore o dal solco minore, la possibilità di leggere le sequenze è assolutamente diversa, quindi ogni proteina può stabilire dei legami con una porzione di sequenza del DNA A questo contribuiscono anche i gruppi metilici, per esempio delle timine (gli unici gruppi idrofobici presenti) STRUTTURE DEL DNA Nel nostro DNA abbiamo un avvolgimento destrogiro però esiste anche l'avvolgimento levogiro, cioè che va nella direzione opposta. come si stabilisce la direzione è quella stabilita dal palmo della mano destra o dal palmo della mano sinistra che indica la direzione. Le conformazioni più comuni del DNA ma anche dell’RNA, e sono la conformazione B che noi troviamo di più nelle nostre cellule, la conformazione A e la Z. Possiamo osservare che il passo dell'elica cambia in queste tre strutture FORMA B: È la forma più comune ed è una doppia elica destrogira, ogni passo di elica conta 10,5 coppie di basi azotate. Le basi sono tra loro distanziate 3,4 Å. Purine e pirimidine assumono conformazione anti FORMA A: È una forma destrogira ed è più schiacciata e tozza rispetto alla forma B, ha quindi un diametro maggiore. Ha 11 paia di basi azotate per ogni passo di elica. Si trova prevalentemente in RNA a doppia elica. Si trova in condizioni di disidratazione o quando si accoppiano DNA e RNA, come nei tRNA. Purine e pirimidine assumono conformazione anti FORMA Z: È una forma molto diversa dalle altre due. È levogira. La lettera Z, con la quale è indicata, fa riferimento alla struttura a “zig zag” assunta dai gruppi fosfato dell’elica. È più sottile e allungata rispetto alle altre forme, dunque ha un diametro minore. Ogni passo d’elica contiene 12 paia di basi azotate. È presente nel DNA quando, a livello della struttura primaria, sono individuabili lunghe sequenze ripetute di guanina (G) e citosina (C) alternate; quindi, quando è presente una successione di C e G, in particolare se le citosine sono metilate (presentano un gruppo metile): queste sequenze sono dette isole CPG, (in cui P sta per “fosfato”). Le purine si presentano nella conformazione sin, mentre le pirimidine si presentano nella conformazione anti. È possibile che in alcuni punti ci sia transizione del DNA dalla forma B a quella Z (e viceversa), nel punto di transizione si verifica estrusione delle basi 7 Il DNA è caratterizzato dalla presenza di isole CPG, regioni a livello di promotori dei geni, ricche di citosine e guanine, in cui le citosine sono metilate, in funzione del silenziamento dell’espressione genica; il DNA ha un suo linguaggio, legato alla struttura primaria. Una successione di C e G determina la tipica struttura a doppia elica, ma se ci sono più A una accanto all'altra, determinano una curvatura del DNA, che non risulta più rettilineo; 6 A producono un angolo di 18°. Ci sono tantissime strutture insolite del DNA, si trovano tantissimo sia a livello di sequenze intergeniche che anche intrageniche, ad esempio a livello degli introni, in cui troviamo sequenze particolari. SEQUENZE PALINDROMICHE Altre strutture secondarie che sono determinate dalla struttura primaria sono le sequenze palindromiche, possono essere - ripetute e invertite: le basi sono complementari rispetto ad un ipotetico asse di simmetria (che nell’immagine è fra C e G); ad esempio, TTAGCAC viene ripetuta dall'altra parte invertita CACGATT. - ripetute e speculari: rispetto all'asse di simmetria centrale sulla doppia elica, ciascuna base trova una base identica a sé stessa dalla parte opposta di tale asse. Le sequenze palindromiche possono appaiarsi e formare delle doppie eliche. Questo determina il fatto che, laddove c'è un allentamento della struttura secondaria intrafilamento, il DNA può assumere delle strutture secondarie, ad esempio, a stem e loop, o struttura hairpin (a forcina). Questa può associarsi sul filamento doppio e si genera una struttura cruciforme (struttura croce), in cui ci saranno tratti in cui il filamento è sottratto all’appaiamento con l’altro filamento. Queste strutture sono importanti per la trascrizione, per la terminazione della trascrizione, con diverso significato regolativo. Possono anche formarsi triplici eliche di DNA. Ad esempio, quando ci sono 4 guanine vicine, hanno la tendenza ad appaiarsi, a reagire tra di loro e formano la cosiddetta “Guanosine tetraplex” detta anche “G quadruplex”, una struttura planare. Queste 4 G possono trovarsi sullo stesso filamento del DNA che si ripiega in modo tale da formare queste due strutture planari, oppure su filamenti diversi Queste strutture si possono stabilire o tra quattro filamenti se sono perfettamente indipendenti l'uno dall'altro, o se un filamento unico gira su se stesso, o tra due filamenti, e si trovano a livello dei telomeri. Appaiamenti del genere non sono degli appaiamenti Watson e Crick, cioè gli appaiamenti di Watson e click canonici sono abbiamo detto la A. In questo caso parliamo dei cosiddetti “accoppiamenti di Hoogsteen”, che non sono gli accoppiamenti canonici tra G-C e A-T. 8 Altre si formano quando è presente CG con la C protonata, si formano strutture strane a triplice elica, cioè delle eliche a 3 filamenti anche quando c'è una successione di C-T, per esempio a livello introni. Si mettono insieme tre filamenti e l'altro rimane non appaiato. In realtà non è proprio così, perché sono 2 filamenti più 1 filamento extra, che vedremo nel DNA mitocondriale. Un'altra possibilità che la struttura primaria modifichi la struttura secondaria del DNA si ha quando c'è una ripetizione di triplette: questi a volte sono dei codoni possiamo trovarlo nella sequenza codificante ma anche in sequenze non codificanti introni, promotori cioè non nel gene, cioè delle triplette ripetute CTG, CGC e GAA quelle più frequenti e sono pericolose perché possono appaiarsi fra loro, come se si chiudessero tra loro, sono pericolose perché al momento della replicazione la DNA polimerasi le può saltare e quindi il filamento di nuova sintesi non sarà come lo stampo perché gli mancheranno dei pezzi o addirittura può aumentare il numero di triplette. Ci sono delle malattie genetiche studiate dalla genetica medica, dette malattie da espansione di triplette. Una di queste malattie è l'atassia di Friedreich (espansione tripletta GAA). Il gene è stato chiamato gene per la Fratassina, ha un ruolo nel metabolismo del ferro a livello di mitocondriale, che determina questa grave forma di atassia. Altre malattie sono la sindrome dell’X fragile, la distrofia miotomica, la Corea di Hungtington (proteina hungtintina). O a livello di DNA, o a livello di RNA, la presenza di queste triplette ripetute può bloccare la DNA polimerasi o la RNA polimerasi. Le strutture dell’RNA sono molteplici. Il tRNA è una delle strutture più interessanti perché presentano tante strutture differenti, come gemme (non appaiati), loop, steli, anse, queste strutture intramolecolari così particolari sono formate per esempio da introni. RNA ha tante funzioni e spesso si lega con proteine, formando complessi ribonucleoproteici. Pensiamo ad esempio allo sliceosoma, alla telomerasi, alla particella di riconoscimento del segnale, al ribosoma, ecc. Le proteine possono avere anche altre funzioni come chaperonine, che servono a far assumere delle strutture secondarie all’RNA, ci sono delle malattie legate a questo tipo di proteine chaperon che non funzionano bene e provocano malattie. 9 DNA E GENOMA Agenti mutageni Nell’immagine sono presenti la struttura secondaria del DNA, la doppia elica, e al centro, alcune strutture di molecole idrofobiche che interferiscono con la struttura secondaria. Troviamo il bromuro di etidio, molto usato nei laboratori, o l’arancio di acridina, entrambi cancerogeni, e l’actinomicina D che è un antibiotico. Le tre molecole hanno in comune gli anelli aromatici che si intercalano nella struttura del DNA. Sappiamo che all’interno il DNA è idrofobico, in quanto le basi azotate sono impilate l’una sull’altra grazie alle interazioni di stacking (di impilamento). Le molecole idrofobiche si interpongono tra una coppia di basi e l’altra della doppia elica. Verrà alterata così la struttura secondaria del DNA e, di conseguenza, la DNA polimerasi non riuscirà più a replicare in maniera fedele il DNA poiché inserirà o eliminerà delle basi, determinando inserzioni o delezioni. Molte di queste molecole hanno un effetto cancerogeno e quindi mutageno. Denaturazione, rinaturazione, ibridazione Immaginiamo di avere due becker con delle soluzioni di DNA a doppia elica con una fonte diversa, quando mescoliamo le due soluzioni le due molecole non vengono mescolate, ognuna di esse mantiene la propria identità. Viene fornito calore alla soluzione facendo bollire l’acqua per 5 o 10 minuti se si tratta di DNA genomico. Successivamente viene tolta la fonte di calore e, andando ad esaminare il contenuto della soluzione, vedremo molecole tutte blu o tutte rosse ma vedremo anche molecole ibride, caratterizzate da un filamento blu ed uno rosso. Le molecole ibride possono formarsi solo dopo un processo di denaturazione fisica (calore) o chimica (pH). Fornendo calore il DNA comincia ad aprirsi partendo dalle regioni ricche in A-T che presentano solo due legami H, successivamente si apriranno le regioni ricche in G-C fino ad avere il filamento completamente aperto. Quando comincia il raffreddamento i due filamenti in blu o in rosso si appaieranno molto 10 velocemente avendo sequenze complementari. L’appaiamento tra un filamento blu ed uno rosso dipende dalle sequenze che possono essere più o meno complementari, dipende da quanto sono estese le regioni di omologia, più vicine sono le specie più alta sarà l’omologia di sequenza. Infatti, in questo modo, si può misurare quanto sono simili due genomi. Dal punto di vista cinetico, quando i due filamenti si incontrano c’è una prima reazione dove si appaiano poche basi, la nucleazione che è la fase più lenta e presenta una reazione di second’ordine. Se le sequenze sono tutte complementari tra loro avverrà l’appaiamento, la chiusura che è la fase più veloce e presenta una reazione di prim’ordine. Spettrofotometria La denaturazione e la rinaturazione possono essere visualizzate mediante l’interazione con la luce ultravioletta, grazie al picco di assorbimento delle basi azotate a 260nm. Osservando il grafico della denaturazione, con la temperatura sulle ascisse e l’assorbanza a 260nm sulle ordinate, all’aumentare di T, l’assorbanza rimane costante fino ai 70°C. Successivamente, aumenta in maniera esponenziale raggiungendo un plateau. Intorno ai 75-80°C i due filamenti si aprono, le basi azotate sono più esposte alla luce con cui viene colpita la cuvetta perciò aumenta l’assorbimento. Quando i due filamenti sono completamente aperti l’assorbimento resta costante. La differenza di assorbimento legata alla denaturazione si chiama effetto ipercromico, seguendo invece la rinaturazione osserviamo l’effetto ipocromico con diminuzione dell’assorbimento. Il punto di flesso della curva sull’asse delle ascisse corrisponde al Tm (temperature of Melting) alla quale il 50% delle molecole è denaturato. Il valore di Tm, specifico per ogni molecola, dipende dalla lunghezza del DNA, quanto più lungo è il DNA, maggiore sarà il Tm. Dipende inoltre dalla composizione in G-C, maggiore sarà il contenuto in G-C (essendo legate da 3 legami H), maggiore sarà Tm. Dipende infine dalla presenza di ioni come sodio o magnesio. Osserviamo il grafico con il Tm sull’asse delle ascisse e il contenuto in G-C sulle ordinate. A bassa concentrazione salina, con il 40% in G-C, la denaturazione avviene a 68°C. Quando la concentrazione salina è elevata lo stesso DNA viene denaturato a 90°C, questo perché Na e Mg con carica positiva interagiscono con le cariche negative dei fosfati. Normalmente i fosfati delle due eliche e quelli dello stesso filamento confliggono tra loro. Le cariche positive degli ioni Na o Mg eliminano le forze repulsive tra i fosfati stabilizzando la doppia elica, per cui avremmo bisogno di quantità maggiori di calore per poter denaturare il DNA. 11 Nel grafico sono presenti genomi di batteri. Pneumococco ha il 38% in G-C, la curva è quindi più spostata verso sinistra. I batteri termofili hanno un genoma con un alto contenuto in G-C, al contrario dei batteri che vivono a basse temperature. Struttura terziaria del DNA Le regioni avvolte del DNA vengono chiamate coiled, in alcune regioni abbiamo un supercoiled, avvolgimento di qualcosa che è già avvolto. Questi’immagine spiega il superavvolgimento del DNA. Due fili attorcigliati l’uno sull’altro e mantenuti fissi alle due estremità. Quando da una delle due estremità si aprono i due filamenti, a valle dell’apertura si formano dei superavvolgimenti. Se continuiamo ad aprire ad un certo punto si bloccherà la reazione di apertura, vi è una restrizione topologica (restrizione causata dal superavvolgimento). Ciò non accade se la mano libera l’altra estremità. Quando c’è bisogno di aprire il DNA a monte o a valle si creano questi superavvolgimenti. Lo stato di superavvolgimento in cui si trova una molecola di DNA è definito topologia, essa è una branca della matematica. Tra le proprietà topologiche troviamo il numero di legame (linking number, Lk): quante volte un filamento passa all’interno di un altro filamento. Il Lk viene calcolato facendo la somma di: writhe (avvolgimento), che può essere di due tipi: ⮚ plectonemico: un filo avvolto su se stesso che troviamo nei batteri e nei virus ⮚ toroidale: superavvolgimento del DNA intorno agli istoni twist (torsione). I superavvolgimenti sono delle proprietà topologiche del DNA che variano solo se c’è una rottura di quest’ultimo. Nell’immagine si passa dal DNA rilassato al DNA superavvolto dove i due filamenti sono avvolti l’uno intorno all’altro per 200 volte. Se riduciamo o aumentiamo di due unità il Lk, il DNA, in ogni caso, si superavvolge. Ciò che cambia è la direzione del superavvolgimento: nel primo caso sarà negativo, nel secondo positivo. La super elica negativa viene indicata come destrorsa, quella positiva sarà sinistrorsa. Si tratta di topoisomeri: 12 molecole che hanno la stessa lunghezza e formula chimica ma diverso Lk e quindi diverso superavvolgimento. I superavvolgimenti che bloccano l’apertura del DNA nella duplicazione, trascrizione e ricombinazione saranno postivi. La super elica destrorsa (negativa) è la forma normalmente presente nelle cellule. I superavvolgimenti possono essere notati quando una delle due estremità è bloccata o quando il DNA è circolare chiuso (entrambe le estremità bloccate). Questo superavvolgimento è stato riscontrato nei plasmidi, molecole circolari chiuse a doppio filamento che si trovano nel DNA batterico o in quello DNA quando i virus contengono un genoma circolare chiuso. Il superavvolgimento negativo subisce delle denaturazioni locali. Il superavvolgimento positivo compatta maggiormente la molecola che non può denaturarsi. Le denaturazioni locali riguardano la formazione di una bolla di replicazione o di trascrizione, in questo caso non si tratta di variazioni di temperatura ma di enzimi che agiscono rompendo i legami a idrogeno. Nell’immagine sono presenti dei topoisomeri, quindi la stessa molecola con diverse proprietà topologiche. Il primo (forma B) è un superavvolgimento negativo in cui ci sono due regioni denaturate localmente. Il secondo (forma C) è rappresentato da sequenze palindromiche, esse andranno a formare degli stem-loop (accoppiamento di basi azotate). Si creano delle strutture cruciformi in corrispondenza dei palindromi che vanno a stabilizzare quelle regioni. Se in una regione vi è una certa ripetizione di C-G (pirimidine-purine, forma D) con C metilate, avviene un cambio conformazionale del DNA, nella regione ripetuta, che diventa ad elica sinistrorsa. Viene messa in evidenza la regione in rosso dell’isomero topologico D che presenta un’elica sinistrorsa mentre tutto il resto della molecola appare rilassato. Dal punto di vista termodinamico, non c’è tensione tra le molecole, energeticamente, pur presentando diverse caratteristiche, sono tutte in equilibrio tra loro. Intervengono degli enzimi a modificare le strutture. Questo avviene solo per il superavvolgimento negativo che consente la denaturazione. Topoisomerasi Le topoisomerasi sono enzimi che modificano le proprietà topologiche, si distinguono in due classi: 13 Classe I: tagliano un solo filamento e non hanno bisogno di ATP. La topoisomerasi crea un nick, un’interruzione, una rottura del legame fosfodiesterico. L’apertura che si crea permette all’altro filamento di passare attraverso aumentando il numero di legame di un’unità. La reazione avviene con la formazione di un intermedio covalente (legame covalente DNA-proteina) grazie ad una tirosina, che si trova nel sito attivo dell’enzima, che lega direttamente l’estremità del legame fosfodiesterico. Successivamente il legame viene scisso liberando energia sufficiente per la formazione di un nuovo legame fosfodiesterico, in questo modo non servirà energia dall’esterno. Classe II: agiscono su entrambi i filamenti e hanno bisogno di ATP. L’enzima taglia entrambi i filamenti, non si tratta di un nick con cui si definisce la rottura di un unico filamento. Il numero di legame cambia di due unità. Questi enzimi sono più complessi strutturalmente di quelli precedenti perché presentano diverse subunità. Quest’ultime si legano al DNA formando un doppio cancello che si apre e si richiude facendo passare il DNA attraverso l’apertura. Esempio: i batteri e i virus che hanno un genoma circolare chiuso, formano dei superavvolgimenti negativi, grazie alle DNA Girasi (topoisomerasi II), che inseriscono superavvolgimenti negativi in modo che la molecola sia pronta a replicarsi o ad essere trascritta. Le topoisomerasi II servono per la creazione di reazioni di concatenazione e decatenazione. Sono presenti due DNA circolari e un catenano: un DNA dentro l’altro. Troviamo questa struttura alla fine della replicazione del cromosoma batterico o di qualsiasi cromosoma 14 circolare chiuso. Servirà quindi la topoisomerasi II che apre il DNA. Sono inoltre importanti per gli eventi di ricombinazione omologa e sito specifica. Nella tabella sono presenti alcune topoisomerasi di tipo I e II nei batteri e negli eucarioti. Per quanto riguarda gli eucarioti, da una particolare pianta (camptotheca acuminata) si estrae la camptotecina (CPT), una molecola che blocca la topoisomerasi di tipo I, fondamentale per la replicazione. La CPT, come anche i suoi derivati, ad esempio l’irinotecano, viene usata come chemioterapico o antibiotico bloccando la proliferazione delle cellule tumorali o di quelle batteriche. 15 Elettroforesi su gel Nell’immagine sono presenti diversi topoisomeri: DNA rilassato, DNA lineare (quando non è circolare chiuso), DNA superavvolto e altamente superavvolto. Viene rappresentata una gel elettroforesi fatta su un DNA circolare. Durante la formazione del DNA questo subisce delle rotture a livello del singolo filamento, i nick, che rilassano la molecola, o delle rotture di entrambi i filamenti con la formazione di DNA lineare. Dopo aver fatto l’estrazione di un DNA batterico dopo il clonaggio, il DNA viene messo sul gel. Non si osserverà solo una banda di DNA, ma quattro bande diverse che migrano con velocità sempre più elevate. Nella stessa molecola cambia la conformazione, il grado di superavvolgimento, il DNA rilassato (banda A) incontra molta più resistenza ad entrare nelle maglie del gel, c’è molto più attrito e quindi rimarrà sopra. Il DNA lineare migra più giù. Quando il DNA è maggiormente superavvolto, la molecola è più compatta e migra molto più velocemente (banda D). Questa gel elettroforesi viene eseguita con clorochina, una molecola che viene anche usata come farmaco, che da la possibilità di osservare bande che differiscono di un numero di legame l’una dall’altra. Superavvolgimento batterico Il superavvolgimento presenta due funzioni: permettere l’apertura locale del DNA durante la replicazione o la trascrizione impacchettare il DNA in modo che possa essere allocato in uno spazio molto più ridotto come il nucleo, in maniera molto organizzata. Nel DNA eucariotico il superavvolgimento è favorito da alcune proteine. Anche nei batteri sono presenti delle proteine Histon Like, con una funzione simil istonica ma non è presente il grado di impacchettamento della cromatina. Il DNA batterico è legato alla membrana plasmatica, questo perché nei batteri non avviene la mitosi, non c’è un fuso mitotico, il cromosoma è adeso alla membrana plasmatica e, al momento della separazione delle cellule figlie, i cromosomi seguono le membrane che si separano. Il cromosoma batterico si attorciglia formando delle anse. Ogni ansa può avere una composizione diversa e, di conseguenza, un diverso significato funzionale. Si pensa che ogni ansa possa corrispondere ad uno o più operoni. 16 IL GENOMA UMANO Nel Genoma Umano ci sono appena 21 mila geni. Diciamo “appena” perché in realtà di proteine se ne conoscono più di 100 mila, quindi geni e proteine sono in rapporto di 1 a 5 o 1 a 10, ovvero c’è un basso numero di geni e un alto numero di proteine. I geni costituiscono quindi una piccola parte del nostro genoma: sono contenuti in 48 milioni di paia di basi (48Mb), che costituiscono l’esoma, su 3 miliardi e 300 milioni di paia di basi (3300 Mb) totali. Genoma ed esoma non sono per questo motivo due termini equivalenti. Il termine “esoma”, infatti, deriva dal termine “esoni”, quindi “codificante, legato a proteine”, anche se più avanti vedremo che non è propriamente corretta questa definizione in quanto esistono delle regioni di esoni non codificanti. Tutto quello che non è esoma costituisce in parte sequenze correlate ai geni, in parte DNA intergenico. Riassumendo, il Genoma Umano si divide in: a) Esoma b) Sequenze correlate ai geni (1152Mb) (si chiamano così perché hanno qualche familiarità con i geni) ❖ Pseudogeni: geni che non sono codificanti ma hanno la stessa struttura dei geni, a volte possono essere trascritti ❖ Frammenti genici ❖ Numts: Nuclear mitochondrial DNA segment, genoma autoctono che sta nei mitocondi lungo 16.560 paia di basi nell’uomo ❖ Introni ❖ UTR: Untranslated region c) DNA intergenico (2000Mb) ❖ Sequenze ripetute (1400Mb) (spesso ripetute in tandem, ovvero la stessa sequenza viene ripetuta tante volte; può variare sia la lunghezza della sequenza ripetuta, ad esempio un dinucleotide sono solo due nucleotidi ma possono essere ripetuti anche 200 nucleotidi, sia il numero di volte per il quale essa viene ripetuta) o Altamente ripetute: DNA satelliti o Mediamente ripetute: minisatelliti o Ripetizioni intersperse (alcuni di questi hanno una familiarità con i retrovirus e con i virus endogeni, ovvero virus che noi abbiamo nel nostro genoma e che, secondo una teoria, se “risvegliati” e riattivati causano malattie come quelle autoimmuni per le quali oggi non abbiamo altre spiegazioni) Trasposoni ad RNA LINE [“lain”] SINE [“sain”] LTR Trasposoni a DNA 17 ❖ Altre regioni intergeniche (600Mb): microsatelliti La complessità del Genoma Il primo genoma a essere sequenziato è stato quello del lievito, non quello umano. L’Homo sapiens ha 46 cromosomi, la farfalla ha 250 cromosomi, quindi ne ha molti di più, e una pianta può avere anche 1260 cromosomi. Il numero dei cromosomi evidentemente non è collegato alla complessità dell'organismo, neanche le dimensioni del genoma e il numero dei geni. La complessità del genoma non correla con numero di cromosomi, dimensioni del genoma e numero di geni perché nei diversi organismi cambia la densità genetica. In verde i geni, in blu gli introni, in rosso il gene della RNA polimerasi, in bianco la sequenza intergenica e in giallo le sequenze ripetute. Un frammento delle stesse dimensioni contiene 57 geni nell’E. coli ma solo 2 nell’uomo, questo perché nell’uomo ci sono tantissime regioni non codificanti. 18 Gli esoni, infatti, costituiscono solo l’1/1.5% del genoma umano. [Domanda di uno studente: “Per riguarda il quanto DNA satellite, minisatelliti e microsatelliti, non ho mai capito realmente la lunghezza in paia di basi di ognuno di essi, visto che trovo sempre lunghezze diverse.” Risposta della professoressa: “Come abbiamo detto prima, l’unità che viene ripetuta può variare da pochi a tanti nucleotidi.”] Domanda della professoressa: “Perché si chiama DNA satellite?” Esso veniva isolato come satellite: nella centrifugazione isopicnica su cloruro di cesio del genoma -nelle immagini seguenti è possibile osservare la centrifugazione del genoma del moscerino da frutta e del topo- vi è un picco principale e dei picchi satelliti, rappresentati dal DNA intergenico ripetuto. Sull’asse delle ordinate nei due grafici è rappresentata la densità di galleggiamento delle varie frazioni in g/cm3. La densità ha un’abbondanza relativa proporzionale all’area sotto i picchi relativi ed è funzione del contenuto C+G. Ogni specie ha i suoi picchi satelliti caratteristici, quindi il suo pattern. Se un picco è molto grande c’è il rischio che ne “nasconda” altri. [Il moscerino viene indicato come Drosophila melanogaster e il topo come Mus musculus] Il picco principale di assorbanza del moscerino si ha a 1.702, invece 1.705, 1.689 e 1.672 sono picchi satelliti. Per il topo, invece, il picco principale è 1.7 e il satellite è 1.69. In entrambi i grafici l’asse delle ascisse va da 1.75 a 1.65 g/cm3, quindi la densità decresce. Queste sequenze ripetute vengono studiate soprattutto in medicina legale, per stabilire l’identità di un individuo, quindi risultano molto utili, ad esempio, per effettuare i test di paternità. Il pattern delle sequenze ripetute caratterizza ogni individuo, è singolare. In questi studi può essere usato anche il DNA mitocondriale. Tutte queste tecniche vengono riassunte nel nome di DNA fingerprinting. 19 PSEUDOGENI Quando un gene subisce un evento di duplicazione, uno dei due geni formati può accumulare mutazioni perché non ci sono le costrizioni funzionali, in quanto c’è l’altro gene che codifica regolarmente per le proteine necessarie. Se la mutazione fa sì che il gene non codifichi più per una proteina, si parla di pseudogene. Diversa è la questione, ad esempio, dell’emoglobina, in cui si hanno sia le catene alpha, sia le catene beta. I due diversi tipi di catene, però, sono dati da un fenomeno chiamato “specializzazione”. A parte il classico pseudogene o pseudogene duplicato descritto precedentemente, possono esserci anche gli pseudogeni processati. Un gene viene trascritto, per trascrizione inversa tradotto e il cDNA così formato viene integrato nel genoma. Sono riconoscibili perché formati unicamente da sequenza codificante e coda di poliA. Dopo l’integrazione gli pseudogeni di entrambe le classi accumulano mutazioni casuali che ne acconsentono il riconoscimento. Cromatina La cromatina ha lo scopo di organizzare anche dal punto di vista strutturale il nostro DNA. Le strutture principali della compattazione del DNA: DNA, nucleosoma, fibra da 10 nm (“collana di perle”), fibra da 30 nm (“solenoide”), cromosoma in metafase. La collana di perle ha grado di impacchettamento pari a 6, il solenoide pari a 40, le anse cromosomiche da 100-400 nm legate a scaffold (regioni di attacco alla matrice) proteici pari a 1000 e i cromosomi mitotici pari a 10 000. Istoni Gli istoni sono proteine basiche in quanto ricche di lisina e arginina. Nella cromatina, in realtà, ci sono anche altre proteine non istoniche e spesso non basiche chiamate proteine HMG, High Mobility Group, come ad esempio i fattori di trascrizione. 20 Nell’immagine gli istoni sono stati semplificati come rocchetti gialli, invece il DNA è il filo rosso. Le nucleasi, in questo caso viene utilizzata la nucleasi micrococcica, possono tagliare il DNA linker in maniera casuale, invece quello attorno agli istoni non viene tagliato. In questo modo può essere isolato il nucleosoma, formato da DNA e istoni. Così abbiamo la possibilità di separare poi il nucleo istonico dal DNA a doppia elica di 146 coppie di nucleotidi. Il nucleosoma è formato da 4 proteine istoniche: 2 H2A, 2 H2B, 2 H3, 2 H4. Se questo esperimento viene fatto su gel, si ottiene un pattern a “scala” chiamato ladder (nell’immagine alla pagina precedente è a sinistra). Ogni gradino di questa scala rappresenta un frammento di DNA con un numero via via crescente di nucleosomi, dal basso verso l’alto. Il ladder appena visto viene ottenuto anche da una cellula apoptotica; una cellula necrotica, invece, non dà bande distinte su gel ma dà un continuo chiamato smear. La struttura degli istoni è molto simile tra loro dal punto di vista dei domini proteici, infatti si pensa che gli istoni si siano generati da una serie di duplicazioni. Ogni istone ha un’estremità C-terminale più corta e una N-terminale molto lunga. Le regioni colorate nell’immagine sono alpha-eliche. Le alpha-eliche costituiscono una struttura tridimensionale chiamata Histon Fold, “ripiegamento degli istoni”. Due monomeri degli istoni, quando si incontrano, creano un dimero “a stretta di mano”. Due dimeri di H2A e H2B si assemblano per formare un tetramero. A loro volta anche un dimero H3-H4 si unisce con un altro dimero H3-H4 formando un altro tetramero. Quando i due tetrameri si uniscono si forma un ottamero. Le code N-terminali sporgono verso l’esterno invece al centro c’è una regione chiamata nucleo centrale. Nelle code N-terminali si trovano principalmente lisina e arginina, in quantità che variano dall’1% al 30%, come riportato nella tabella sottostante. Le code degli istoni sono molto importanti in quanto soggette a modifiche post traduzionali. L’istone H1 non si dimerizza, infatti è come se fosse già un dimero: pesa circa il doppio (223 aa) degli altri istoni (102-129 aa). Esso è costituito per il 30% da lisine, ed è l’unica proteina ad avere al suo interno una così grande quantità di questo amminoacido. Il DNA che 21 avvolge il nucleo istonico forma 140 legami a idrogeno con i domini alpha-elica degli istoni. Solitamente, invece, le interazioni proteina-ligando coinvolgono un massimo di 20 legami a idrogeno. A seguire due immagini: la prima mette in evidenza le code degli istoni che fuoriescono dall’ottamero, la seconda rappresenta l’istone H1, del quale vedremo la funzione in seguito. La differenza tra nucleosoma e cromatosoma sta nel fatto che il primo non coinvolge l’istone H1, il secondo, invece, sì. L’istone H1 interagisce con il DNA linker producendo una maggiore adesione del DNA all’ottamero istonico e lega anche una regione mediana delle 147 bp associate all’ottamero istonico. Il legame di H1 aumenta il compattamento del DNA sul nucleosoma, imponendo una costrizione sugli angoli di entrata e uscita dal DNA del nucleosoma. L’avvolgimento del DNA intorno al nucleo istonico è di tipo negativo. 22 L’immagine (a) è priva di H1, che, al contrario, ci sono nell’immagine (b). Entrambe sono fatte al microscopio elettronico. È evidente che la cromatina con H1 è più compatta. La professoressa paragona l’istone H1 a un lucchetto che serra l’impacchettamento del DNA. Ci sono tanti tipi di istoni, alcuni definiti come “istoni non canonici”. Ad esempio di H2A e H3 esistono tante varianti istoniche che alterano l’affinità del legame al DNA degli istoni e la funzione del nucleosoma. H2A.z è associata a regioni di DNA genomico attivamente trascritte, infatti reprime la formazione di strutture troppo condensate. H2A.X fosforilata, è un marcatore (definito dalla professoressa come “bandierina”) della presenza di lesioni al DNA. CENP-A sostituisce H3 nelle regioni centromeriche, fornendo una più estesa coda N-terminale che rende disponibili specifici siti di interazione con il cinetocore. A questo punto riprendiamo il discorso sul livello di organizzazione del DNA di una cellula eucariotica. La “collana di perle” di 10nm si compatta in fibra cromatinica di 30nm. Sono state formulate due teorie sulla struttura di questa fibra, perché pare che in alcuni punti la cromatina assomigli a un solenoide, e in altri, invece, pare abbia un andamento a zig-zag. Non si sa bene se esista solo una struttura delle due o se esse coesistano; si reputa comunque più probabile che le due strutture coesistano e che non siano alternative 23 (alternative indica “o l’una o l’altra”). È possibile vedere dall’immagine che la prima struttura ha una regione vuota al centro, la seconda no. L’impacchettamento di ordine superiore è assicurato dalla formazione di anse di cromatina bloccate alla base di una struttura proteica detta scaffold (“impalcatura”) nucleare. Le topoisomerasi (di classe 2) e le proteine SMC (Structural Maintenance of Chromosomes) sono componenti essenziali dello scaffold in quanto hanno il ruolo di tenere unite regioni del DNA distanti o differenti. Le prime, se bloccate, non permettono il proseguimento della duplicazione. Le seconde, invece, sono proteine che mantengono e garantiscono la struttura del cromosoma. Le proteine SMC si possono distinguere in due classi diverse che condividono una struttura proteica ad anello identica: le coesine e le condensine. Le coesine formano un anello che tiene insieme i cromatidi fratelli in metafase. Le condensine tengono insieme le anse della cromatina di ciascun cromosoma al momento della mitosi. Le prime compaiono nella fase G1 del ciclo cellulare, le seconde nella G2. [nds. Dalle slides presentate in classe e dalla dispensa dello scorso anno è possibile fare la seguente integrazione: Esistono delle sequenze di DNA che favoriscono l’attacco alla matrice nucleare o allo scaffold e che, quindi, favoriscono anche la formazione di anse di cromatina di 30-100 kb. Quando le anse di cromatina sono piccole, sono attivamente trascritte. Invece, le anse più grandi sembrano essere più spente dal punto di vista trascrizionale. Queste sequenze sono dette “sequenze di attacco alla matrice” MAR (Matrix Attachment Region). Ci sono anche delle sequenze che favoriscono l’attacco allo scaffold, dette “sequenze di attacco allo scaffold” SAR (Scaffold Attachment Region).] Queste variazioni della cromatina sono favorite dai complessi di rimodellamento della cromatina, complessi proteici enzimatici che vanno a rimodellare la cromatina e che regolano l’interazione tra il DNA e l’ottamero. La cromatina, quindi, non è statica. L’accessibilità al DNA può avvenire in diversi modi: - scivolamento dei nucleosomi: determina lo scivolamento del DNA sul nucleo istonico, quindi ne cambia la posizione; - rimozione dell’ottamero; - rimozione del dimero; - sostituzione dei dimeri con altre varianti istoniche (isoforme). [nds. Dalle slides presentate in classe e dalla dispensa dello scorso anno è possibile fare la seguente integrazione: 24 - spostamento dei nucleosomi: determina un trasferimento del nucleo istonico che viene trasferito da una porzione di DNA ad un’altra, rendendo accessibile la regione di DNA su cui era posizionato il nucleo istonico, sinteticamente riguarda la dissociazione DNA/istoni; - rimodellamento dei nucleosomi: determina l’indebolimento delle interazioni tra DNA e nucleo istonico che resta comunque nella stessa posizione, il DNA non scivola intorno al nucleo istonico, in poche parole il DNA viene reso più accessibile] L’attività di tali complessi necessita dell’energia fornita dall’idrolisi di ATP. Ci sono quindi diverse possibilità di modificare la cromatina e i complessi che attuano questo tipo di rimodellamento sono stati suddivisi in due classi: - Complesso SWI/SNF: determina la rottura di contatto tra DNA-istone; - Complesso ISWI: determina lo scivolamento del DNA e il riposizionamento dei nucleosomi al fine di liberare, ad esempio, i cromosomi, come accade al momento di inizio della trascrizione. La cromatina si divide in: 1. Eucromatina 2. Eterocromatina: - costitutiva (DNA satellite delle regioni centromeriche) - facoltativa (regioni non espresse in un tessuto, ma espresse in un altro; cromosoma X dei mammiferi –corpo di Barr)] Modificazioni post-traduzionali Come già detto, gli istoni possono subire una serie di modificazioni che rientrano nella categoria delle modificazioni post-traduzionali. Esse riguardano le code N-terminali degli istoni e alterano la funzione della cromatina. Se le modifiche che avvengono a livello della sequenza di DNA vengono chiamate “genetiche”, tutte le modifiche che avvengono a livello di DNA e istoni vengono chiamate epigenetiche. Possono essere: - Acetilazione (lisine): è una delle più frequenti modifiche, ovviamente non è una reazione spontanea, ma è catalizzata da una classe di enzimi chiamati HAT (istone acetil-transferasi, chiamato anche transacetilasi). Tutte le modifiche sono reversibili, quindi la reazione opposta all’acetilazione è la reazione catalizzata dalla HDAC (istone deacetilasi). L’acetilazione avviene al livello dei residui di lisina. Le lisine, infatti, sono abbondantissime nelle code N-terminali. Esse hanno il gruppo amminico –NH3+, con carica positiva. Il compito di questa reazione è mascherare la carica positiva del gruppo amminico della lisina, che è fondamentale nello stabilire delle interazioni elettrostatiche con i gruppi 25 fosfato del DNA, permettendo l’impacchettamento della cromatina. Quindi la presenza di acetilasi, (anche transacetilasi o deacetilasi) regola l’accessibilità alla cromatina. Questo è importantissimo a livello della regolazione genica. [nds. Quest’ultimo concetto viene esplicitato nelle dispense dello scorso anno: Ad esempio, quando ci sarà bisogno di attivare il promotore di un gene, entrano in azione delle transacetilasi che vanno a coprire le cariche positive delle lisine, allentando l’interazione tra istoni e DNA, rendendo quest’ultimo più accessibile. Quando questo motore deve essere mascherato, perché non c’è più bisogno dell’espressione di quel gene, entrano in azione le deacetilasi, che eliminano il gruppo acetilico e ristabiliscono le interazioni con il DNA che viene ulteriormente impacchettato.] - Metilazione (lisine e arginine): può avvenire sia su residui di lisina che sui residui di arginina tramite l’azione della metil transferasi HMT (metilasi). La metilazione aumenta il compattamento del DNA perché introduce gruppi metilici idrofobici che, di conseguenza, aumentano le interazioni idrofobiche, determinando la chiusura della struttura della cromatina. La cromatina viene, quindi, compattata ulteriormente. La demetilazione è catalizzata dalla demetilasi. - Fosforilazione (serine e treonine) è la modifica più frequente. L’aggiunta di un gruppo fosfato a opera dell’enzima chinasi introduce una carica negativa che entra in conflitto con le cariche negative del DNA stesso. La presenza di un gruppo fosfato è importante sia per la carica negativa che introduce, sia per la sua voluminosità dal momento in cui sono presenti l’atomo di fosforo e gli atomi di ossigeno. La reazione inversa è catalizzata dalla fosfatasi. Di solito la fosforilazione e la defosforliazione hanno a che fare con gli eventi legati alla replicazione piuttosto che con la trascrizione (acetilazione). - ADP-ribosilazione (glutammato): è catalizzata da una ribosil transferasi, invece una idrolasi catalizza la reazione inversa. Questa reazione mette in relazione le condizioni metaboliche con l’espressione dei geni. - Ubiquitinazione (lisine e arginine): vi è l’aggiunta dell’ubiquitina su residui di lisina e di arginina. Ciò permette l’accessibilità dei promotori, quindi non è vero che gli istoni vengono degradati! 26 - Sumoilazione (lisine): vi è l’aggiunta della proteina SUMO, simile all’ubiquitina, con 76 amminoacidi, quindi più piccola. Cromodomini e bromodomini La modificazione delle code N-terminali degli istoni permette il legame con proteine regolatorie contenenti specifici domini strutturali. Questi possono essere di due tipi: - Cromodomini: le proteine che li presentano hanno strutture secondarie ricche di foglietti-β. Esse reagiscono con le code metilate e le regioni deacetilate della cromatina aiutando il compattamento (eterocromatina) di quest’ultima affinché assuma la configurazione close, molto compatta e inaccessibile. - Bromodomini: le proteine che li presentano sono ricche di α-eliche e interagiscono con la cromatina acetilata, promuovendo la conformazione open, cioè accessibile (eucromatina). 27 REPLICAZIONE DEL DNA Nelle scorse lezioni abbiamo visto i componenti di base degli acidi nuclei, mettendo in evidenza anche le caratteristiche fisico-chimiche importanti. Struttura e funzione vanno sempre insieme, in biochimica è ancora più evidente. “La chiave e la serratura” è diventato un paradigma dal quale non si sfugge. Modelli di replicazione del DNA [nds. La professoressa nella sua slide mette in evidenza la seguente frase presa dall’articolo Molecular structure of nucleic acids: “It has not escaped our notice that the specific pairing we have postulated immediately suggests a possible copying mechanism for the genetic material.”] Questo è l'articolo, che abbiamo già incontrato, che descrive la struttura del DNA, pubblicato nel 1953, il 25 Aprile. Siamo nel 2024, quindi sono passati 71 anni quasi. In questo lavoro, la cosa interessante è che viene messo in evidenza che la struttura del DNA suggerisce in qualche modo un “modello”, cioè che i due filamenti in realtà possano servire da stampo per la replicazione. [nds. La professoressa dice che non si soffermerà su questi argomenti perché li abbiamo già affrontati in biologia. Ad esempio nelle slides ha proiettato l’esperimento di Meselson e Stahl che abbiamo già fatto in genetica e che è possibile trovare anche nella dispensa di biologia molecolare 2020-2021. Riporto uno schemino riassuntivo.] Quindi partiamo già dall'idea che la replicazione avvenga con questo modello semi-conservativo, cioè che entrambi i due filamenti parentali servano come stampo. Qui i filamenti rossi sono gli stampi e quelli in blu sono invece quelli di nuova sintesi. [nds. Ribadisce che non approfondirà questi argomenti perché li abbiamo già trattati, ma dice che dobbiamo ricordarci che questi esperimenti avvengono verso la fine degli anni 50.] Quali furono i concetti che vennero fuori da questa serie di esperimenti fatti essenzialmente tutti con i radioisotopi? Fino agli anni 80, ma anche 90, e pure adesso, per alcuni 28 esperimenti, l'uso dei radioisotopi era quasi imprescindibile. In questi anni erano molto di moda, molto in voga. Questo tipo di esperimenti sulla replicazione usavano la timidina triziata. Essa diede la possibilità di visualizzare la replicazione del DNA al microscopio elettronico e di rispondere ad alcune domande; come ad esempio “la replicazione parte in un punto casuale lungo il cromosoma? È uni o bidirezionale?”. Questi esperimenti fatti con la timidina triziata mettevano in luce anche la formazione di intermedi, come la struttura chiamata theta θ, dalla lettera dell'alfabeto greco che stava ad indicare che la replicazione avviene in maniera bidirezionale, cioè parte in un punto e si dirama in entrambe le direzioni, quindi forma quelle che chiameremo due forche replicative o “forcelle”. Caratteristiche della replicazione del DNA Riassumendo: la struttura a doppia elica, con 2 filamenti complementari, suggerisce lo schema di replicazione del DNA; cioè ogni filamento può fungere da stampo per l’altro, come dimostrato dall’esperimento di Meselson e Stahl. Con quale meccanismo molecolare ciò avvenga è stato ed è oggetto di intense indagini. Oggi sappiamo molto del processo: coinvolge molte attività enzimatiche, ma non è ancora del tutto chiarito, soprattutto negli eucarioti. Cominciamo con la chimica della sintesi del DNA e le funzioni enzimatiche, poi vedremo i problemi connessi con la sintesi alla forcella replicativa, infine l’inizio e la terminazione. In tutte le cellule la replicazione è sotto stretto controllo, in particolare l’inizio. L’azione coordinata di tutte queste proteine permette l’attuarsi di questo processo con velocità appropriata, accuratezza e completezza. Le caratteristiche principali della replicazione del DNA, quindi, sono due: bidirezionalità e semidiscontinuità. La prima è stata spiegata precedentemente; la seconda, invece, è stata affrontata dallo scienziato Okazaki che, sempre con lo stesso tipo di esperimenti, vide che i due filamenti vengono copiati “in maniera diversa”, perché uno viene copiato seguendo la direzione canonica della sintesi, 5’-3’, l'altro filamento, invece, viene replicato in maniera frammentata. Questi frammenti presero il nome del loro scopritore, frammenti di Okazaki. Ma perché accade ciò? Nella cellula i 2 neo-filamenti vengono replicati contemporaneamente, perché i filamenti parentali vengono separati in modo che ognuno funga da stampo. La zona di separazione, dove avviene la sintesi dei 2 nuovi filamenti, è detta forcella replicativa (RF). La RF si sposta continuamente verso il DNA non ancora srotolato, assieme ai filamenti separati che fungeranno da stampo. L’antiparallelismo della doppia elica complica la replicazione simultanea dei due filamenti, poiché la DNA polimerasi può sintetizzare solo in direzione 5’-3’: solo uno dei due filamenti stampo può essere copiato in modo continuo, in direzione di apertura della forcella, ed è detto filamento guida o continuo (leading strand). Anche l’altro filamento deve essere sintetizzato dalla DNA polimerasi in direzione 5’-3’, cioè in direzione opposta a quella di apertura della forcella, quindi in modo discontinuo. È detto filamento lento o ritardato (lagging strand), perché la DNA polimerasi deve disporre di una certa quantità di stampo prima di iniziarne la sintesi. Le RF partono da un punto preciso, un punto che nel cromosoma di Escherichia Coli viene chiamato OriC. 29 In questo punto di partenza, uno è il filamento sintetizzato in maniera continua e l'altro invece è il filamento sintetizzato in maniera discontinua. I cerchi in giallo sono tutto il bagaglio di enzimi, di proteine, che sono necessari affinché questa sintesi possa venire e che nei batteri è chiamato replisoma. La sintesi di un frammento discontinuo dura fino al terminale 5’ del frammento precedente. Questi frammenti di Okazaki, variano come lunghezza fra 1000 e 2000 nucleotidi nei batteri e fra 100 e 200 nucleotidi negli eucarioti. Quindi essi sono più lunghi nei batteri nei quali, per di più, sono costituiti da due componenti: sia DNA sia RNA. Questo non è sempre vero negli eucarioti, in quanto, di solito, manca la componente a RNA. Che fine fanno i frammenti di Okazaki? Subito dopo la loro sintesi vengono saldati covalentemente in un filamento continuo, quindi sono degli intermedi di replicazione. L’inizio di un nuovo filamento dei frammenti di Okazaki richiede un innesco di RNA, in inglese primer. La necessità di creare un innesco per la DNA polimerasi è fornita da un enzima, detta primasi, in grado di sintetizzare de novo, cioè senza innesco, corti frammenti (5-10 basi) di RNA primer, poi utilizzati dalla DNA polimerasi. La frequenza di utilizzo della primasi sui due filamenti è ovviamente diversa: sul filamento guida viene utilizzata una sola volta, sull’altro tutte le volte che viene iniziato 30 un frammento di Okazaki. Dato che ad ogni forca replicativa vengono sintetizzate milioni di basi, la sintesi del filamento lento può richiedere centinaia di migliaia di frammenti di Okazaki, ciascuno col suo primer. La primasi, a differenza delle RNA polimerasi, che sintetizzano gli altri RNA cellulari, non richiede sequenze specifiche per iniziare la sintesi del primer, ma si attiva solo in associazione con proteine specifiche della replicazione. La sintesi del DNA Come avviene la sintesi del DNA? Parliamone anche dal punto di vista biochimico. Quali sono gli ingredienti per fare un buon DNA? La prima cosa che è necessaria sono i quattro precursori, i quattro deossiribonucleosidi trifostato (dNTP), cioè ATP, TTP, GTP e CTP. Poi abbiamo bisogno di un complesso innesco-stampo, quindi non è sufficiente lo stampo ma è necessario un complesso primer-stampo, che è quello di cui si è parlato precedentemente. Cosa fa il primer? Offre un gruppo 3’-OH, perché deve avvenire il legame con il fosfato in alpha del nucleotide entrante. Il nucleotide entrante deve essere complementare a quello che si trova sullo stampo. Quindi, se c'è una T, il nucleotide entrante deve essere una A. I dNTP e il primer-stampo sono le prime due componenti che servono “per fare un buon DNA”. La terza componente è l'enzima, cioè la DNA polimerasi. Vedremo che di DNA polimerasi ne esistono tantissime. 31 La rapida idrolisi del pirofosfato, da cui si ottengono due fosfati, accoppiata alla reazione nella quale viene aggiunto il nucleotide, fornisce un contributo decisivo a spostare la reazione verso destra, rendendola irreversibile (Keq=105), anche se in alcuni casi può tornare indietro. Il delta G è estremamente negativo. Enzimologia della replicazione Diciamo qualcosa sugli enzimi della replicazione, che abbiamo chiamato DNA polimerasi perché sintetizzano il DNA. Il primissimo enzima che è stato scoperto e identificato, è stato chiamato DNA polimerasi I, quindi per i procarioti la terminologia degli enzimi riflette la cronologia della scoperta: sono stati dati i nomi polimerasi I, II, III, IV, V, VI, VII, VIII, IX, X. Negli eucarioti, la denominazione cambia, perché vengono utilizzate tantissime lettere dell'alfabeto greco. Quindi, il primo enzima identificato è stato la polimerasi I, o enzima di Kornberg, il ricercatore che ha identificato l'enzima nel ‘57. Ma qual è la particolarità di questo enzima? Si tratta di un enzima monomerico, con tre attività enzimatiche, cioè con tre diversi siti attivi. Quindi è un enzima abbastanza nuovo e insolito. Esso è molto grande, se confrontato con la dimensione media delle altre proteine. Infatti si consideri che le proteine hanno delle dimensioni di 400-500 amminoacidi in media. Questa proteina ha 928 aminoacidi, quindi la polimerasi è un'unica catena di 928 aminoacidi. È stata “assimilata” nella sua struttura a una mano destra parzialmente chiusa in quanto sono riconoscibili tre domini, tanto nella proteina quanto nella mano: - il dominio delle dita, - il dominio del pollice, - il dominio del palmo. Il palmo, costituito da un foglietto beta, contiene gli elementi del sito catalitico e controlla la correttezza dell’appaiamento delle basi. La funzione delle dita è quella di trattenere il dNTP nella corretta posizione per la reazione (l’accoppiamento deve essere purina-pirimidina e non purina-purina o pirimidina-pirimidina). Le dita provocano anche una curvatura dello stampo in modo da esporre al sito attivo solo la prima base dopo l’innesco. Dopo la formazione del legame fosfodiesterico le dita si riaprono e consentono lo spostamento del complesso innesco-stampo di una coppia di basi. La funzione del pollice è quella di stabilizzare il complesso tra DNA polimerasi e substrato in modo da aumentare il numero di nucleotidi (aumento di concentrazione che, come visto nella cinetica enzimatica, fa aumentare la velocità) che possono essere aggiunti ogni volta che la DNA polimerasi si lega al complesso innesco-stampo. 32 ATTIVITA’ ESONUCLEASICA A livello del sito attivo ci sono due residui di aspartato, amminoacido acido, che quindi ha cariche negative che coordinano atomi positivi di magnesio o manganese (a seconda delle polimerasi). Questi cationi sono molto, molto, molto importanti. Perché sono importanti? Perché questi, a loro volta, coordinano atomi di ossigeno e mettono nella giusta geometria i tre gruppi fosfato del nucleotide entrante. Se questa geometria non è rispettata, che cosa succede? Si attiva il secondo sito attivo dell'enzima che è un'attività esonucleasica, che va a rimuovere il nucleotide appena inserito, quindi rompe il legame fosfodiesterico con una direzione 3’-5’. Quando è riconosciuta correttamente la geometria purina-pirimidina (e non purina-purina o pirimidina-pirimidina), la reazione di sintesi va avanti molto velocemente. Inoltre, quando è rispettato l'accoppiamento canonico di Watson e Crick, cioè la A che accoppia la T e la G con la C, la sintesi va avanti ancora più velocemente, diciamo 10.000 volte più veloce che se non entrasse, ad esempio, una G al posto dell'A, cosa che è possibile. La corretta geometria è determinante per la capacità di formare legami a idrogeno. La tautomeria cheto-enolica, infatti, è il primo responsabile dell’inserimento di nucleotidi errati a livello del sito attivo delle polimerasi. Facendo un discorso in generale, non solo sulla polimerasi I: tutte le polimerasi possono inserire un 33 nucleotide sbagliato in seguito all'evento di tautomeria cheto-enolica che, come abbiamo già detto, è molto probabile. Questo perché è sufficiente una piccola variazione locale di pH, ad esempio, o di qualcos’altro che determini questo squilibrio, e che quindi faccia cambiare le proprietà di legame a livello del sito attivo. Un'altra caratteristica che deve essere rispettata è che devono essere inseriti deossiribonucleotidi e non ribonucleotidi, anche se nella cellula sono più abbondanti i ribonucleotidi rispetto ai deossi. E quindi come si fa a distinguere deossi da non deossi? A livello del sito attivo, un ribonucleotide ha –OH, che crea una sorta di “ingombro” che non gli permette di entrare nella polimerasi; problema che, invece, i deossiribonucleotidi non hanno. I ribonucleotidi, in realtà, possono anche entrare, ma, nel caso entrassero, essi verrebbero subito eliminati. LE NUCLEASI Ora parliamo delle nucleasi. È già stata menzionata l'attività esonucleasica 3’-5’. Ma, in generale, come si chiamano gli enzimi che degradano il DNA? Saranno delle desossiribonucleasi, e gli enzimi che degradano l'RNA saranno delle ribonucleasi!!! In generale questi enzimi possiamo chiamarli anche come nucleasi. [nds. La professoressa ribadisce che se noi diciamo nucleasi non stiamo specificando se si tratta di una DNAsi o di una RNAsi, quindi se vogliamo essere precisi dobbiamo dire DNAsi o RNAsi.] 34 Le nucleasi possono a loro volta essere distinte in endonucleasi ed esonucleasi. Qual è la differenza? Si dicono “endo-nucleasi” perché tagliano all'interno dell'unità, l’”eso-nucleasi” taglia i nucleotidi alle due estremità. Visto che le estremità sono due, cioè abbiamo l'estremità al 5' e l'estremità al 3', queste attività esonucleasiche possono andare in direzione sia 3'-5' sia 5'-3'. Proofreading L’immagine soprastante è un’esemplificazione dell’attività di proofreading, cioè quell'attività di taglio del nucleotide appena inserito. Può essere paragonato al tasto delete o cancel della tastiera del computer: noi scriviamo, ci rendiamo conto di aver inserito una lettera sbagliata e, col tasto della tastiera, torniamo indietro. Questo meccanismo si attiva quando non è riconosciuta la geometria dell'accoppiamento: si attiva il sito esonucleasico (che è diverso dal sito polimerasico, cioè sta in un punto diverso) e, attraverso un taglio, viene ripristinato il corretto nucleotide. NICK TRANSLATION Qual è la terza attività enzimatica della polimerasi I? [nds. Si ricorda che le prime due solo l’attività esonucleasica e quella di proofreading.] È l'attività esonucleasica 5'-3', chiamata anche attività di nick translation. Perché si chiama attività di “nick translation”? Che cosa significa? Si ricorda che il nick, come si può vedere dall’immagine, è un'interruzione della catena dovuta ad un errore, quindi manca un legame fosfodiesterico. In questa situazione, la DNA polimerasi I che cosa può fare? Si lega, “e sta in una situazione che per lei è ideale”, nel senso che riconosce il 3’-OH, e quindi può polimerizzarlo. Però, avendo tanti nucleotidi davanti, di fatto non può polimerizzarlo: quello che deve fare è, quindi, rimuovere prima questi nucleotidi. Questo può farlo solo grazie l'attività esonucleasica 5'-3'. Tutto ciò avviene in presenza di magnesio perché il magnesio è fondamentale per tutte le DNA polimerasi. Alla fine si ottiene uno spostamento del nick, quindi una translation del nick, cioè il nick è passato da una 35 posizione x a una posizione y. Questo è il motivo per cui si parla di “nick translation”. Ma a che cosa serve fisiologicamente, ovvero nella replicazione? Ci serve sul filamento ritardato, sul filamento lagging, dove ci sono tanti frammenti di Okazaki e primer. La DNA polimerasi I si lega in un punto di discontinuità del filamento, rimuove il primer del frammento che le sta davanti e può continuare la sintesi del frammento, può spostare i nick e, spostando tutti i nick, elimina tutti i frammenti di RNA. Fatta questa operazione, alla fine servirà poi soltanto una DNA ligasi che ripristina la continuità dei frammenti e del filamento. Quando si è capito che esisteva questa attività di nick translation, questa è stata subito utilizzata per la sintesi delle sonde per l'ibridazione. Ora facciamo una piccola parentesi sulle tecniche di biologia molecolare, che sono veramente tra le primissime tecniche che sono state messe a punto: utilizzando una DNA polimerasi I, si era in grado di sintetizzare delle sonde. Che cosa sono le sonde? Abbiamo detto che nell''ibridazione c’è bisogno di regioni di DNA o di RNA, adesso facciamo il caso di DNA, che siano individuabili, ad esempio, marcate con il fosforo. Questo è quello che si faceva da sempre, quello che si è fatto per tantissimi anni, invece oggi più che la radioattività si utilizza la fluorescenza o altri sistemi di visualizzazione. Il concetto è rimasto sempre lo stesso, però può essere anche non radioattiva la molecola. Che accade? Se si ha la DNA polimerasi I e un DNA, si possono provocare dei nick sul DNA, nick che possono essere provocati attraverso un trattamento con DNAsi. [nds. La professoressa aggiunge che quindi i nick vengono in realtà provocati sia su un filamento che sull’altro filamento, non come nell’immagine.] Si aggiunge la DNA polimerasi I con i quattro nucleotidi dei quali almeno uno deve essere radioattivo, ma potrebbero anche essere tutti radioattivi. L’enzima compie attività di polimerizzazione e di esonucleasi al 5'-3', sostituendo il 36 DNA con nucleotidi radioattivi: il risultato è quello di avere alla fine un frammento di DNA tutto reattivo, che può essere utilizzato negli esperimenti di ibridazione. La DNA polimerasi I può essere, siccome è piuttosto grande, sottoposta a trattamenti con proteasi, [nds. le proteasi sono enzimi che catalizzano la rottura del legame peptidico] vengono fuori due frammenti della DNA polimerasi. Uno dei due, quello più grande, è di più di 600 aminoacidi ed è chiamato frammento di Klenow, dal ricercatore che mise a punto a questo tipo di esperimenti, quello più piccolo è di circa 300 aa. Ma il frammento di Klenow, che cosa contiene? Contiene solo l'attività polimerasica e l'attività di proofreading, quindi separa da queste l'attività di nick translation, al contrario della DNA polimerasi I che aveva tutte e tre le attività, e questo può essere molto utile in una serie di esperimenti che si possono fare per la sintesi del DNA in laboratorio, cioè quando si vuole in laboratorio utilizzare l’enzima per la sintesi del DNA. L’attività di proofreading è la primissima attività di riparazione in caso di mutazioni che noi stiamo vedendo nella sintesi del DNA, perché l'accoppiamento con un nucleotide errato al momento della sintesi è un evento piuttosto frequente. Questo errore ha una frequenza media di 105, cioè un nucleotide ogni 10.000 risulta essere sbagliato. Quindi la capacità della polimerasi di inserire nucleotidi sbagliati è di uno ogni 105, però bisogna considerare l'interezza del cromosoma, che in caso di Escherichia Coli è di 4 milioni e 600 mila, quindi andando a moltiplicare il numero di mutazioni, e questi eventi possono anche aumentare in seguito anche ad altre situazioni, agenti mutageni esterni o interni, il numero che ne

Dispense di Biologia Molecolare - PDF

Document Details

Tags

Related

Summary

Full Transcript