Capitolo 2 Struttura acidi nucleici PDF
Document Details
Uploaded by ResplendentAffection5542
Tags
Related
- BNUR 2003 Biomedical Chemistry and Lab Diagnostics Lecture Notes PDF
- BNUR 2003 Biomedical Chemistry & Lab Diagnostics PDF
- Master I Biochimie 2023 PDF
- Module 12: Les acides nucléiques - Biochimie Structurale BCM-1001 - Cahier d'accompagnement PDF
- Biochemical Genetics PDF - Lecture Notes
- Cours Biochimie Structurale - A.N - 2023-2024 - Pr. Derwich - PDF
Summary
Il capitolo presenta una descrizione della struttura degli acidi nucleici, DNA e RNA. Vengono spiegati i nucleotidi, le basi azotate e le diverse forme di DNA e RNA. Sono inclusi esempi e illustrazioni per comprendere i concetti presentati.
Full Transcript
A 2 Struttura degli acidi nucleici 2.1 Struttura chimica degli acidi nucleici 2.2 Struttura fisica del DNA: la scoperta della strut...
A 2 Struttura degli acidi nucleici 2.1 Struttura chimica degli acidi nucleici 2.2 Struttura fisica del DNA: la scoperta della struttura a doppia elica 2.3 Struttura fisica del DNA: i parametri strutturali della doppia elica 2.4 Topologia del DNA e DNA topoisomerasi 2.5 Struttura dell’RNA 2.1 Struttura chimica degli acidi nucleici Gli acidi nucleici, DNA e RNA, sono costituiti da catene polinucleotidiche, cioè polimeri lineari di unità chiamate nucleotidi. Descriveremo prima i singoli nucleotidi isolati, per poi vedere come questi sono legati tra loro in una catena di acido nucleico. I nucleotidi sono molecole costituite da tre componenti: uno zucchero pento- so, una base azotata, uno o più gruppi fosfato. Nel caso del DNA lo zucchero è il deossiribosio (chiamato anche desossiri- bosio), mentre nell’RNA è il ribosio. Come si vede in figura 2.1, i due zuccheri Purine Pirimidine NH2 O O NH2 O H H CH3 H N N 6 4 N3 4 7 5 6 1 N 7 5 1 N N3 5 4 5 N3 5 8 8 9 4 2 9 4 2 2 6 2 6 2 6 3 3 1 1 1 N N N N O N O N O N H2N H H H H H Adenina (A) Guanina (G) Timina (T) Citosina (C) Uracile (U) 5 5 HO CH2 OH HO CH2 OH O O 4 1 4 1 3 2 3 2 OH OH OH Ribosio Deossiribosio Figura 2.1 Strutture dei componenti chimici degli acidi nucleici. ISBN 978-88-08-18518-1 CAPITOLO 2 Struttura degli acidi nucleici A 13 Tabella 2.1 Basi, nucleosidi e nucleotidi. Abbreviazione Basi Nucleosidi Nucleotidi RNA DNA Adenina Adenosina Acido adenilico AMP dAMP Guanina Guanosina Acido guanilico GMP dGMP Citosina Citidina Acido citidilico CMP dCMP Timina Timidina Acido timidilico dTMP Uracile Uridina Acido uracilico UMP differiscono per un gruppo OH presente sulla posizione 2 del ribosio e che man- ca nel deossiribosio. Come vedremo più avanti, questa differenza è molto rile- vante, in quanto questo gruppo OH conferisce instabilità alle molecole di RNA. Il DNA che ha un H in quella stessa posizione è metabolicamente più stabile. Le basi azotate che si trovano negli acidi nucleici naturali sono di due tipi: pu- rine (a doppio anello eterociclico) e pirimidine (a singolo anello). La figura 2.1 mostra le specifiche basi che si trovano negli acidi nucleici naturali: due purine, adenina e guanina, presenti sia nel DNA che nell’RNA, e tre tipi di pirimidine, citosina, timina e uracile, di cui la citosina è comune a DNA e RNA, mentre la timina è componente del solo DNA trovandosi al suo posto l’uracile nell’RNA. La differenza tra uracile e timina è la presenza di un gruppo metilico in posizione 5 dell’anello pirimidinico. Di solito ci si riferisce alle basi con le loro iniziali A, C, G, T e U. La figura 2.2 illustra le posizioni e le modificazioni chimiche che possono avvenire nelle basi. Più avanti vedremo come queste basi modificate sia nell’RNA che nel DNA abbiano un ruolo essenziale in molti processi biologici. Quando una delle suddette basi è legata alla posizione 1 di uno zucchero (ribosio o deossiribosio), abbiamo i nucleosidi, che prendono il nome di adeno- sina, guanosina, citidina, timidina e uridina (tab. 2.1). Poiché in ciascun nucle- oside sia lo zucchero che la base azotata hanno una numerazione 1, 2, 3 ecc. per indicare le varie posizione della molecola (vedi numerazioni in fig. 2.3), si usa aggiungere un apice ['] alla numerazione relativa allo zucchero per distinguerla da quella della base. Ai nucleosidi possono essere legati uno o più gruppi fosfato e, in tal caso, prendono il nome di nucleotidi: questi sono chiamati acido adenilico, acido guanilico ecc., come mostrato in tabella 2.1. Infatti, il gruppo fosfato conferisce una valenza acida alla molecola. La figura 2.3 mostra come il gruppo fosfato possa trovarsi legato al carbonio 5' dello zucchero oppure al carbonio 3'. Inoltre, considerati come molecole indipendenti (cioè non inserite nella catena polinu- cleotidica), i nucleotidi possono contenere un solo gruppo fosfato oppure due o tre. In particolare, i nucleotidi che vengono utilizzati come substrato per la sintesi del DNA e dell’RNA hanno tre gruppi fosfato legati in serie sulla posizione 5' dello zucchero, come mostrato in figura 2.4. In questo caso i tre gruppi fosfato vengono indicati, a partire da quello legato direttamente allo zucchero, con α, β e γ. Come mostrato in tabella 2.1, l’abbreviazione per i nucleotidi è la lettera che indica la base (A, G ecc.) preceduta da una lettera “d” minuscola nel caso la base sia legata al deossiribosio, e seguita dall’indicazione del numero di gruppi fosfato: MP (monofosfato), DP (difosfato) o TP (trifosfato). Per esempio: dGMP, deos- siguanosina monofosfato, è un deossiribosio legato a una guanina e a un gruppo fosfato; ATP, adenosina trifosfato, è un ribosio legato a un’adenina e a tre gruppi fosfato. In figura 2.5 si può vedere che una base legata allo zucchero si definisce nucleoside e se il nucleoside è legato al fosfato si chiama nucleotide. 14 A Dalla scoperta del DNA al codice genetico e struttura degli acidi nucleici ISBN 978-88-08-18518-1 O NH H N 5 4 7 5 6 1N 8 Inosina (I) 6 3N CH3 3-metilcitidina (m3C) 9 4 2 1 3 2 N N N O Ribosio Ribosio CH3 NH2 5 4 CH3 O 6 3N 5-metilcitidina (m5C) 1 N+ H 2 5 6 1N N 8 7 7-metilguanosina (m7G) 9 4 2 O N 3 Ribosio N Ribosio CH3 N H O N N6-metiladenosina (m6A) 5 4 5 6 1N 3N 8 7 6 H 5,6-diidrouridina (D) 4 2 1 9 2 N 3 N N O Ribosio Ribosio H O S N 5 4 3 2 1N H 3N H 4 5 Pseudouridina (Ψ) 6 1 4-tiouridina (4T) 6 2 N O O Ribosio Ribosio O O H H N 7 5 6 1N N 8 N2-N2-dimetilguanosina (m G) 2,2 5 6 1N 2 7 9 4 3 CH3 8 9 4 2 N2-metilguanosina (m2G) N N 3 N N N HN Ribosio CH3 Ribosio CH3 O O CH3 NH O H3C NH CH O H N CH2 5 6 1N 7 N1-metiladenosina (m1A) O Wybutosina (yW) 8 9 4 2 H2C 3 N N N 7 5 6 1N 8 H3C Ribosio 9 4 3 2 N N N Ribosio CH3 Ribonucleotidi modificati CH3 N H CH3 NH2 N 5 4 7 5 6 1 N 8 2 6 3N 5-metilcitidina (m5C) 9 4 3 N6-metiladenosina 1 2 N N N Deossiribosio O Deossiribosio Deossiribonucleotidi modificati Figura 2.2 Basi modificate che si possono trovare nell’RNA e nel DNA. ISBN 978-88-08-18518-1 CAPITOLO 2 Struttura degli acidi nucleici A 15 Figura 2.3 I nucleotidi posso- no portare il gruppo fosfato in posizione 5' o 3'. O –O O CH2OH P CH2 O O O– O OH OH OH –O O P O– 3'-monofosfato 5'-monofosfato (Pirimidina) (Purina) Figura 2.4 Nomenclatura dei gruppi fosfato in un nucleosi- de trifosfato. Il gruppo fosfato O O O in posizione α è quello che si –O ritrova nello scheletro degli aci- P O P O P O CH2 di nucleici. O O– O– O– γ β α OH OH Figura 2.5 Basi, nucleosidi Base P Base e nucleotidi. Una base legata O O O allo zucchero costituisce un nucleoside. Se il nucleoside è Base P legato a uno o più gruppi fosfa- to viene detto nucleotide. Ribosio o Nucleoside Fosfato Nucleotide deossiribosio Passiamo ora a vedere come i nucleotidi sono legati tra loro a formare una ca- tena polinucleotidica di DNA o di RNA. La figura 2.6 mostra che lo scheletro (o impalcatura) della catena polinucleotidica è costituito dall’alternanza di zuccheri (deossiribosio o ribosio) e di gruppi fosfato, e che le basi sporgono lateralmente da questo scheletro. Infatti, ciascuna base è legata alla posizione 1' di uno zuc- chero da un legame glicosidico che interessa l’N1 delle pirimidine o l’N9 delle purine. Va notato che tra uno zucchero e l’altro c’è un solo gruppo fosfato e che quindi si tratta di un polimero di nucleosidi monofosfato; infatti, durante la sin- tesi degli acidi nucleici, ciascun nucleoside trifosfato utilizzato come substrato, perde due dei suoi tre gruppi fosfato (vedi oltre). Come evidenziato nella figura, ciascun gruppo fosfato forma un legame estere con il carbonio 5' di uno zucchero e un secondo legame estere con il carbonio 3' dello zucchero successivo. Questo tipo di legame, chiamato fosfodiesterico, conferisce una sorta di asimmetria, o meglio di polarità, alla catena polinucleotidica, nel senso che questa presenta due diverse estremità: da una parte c’è un nucleotide che ha il carbonio 5' libero, mentre il carbonio 3' è impegnato nel legame fosfodiesterico con il nucleotide adiacente; dall’altra la molecola polimerica termina con un nucleotide che ha il carbonio 5' impegnato nel legame fosfodiesterico con quello adiacente, mentre 16 A Dalla scoperta del DNA al codice genetico e struttura degli acidi nucleici ISBN 978-88-08-18518-1 Figura 2.6 Una catena poli- 5' nucleotidica ha una struttura ripetitiva. Essa consiste di uno O scheletro (o impalcatura) in cui NH2 si alternano zuccheri e gruppi –O P O fosfato, legati tra loro da lega- Subunità mi 5' → 3' fosfodiesterici. Da N C O C N nucleotidica questa impalcatura protrudono HC lateralmente le basi azotate. CH 2 C CH O N N O O –O O H P Scheletro di O C NH2 Base zucchero-fosfato HC C pirimidinica CH2 O N N C O Legami fosfodiesterici O O 5'-3' –O O P O N C Base O C NH purinica HC CH2 O C C N N NH2 O O –O O P O 3' il carbonio 3' è libero. 5' e 3' liberi vuol dire che questi C-terminali non sono impegnati in legami fosfodiesterici; la loro valenza è comunque impegnata da gruppi –OH o da gruppi fosfato. Questa polarità 5' → 3' delle catene polinucleotidiche, sia di DNA che di RNA, è molto importante. Infatti, la struttura dello scheletro della catena poli- nucleotidica è diversa se vista da un estremo o dall’altro e, come vedremo nelle pagine seguenti, tutte le reazioni di sintesi e copiatura (replicazione, trascrizio- ne e traduzione), e anche la maturazione e la degradazione degli acidi nucleici, coinvolgono attività enzimatiche che sono specifiche per l’una o l’altra direzione. Per convenzione le sequenze degli acidi nucleici si scrivono in direzione 5' → 3', cioè dall’estremità 5' libera a sinistra all’estremità 3' libera a destra. In disegni, sche- mi e sequenze è in genere utile indicare le due estremità, ma è sicuramente indispen- sabile evidenziarle laddove non fosse rispettata la direzione convenzionale 5' → 3'. La figura 2.7 mostra un modo spesso usato per schematizzare una catena polinucleotidica: in questo schema le barrette verticali indicano gli zuccheri e quelle oblique i gruppi fosfato che uniscono il carbonio 3' di uno zucchero con il carbonio 5' dello zucchero adiacente. Si noti che a sinistra vi è l’estremità 5' libera (in questo caso porta un gruppo fosfato) e a destra l’estremità 3' libera (in questo caso porta un gruppo OH). Le basi vengono indicate con le convenzionali lettere A, U, C, G, legate al carbonio 1' degli zuccheri. Negli anni quaranta del secolo scorso fu acquisita un’altra informazione sulla struttura chimica del DNA. Si tratta delle ricerche del chimico di origine austriaca ISBN 978-88-08-18518-1 CAPITOLO 2 Struttura degli acidi nucleici A 17 Figura 2.7 Schema semplifi- A U C G cato di una catena polinucleo- tidica di RNA. 2' OH 2' OH 2' OH 2' OH 3' 3' 3' 3' P P P P OH 5' 5' 5' 5' Tabella 2.2 Composizione in basi del DNA di varie specie. Fonte A G C T A/T G/C G+C Py/Pu Escherichia coli 26,0 24,9 25,2 23,9 1,08 0,99 50,1 1,04 Mycobacterium tuberculosis 15,1 34,9 35,4 14,6 1,03 0,99 70,3 1,00 Lievito 31,7 18,3 17,4 32,6 0,97 1,05 35,7 1,00 Bue 29,0 21,2 21,2 28,7 1,01 1,00 42,4 1,01 Maiale 29,8 20,7 20,7 29,1 0,92 1,00 41,4 1,01 Uomo 30,4 19,9 19,9 30,1 1,01 1,00 39,8 1,01 Erwin Chargaff (1905-2002), anche lui emigrato per motivi razziali negli Stati Uniti, dove condusse, presso la Columbia University a New York, le sue ricerche sulla composizione in basi del DNA. Chargaff si era accorto che preparazioni di DNA di origine diversa possono avere un differente contenuto delle quattro basi A, C, G e T (espresse come contenuto percentuale). Compì quindi numerosi e lunghi studi di analisi quantitativa e concluse che, mentre organismi di diverse specie possono avere DNA con composizione in basi differente, il DNA preparato da diversi tessuti od organi della stessa specie ha sempre la stessa composizione in basi. Questa costanza nell’ambito dello stesso organismo e diversità tra organismi diversi ben si accordava con l’idea del ruolo del DNA come materiale genetico. Nel corso di questi studi Chargaff fece un’altra osservazione che si rivelò poi importante nel momento in cui Crick e Watson affrontarono il problema della struttura fisica del DNA. Come mostrato in tabella 2.2, Chargaff osservò che, qualsiasi sia la fonte del DNA e nonostante la diversa composizione in basi, veniva sempre rispettata una regola (che venne poi chiamata regola di Chargaff): la per- centuale di A è sempre uguale alla percentuale di T, e la percentuale di C è sempre uguale alla percentuale di G. Questa regola non è valida nel caso dell’RNA. 2.2 Struttura fisica del DNA: la scoperta della struttura a doppia elica Era chiaro in quegli anni che per svelare il mistero della funzione dei geni fosse necessario conoscere la struttura del DNA. Per comprendere la funzione di una macromolecola, infatti, non basta conoscerne la struttura chimica, ma è neces- sario conoscerne la struttura tridimensionale. È interessante il fatto che già nel 1940 due personaggi di primo piano della scienza di allora, Max Delbrück (vedi fig.1.2) e Linus Pauling (fig. 2.8), scrissero insieme un lavoro pubblicato sulla rivista scientifica Science in cui si avventuravano in congetture sulla struttura del gene. A quell’epoca non si sapeva ancora che il materiale genetico fosse il DNA. I 18 A Dalla scoperta del DNA al codice genetico e struttura degli acidi nucleici ISBN 978-88-08-18518-1 due autori pensavano piuttosto a geni fatti di proteine, tuttavia raggiunsero delle conclusioni che potremmo definire profetiche. Il loro ragionamento partiva dalla considerazione che una delle due proprietà fondamentali di un gene è la capacità di essere duplicato (l’altra è la proprietà di esprimere un carattere o fenotipo). La duplicazione di un oggetto non è qualche cosa che in natura si osserva comunemente, se si escludono i sistemi viventi, dove appunto sono implicati i geni. Anche con le sofisticate tecnologie di oggi, non si è riusciti a costruire una macchina che sappia duplicarsi. Al massimo possiamo fare una macchina molto complessa capace di duplicare un oggetto semplice. Quello che invece appare molto più facile è fare uno stampo (un calco), produ- cendo quindi un oggetto con struttura complementare all’oggetto originale. Con questo stampo possiamo, ripetendo l’operazione, riprodurre l’oggetto originale. Figura 2.8 Linus Pauling Applicando questo ragionamento alla struttura dei geni, Delbrück e Pauling con- (1901-1994). Pauling è sta- to un grande chimico che clusero che, strutturalmente, un gene doveva essere costituito da due parti com- oltre a risolvere la struttura plementari, nel senso di superfici complementari che possano fare ciascuna da dell’alfa elica delle proteine, stampo per la replicazione. È evidente come questa idea si sia poi rivelata esatta ricerca per la quale ha ot- tenuto il premio Nobel, ha nella struttura a due filamenti complementari del DNA. svolto studi fondamentali Dopo l’identificazione del DNA come materiale genetico, vari laboratori co- sui legami chimici. Ha rice- vuto anche un secondo No- minciarono a interessarsi alla sua struttura tridimensionale utilizzando per lo più bel per la pace. le tecniche che erano state messe a punto e già applicate con successo allo studio della struttura delle proteine. Tra questi pochi gruppi primeggiavano, agli inizi degli anni cinquanta, due laboratori: quello di Linus Pauling, in California, e quello di Maurice Wilkins e Rosalind Franklin a Londra (fig. 2.9A). La tecnica che si è dimostrata fondamentale per risolvere la struttura del DNA è stata la diffrazione dei raggi X, anche se altri tipi di informazioni ottenute con metodi diversi sono state pure importanti. La tecnica della diffrazione dei raggi X richiede che la macromolecola che si vuole analizzare possa essere ottenuta in forma di cristallo in cui le molecole, e quindi gli atomi che le compongono, sono tutte allineate in maniera ordinata. La figura 2.10 mostra uno schema semplificato di un diffrattometro a raggi X. Men- tre era relativamente facile ottenere piccoli cristalli di proteine purificate, questo non si rivelò possibile per il DNA. Tuttavia, anche se non si tratta di un vero cristallo, il DNA può essere ridotto in forma di fibre in cui le lunghe molecole del DNA sono orientate più o meno parallelamente l’una all’altra. Queste fibre di molecole orientate permisero di ottenere delle immagini di diffrazione dei raggi A B Figura 2.9 (A) Maurice Wilkins (1916-2004) e Rosalind Franklin (1920-1958). (B) Appunti di Rosalind Franklin sulla struttura del DNA. ISBN 978-88-08-18518-1 CAPITOLO 2 Struttura degli acidi nucleici A 19 ω Circolo-Chi Rivelatore Specchi che concentrano e focalizzano il fascio Cristallo Sorgente di raggi X di raggi X χ φ Fascio Fascio primario mirato di raggi X θ Figura 2.10 Schema semplificato di un diffrattometro a raggi X. A B 3,4 Å 34 Å Figura 2.11 Fotografie di diffrazione dei raggi X di fibre di Crick sulla base della foto di diffrazione prodotta dalla Franklin. DNA. (A) Fotografia originale ottenuta da Rosalind Franklin. (B) (Per gentile concessione del Dolan DNA Learning Center, Cold Appunti per il calcolo dei parametri dell’elica effettuati da Francis Spring Harbor, NY.) X che, anche se non ottimali, consentirono di ricavare alcuni parametri struttu- rali. Nel 1952 Pauling propose una struttura, che però si rivelò poi sbagliata: tre eliche intrecciate tra loro con lo scheletro zucchero-fosfato all’interno e le basi sporgenti verso l’esterno. Questo particolare delle basi rivolte all’esterno era stato proposto per giustificare il fatto che i dati sperimentali indicavano che gli sche- letri zucchero-fosfato delle eliche formano una struttura regolare con diametro abbastanza costante, cosa difficile da spiegare se le basi, pirimidine più piccole e purine più grandi, si fossero trovate all’interno della struttura. Nel frattempo Rosalind Franklin a Londra andava producendo immagini di diffrazione dei raggi X sempre migliori (fig. 2.11A) ma evitava di lanciarsi in proposte di modelli ri- tenendo necessario accumulare più dati certi. È a questo punto che intervennero Francis Crick e James Watson (fig. 2.12A). Crick era già al Cavendish Laboratory a Cambridge e lavorava a problemi di struttura delle proteine. Watson era un 20 A Dalla scoperta del DNA al codice genetico e struttura degli acidi nucleici ISBN 978-88-08-18518-1 A B C Figura 2.12 Crick, Watson e la doppia elica. (A) Francis Crick e James Watson passeggiano lungo “The Backs” a Cambridge nel 1953. (B) Modello in metallo della doppia elica del DNA alto quasi due metri, realizzato da Watson e Crick nel 1953. (C) Figura originale riportata nella pubblicazione di Watson e Crick, Nature, aprile 1953. giovanissimo borsista venuto dagli Stati Uniti, dove aveva fatto il dottorato con Salvador Luria, e proveniva, quindi, dal menzionato gruppo del fago. I due stabi- lirono una collaborazione, oltre a un’amicizia personale, e avendo ben chiaro che scoprire la struttura del DNA era la vera sfida del momento che avrebbe cambiato completamente la Biologia, si dedicarono a questo problema. I dati sperimentali che utilizzavano erano, oltre a quelli prodotti da loro su una fibra di DNA diversa da quella analizzata dalla Franklin, quelli che gli altri gruppi, soprattutto i vicini del King’s College a Londra, pubblicavano o presentavano in occasione di conve- gni o seminari scientifici. Quando Crick vide la foto di diffrazione prodotta dalla Franklin, capì subito che si trattava di un’elica e provò a calcolarne i parametri, come mostrato in figura 2.11B. Inoltre, Watson e Crick scelsero come approc- cio quello di tentare di costruire dei modelli (con le basi ritagliate in cartone, fili di ferro ecc.) e di confrontarli con i dati sperimentali di diffrazione dei raggi X, procedendo in una serie di prova-errore. Watson racconta che la mattina del 28 febbraio 1953 stava provando con dei modelli di cartone a formare possibili appaiamenti tra le basi e si accorse che se si appaiava A con T e G con C si ottene- vano due coppie le cui estremità avevano la stessa distanza. La cosa più importante era che le coppie così formate erano sovrapponibili e, quindi, in grado di formare molecole di lunghezza praticamente infinita se si impilavano una sull’altra. Inol- tre, erano convinti che la struttura di Pauling con i fosfati al centro dell’elica fosse sbagliata e quindi decisero di disporre i due filamenti zucchero-fosfato all’esterno e di sistemare le basi affacciate all’interno della struttura. Questa soluzione, insieme all’idea di mettere di fronte una A a una T e una C a una G, permetteva allo stesso tempo di giustificare la regolarità del diametro della doppia elica (ogni coppia di ISBN 978-88-08-18518-1 CAPITOLO 2 Struttura degli acidi nucleici A 21 basi è costituita da una purina e una pirimidina) e di dare una spiegazione logica alla regola di Chargaff (la quantità di A è uguale alla quantità di T e la quantità di G è uguale alla quantità di C). La struttura del DNA era dunque risolta. La figura 2.12B mostra il modello di metallo che avevano costruito per studiarne le caratteristiche, mentre la figura 2.12C mostra la figura originale dell’articolo che Watson e Crick pubblicarono sulla rivista scientifica Nature il 25 aprile 1953. 2.3 Struttura fisica del DNA: i parametri strutturali della doppia elica Secondo il modello proposto da Crick e Watson le coppie di basi, che con i loro anelli eterociclici sono strutture sostanzialmente piatte, sono disposte quasi per- pendicolarmente rispetto all’asse della doppia elica, come a formare dei gradini di una scala a chiocciola (fig. 2.13). Le basi che si affacciano in ciascuna coppia sono sempre una pirimidina e una purina e in particolare vi è sempre l’appaia- mento tra una A e una T e tra una G e una C, il che giustifica la regolarità del diametro della doppia elica. Come mostrato in figura 2.14, nella coppia di basi A-T la A si viene a trovare di fronte alla T con una geometria e una distanza tali da permettere la formazione di due legami idrogeno, mentre nella coppia G-C la G e la C formano tre legami idrogeno. Una caratteristica importante del modello è che le due catene polinucleotidiche sono “antiparallele”, cioè sono disposte con una polarità 5' → 3' opposta l’una rispetto all’altra, come mostrato in figura 2.15 dove si può osservare anche come i due filamenti siano costituiti dall’alternanza di residui di deossiribosio e di gruppi fosfato, mentre le basi sporgono lateralmente per appaiarsi con quelle dell’altro filamento. La doppia elica (duplex) del DNA ha una struttura regolare, destrorsa, compie un giro completo ogni 34 Å e ha un diametro di circa 20 Å. La distanza tra due coppie A 3' 5' Legame idrogeno B 1 giro d’elica = 34 Å = ∼10,5 paia di basi Base 12 Å Impalcatura Solco (1,2 nm) minore zucchero-fosfato 22 Å Solco (2,2 nm) Adenina maggiore Guanina Citosina Timina 3' 5' H O C nei fosfati della CeN P 20 Å (2 nm) catena fosfodiesterica nelle basi Figura 2.13 Due diverse rappresentazioni grafiche della dop- cui l’impalcatura zucchero-fosfato è rappresentata dai nastri. (B) pia elica del DNA, dove sono indicate le dimensioni e alcune Struttura molecolare ad atomi pieni. caratteristiche strutturali. (A) Rappresentazione schematica in 22 A Dalla scoperta del DNA al codice genetico e struttura degli acidi nucleici ISBN 978-88-08-18518-1 Figura 2.14 Legami idrogeno H tra le coppie di basi del DNA. (A) Tra la G e la C della coppia N di basi G-C si formano tre lega- H mi idrogeno. (B) Tra la A e la T O 4 della coppia A-T se ne formano N N3 C due. 6 H 2 N G 1N N 2 O Zucchero N H Zucchero N H CH3 H O H N 4 N N3 T 6 H N N A 1N O Zucchero N Zucchero Figura 2.15 Appaiamen- 5' to tra le basi di due catene polinucleotidiche. Si noti H O l’appaiamento specifico tra le O– basi complementari (A con T P H N N e G con C) e l’opposta polarità CH3 O O O 5' 3' delle due catene polinu- 3' N CH2 cleotidiche complementari. H N A T N O HO N N O H O O– O P CH2 N H O O O O O N N C P CH2 H N O –O O G N N O N H N O CH3 O– O P CH2 H H O H O O N O O N T N CH2 P H N O –O A N O N O N O O– H O P CH2 H O N O O O O P H N G CH2 C N O –O O N O H N H OH O CH2 3' O O P –O O 5' ISBN 978-88-08-18518-1 CAPITOLO 2 Struttura degli acidi nucleici A 23 Figura 2.16 Gruppi chimici Solco maggiore delle basi esposti nel solco maggiore e nel solco minore D del DNA. Si noti la posizione di legame delle basi con gli H H zuccheri, spostata rispetto all’asse centrale delle basi ap- H paiate. Questa posizione crea A N A un’asimmetria nella molecola H O 4 5 generando i due solchi di di- N N C mensioni diverse. Le lettere in 7 2 N rosso identificano i vari gruppi: 6 H G N A: accettore di legami idroge- N 2 O 3 O no; D: donatore di legame idro- N H dR geno; H: idrogeni non polari; dR N A M: gruppo metilico. O A H D Solco minore Solco maggiore M D A CH3 A H O H 5 N 4 N N T 7 2 N 6 H A N N 2 O 3 O N dR H dR A O A H Solco minore di basi adiacenti è di 3,4 Å e ci sono, quindi, circa 10 coppie di basi per ogni giro di elica. L’elica presenta un’asimmetria dovuta alla posizione delle molecole di de- ossiribosio ai lati delle basi: infatti, come conseguenza dell’opposta polarità 5' → 3' delle due eliche, i due zuccheri di ciascuna coppia di nucleotidi si vengono a trovare dallo stesso lato (fig. 2.16). Come evidente in figura 2.13, questa asimmetria genera nella doppia elica due solchi di dimensioni diverse, detti appunto solco maggiore e solco minore. Questi due solchi sono molto importanti per il riconoscimento della sequenza del DNA: il solco maggiore ha molti più atomi che possono essere donato- ri o accettori di legami idrogeno e come conseguenza si può dire che il “linguaggio” presentato da questa zona dell’elica è molto più vario e ricco che nel solco minore. Inoltre, come mostrato in figura 2.17, l’α-elica delle proteine ha la dimensione giusta per poter interagire esattamente con il solco maggiore. Come vedremo in seguito, infatti, quasi tutte le proteine che si legano specificamente al DNA hanno dei domini ad α-elica che riconoscono le sequenze esposte nel solco maggiore. Stabilità della doppia elica di DNA in soluzione Facciamo qualche considerazione sulla stabilità della molecola di DNA a doppia elica in soluzione acquosa. Le catene polinucleotidiche singole hanno una parte idrofilica, lo scheletro zucchero-fosfato, e una parte idrofobica, le basi. Nella 24 A Dalla scoperta del DNA al codice genetico e struttura degli acidi nucleici ISBN 978-88-08-18518-1 Figura 2.17 Le proteine inte- α-elica ragiscono generalmente con il solco maggiore del DNA. Il solco maggiore della doppia elica del DNA ha la dimensione giusta per accogliere e interagi- re con la struttura α-elica delle proteine. Solco Solco minore maggiore A B 3,4 nm 0,34 nm C Figura 2.18 Impilamento delle basi. (A) In questa rappresentazione del DNA si apprezza bene come le paia di basi siano planari e sovrapposte (impilate) l’una sull’altra; esse sono quasi perpendicolari all’asse della doppia elica, ma dR non sempre perfettamente parallele tra loro. (B) Immagine del DNA visto lungo il suo asse che mostra, all’esterno, lo scheletro zucchero-fosfato e, all’interno, dR le paia di basi sovrapposte. (C) Particolare di due paia di basi adiacenti sovrap- poste viste lungo l’asse della doppia elica; si può osservare come in realtà la so- dR vrapposizione delle paia di basi è solo parziale perché, a causa della rotazione dell’elica, ogni coppia è girata, rispetto a quella adiacente, di un angolo (twist) dR di circa 34° (360° per ogni giro di elica, cioè ogni 10,5 paia di basi). struttura a doppia elica i due scheletri zucchero-fosfato, idrofilici, con le cari- che negative dei fosfati, si dispongono all’esterno della struttura a contatto con l’acqua, mentre le basi (idrofobiche) vanno a disporsi all’interno sfuggendo così all’acqua. Nel suo insieme, la stabilità della doppia elica, cioè la propensione a mantenere le due catene polinucleotidiche legate tra loro, dipende da varie forze. I due scheletri che contengono gli atomi di fosforo carichi negativamente tendono a respingersi; questa repulsione viene controbilanciata da due tipi forze che tendono a mantenerle appaiate. Innanzitutto i legami idrogeno tra le basi, che, come abbiamo detto, sono tre tra ogni coppia G-C e due tra ogni coppia A-T. Benché questo appaiamento delle basi complementari sia essenziale per la specificità di legame, i legami H tra le basi contribuiscono solo in parte alla stabi- lità della doppia elica. Infatti, questa stabilità è aumentata dall’effetto idrofobico dovuto all’impilamento (stacking) delle basi. Questo è spiegato in figura 2.18, dove, guardando lungo l’asse dell’elica, si vede come le coppie di basi adiacenti presentino una considerevole sovrapposizione, anche se non completa a causa della rotazione dell’elica. Questa sovrapposizione è stabilizzata dalla idrofobici- tà delle basi stesse, che, così impilandosi, mantengono minimo il contatto con l’acqua. Gli orbitali p degli anelli aromatici tendono a formare legami deboli che stabilizzano l’elica. La tabella 2.3 riporta il contenuto energetico delle varie com- binazioni tra le coppie di basi. Va sottolineato che c’è una differenza di energia se sopra una coppia di AT c’è una coppia di GC o di CG, nel senso che la geometria di impilamento ha un’influenza da un punto di vista energetico. ISBN 978-88-08-18518-1 CAPITOLO 2 Struttura degli acidi nucleici A 25 Tabella 2.3 Energia di impilamento delle coppie di paia di basi. Energia di impilamento Coppie di paia di basi impilate (kcal/mole/coppia di pb) 5' – GC – 3' –14,59 3' – CG – 5' 5' – AC – 3' –10,51 3' – TG – 5' 5' – TC – 3' –9,81 3' – AG – 5' 5' – CG – 3' –9,69 3' – GC – 5' 5' – GG – 3' –8,26 3' – CC – 5' 5' – AT – 3' –6,57 3' – TA – 5' 5' – TG – 3' –6,57 3' – AC – 5' 5' – AG – 3' –6,78 3' – TC – 5' 5' – AA – 3' –5,37 3' – TT – 5' 5' – TA – 3' –3,82 3' – AT – 5' Da quanto detto deriva che la stabilità della doppia elica in soluzione non è uguale per tutti i DNA. Infatti, la stabilità dipende dalla composizione in basi del DNA, in quanto un DNA ricco in coppie C-G, con tre legami idrogeno, è più stabile di un DNA ricco in coppie A-T, con solo due legami idrogeno. Inol- tre, dipende dalla particolare sequenza di nucleotidi nel DNA: infatti, l’effetto idrofobico dipende dall’impilamento e quindi dalla sovrapposizione di coppie di basi adiacenti e quanto due coppie di basi sono sovrapposte dipende dalla parti- colare sequenza di nucleotidi. Proprio a causa delle interazioni di impilamento tra le basi e ai gradi di flessibilità che hanno i legami chimici dei nucleotidi, il parallelismo tra due coppie di nucleotidi lungo l’asse dell’elica non è quasi mai perfetto, come si può vedere in figura 2.18A, e quindi la relativa posizione delle basi è stata catalogata in vari parametri. Per semplificare ne descriveremo qui solo tre (Twist, Roll e Tilt), che sono illustrati in figura 2.19. Il Twist rappresenta l’angolo tra due coppie di nucleotidi rispetto all’asse della doppia elica, il Roll è l’inclinazione, dovuta alle forze di repulsione tra due coppie di nucleotidi, rispet- to all’asse della coppia AT o GC e, infine, il Tilt è l’angolo che si forma, sempre per repulsione, rispetto all’asse dello scheletro zucchero-fosfato. Queste posizioni relative, come vedremo in seguito, influenzano la forma stessa del DNA, che può diventare “curvo” in base alla ripetizione di particolari sequenze. Strutture alternative e strutture superiori degli acidi nucleici Strutture alternative La struttura a doppia elica proposta da Crick e Watson è quella ottenuta median- te diffrazione dei raggi X di fibre di DNA in condizioni di alta umidità e quindi anche in soluzione acquosa, come è la situazione in vivo. Questa struttura, che 26 A Dalla scoperta del DNA al codice genetico e struttura degli acidi nucleici ISBN 978-88-08-18518-1 Twist Roll Tilt Z Z Z Y X Y X Y X Figura 2.19 I parametri Twist, Roll e Tilt descrivono il relativo no: il Twist, rotazione mediamente di 34° dovuta al giro della posizionamento di due paia di basi adiacenti. Le paia di basi doppia elica, e il Roll e il Tilt che descrivono l’angolatura tra due adiacenti impilate nella doppia elica non sono perfettamente pa- paia di basi rispetto all’asse dell’elica e allo scheletro zucchero- rallele, presentando angolazioni che dipendono dalle particolari fosfato. Definizione degli assi: Z corrisponde all’asse della doppia paia di basi considerate. Queste alterazioni al parallelismo delle elica del DNA; Y indica la direzione dei legami idrogeno tra una basi sono descritte da alcuni parametri. I parametri principali so- coppia di basi; X è l’asse perpendicolare a Y. Figura 2.20 Strutture alterna- DNA B DNA A DNA Z tive del DNA. La doppia elica del DNA può assumere, in par- ticolari condizioni ambientali o 0,34 nm per particolari sequenze di basi, varie forme strutturali alterna- tive. Delle varie possibili sono mostrate qui le tre forme di maggior interesse biologico: la forma DNA B è la classica forma del DNA duplex in vivo; la forma DNA A si riscontra nel DNA du- plex in condizioni artificiali di bassa umidità ma anche, in nor- mali condizioni in vivo, nei du- plex di RNA e in molecole ibride (eteroduplex) DNA/RNA; la pe- culiare forma sinistrorsa DNA Z 3,4 nm può essere assunta da DNA con sequenza alternata purina/pi- rimidina, ed è facilitata dal su- peravvolgimento negativo della molecola di DNA. Le frecce ros- se indicano che le doppie eliche in forma A e B sono destrorse, mentre la doppia elica in forma Z è sinistrorsa. (Fonte: Kielkopf C. & Dervan P.B.) viene identificata come forma B, non è l’unica possibile. Infatti, negli anni suc- cessivi al lavoro di Crick e Watson, sono state descritte varie altre strutture che la doppia elica di DNA può assumere in varie condizioni ambientali (perlopiù presenza di ioni diversi) o per particolari sequenze di basi. Tralasciamo qui di parlare delle forme C, D, E e altre che sono state descritte per gli acidi nuclei- ISBN 978-88-08-18518-1 CAPITOLO 2 Struttura degli acidi nucleici A 27 Tabella 2.4 Parametri strutturali delle forme A, B e Z del DNA. Coppie di basi Rotazione delle basi Diametro Passo dell’elica “Rise” Forma per giro di elica (gradi) (Å) (Å) (Å per coppia di basi) A 11 33 23 25 2,3 B 10,5 36 20 34 3,4 Z 12 –30 18 46 3,8 ci, limitandoci a considerare la forma A e la forma Z. La figura 2.20 mette a confronto le tre strutture del DNA (B, A e Z), mentre la tabella 2.4 riporta i principali parametri strutturali per queste tre forme alternative. Se si riduce l’umidità relativa in cui si trova la fibra di DNA, quest’ultimo assume la forma A. Questa è destrorsa come la forma B, ma se ne differenzia per vari aspetti: le coppie di basi presentano una maggiore angolatura rispetto al piano perpen- dicolare all’asse della doppia elica; ci sono 11 coppie di basi per ogni giro di elica; il passo dell’elica è di 25 Å e il diametro è di 23 Å, quindi presenta una forma un po’ “tarchiata” rispetto alla forma B. Mentre la forma B può essere assunta da duplex di DNA solo in condizioni non naturali di bassa umidità, la forma A la si trova anche in vivo, quindi in soluzione acquosa, per duplex formati da due filamenti di RNA oppure da un filamento di DNA e uno di RNA. Infatti la presenza dell’ –OH nella posizione 2' del ribosio impedisce alla molecola di assumere la forma B. Di tutte le strutture studiate, la forma Z è sicuramente la più particolare. Come si può osservare in figura 2.20, la caratteristica peculiare della forma Z è il fatto di essere un’elica sinistrorsa, anziché destrorsa come tutte le altre forme. I parametri dell’elica comprendono un diametro di 18 Å e un passo di 46 Å, quindi un’elica “magra e allungata” rispetto alla forma B. Questa struttura è stata scoperta studiando DNA sintetici in cui G e C si alternano lungo la sequenza; tuttavia, sono state ottenute prove sperimentali che suggeriscono che una piccola percentuale del DNA presente nelle cellule si trova in forma Z e sono state iso- late delle proteine che si legano specificamente a tratti di DNA Z. La causa che genera il DNA Z è il cambiamento di orientamento del legame glicosidico tra la guanina e il deossiribosio. Nella forma B lo zucchero e la base sono presenti nella conformazione “anti”, mentre nella forma Z si presentano nella rara con- formazione “syn” (fig. 2.21). La forma a “zig-zag” , da cui il nome Z, si spiega con l’alternanza di conformazioni syn e anti di nucleotidi contigui. La figura Figura 2.21 Le due posizioni O syn e anti della deossiguanosi- O na nelle forme A e Z del DNA. N N HN Nel DNA a elica destrorsa il le- NH game che unisce il deossiribosio H2N N alla base è sempre in forma an- N ti. Nel DNA Z il legame ruota fa- HO N N NH2 HO O O cendo assumere alla guanosina una conformazione syn. Nelle pirimidine, il legame è general- mente nella conformazione anti per l’interferenza sterica tra lo OH OH zucchero e l’ossigeno carboni- anti syn lico nella posizione 2 delle piri- midine. Quindi, in una coppia G-C solo la G potrà rovesciare la posizione dello zucchero. 28 A Dalla scoperta del DNA al codice genetico e struttura degli acidi nucleici ISBN 978-88-08-18518-1 Figura 2.22 Nella stessa mo- A DNA B DNA Z DNA B lecola di DNA possono coe- sistere tratti di DNA B e di DNA Z. (A) Un tratto di DNA Z è intercalato in una molecola a struttura DNA B. (B) Dettaglio del punto di transizione dalla forma Z alla forma B. B DNA Z DNA B Estrusione timina Estrusione adenina Giunzione B-Z Figura 2.23 DNA a tripla elica. A 3' 5' 3' B C CH3 (A) Sequenze nucleotidiche dei 5' due filamenti complementari T—A N O CH3 del DNA e del terzo filamento G—C che va a formare la struttura tri- C—G N H O plex; si notino le polarità 5' 3' C—G O H delle sequenze. (B) Rappresen- T—A H N N N tazione schematica della strut- A—T H 3' G—C N N tura a tripla elica in cui si vede G—C O che il terzo filamento è inserito T — A—T 5' nel solco maggiore del duplex. N N T — A—T (C) Appaiamenti tra le tre basi: T — A—T si osservano i normali legami T — A—T idrogeno del tipo Watson e T — A—T C— G—C Crick tra le basi complementari T — A—T T ∙ AT e gli appaiamenti di Hoogsteen T — A—T con la terza base. In (B) e (C) è T — A—T usato lo stesso codice colori. C— G—C T — A—T H H T — A—T N N C— G—C T — A—T N+ H N T — A—T O H T — A—T H O N N T — A—T H C— G—C N N T — A—T O 3' H * T — A—T N N N G—C 5' G—C H C—G C—G C—G A—T C ∙ GC G—C 5' 3' 5' 3' Interazioni di Hoogsteen 2.22 illustra un tratto di DNA Z inserito tra due tratti di DNA B. È importante notare l’estrusione delle basi A e T nei punti di passaggio da una forma all’altra. Tripla elica In genere gli acidi nucleici, DNA e RNA, si trovano in forma di singolo filamento o di duplex, ma è stato poi scoperto che in casi molto particolari si possono formare anche delle regioni a tripla elica. Benché non sia stato dimostrato un ruolo naturale per questa struttura, essa riscuote un certo interesse perché potrebbe offrire la pos- sibilità di sviluppare degli inibitori specifici per bloccare l’attività di geni bersaglio. Senza entrare nei dettagli, si può dire che, come mostrato in figura 2.23, un tratto ISBN 978-88-08-18518-1 CAPITOLO 2 Struttura degli acidi nucleici A 29 A B dR A B B HH dR dR Figura 2.24 Il quartetto di H G. (A) Struttura di un DNA (o C NN NN NN RNA) quadruplex che si può A C T dR dR HH N N N formare tra quattro tratti a sin- TA dR NN NN H golo filamento che contengano T N N NN A T A N NN 3 o più G. (B) Struttura chimi- A G G A G HH N ca del quartetto di G; le linee G H G G G G NN O O OO tratteggiate rosse indicano i G G G N O O HH legami idrogeno degli appaia- G G G G G NN H menti di tipo Hoogsteen. (C) N HH G G G G G HH NN NN HN Esempi di diversa disposizione H G G G G G H N HH N N dei filamenti: intramolecolari, G A G H NN intermolecolari (2 o 4 filamen- A A T HH N ti) e con orientamenti 5' 3' G A G T H OO OO NN A O O N che possono essere 2 a 2 an- A HH A A NN N H tiparalleli o tutti con la stessa N N direzione. N NN NN dR 5' 3' HH N N dR 5' 3' NN NN NN H dR N N N dR dR HH dR H C I B II III C I II III 3 3 3 3 3' 3' 3' 3' 3' 3' 3' 53' 5' 3 3 5' 5 3' 3' 5' 5' 3' 3' 5 5 3 5 5 3' 5 5 5' 5' G4-DNA 3' tipo “Basket” “Basket” 5' tipo 5' intermolecolare 5' G4 DNA 5'