Genetica Umana PDF
Document Details
Uploaded by Deleted User
Università degli Studi 'G. d'Annunzio' Chieti - Pescara
2024
Giuseppe Calabrese
Tags
Summary
Questo documento presenta una sintesi introduttiva sulla genetica umana, concentrandosi principalmente sulla struttura del DNA. Descrive i componenti del DNA, le regole di Chargaff, la struttura a doppia elica, i diversi tipi di DNA e il processo di duplicazione, con particolare riferimento alle topoisomerasi, elicasi e DNA polimerasi.
Full Transcript
2024/25 GENETICA UMANA LM – 41 | UNIVERSITÀ DI CHIETI G. D’ANNUNZIO Prof. Giuseppe Calabrese GENETICA UMANA IL DNA Il DNA, nelle cellule eucariotiche, è conservato all’interno del nucleo della cellula, separandolo così dall’ambiente citoplasmatico. Esso si organizza...
2024/25 GENETICA UMANA LM – 41 | UNIVERSITÀ DI CHIETI G. D’ANNUNZIO Prof. Giuseppe Calabrese GENETICA UMANA IL DNA Il DNA, nelle cellule eucariotiche, è conservato all’interno del nucleo della cellula, separandolo così dall’ambiente citoplasmatico. Esso si organizza in cromatina, molecola nucleo-proteica che associa il DNA a proteine (istoni), in modo tale da stipare una molecola estremamente lunga in uno spazio ristretto come il nucleo. La molecola di DNA venne isolata circa due secoli fa da Miescher e, in una delle prime descrizioni che furono fatte, fu definito come sostanza zuccherina, bianca, di carattere leggermente acido e conte- nente fosforo. Dapprima prese il nome di “nucleina”, poiché il nucleo era l’unica porzione della cellula in cui era visibile al microscopio; solo più tardi si arrivò a poterla colorare e a chiamarlo poi acido desossiribonucleico, distinguendolo così dall’RNA. La sua struttura chimica vene resa nota soltanto verso gli anni ’20 del secolo precedente grazie a Phoebus Levene: formato da catene di NUCLEOTIDI, monomeri a loro volta formati da: 1. un carboidrato pentoso, nello specifico un monosaccaride pentoso aldoso; 2. una base azotata, strutture cicliche contenenti azoto; 3. un gruppo fosfato, forma salina dell’acido ortofosforico. Le basi azotate sono 4 e sono Adenina, Guanina, Citosina e Timina che differenziano i 4 tipi di nu- cleotidi. Le basi azotate a loro volta sono raggruppate in PURINE (Adenina e Guanina) e PIRIMIDINE (Citosina, Timina e Uracile). Le purine presentano chimicamente due formazioni cicliche: una esago- nale e una pentagonale; le pirimidine hanno una sola formazione ciclica esagonale. LE REGOLE DI CHARGAFF Chargaff riuscì a scoprire una curiosa corrispondenza tra i 4 tipi di nucleotidi: in particolare tra adenina e timina e tra citosina e guanina. Si capì che il rapporto tra le quantità di questi nucleotidi presi due alla volta è costante, ma cambia da una specie all’altra. Dunque, la quantità delle purine in percentuale è la stessa delle pirimidine e quindi la quantità di adenina è la stessa di timina e la quantità di citosina è la stessa di guanina. 1 %A = %T e %G = %C A livello molecolare, la selezione naturale ha portato il DNA a essere la migliore molecola per conser- vare e trasmettere l’informazione genetica. Questa molecola, infatti, presenta 4 caratteristiche: 1. Riesce a trasmettere tutte le informazioni genetiche da cellula a cellula e di generazione in generazione; 2. È capace di produrre una copia di sé stesso grazie alla duplicazione semiconservativa che avviene in maniera quasi impeccabile (1 errore ogni 50 milioni di copie prodotte) 3. È chimicamente molto stabile e difficile da danneggiare o degradare; 4. È in grado di mutare permettendo lo sviluppo di nuovi caratteri e mantenendo un’alta variabilità genetica e permettendo il processo evolutivo. Molto spesso, molte mutazioni possono risultare vantaggiose (ma anche deleterie) e dunque ciò permette di costituire un genoma sempre più performante. FRANKLIN, WATSON E CRICK Watson e Crick al loro tempo, decisero di concentrarsi sugli studi del DNA (a differenza del resto della comunità scientifica che si concentrava sulle proteine) basandosi anche sulle scoperte grazie all’uso dei raggi X della precedente Franklin. Riuscirono, così, ad individuare la struttura tridimensionale della molecola di DNA. La molecola di DNA è un polimero, co- stituito dalla aggre- gazione in catene lineari di nucleotidi. I nucleotidi legano tra di loro grazie ad un legame cova- lente che prende il nome di legame fosfodiesterico tra il fosfato del C5 e il C3 del pentoso del nucleotide succes- sivo. Diversi legami tra nucleotidi for- mano un filamento che presenta una direzione: questo perché avremo una estremità di inizio, ovvero l’estremità 5’, determinata da un fosfato che non lega nient’altro, ed una estremità di fine, l’estremità 3’, determinata dal C3 libero. Due catene a singola elica di DNA, dunque, legano tra di loro stabilendo legami deboli a idrogeno appaian- dosi in modo complementare. Le basi azotate, dunque, si appaiono in modo complementare e unico 2 tramite questi ponti a idrogeno: l’adenina lega, formando 2 ponti a idrogeno, la timina e la citosina lega, formando 3 ponti a idrogeno, la guanina. Tali corrispondenze sono le uniche possibili in quanto le altre opzioni di appaiamento risultano instabili per via di un numero ridotto di legami a idrogeno che si formano o da una eccessiva distanza tra le due basi azotate. Le due emieliche, tenute insieme dai ponti a idrogeno, hanno verso opposto: infatti il primo nucleotide del primo filamento si appaia con l’ultimo del secondo filamento e viceversa. Per questo motivo i due filamenti sono detti antiparalleli. Dopo essersi appaiati, dunque, i due filamenti si avvolgono, for- mando la tipica struttura a doppia elica, individuata per la prima volta da Watson e Crick. Tale struttura può essere paragonata ad una scala a pioli avvolta su sé stessa, dove i pioli rappresentano le basi azotate appaiate mentre i montanti della scala rappresentano le catene di zuccheri e fosfati. Essa presenta alcune caratteristiche importanti: un giro completo su sé stessa contiene 10 coppie di basi appaiate l’una con l’altra; la distanza tra la prima base appaiata e la decima è di 3,4 nm, per cui possiamo concludere che tra una coppia e l’altra vi sia una distanza di 0,34 nm. Altra caratteristica che è possibile notare è la presenza di solchi maggiori e solchi minori nel profilo della catena di DNA. Oggi vengono sfruttati per controllare l’espressione genica tramite l’utilizzo di alcuni farmaci. Lo spes- sore complessivo dell’elica è di circa di 2 nm. Il modello dell’elica prodotto da Watson e Crick viene identificato come DNA – B ed ha un andamento destrogiro. È il modello di DNA più frequente a livello cellulare ma esistono anche altri tipi di DNA che presentano strutture leggermente differenti: il DNA – A e il DNA – Z. Il DNA – A, a parità di nucleotidi di B, risulta essere molto più compatto, ha un unico tipo di solco laterale a differenza di B, ed ha una struttura molto meno flessibile. Questo tipo di DNA è presente in quelle regioni dove vi è un’alta concentrazione di ripetizioni nucleotidiche, come il centromero, per aumentare di stabilità la struttura cromosomica ed evitare, così, errori. 3 Il DNA – Z ha un avvolgimento di tipo opposto rispetto ai due DNA precedenti: l’avvolgimento segue un andamento sinistrorso. A parità di nucleotidi, la molecola Z è più estesa, sottile e molto più disor- dinata. Il suo avvolgimento tende ad essere più irregolare, quasi a zig-zag, da cui il nome DNA - Z. È possibile individuarlo nelle zone di confine tra esoni ed introni. Vi sono anche altre tipologie di DNA: Il DNA A TRIPLA ELICA: è possibile, infatti, associare a tratti di DNA a doppia elica una terza catena nucleotidica grazie allo sviluppo di ponti a idrogeno del tipo Hoogsteen, alternativi a quelli di W. e C., e che permettono di mantenere salda la terza catena alla struttura. Il DNA A QUADRUPLA CATENA (DNA 4G, a tetrade di Guanine) che è dovuto alla presenza sul filamento di lunghi tratti di guanine. Queste guanine possono organizzarsi tra di loro facendo ripiegare su sé stesso il singolo filamento di DNA. Quest’associazione tra guanine viene cata- lizzata dallo ione metallico potassio K+, che le mantiene salde. Infatti, affinché si possa svilup- pare una struttura di questo tipo è necessaria la presenza di almeno 8 guanine. I legami che si sviluppano tra le guanine sono sempre del tipo di Hoogsteen. Questa struttura si trova nelle regioni telomeriche dei cromosomi e in alcuni geni con caratteristica associazione di guanine. Si crede serva per ridurre la dimensione dei telomeri in modo che non si abbia un eccessivo prolungamento della vita della cellula (i telomeri infatti sono collegati alla sopravvivenza della cellula: essi si accorciano ad ogni divisione). DUPLICAZIONE DEL DNA Già Watson e Crick, nel loro articolo pubblicato su Nature, affermavano che quella particolare struttura aveva fatto intuire loro un modello di duplicazione: un modello di tipo semiconservativo. Grosso modo, infatti, il processo avviene tramite la separazione delle due emieliche, lungo le quali vengono stampati due nuovi filamenti. I nucleotidi liberi presenti nell’ambiente nucleare vengono, così, utilizzati per gli stampi delle due nuove emieliche che si appaieranno con le “originali”. Il primo esempio che venne fatto per comprendere il meccanismo di duplicazione prese in considera- zione il batterio Escherichia Coli. Il cromosoma circolare procariotico, tramite l’utilizzo di radiazioni, è stato visto separarsi in una specifica regione e tale separazione in seguito si è estesa fino alla sua completa divisione e poi duplicazione. Negli eucarioti, invece, si è scoperto che non vi è un unico sito di origine e di separazione del DNA durante la duplicazione ma ce ne sono molteplici: questo perché il DNA eucariotico è circa 1000 volte più grande rispetto a quello procariotico ed è essendo il momento della duplicazione un momento di debolezza per la cellula in quanto non ha la possibilità di tradurre il genoma in proteine, avere più siti di inizio permette di restringere i tempi del processo. Ogni 80 mila nucleotidi, vi è dunque un sito di duplicazione. Le regioni di sintesi appaiono come un rigonfiamento della struttura nucleica, prendono il nome di bolle di replicazione e sono caratterizzate dall’avere due estremità dette forche/forcelle di replica- zione, che sono due punti critici in quanto sono le regioni in cui avviene la duplicazione vera e propria. Man mano che il processo continua le forche si allontanano l’una dall’altra in direzione opposta e la 4 bolla si allarga e ingrandisce fino a raggiungere la successiva per fondersi. L’avanzamento però delle forche di replicazione in una bolla porta ad un eccessivo avvolgimento del DNA non separato, che si attorciglia, con il rischio di rottura di una delle emieliche. Le topoisomerasi, allora, intervengono, idrolizzando e risintetizzando i legami fosfodiesterici ed eliminando così i superavvolgimenti. Le bolle di replicazione si avviano in zone ric- che di appaiamenti Adenina-Timina poiché presentano un numero di ponti a idrogeno mi- nore. Ad aprire le bolle di replicazione sono degli enzimi specifici, le elicasi, che rompono i ponti e allontanano così i due filamenti; per evitare però che le due emieliche si riuni- scano, intervengono delle specifiche proteine, le SSBP, che legano le singole eliche. In que- sto modo i due filamenti possono essere te- nuti separati in modo stabile e i nucleotidi li- beri presenti nella matrice nucleare (dNTP e rNTP, dessosiribonucleotidi trifosfati e ribo- nucleotidi trifosfati.) possono ora stabilire le- gami a idrogeno con le basi delle due emieli- che. Per poter poi produrre la nuova catena su uno dei due stampi è necessario l’arrivo di un nuovo enzima: la DNA polimerasi. Ora, sarebbe stato molto più semplice se, dopo che i nucleotidi liberi si sono appaiati, la DNA polimerasi li avesse poi unicamente uniti creando il nuovo filamento, ma l’evoluzione ha fatto sì che tale pro- cesso fosse legger- mente diverso, altri- menti ci sarebbe stato un numero troppo ele- vato di errori. Per du- plicare il DNA, infatti, le DNA polimerasi neces- sitano di brevi tratti di RNA, detti primer, complementari al fila- mento stampo e gene- rati da un ulteriore en- zima, la RNA-primasi. A partire dai primer, la DNA polimerasi può 5 ora legare i nucleotidi liberi precedentemente appaiatisi al filamento stampo. Tutto ciò avviene perché la DNA polimerasi necessita di un breve tratto a doppia elica per poter incominciare il processo di replicazione. Poiché tutte le DNA polimerasi sintetizzano il DNA solo in direzione 5’ →3’ e sono anti- paralleli, i due filamenti si comportano in modo differente durante la replicazione: Il filamento stampo che ha direzione antiparallela a quella della DNA polimerasi (cioè 3’→5’) può essere sintetizzato in maniera continua a partire dall’innesco mentre la forcella replicativa avanza lungo la molecola di DNA: questo filamento è il cosiddetto filamento veloce/guida. Il filamento che ha orientamento 5’→3’ non può invece essere sintetizzato in maniera continua; esso viene replicato a tratti in corrispondenza della graduale apertura della forca di replicazione e dove sono stati generati diversi inneschi, per ogni tratto, e viene detto filamento lento/in ritardo. I brevi tratti sintetizzati sul filamento lento sono detti frammenti di Okazaki, da colui che li aveva teorizzati e in parte dimostrati. Ovviamente, i frammenti di Okazaki non costitui- scono un filamento continuo poiché sono alternati da numerosi primer. Per riunire insieme tutte le porzioni di DNA neosintetizzato, entrano a questo punto in gioco, per entrambi i filamenti, gli enzimi RNasi e DNA ligasi: 1. La DNA polimerasi lungo i tratti di primer si trasforma in una vera e propria RNasi e idrolizza i nucleotidi del primer a RNA e li sostituisce con i corrispondenti desossiribonucleotidi. Ora si hanno numerosi frammenti di DNA. 2. Successivamente, la DNA ligasi salda tramite la sintesi di un legame fosfodiesterico i fram- menti di DNA neosintetizzati per formare un unico filamento. Il processo così è completato e si sono formati due nuovi filamenti appaiati con i due filamenti stampo. L’ESPERIMENTO DI HERSHEY-CHASE Uno degli esperimenti fondamentali che per primo portò alla comprensione del DNA come molecola della vita e portatrice dell’informazione genetica fu quello di Hershey-Chase, il quale si scontrò con gran parte della comunità scientifica di allora, concentrata, invece, sullo studio delle proteine. Tale esperimento utilizzò i meccanismi infettivi dei virus batteriofagi T2 per comprendere se il responsabile della duplicazione dei virus nel batterio fossero le proteine del capside o l’acido nucleico avvolto da tali proteine. Sfruttarono, così, la radioattività utilizzando lo zolfo, presente solo nelle proteine, e il fosforo, presente solo negli acidi nucleici, radioattivi. 1) Dapprima, misero i batteriofagi a duplicarsi in un ambiente ricco di questo particolare zolfo che, così, veniva utilizzato dai virus per costruire le proteine del capside: dunque, l’involucro proteico era ora radiomarcato. In seguito, infettarono con questi fagi alcuni batteri (Escherichia Coli) su un terreno di coltura per alcuni minuti. Il tutto venne sottoposto a centrifugazione in modo che la parte esteriore della particella virale si potesse distaccare dalla membrana dei batteri: in 6 questo modo, per via di massa maggiore, le parti cellulari si stagliavano sul fondo della provetta mentre le particelle virali rimanevano in sospensione. A seconda di dove si misurava la mag- giore radioattività tramite contatore Geiger era possibile dedurre se la molecola marcata si trovasse o meno all'interno della cellula. Nel caso delle proteine marcate la radioattività si mi- surò sul sopranatante; dal momento che il fago per replicarsi ha bisogno di introdurre all'in- terno della cellula ospite il suo materiale genetico per poter sfruttare l'apparato batterico di replicazione, apparve evidente che il materiale genetico non erano le proteine, poiché rimane- vano in superficie. Ciò però non bastava a dimostrare che il materiale genetico era il DNA: fecero, così, un contro esperimento. 2) In questo secondo esperimento, i fagi T2 venivano fatti replicare in un ambiente ricco di fosforo radioattivo: in questo modo, ora, ad essere radiomarcato era la molecola di DNA. Poi, infetta- rono su terreni di coltura standard dei batteri tramite questi fagi radiomarcati e sottoposero la soluzione del terreno di coltura a centrifugazione, separando ancora una volta la parte esterna virale da quella cellulare batterica. Questa volta, la radioattività venne misurata sul fondo della provetta: il materiale genetico era, quindi, il DNA. Esperimento n° 1 Esperimento n°2 7 ESPERIMENTO DI GRIFFITH L'esperimento di Frederick Griffith del 1928 fu uno dei primi esperimenti a suggerire che i batteri sono in grado di trasferire informazioni genetiche attraverso un processo noto come trasforma- zione. In tal modo, esso aprì la strada alla determinazione di quale fosse la natura del materiale gene- tico. L'ufficiale medico inglese F. Griffith in quegli anni studiava un batterio in grado di causare la pol- monite: lo pneumococco (Streptococcus pneumoniae). Nei suoi esperimenti fece uso di due ceppi batterici: Il ceppo S, detto anche "liscio" dal momento che produce colonie lisce e lucenti (grazie alla pre- senza di una capsula batterica polisaccaridica che avvolge ogni cellula). Questo ceppo è in grado di provocare la polmonite. Il ceppo R, detto anche "rugoso" dal momento che produce colonie dall'aspetto "rugoso" (a causa dell'assenza della capsula batterica). Questo ceppo non è in grado di provocare polmonite. Il ceppo R deriva da una mutazione di un ceppo S. Quando Griffith iniettò batteri R (non patogeni) in un topo, verificò che la cavia non si ammalava e non era possibile isolare questi batteri dai tessuti dell'animale. Quando il medico iniettò batteri S (patogeni) in un topo, verificò che l'animale si ammalava, moriva ed era possibile isolare questi batteri dai tessuti dello stesso. Successivamente prese alcuni batteri S e li uccise in seguito a shock termico. Iniettò poi questi batteri morti in un topo e, come c'era d'aspettarsi, il topo non si ammalò e non fu possibile isolare gli S dai tessuti dell'animale. 8 Da ciò si deduce che, per provocare la malattia, è necessaria la presenza della capsula e i batteri capsulati devono essere ovviamente vivi. A questo punto Griffith preparò casualmente una miscela in cui erano presenti batteri vivi R e batteri morti S (uccisi da trattamento termico). Iniettò questa miscela in un topo: quello che ci si aspettava era la NON comparsa di malattia nell'animale (dal momento che non sarebbero dovute sussistere le condizioni appena citate). In realtà il topo si ammalò e morì; nei suoi tessuti si riscontrarono batteri S. Griffith propose l'unica spiegazione plausibile: alcuni batteri R, in seguito all'interazione con batteri morti S si erano trasformati in S. Evidentemente all'interno dei S morti doveva essere presente una qualche sostanza in grado di conferire ai batteri R la capacità di sintetizzare la capsula polisaccaridica. Questa sostanza è il materiale genetico. L’RNA L'acido ribonucleico è un acido nucleico implicato in vari ruoli biologici, quali la codifica, regola- zione ed espressione dei geni, in particolare la sintesi proteica. Anch’esso come il DNA è una macro- molecola polimerica costituita da una catena di nucleotidi ma i due composti presentano parecchie differenze: 1) L’RNA ha come carboidrato di base dei propri nucleotidi il ribosio; 2) Tra le sue basi azotate non compare la timina ma l’uracile (A, C, G, U); 3) L’RNA non può replicarsi; 4) È poco stabile ed è labile (il tempo di vita di una molecola di RNA può essere di pochi minuti o al massimo di qualche giorno); 5) Può avere diverse forme e strutture (mRNA, rRNA, tRNA). 6) Si presenta come un unico filamento ma può ripiegarsi, in caso di complementarità, in alcuni punti della stessa catena; 9 IL DOGMA CENTRALE DELLA BIOLOGIA Il dogma centrale della biologia affermava l’unidirezionalità del passaggio da DNA a RNA. La mole- cola di DNA era in grado di duplicare sé stessa, di trascriversi in RNA (messaggero dell’informazione genetica che passa dal nucleo al citoplasma e quindi ai ribosomi) e questo poi di tradursi unicamente in proteina. Durante gli anni ’70, vennero individuati i retrovirus, caratterizzati dalla presenza dell’enzima trascrit- tasi inversa, capace di sintetizzare un filamento di DNA a partire da uno stampo di RNA. Dunque ora non vi era più l’unidirezionalità del passaggio da DNA a RNA ma era possibile anche il contrario. Inoltre, si individuarono anche RNA che potevano svolgere funzioni diverse rispetto alla mera traduzione pro- teica (come i tRNA e rRNA). Pochi decenni più tardi, si scoprì che i filamenti di RNA potevano anche essere modificati tramite processi fisiologici sia come numero di nucleotidi che come tipo di nucleotidi (potevano essere editati). TIPOLOGIE DI RNA RNA TRANSFER (tRNA) È un RNA stabile; Funzione: trasferire gli amminoacidi dal citosol ai ribosomi; È un RNA traducente; Sede: il citoplasma; Costituisce il 10/20% degli RNA totali; RNA RIBOSOMIALE (rRNA) È un RNA stabile; È uno dei componenti della struttura dei ribosomi; È un RNA traducente; Sede: i ribosomi, ma la sua forma non matura si trova all’interno del nucleolo; Costituisce l’80/90% degli RNA totali; RNA MESSAGGERO (mRNA) È un RNA labile, caratterizzato da molecole estremamente delicate che, dopo aver svolto la loro funzione, devono essere eliminate, facendo in modo quindi che il messaggio che portano al ribosoma duri solo il tempo necessario per produrre la proteina necessaria. 10 È un RNA traducibile, tradotto in sequenze di amminoacidi Sede: i poliribosomi (lunghe catene di ribosomi che si avvolgono intorno all’mRNA) Costituisce il 2/5% degli RNA totali L’RNA MESSAGGERO (mRNA) La sintesi di un mRNA avviene con la separazione delle due emieliche e viene scelta e individuata una sola emielica come stampo per la trascrizione: ad occuparsi di questo intervengono i fattori di trascri- zione. In seguito la RNA polimerasi di tipo II sintetizza il trascritto primario. Esistono anche altri tipi di RNA polimerasi (come la I e la III) che svolgono altre funzioni come la sintesi dell’rRNA e di altre tipologie di RNA. Per la trascrizione, le RNA polimerasi si organizzano sottoforma di 6 peptidi (che costituiscono la configurazione più stabile per il processo di trascrizione) a cui si associano altre molecole accessorie che sono tipiche di un tessuto o di un organo in particolare. A questo punto comincia la sintesi dell’mRNA che termina quando l’RNA polimerasi incontra una specifica sequenza nucleotidica deno- minata codone di stop o terminatore. Si ha l’arresto della sintesi dell’mRNA con l’allontanamento dell’mRNA dalla struttura della RNA Polimerasi e la definitiva disattivazione della RNA polimerasi. Uno dei meccanismi con il quale si ha il distacco dell’RNA dalla sequenza genica è tramite la conformazione “a cappio” caratterizzata dal ripiegamento dell’RNA che porta alla formazione di un tratto a doppia elica, il quale esercita un’azione di trazione sulla rimanente porzione di RNA che si trova ancora attac- cata al filamento di DNA. Con questo fenomeno di trazione, sfruttando anche la presenza di ponti a idrogeno, l’RNA si libera dalla struttura del DNA. Il rilascio è favorito dall’accoppiamento di basi ade- nina-uracile e timina-adenina che presentano solo due ponti a idrogeno. L’RNA TRANSFER o DI TRASPORTO (tRNA) Il tRNA è un RNA traducente costituito da un unico filamento ripiegato in alcuni punti su sé stesso e formando alcuni tratti a doppia elica, assumendo la tipica forma a croce o a “trifoglio” con le sue 4 braccia. Ogni braccio svolge una funziona ben pre- cisa: Braccio accettore: lungo questo tratto il tRNA lega l’amminoacido; Braccio dell’anticodone (o braccio A): op- posto al braccio accettore, presenta l’anti- codone complementare al codone presente sull’mRNA; Braccio T: svolge un ruolo importante nel riconoscimento della zona in cui deve posi- zionarsi il tRNA nel ribosoma; Braccio D: che gioca un ruolo importante nell’azione di alcuni enzimi. 11 Anche il tRNA ha i propri geni da cui viene trascritto: mutazioni di tali geni possono causare gravi patologie causando disfunzioni nella sintesi proteica. I tRNA sono 61, uno per ogni tripletta che traduce un amminoacido: molte triplette infatti traducono per uno stesso amminoacido (questo permette an- che di “aggirare” alcuni errori possibili). Le triplette in totale sono 64 ma 3 sono di stop e non codifi- cano per nessun amminoacido. Il tRNA nella realtà presenta una struttura tridimensionale dalla forma angolata, simile a una “L maiu- scola rovesciata”. L’RNA RIBOSOMIALE (rRNA) Gli rRNA costituiscono morfologicamente i ribo- somi, piccole strutture globulari presenti nel cito- plasma e addetti alla traduzione e sintesi proteica. Sono costituiti da 2 subunità: la subunità mag- giore e la subunità minore. I ribosomi sono spe- cifici dei procarioti o degli eucarioti: nei procarioti sono appunto più piccoli. Essi vengono misurati in base al coefficiente di sedimentazione (unità di misura lo Svedberg). Le loro misure sono 70S per i procarioti e 80S per gli eucarioti ed essenzial- mente indicano la velocità con cui precipitano sul fondo della provetta durante ultracentrifugazione. Sia nei ribosomi eucariotici che nei ribosomi pro- cariotici, le due subunità possono essere separate e a loro volta analizzate tramite ultracentrifuga- zione, ottenendo diversi coefficienti di sedimenta- zione la cui somma non coincide, per motivi fisici, con il coefficiente del ribosoma completo. La differenza di grandezza e massa tra i ribosomi procariotici ed eucariotici sta nella presenza di un maggior quantitativo di ribonucleoproteine. Nelle subunità mi- nori vi è un’unica molecola di rRNA, mentre nelle subunità maggiori vi sono 2 molecole di rRNA nei procarioti e 3 negli eucarioti. Queste 3 molecole di rRNA hanno origini differenti poiché vengono trascritte da geni differenti: 2 delle tre ed anche quella della subunità minore vengono sintetizzate nella stessa regione cromosomica mentre una della 3 in una regione cromosomica diversa. Il nostro genoma sintetizza l’RNA ribosomiale grazie sempre a RNA polimerasi che agiscono in dire- zione 5’→3’. Questi geni si trovano su 5 coppie di cromosomi acrocentrici (presentano il centromero alle estremità): le coppie 13, 14, 15, 21 e 22. Ogni cromosoma presenta, ovviamente, centinaia di copie dei geni che trascrivono per l’RNA ribosomiale. Queste copie sono localizzate una dietro l’altra e hanno tutte lo stesso verso. Ciascun RNA ribosomiale viene sintetizzato sottoforma di un unico grande filamento; successivamente perderà alcuni segmenti dando lungo a piccole molecole di RNA ribosomiale. La formazione del ribosoma avviene nel nucleolo, dove si raccolgono gli elementi neces- sari per costruire i ribosomi. È una zona ricca di ribonucleoproteine provenienti dal citoplasma, infatti tale porzione del nucleo presenta una maggiore affinità per una colorazione di tipo basico. Nel nucleolo 12 vi sono i geni necessari alla sintesi del rRNA che vengono così trascritti e si ottengono diversi tipi di rRNA: Gli rRNA 18S formano, insieme alle ribonucleoproteine, la subunità minore; Gli rRNA 5S, 5.8S, 28S, sempre insieme alle proteine, formano la subunità maggiore. Le subunità vengono poi espulse dal nucleo attraverso i pori nucleari nel citoplasma dove si assem- bleranno solo al momento della traduzione. La subunità maggiore del ribosoma presenta al suo interno 3 siti: Il sito amminoacidico (A): dove arriva l’amminoacido da aggiunger alla catena in formazione; Il sito peptidilico (P): dove è presente già la catena formata di amminoacidi; Il sito d’uscita (E): il sito d’uscita dei tRNA ormai privi di amminoacido dopo aver svolto la loro funzione. La traduzione proteica segue precisi passaggi: 1. L’mRNA si innesta nella subunità minore in modo che la prima tripletta (AUG) che codifica per la metionina corrisponda al sito P della subunità maggiore. Poi, si inserirà nel sito P il tRNA trasportante la metionina e da qui si scateneranno una serie di reazioni che attivano il processo di traduzione proteica come il rilascio di fattori di inizio e inibitori che determinano tutto il processo traduttivo. 2. Il tRNA con l'anticodone corrispondente al codone successivo nell'mRNA si attacca nel sito A. Viene effettuato un controllo di qualità sul tRNA per non venire aggiunto se la corrispondenza codone-anticodone non è corretta; 3. L’amminoacido nel sito P si lega a quello presente nel sito A tramite un legame peptidico, dando origine a un dipeptide. La formazione del legame viene catalizzata dall’enzima peptidil- transferasi; 4. Il primo amminoa- cido quindi si stacca dal suo tRNA e si ha lo scorrimento vero e proprio del ribo- soma: nel sito P si sposta il tRNA che era presente in A e che ora lega due amminoacidi e nel sito E viene posto il tRNA ormai vuoto; nel sito A invece arriva un nuovo tRNA che traduce la tripletta successiva. Procedendo così si ha l’intera lettura dell’mRNA da parte del ribosoma, dando luogo a una proteina. Il processo terminerà solo quando il ribosoma incontrerà una tripletta di stop. 13 IL CODICE GENETICO È bene innanzitutto ribadire che un gene, il genoma, il codice genetico non sono sinonimi. Un gene è un tratto di DNA che codifica per un RNA che può essere messaggero o un RNA funzionale (tipo il genere del tRNA). Il genoma è l'insieme di tutte le molecole di DNA contenute in tutti i 46 cromosomi: questo è il genoma nucleare, ma esistono anche altri genomi. Inoltre, genoma e corredo cromosomico non sono la stessa cosa; si intende, per cromosoma, in senso generale, anche la molecola circolare di DNA dei batteri (cromosoma batterico), così come il genoma virale viene anche indicato come cromosoma virale. Il codice genetico è il sistema secondo il quale si stabilisce la corrispondenza tra una sequenza di nucleotidi e gli amminoacidi. Il codice genetico si dice universale, ma è una approssimazione: pren- dendo a 3 a 3 le 4 basi, i 4 tipi di nucleotidi, si producono 64 combinazioni. Esso è composto da 64 triplette di nucleotidi, di cui tre triplette di stop, che codificano per solo 20 amminoacidi: ciò significa che molte delle triplette codificano per uno stesso amminoacido. Evolutivamente, avere un maggior numero di triplette che codificano per uno stesso aminoacido consente di aggirare eventuali errori di trascrizione o di traduzione. Infatti, grazie a questo meccanismo, non è necessario che il tRNA abbia l'anticodone perfettamente complementare alla tripletta sull'RNA messaggero per inserire il giusto amminoacido e questo permette anche che, nel caso in cui si sia verificata una mutazione (e quindi lungo il filamento di tRNA un nucleotide è stato sostituito da un altro), la tripletta continui a codificare per lo stesso amminoacido. Per questo il codice genetico ridondante risulta essere molto vantaggioso. I RIBOSOMI L’mRNA, quindi, viene raggiunto dai ribosomi, i quali, disponendosi uno di fianco all’altro, vanno a costituire la catena polisomica (che è il livello standard di sintesi proteica nell’uomo). Le catene poli- somiche assumono una caratteristica struttura a vortice nel citoplasma. Già durante la sintesi del RNA messaggero, nei procarioti, i ribosomi, che si trovano nel citoplasma proprio come il cromosoma circolare, incominciano ad avvicinarsi e ad effettuare il processo di traduzione: questo non avviene negli eucarioti poiché il trascritto primario deve subire prima delle modifiche chimico-strutturali di maturazione che lo trasformerà poi in mRNA. L’immagine seguente rappresenta uno schema riassuntivo di tutta la sintesi proteica in una cellula procariotica. In alto troviamo un tratto di DNA di un cromosoma e, in corrispondenza di questo tratto, si individuano un gene trascritto in RNA messaggero (usato nella sintesi proteica), un gene che invece trascrive per un tRNA ed un gene che trascrive anche per l’rRNA. Nell’immagine ci sono alcuni ammi- noacidi che sono ancora liberi e che verranno poi legati dal loro corrispondente tRNA e alcuni tRNA che si avvicinano ai ribosomi, i quali hanno già agganciato l’mRNA e hanno cominciato a sintetizzare catene polipeptidiche. 14 Il ribosoma è parte fonda- mentale della sintesi proteica: esso costituisce il supporto ri- gido entro cui far avvenire la traduzione in modo ordinato. Senza ribosomi l’assemblag- gio amminoacidico risulte- rebbe disordinato, confusio- nario in quanto sono i ribo- somi a stabilire la modalità di lettura di una tripletta e quindi poi tutte le sequenze che ne seguono; inoltre, il ribosoma permette di leggere tutto l’mRNA, mantenendolo fermo 15 e rigido, senza che questo si deformi, si avvolga e dunque poi faccia perdere la lettura di alcune triplette. La conoscenza dei meccanismi di traduzione ha permesso di comprendere meglio i meccanismi cel- lulari di azione di alcuni antibiotici che sfruttano proprio il processo di sintesi proteica, in particolare l’interazione del ribosoma (e degli enzimi associati) con mRNA e tRNA. Tali antibiotici sono in grado solo di interferire con i meccanismi procariotici e non con quelli eucariotici: STREPTOMICINA: blocca la sintesi al primo amminoacido. Impedisce il corretto riconosci- mento tra il primo codone e l’anticodone del primo tRNA e si ha un’alterazione della specificità di appaiamento. TETRACICLINE: inibiscono l’attacco del tRNA per la seconda tripletta, quella del sito A. Anche in questo caso, questo blocco, arresta o rallenta terribilmente la sintesi proteica. Il risultato è che la cellula batterica non riesce più a produrre proteine. CLORAMFENICOLO (e tutta la famiglia di antibiotici che lo hanno come capostipite): inibisce la peptidil-transferasi, cioè l’enzima che lega l’amminoacido appena trasportato dal tRNA che si trova nel sito A e l’amminoacido o la catena di amminoacidi che sono legati nel sito P sul tRNA. ERITROMICINA: blocca la traslocazione del pp-tRNA (polipeptidil- tRNA), cioè il tRNA che si porta dietro tutta la catena amminoacidica, dal sito A al sito P. Tutte queste azioni di interferenza sono estremamente selettive: hanno, cioè, solo effetto sui batteri e non sugli eucarioti. Ma perché? I ribosomi e gli enzimi necessari sono differenti tra cellula batterica e cellula eucariotica. Lo stesso codice genetico differisce tra le due tipologie di cellule. Gli antibiotici, tuttavia, determinano effetti inibitori anche sui mitocondri che, filogeneticamente, sono più vicini ai procarioti e dunque, sotto terapia antibiotica, la produzione energetica cellulare può calare: i tessuti che normalmente richiedono più energia (come quello muscolare) possono quindi risentirne. 16 POSSIBILE DOMANDA del PARZIALE: L’immagine sovrastante presenta diverse schematizzazioni della molecola di DNA tipo B: soltanto una è corretta. Infatti, la schematizzazione corretta è l’ultima a partire da sinistra poiché presenta il corretto numero di appaiamenti tra basi azotate in un giro completo di elica (oltre ad avere un andamento destrorso). L’ORGANIZZAZIONE DEL GENOMA Il genoma costituisce l’intero patrimonio nucleotidico presente nelle cellule di un organismo. Se para- goniamo tra di loro alcune specie a livello genomico, esse presentano alcune differenze, talvolta molto evidenti. Prendiamo in considerazione i seguenti organismi: n. Coppie di Basi Lunghezza DNA n. massimo di geni E. Coli 4 x 106 1,4 mm 3000 Lievito 13 x 106 4,6 mm 11 000 Drosofila 165 x 106 56 mm 138 000 Uomo 3200 x 106 2000 mm 1 670 000 Essi sono estremamente diversi per dimensione. La tabella mostra il numero dei nucleotidi presenti nel genoma di questi 4 organismi, la lunghezza complessiva teorica che avrebbe il loro DNA e il numero stimato di proteine che quel genoma sarebbe in grado di codificare. Questa stima è stata effettuata considerando che ogni proteina, mediamente, è costituita da 400 amminoacidi e, dunque, viene codi- ficata teoricamente da un totale di 1.200 nucleotidi (400 triplette). Seguendo questi dati, allora si nota come il genoma dell’Escherichia Coli, che presenta circa 4 milioni di nucleotidi, dovrebbe essere in grado di codificare 3000 proteine diverse. Considerando il lievito, che ha un genoma che è circa il triplo di quello del batterio, riuscirebbe a produrre ben 11.000 tipi di proteine differenti. Però, vista la semplicità dell’organizzazione dei lieviti, questo dato sembra essere esagerato. La drosofila, che presenta circa 165 milioni di nucleotidi, dovrebbe essere in grado di produrre 138.000 proteine diverse. Ma tutto sembra essere eccessivo poiché neanche nel genoma umano sono state trovate questa quantità di proteine; quindi, già il genoma della drosofila sembra essere abbon- dantemente superiore alle reali necessità dell’organismo. Arriviamo infine all’uomo in cui, a fronte di un genoma aploide di 3,2 miliardi di nucleotidi, che viene poi tradotto in un corredo diploide costituito da 46 cromosomi organizzati a coppie, si riuscirebbero a sintetizzare ben 1.670.000 proteine. In realtà, le stime più aggiornate parlano di poco meno di 100.000 peptidi funzionanti. Come mai accade tutto questo? Man mano che gli organismi diventano più 17 complessi, sia come struttura generale che come quantità di nucleotidi, la porzione nucleotidica che effettivamente partecipa alla trascrizione e traduzione delle proteine diventa sempre più pic- cola; infatti, nel genoma umano questa frazione è costituita appena dall’1- 3% di tutto il genoma. Addirittura questo 1% del genoma disponibile per la sintesi proteica è anche capace di produrre più proteine del numero di geni che in quell’1% è presente. Tutto sta nella capacità di utilizzare quello disponibile nelle maniere più varie ed efficienti possibili da parte della cellula. GENOMA PROCARIOTICO Nei procarioti, il genoma è organizzato sottoforma di un’unica molecola cromosomica circolare (defi- nita comunque cromosoma anche se non è associata completamente a proteine). Il genoma si trova, quindi, in una porzione del protoplasma chiamata nucleoide; al microscopio elettronico, appare un po’ più chiaro rispetto alla restante parte di protoplasma poiché meno elettro denso. Questa molecola di DNA circolare: 1. è lunga grossomodo 1,5 mm e ha un unico sito di replicazione. 2. Essendo circolare, è priva delle estremità tipiche dei cromosomi eucariotici e dei loro punti di fusione: i telomeri e i centromeri. 3. Non ci sono o sono rari gli introni. 4. Sono rarissime le sequenze ripetute (pezzi di DNA presenti in multiple copie nel genoma, che invece rappresentano la stragrande maggioranza del genoma nelle cellule eucariotiche). Questo, nei procarioti, rappresenta il genoma principale. Vi è anche una forma di genoma se- condario e opzionale: i plasmidi. I plasmidi sono presenti solo in alcune cellule batteriche e hanno la capacità di essere facilmente trasferibili da una cellula batterica ad un’altra. Sono stati scoperti 50-60 anni fa come i depositari delle informazioni genetiche capaci di inattivare molti antibiotici. L’importanza genetica dei plasmidi è che sono state le prime molecole di DNA ad essere mani- polate e questo ha permesso poi di produrre vac- cini e farmaci. La dimensione dei plasmidi è mille volte inferiore a quella del genoma principale e sono costituiti da qualche migliaio di nucleotidi. I plasmidi possono essere presenti in più copie nei batteri e replicano sé stessi in maniera totalmente autonoma dal genoma principale presente nel nu- cleoide. Il gene procariotico è caratterizzato da una porzione centrale, la cosiddetta ORF (open reading frame). L’ORF rappresenta la cornice di lettura che viene trascritta e tradotta in una proteina. Questo è il motivo per cui questo segmento è il cosiddetto gene strutturale. L’ORF non è l’unica porzione del gene 18 procariotico: ci sono altre porzioni necessarie alla corretta trascrizione e alla corretta traduzione. Sia al 5’, cioè a monte della sequenza di DNA, sia a valle, al 3’ dell’ORF, ci sono delle sequenze che svolgono funzioni specifiche: al 5’, a monte del gene, troviamo il promotore: il tratto di DNA del gene che serve all’RNA polimerasi per riconoscere lungo il filamento dove aggrapparsi per poter avviare la trascrizione. Il promotore, spesso, viene raggiunto da una serie di fattori di trascrizione che permettono una regolazione più fine della trascrizione. A seguire si individua un’altra sequenza importante, l’operatore: esso contiene specifiche se- quenze, le sequenze di Shine-Dalgarno, che permettono di agganciare l’mRNA in modo che la sua prima tripletta da tradurre corrisponda nel ribosoma esattamente al sito p. Questo per- mette di leggere correttamente i vari nucleotidi. al 3’, a seguire la ORF, troviamo il terminatore: contiene sequenze che determinano l’arresto della trascrizione e partecipano allo stop della traduzione nei ribosomi. ORGANIZZAZIONE DEL GENOMA UMANO (EUCARIOTICO) Considerando il genoma umano, che è di tipo eucariotico, le cose si complicano. Il genoma, infatti, è sovrabbondante in nucleotidi rispetto alle triplette necessarie a codificare le proteine utili all’organi- smo. Nel caso del genoma umano, è possibile distinguere due differenti tipi di genoma all’interno di una cellula: il genoma nucleare: il genoma nucleare è il genoma principale della cellula; è costituito, in un corredo aploide, da circa 3.2 miliardi di nucleotidi che a loro volta formano un patrimonio di 21.000 geni. Il genoma nucleare può poi essere suddiviso in un 30% che è relativo alle 19 sequenze effettivamente geniche o correlate con i geni e ad un 70% che invece è costituito da DNA extra genico. o Questo 70% è costituito fondamentalmente da residui evolutivi di geni antichi e da sequenze di lunghezza variabile che costituiscono le sequenze ripetute di DNA nelle nostre cellule. o Del 30% soltanto il 10% è effettivamente costituito da sequenze codificanti mentre il restante 90% è costituito da sequenze non codificanti, come ad esempio gli introni, le sequenze non tradotte che controllano la trascrizione e la arrestano, frammenti genici, e gli pseudogeni. Gli pseudogeni sono geni che hanno subito ed hanno perso la capa- cità di essere trascritti e tradotti (capacità che in alcuni casi però non è persa definiti- vamente.) Il genoma mitocondriale: è costituito da molecole di DNA molto più piccole di quelle presenti nel nucleo. Esse codificano per le poche proteine necessarie ai processi energetici e anche per i tRNA e rRNA specifici del mitocondrio. Questi tRNA e rRNA seguono regole e hanno caratteristiche strutturali che sono diverse dai corrispettivi che si trovano nel citoplasma della cellula eucariote in cui il mitocondrio è localizzato in quanto sappiamo che il mitocondrio è filogeneticamente più vicino ai procarioti. 20 Il genoma eucariotico in generale segue lo schema organizzativo che presenta ovviamente anche quello umano, suddividendosi in genoma nucleare e mitocondriale. Esso è certamente più lungo ri- spetto al procariotico poiché ha un maggior numero di nucleotidi: il DNA umano non condensato raggiunge una lunghezza di ben 2 metri. Il genoma eucariotico si organizza in molecole lineari (e non circolari) a loro volta condensate in cromosomi. Per via della sua grande estensione, nel genoma eucariotico si hanno più siti di replicazione che servono per duplicare il DNA di tutti i cromosomi della cellula nel minor tempo possibile, in modo da salvaguardare la sopravvivenza stessa della cellula. Il genoma umano è organizzato in molecole lineari a loro volta organizzate nei 46 cromosomi. I cromosomi nel cariogramma (o cariotipo) vengono disposti in ordine di grandezza decrescente e vengono inquadrati nella metafase della divisione cellulare. Nel cariogramma, infatti, si individuano i cromosomi formati da due molecole di DNA, una per ogni cromatidio fratello. Recentemente si è scoperto che il cromosoma 22 ha più nucleotidi del 21. Il cromosoma 22 era stato considerato più piccolo del 21 solo per un motivo morfologico; infatti, siccome la cromatina del cromosoma 22 era meno identificabile con i mezzi di colorazione dell’epoca, questo cromosoma appariva più piccolo. In realtà, però, guardando il materiale genetico all’interno di questi cromosomi si è scoperto che c’è differenza nel numero di nucleotidi e che quindi il 21 ha dimensioni minori. I cromosomi eucariotici hanno sia regioni telomeriche, che hanno funzione di protezione da alterazioni strutturali e fusioni tra cromosomi, sia una regione caratterizzata da una specie di strozzatura che si vede nei cromosomi mitotici o meiotici e che contiene il centromero del cromosoma, dove si aggan- ciano le fibre del fuso mitotico o meiotico. Le interazioni tra le fibre del fuso e le regioni centromeriche consentono la corretta suddivisione del materiale cromosomico durante i processi di divisione cellu- lare. 21 Un tipico gene eucariotico, strutturalmente, è formato da due diversi tipi di sequenze: 1. ESONI: sono le sequenze di DNA che vengono trascritte e che hanno una sequenza nucleoti- dica che letta a triplette determina la sintesi in proteine; 2. INTRONI: sono delle sequenze nucleotidiche che si interpongono tra esoni. Sebbene queste sequenze vengano inizialmente trascritte, successivamente vengono eliminate attraverso lo splicing. Dunque, in generale, la parte di un gene eucariotico che contiene le sequenze introniche ed esoniche viene detta regione strutturale (ovvero il gene di per sé). Le sequenze introniche hanno prevalenza, a livello quantitativo, nella porzione strutturale del gene: sono circa 9 volte più grandi rispetto alle sequenze esoniche con cui confinano. Quasi la totalità dei geni ha sia esoni che introni e sono auten- tiche eccezioni i geni privi di sequenze introniche; un esempio sono i geni che codificano per la sintesi degli istoni, proteine fondamentali che si adoperano nel ripiegamento ordinato del DNA. Esoni ed Introni vengono trascritti in mRNA eterogeneo; quest’ultimo, per diventare mRNA effettivo, deve subire un processo di maturazione composto da tre fasi: 1) CAPPING: all’estremità 5’, vengono aggiunte alcune guanine al primo nucleotide del trascritto, con un particolare legame rovesciato che permette di aumentare la durata del mRNA proteg- gendolo dall’azione delle nucleasi citoplasmatiche; 2) SPLICING: Il trascritto tende a ripiegarsi in modo che le sequenze copiate dagli introni si av- volgano su loro stesse. Poi tramite la partecipazione anche di altri piccoli RNA e proteine, si forma lo spliceosoma, grosso complesso enzimatico che catalizza il processo e che taglia le sequenze di introni dal pre-mRNA. 3) POLIADENILAZIONE: consiste nell'aggiunta di una sequenza poliadenilica di circa 200 nucleo- tidi (poli(A)), all'estremità 3'-OH del pre-mRNA tramite legame covalente. Quasi tutti gli mRNA possiedono una coda poli(A). Un'eccezione è rappresentata dall'mRNA che codifica per le proteine istoniche. 22 L’mRNA maturo risulta essere più breve e povero di nucleotidi rispetto al trascritto primario. Oltre la parte strutturale, nel gene, troviamo delle porzioni regolatorie: IL PROMOTORE: Verso l’estremo 5’, a monte del primo esone, c’è una sequenza detta promo- tore, presente anche nel genoma batterico. Il promotore è tipicamente caratterizzato dal TATA BOX, sequenze formate da Timina e Adenina alternate. Questa sequenza è presente in tutti i geni (tranne rare eccezioni) e possiamo trovarle all’ incirca 25 nucleotidi a monte del primo nucleotide trascritto in RNA; per questo motivo la sua posizione viene indicata come -25. Mu- tazioni del TATA box determinano un forte rallentamento della trascrizione del gene (si parla di rallentamenti anche del 90%) e, data la sua importanza, viene detto facilitatore della trascri- zione. Alcuni geni hanno più TATA box. LA CAAT BOX: A monte del TATA box, precisamente 80 nucleotidi di distanza dal primo nu- cleotide che viene trascritto, si trova la sequenza CAAT BOX, chiamata così perché ricca di citosine, adenine e timine. Questa regione è presente nell’80% dei geni del nostro genoma e anch’essa ha un'azione di facilitazione e potenziamento della trascrizione. L’ISOLA CpG (o GC BOX): A circa 100 nucleotidi dall’inizio del gene trascritto, troviamo una sequenza presente nel 75% o poco più dei nostri geni, ricca di citosine e guanine alternate. Questa regione viene detta ISOLA CpG, dove C e G stanno per citosine e guanine mentre la P rappresenta il fosfato che le lega. Queste isole sono più o meno estese a seconda dei geni e hanno la caratteristica di poter avere sia un’azione facilitatoria che inibente sulla trascrizione. In condizioni di normalità delle citosine, l'isola CPG determina la facilitazione della trascrizione del gene a valle; quando, invece, la base azotata citosina è arricchita da un gruppo metile, l'isola si dice metilata e questa metilazione impedisce completamente la trascrizione del gene. In un’isola CpG metilata è come se il gene fosse stato eliminato. Da un punto di vista medico, alcuni farmaci sono capaci di agire in queste regioni aumentando il grado di metilazione o privando le citosine del gruppo metile a seconda delle necessità. Queste isole sono tutt’oggi studiate, cercando di manipolarle per poter riattivare geni mutati, la cui mutazione potrebbe essere raggirata per far funzionare comunque il gene anche se solo in parte. Le porzioni TATA box, CAT box e isole CpG, si trovano tutte nella parte prossimale ed iniziale del gene strutturale. Esistono poi altre sequenze molto più distanti, anche 1000 o 3000 nucleotidi dal gene, dette sequenze potenziatrici della trascrizione, capaci di agire a distanza, sia in forma fisiologica, sia 23 patologica. Queste regioni, che normalmente controllano un gene a valle, se dovessero, per un evento mutageno, essere trasferite in un'altra zona del cromosoma o su un cromosoma differente, potrebbero attivare dei geni che normalmente dovrebbero essere spenti (come geni che svolgono funzioni solo in periodo fetale) e che determinerebbero gravi conseguenze per l’organismo. I geni eucariotici sono molto differenti l’uno dall’altro e differiscono per tre principali punti: la lunghezza complessiva del gene, la composizione del gene di introni ed esoni, l’organizzazione intergenica. Considerando la lunghezza, esistono geni formati da pochi nucleotidi e geni che contengono milioni di nucleotidi. Si potrebbe pensare che più è esteso il gene e maggiore è la sua rilevanza ma non è così, poiché spesso geni piccolissimi sono fondamentali per la difesa dell’organismo e per altre fun- zioni. Prendiamo in esame qualche esempio pratico di geni: esempi 1) il gene dell’insulina, nonostante si composto da 1200/1300 nucleotidi, è di fondamentale im- portanza; 2) i geni per le beta globine, ovvero le proteine fondamentali per la costituzione dell'emoglobina, contengono circa 1500 nucleotidi (molto piccolo), come anche l’albumina, avente un gene costituito da circa 18000 nucleotidi; 3) Tra la fascia di geni composti da 10 mila fino a 100 mila nucleotidi (vedi immagine sopra), ci sono geni come quelli per il collagene. 4) Troviamo poi i recettori delle proteine LDL, ovvero proteine legate al colesterolo ‘’pericoloso’’, i cui geni hanno una dimensione di orca 40000 nucleotidi. 24 5) Infine abbiamo i mega geni, come quello per il fattore VIII, che interviene nella coagulazione, che conta circa 200.000 nucleotidi; il gene cosiddetto CFTR, il quale acronimo sta per “Rego- latore Transmembrana per la Fibrosi Cistica”, malattia genetica autosomica recessiva. E in questo gruppo abbiamo il gene più grande ad oggi conosciuto, che è quello della distrofina, proteine tipica del sarcolemma, la cui mutazione causa la distrofia muscolare di Duchenne e quella di Becker, due malattie dovute dalla mutazione dello stesso gene, però in modo diffe- rente. I geni dunque hanno dimensioni molto variabili ma la loro rilevanza per l’organismo non dipende da esse. In realtà, data la struttura media di un gene, si è scoperto che geni disposti sullo stesso filamento del DNA, possono essere trascritti tutti insieme o in parte insieme. In questa immagine possiamo osservare una sequenza di Dna a doppia elica; sull’ elica superiore si osservano dei rettangoli che corrispondono agli esoni di 3 geni (gene 1, gene 2, gene 4), mentre sulla catena complementare c’è un gene (gene 3) i cui esoni sono posizionati singolarmente (senza essere affiancati da altri geni). Dunque, andando ad analizzare il trascritto del gene 1, si è visto che, tra i vari mRNA che si erano ottenuti, ce ne erano alcuni che contenevano solo qualche sequenza esonica del gene 1 ma anche alcuni trascritti copiati da esoni del gene contiguo o trascritti di altri geni anche molto lontani. Ciò ha portato alla conclusione che la struttura del gene può essere manipolata dai meccanismi di trascrizione in maniera un po’ meno precisa, tanto da unire tratti di proteine che deri- vano da geni diversi anche non tanto vicini tra loro. Poiché non sempre precisi, quindi, i confini tra un gene e l’altro sono definiti come sfocati. Prendendo in considerazione una malattia dovuta ad un errore della traduzione di un tratto di mRNA trascritto da più geni, se ci si focalizza sull’analisi solo del DNA della sequenza del primo gene (non riscontrando problemi) senza tenere conto che spesso questo gene viene trascritto insieme ad altri, si può verificare una mancata diagnosi di malattie genetiche. 25 SEQUENZE GENICHE DUPLICATE E DIVERSIFICATE Ci sono poi sequenze duplicate e diversificate, cioè sequenze geniche che nel nostro genoma sono presenti in più copie e possono svolgere funzioni diverse. Il nostro genoma possiede numerose se- quenze duplicate. Le sequenze duplicate diversificate sono sequenze geniche estremamente simili tra di loro, tant’è che si è supposto che siano derivate tutte da un unico gene primordiale. Ad esempio, ci sono 3 geni: quello dell’albumina, quello dell’alfa-fetoproteina e quello della proteina G cellulare o GC. In tutti e tre i geni riscontriamo: lo stesso numero di esoni e di introni; simile sequenza nucleotidica negli esoni; le proteine codificate da questi tre geni sono tutte proteine transmembranali, cioè si trovano nello spessore della membrana plasmatica della cellula. I ricercatori sono arrivati alla conclusione che, essendoci tutte queste analogie (sia di posizione e sia di organizzazione strutturale), questi 3 geni probabilmente derivino da una duplicazione, intervenuta durante l’evoluzione, di un gene ancestrale. Guardando, però, all’organizzazione e alla distribuzione degli esoni e degli introni nella porzione 5’, in quella intermedia e in quella 3’, si è scoperto in realtà che la sequenza nucleotidica è sovrapponibile in tutte e tre le porzioni di ciascuno dei geni. Venne, così, sollevata l’ipotesi che anche il gene ancestrale che li aveva generati fosse il risultato di un’ampli- ficazione per triplicazione di un segmento più piccolo, il gene primordiale, da cui sono derivati i tre geni come li conosciamo oggi. Le sequenze duplicate sono conseguenza dell’evoluzione che ha subito il genoma di una cellula di un organismo nel tempo che, pian piano, ha portato fino al genoma che conosciamo oggi. Si tratta di un caso molto diffuso, tanto che ci sono numerose regioni genomiche che hanno a che fare con la stessa tipologia di geni. Questi geni vanno a costituire le cosiddette “famiglie multigeniche” o “super famiglie geniche”, a seconda di quanti sono i geni che le costituiscono e che hanno funzioni simili. Le famiglie multigeni- che sono quindi gruppi di geni che hanno grande somiglianza nella sequenza di DNA, sia da un punto di vista strutturale nucleotidico (sono simili da un punto di vista nucleotidico), sia da un punto di vista funzionale (sono simili poiché trascrivo proteine che svolgono stesse funzioni). Esempi pratici di geni simili tra loro sono: i geni per l’ormone della crescita, numerosi e tutti localizzati nella posizione cromosomica 17, e i geni dei recettori olfattivi, di cui se ne contano circa cento distribuiti sull’intero genoma. La famiglia genica dei geni che codificano per gli RNA ribosomiali (i cui geni sono localizzati sul braccio corto di 5 tipi di cromosomi: 13-14-15-22-21). Un’importante famiglia di geni è quella degli omeogeni. La famiglia degli omeogeni partecipa allo sviluppo dell’organismo: permettono, infatti, uno sviluppo simmetrico e coordinato regolando i pro- cessi di morfogenesi. Furono scoperti da un gruppo di ricercatori italiani circa 50 anni fa grazie agli studi effettuati sul moscerino della frutta (drosophila melanogaster). In moscerini con particolari mal- formazioni, alcuni di questi geni non si trovavano nel posto che teoricamente dovevano occupare 26 lungo il filamento di DNA, ma in posizioni diverse. Dunque, i ricercatori compresero che questi geni, posti uno dietro l’altro, controllavano i processi di morfogenesi. In tutti questi geni allineati sul cromo- soma era comune un gruppo di 60 nucleotidi, detto Homeobox. Verificando la presenza di questi geni in specie più complesse come il topo o l'uomo, si scoprì che si trovavano in 4 cromosomi e che controllavano lo sviluppo del Sistema Nervoso Centrale. In questo modo, nel caso in cui parti di questi geni fossero andate perse per via di mutazioni cromosomiche, le altre avrebbero compensato l’errore. SEQUENZE DUPLICATE Nel nostro genoma, le sequenze duplicate, non necessariamente contenenti geni, sono abbondantis- sime. Come si nota nell’immagine, sulle barre orizzontali (che corrispondono ad ogni cromosoma del nostro genoma), le linee in blu collegano sequenze di migliaia di nucleotidi identiche tra di loro su ogni cro- mosoma. Ad esempio, sul cromosoma 7, vi è una grande quantità di sequenze tra loro simili; ci sono anche in buona parte sul cromosoma 1 tra la regione centromerica (in viola) e le due regioni telome- riche; se andiamo sul cromosoma 16, queste, rispetto alla lunghezza totale del cromosoma, sono veramente abbondanti e lo stesso accade per il cromosoma 17 e per il 22. Queste sequenze duplicate sono la conseguenza di errori che si sono accumulati nel genoma durante le migliaia di anni di evoluzione. Osservando le barre azzurre più fitte, si è scoperto che tali regioni sono più deboli nel rimanere integre e vanno facilmente incontro ad errori di appaiamento durante la 27 meiosi: sono regioni che più frequentemente danno luogo all’insorgenza di alcune malattie cromoso- miche o geniche ricorrenti nella nostra specie. Non solo ci sono sequenze di migliaia di nucleotidi identiche sullo stesso cromosoma, ma ci sono anche sequenze piuttosto lunghe (che possono contenere geni al loro interno) che sono identiche tra cromosomi diversi. Queste omologie, sono state dimostrate essere responsabili di alcune trasloca- zioni, un errato scambio di parti di cromosomi non omologhi durante il riarrangiamento cromosomico. SEQUENZE RIPETUTE IN TANDEM Oltre a queste sequenze duplicate (in un numero variabile di copie e molto estese), ci sono alcune ripetizioni particolari poiché tra loro ravvicinate e, curiosamente, hanno lo stesso orientamento. Di solito i meccanismi di duplicazione e di traslocazione non sono meccanismi che mantengono sem- pre lo stesso verso della sequenza. Solo in alcuni casi questo si verifica: sono le cosiddette sequenze ripetute in TANDEM (proprio come due persone che stanno insieme sulla bicicletta e guardano tutte e due nella stessa direzione). Esempi di sequenze ripetute in tandem sono le sequenze dei geni ribo- somiali. Infatti, questi geni, che sono localizzati sulle coppie dei cromosomi acrocentrici 13, 14,15, 21 e 22, si susseguono uno dietro l’altro, in centinaia di copie. L’evoluzione ha fatto sì che queste copie si accumulassero, in modo da costituire un grande vantaggio per l’individuo in quanto, anche se ve- nisse persa una parte di queste, ci sarebbero le altre che compenserebbero tale perdita. Da ciascuno di questi elementi ripetuti, si produce un RNA messaggero che contiene tutte le regioni corrispondenti a tre dei quattro tipi di RNA ribosomiali. 28 SEQUENZE MEDIAMENTE RIPETUTE Ci sono poi le sequenze altamente e mediamente ripetute. Queste sequenze sono molto più brevi rispetto alle sequenze ripetute in tandem ma hanno un numero di ripetizione maggiore e sono molto abbondanti. Si sono originate molto probabilmente dall’intervento di virus che hanno inserito nel no- stro genoma (e che continuano ad inserire) nuovi tratti di DNA. Le sequenze mediamente ripetute hanno un numero di ripetizione che va da circa 10 mila a 100 mila copie e si suddividono in diverse tipologie di sequenze: le LINES, le SINES, le SVA e i trasposoni. Oggi sappiamo che queste sequenze sono localizzate in alcune regioni dei nostri cromosomi: tipica- mente le LINES si presentano in regioni dove la cromatina è meno densa, mentre la SINES sono tipicamente localizzate nelle regioni dove vi è una maggior concentrazione di geni. Vediamo nei dettagli ogni tipologia di sequenza: SEQUENZE LINES: costituiscono il 20% del genoma; ogni singola sequenza ha una dimensione che va dai 4 ai 6000 nucleotidi e sono presenti alcune migliaia di copie nel nostro genoma. La famiglia genica più importante delle LINES è la L1. Queste sequenze contengono al loro interno dei geni codificanti per proteine, la cui funzione è correlata alla replicazione del DNA, alla tra- scrizione e ad altri processi. Tra queste proteine rientrano la trascrittasi inversa (enzima utiliz- zato dai retrovirus), le endonucleasi (enzimi in grado di tagliare il DNA in un punto specifico) e i retrotrasposoni. Queste sequenze sono in larga parte sequenze parzialmente danneggiate, solo un centinaio di copie sono integre. Oggi è stato acclarato che sono di origine retrovirale. SEQUENZE SINES: costituiscono il 13% del genoma, nel quale sono molto sparpagliate, circa ogni 1000-3000 nucleotidi. Sono sequenze molto più corte ma molto abbondanti, presenti specialmente negli eucarioti più complessi, e sono specie-specifiche (conservano, cioè, l’ori- gine delle varie specie eucariotiche). La famiglia più rappresentativa di questo tipo di sequenze prende il nome di Alu. Sono sequenze caratteristiche delle regioni maggiormente trascritte del nostro genoma e derivano da un RNA detto RNA 7S. SEQUENZE SVA: più rare, costituiscono il 5-8% del genoma e sono strettamente imparentate con quelle retrovirali. Sono sequenze trascritte e molte copie di queste contengono i tre geni fondamentali (gag, pol, env) per la replicazione virale che codificano per gli elementi necessari alla costituzione del virus. Grazie all’evoluzione, queste sequenze raramente riescono a repli- care in maniera completa il genoma del retrovirus ma alcuni ricercatori sono concordi nell’af- fermare che ci siano almeno 100 copie integre e potenzialmente infettive del genoma retrovi- rale integrato nel genoma umano. TRASPOSONI: I trasposoni sono segmenti di DNA che sono in grado di saltare da una zona all’altra del cromosoma: queste sequenze creano un RNA copia della loro sequenza e quell’RNA, con meccanismi vari, riesce ad inserire una copia del trasposone in un’altra regione genomica. Sono caratterizzati dalla presenza di un gene che codifica per la trasposasi, enzima che catalizza il processo di inserzione del segmento di DNA nel nuovo sito. I trasposoni sono 29 presenti sia nei procarioti che negli eucarioti e sono suddivisibili in forme semplici, nelle quali sono presenti solamente i geni necessari per la trasposizione, e forme complesse, che inclu- dono più geni. La maggior parte delle informazioni che si hanno sui trasposoni deriva dai retrotrasposoni. Per i trasposoni a DNA ci sono ancora poche informazioni che non permet- tono ancora di capire come effettivamente essi vengano utilizzati in maniera fisiologica dalla cellula. o RETROTRASPOSONI: I retrotrasposoni sono stati oggetto di più studi, per cui si hanno un numero maggiore di informazioni a riguardo. I retrotrasposoni sono sequenze pre- senti nel nostro genoma caratterizzate da due geni che codificano per due proteine. Il primo gene codifica per una proteina strutturale: questa ha il compito di trasportare l’mRNA dall’ambiente nucleare a quello citoplasmatico e viceversa; il secondo gene codifica invece per una trascrittasi inversa, enzima capace di trascrivere una molecola di RNA in una di DNA ed anche di scindere la molecola di DNA rompendo legami fo- sfodiesterici. Proprio come i trasposoni, i retrotrasposoni sono in grado di saltare da una zona all’altra di un cromosoma sfruttando, però, i meccanismi di retrotrascrizione. I retrotrasposoni si possono suddividere in due classi: i retrotrasposoni che presen- tano alle estremità delle lunghe sequenze ripetute terminali (LTR, dall'inglese Long Terminal Repeat, per questo chiamati retrotrasposoni LTR) e i retrotrasposoni che non le presentano (retrotrasposoni non-LTR). Il retrotrasposone LTR è costituito da due estremità, dette LTR (long terminal repeat) che circondano questi due geni: esse sono tipiche dei retrovirus e sono fondamentali poiché permettono il riconoscimento del punto in cui la copia del retrotrasposone si deve inserire. Dunque, la sequenza completa (con geni e sequenze LTR) viene copiata in RNA; questa poi viene trascritta in DNA grazie alla trascrittasi inversa e poi questa sequenza di DNA viene inserita in una nuova zona del cromosoma: si è formata una nuova copia del retrotrasposone. Più in dettaglio, in una certa regione genomica, su un cromosoma si ha un elemento retrotrasponibile. Questo elemento, che fa parte di una sequenza L1 (una sequenza LINES mediamente ripetuta), contiene 2 geni chiamati ORF (due sequenze di DNA al cui interno è possibile identificare una sequenza nucleotidica che, se letta a tre a tre, traduce per una proteina funzionale). Questa regione viene copiata in RNA messaggero che matura e finisce dal nucleo al citoplasma. Qui, viene riconosciuto dai ribosomi che leggono la sequenza producendo due proteine: una è quella che permetterà la retro- trascrizione e l’altra, invece, è la proteina che è in grado di prendere l’RNA, che è appena passato nel citoplasma e letto dai ribosomi, e di ritrasferirlo nel nucleo. Una volta che l’RNA è tornato nel nucleo, la trascrittasi inversa è in grado di scindere un legame fosfodiesterico su una delle due emieliche di un tratto di DNA (in corrispon- denza di una zona ricca di timine) in modo che si possa verificare un appaiamento tra il poliA dell’RNA sintetizzato (a partire dal genoma del retro trasposone) ed il tratto di DNA dove dovrà essere inserito. Si incomincia a formare una nuova molecola, una 30 emielica di DNA, che ha la sequenza complementare a quella dell’RNA messaggero. Una volta che è stata completamente copiata, la sequenza attiva la DNA polimerasi e sull’altra emielica viene generata la copia complementare al DNA di quella prodotta dalla trascrittasi inversa ed inserita nella prima emielica. Il risultato che si ottiene è una piccola estensione del cromosoma poiché al suo interno è stata appena inserita una nuova copia di un retrotrasposone. Questo fenomeno avviene continuamente nelle cel- lule eucariotiche ed è ritenuto uno dei meccanismi di mutagenesi alla base dell’evolu- zione degli organismi. Può capitare che questo segmento di DNA che si vada a inserire in un’altra regione di un altro cromosoma (o dello stesso) e possa andare a interrom- pere dei geni. Ciò può portare all’ alterazione di sequenze esoniche, introniche, o pro- motori. Tuttavia la trasposizione di questi elementi serve a migliorare l’adattamento della nostra specie all’ambiente. PSEUDOGENI Con il termine pseudogene si intende una sequenza di nucleotidi simile a un gene (a livello di strut- tura), ma priva di alcuna espressione all'interno della cellula. A seconda di come si formano: Spesso, può accadere che si vadano a formare i cosiddetti pseudogeni processati (o retro- trasposti) a seguito di questi processi di trasposizione. Talvolta, un gene può essere trascritto in mRNA e quest’ultimo poi essere intercettato da una trascrittasi inversa. Si forma, così, un filamento di DNA che viene poi integrato all’interno del cromosoma: si è formata una sequenza genica priva di introni, di promotore o comunque di sequenze regolatorie: lo pseudogene processato (indicato in genetica con ψ). Lo pseudogene processato non può essere trascritto, non può essere tradotto in quanto è privo di qualsiasi sequenza che ne regola i processi, per cui non altera i vari meccanismi genici. La sua formazione è priva di ogni effetto. Mutazioni causate da errori di duplicazione si possono accumulare su questi pseudogeni risultando co- munque innocue. Da un punto di vista diagnostico però è bene comprendere al meglio se la mutazione individuata è presente in uno pseudogene o in un gene reale (e che potrebbe dunque avere consequenze patologiche). Alcune volte, però, accade qualcosa che non 31 dovrebbe succedere: tale sequenza si va ad inserire in prossimità di un promotore di un gene limitrofo. Il promotore non tiene conto di tale processo e oltre a promuovere la trascrizione del suo gene specifico, promuove anche la trascrizione del retro-pseudogene. Gli pseudogeni non processati (o duplicati) si formano invece con un meccanismo differente da quello della trasposizione. In questo caso, in seguito a duplicazione genica, può originarsi una copia di un gene funzionale. Questa copia poi con il passare delle generazioni può acquisire mutazioni che la rendono non più funzionale: si è formato uno pseudogene non processato. Questi pseudogeni duplicati, di solito, hanno tutte le caratteristiche di un gene normale, incluso un promotore e una normale struttura esone - introne. La perdita della funzionalità di questo gene-copia di solito non ha un effetto visibile sulla fitness dell'organismo nel quale si trova, visto che vi è almeno una copia del gene funzionale. SEQUENZE ALTAMENTE RIPETUTE Le sequenze altamente ripetute sono molto più numerose (decine di milioni di copie) e risultano essere molto più corte. Esse costituiscono circa il 10% del genoma umano. In questo caso non si parla più di lunghe sequenze composte da svariati nucleotidi ma di brevi sequenze di 2/3 nucleotidi presenti su tutti i cromosomi. Le sequenze altamente ripetute possono essere suddivise in due gruppi: 1) Le sequenze accumulate in specifiche regioni cromosomiche come i centromeri e le regioni telomeriche; 2) Le sequenze che sono sparpagliate in modo causale su ogni cromosoma. Analizziamole una per volta: GRUPPO 1 Le sequenze a livello dei centromeri non sono codificanti e contano 50 milioni di nucleotidi. Esse, seppure potrebbero sembrare banali perché brevi e largamente ripetute, svolgono fun- zioni importanti. Quando queste sequenze non sono presenti i cromosomi non vanno incontro ad una corretta divisione meiotica o mitotica oppure si separano troppo precocemente con conseguenze gravi o gravissime per le cellule figlie. Inoltre, la loro sequenza è anche da ricol- legare a delle proteine, quelle del cinetocore, che fanno da tramite tra il cromosoma e i due poli del fuso. Quanto ci sono mutazioni a livello del centromero, il cinetocore non è stabile e quando viene raggiunto dalle fibre del fuso non si verifica un aggancio solido tra le fibre e il cromosoma stesso. Per i telomeri, le sequenze altamente ripetute svolgono una funzione fondamentale in quanto impediscono che il DNA di due cromosomi vicini possa reagire e fondere i due cromosomi. Questo accade quando le estremità della catena di due molecole di DNA risultano libere, hanno cioè a disposizione un 5’ e un 3’ che potrebbero andare incontro ad un legame fosfodiesterico. Queste sequenze telomeriche vanno incontro ad un graduale consumo con il tempo: più la cellula replica (svolge quindi una vita prolungata) più queste regioni si riducono. 32 L’assenza/consumo di queste sequenze risulta essere un marchio di invecchiamento cellulare mettendo in correlazione l’insorgenza più frequente di tumori con l’avanzare dell’età degli indi- vidui. La particolarità è che, nelle cellule tumorali, le regioni telomeriche smettono di accor- ciarsi (questo accorciamento mancato fa sì che le cellule neoplastiche continuino a vivere e proliferare). GRUPPO 2 Il secondo gruppo annovera tutte quelle sequenze di DNA altamente ripetuto sparpagliato però su tutti i cromosomi. Queste sequenze si suddividono in satellite, minisatellite e microsatellite. Le sequenze microsatelliti sono brevissime sequenze di qualche unità di nucleotidi presenti in un numero variabile di copie in differenti regioni di uno o più cromosomi del nostro genoma. Sono queste regioni quelle utilizzate per riconoscere a livello forense autori di delitti o per il riconoscimento della paternità. DNA satellite: tipico delle zone centromeriche dei cromosomi. Costituisce circa il 15% del genoma umano ed è DNA non codficiante. Esistono varie tipologie di sequenze (satellite 1, satellite 2, satellite 3 …) che possono essere specifiche di qualche cromosoma o presenti su tutti i cromosomi in corrispondenza dei centromeri. La combinazione delle varie tipologie dà come risultato finale la possibilità che questi cromosomi vengano correttamente orientati du- rante i processi di divisione cellulare. DNA minisatellite: tipicamente presente nei telomeri, in tale gruppo evidenziamo un’ulteriore sottocategoria definita “sequenze ipervariabili” perché il numero delle copie di queste se- quenze in determinate regioni è variabile non solo tra individui ma anche tra due cromosomi omologhi. Le sequenze minisatellite ipervariabili sono le sequenze più abbondantemente ricer- cate per il riconoscimento del padre biologico. La prima sequenza fu identificata vicino ai geni per l’alfa globina. Inizialmente il fatto che un individuo, il cui DNA era stato utilizzato come modello per scoprire dove si trovasse il gene per l’alfa globina, presentasse una grande varia- bilità vicino al locus per il gene alfa globina aveva fatto pensare che l’individuo fosse casual- mente predisposto a sviluppare una talassemia. Solo dopo, studiando individui che non erano neanche lontanamente predisposti a sviluppare una talassemia, ci si accorse che anche loro avevano una grande variabilità nelle sequenze di queste regioni. Si poté arrivare alla conclu- sione che ci doveva essere qualcos’altro: le sequenze ipervariabili che erano collocate in pros- simità del gene dell’alfa globulina erano in realtà distribuite in tutti i cromosomi. Le sequenze microsatelliti sono brevissime sequenze di qualche unità di nucleotidi (1-4 unità) presenti in un numero variabile di copie in differenti regioni di uno o più cromosomi del nostro genoma. Sono queste regioni quelle utilizzate per riconoscere a livello forense autori di delitti o per il riconoscimento della paternità. Oggi sono utilizzate per vedere se ci sono differenze in tutte quelle caratteristiche dell’individuo come la capacità di riconosce come amaro o salato un determinato alimento. Un esempio: il fatto che qualcuno di noi provi piacere nell’assaggiare qualcosa di aspro a differenza di qualcun altro risiede proprio nelle differenze delle sequenze nucleotidiche che alterano la reazione di alcuni nostri sensi. 33 DIFFERENZE TRA LE SEQUENZE MEDIAMENTE E ALTAMENTE RIPETUTE La tabella soprastante mostra le principali differenze che vi sono tra le sequenze mediamente ripetute e le sequenze altamente ripetute. Le differenze più sostanziali sono: Le sequenze mediamente ripetute contengono molto spesso geni interi e funzionanti i quali svolgono delle funzioni molto comuni nella cellula. Le sequenze altamente ripetute sono prive di geni utili poiché essendo estremamente corte non c’è spazio necessario per un gene. Come conseguenza abbiamo anche che le sequenze mediamente ripetute sono molto più estese (contengono geni). Hanno tempi di replicazioni differenti: le sequenze mediamente ripetute vengono duplicate precoce- mente in fase S così che le sequenze che contengono geni possano già essere trascritte in RNA anche quando non è stato ancora completata la duplicazione dell’intero DNA del cromosoma. ORGANIZZAZIONE DEL GENOMA UMANO (in sintesi) Andando a riassumere... “cosa contiene il nostro genoma?” Possediamo all’incirca, tra geni e pseu- dogeni, più di 54mila unità geniche distinte tra loro. Se consideriamo solo geni codificanti per proteine, allora sono circa 20mila sequenze geniche tradotte. Se poi si consideriamo anche i geni che trascri- vono per RNA contiamo altri 17mila geni. Questi geni non codificanti per proteine, fino a dieci anni fa, erano sconosciuti tanto da attribuire a queste sequenze l’appellativo di junk DNA (DNA spazzatura). 34 Oggi, invece, si sa che queste sequenze sono geni che si comportano in modo diverso rispetto a quelli codificanti poiché hanno una struttura diversa. Infatti NON devono avere necessariamente: - la tripletta ATG, -il promotore al 5’, Tuttavia, hanno una serie di caratteristiche che limitano la nostra capacità di riconoscere queste se- quenze nel genoma. Questi RNA non tradotti possono determinare l’avvio di processi metabolici fisio- logici oppure bloccarli quando presentano mutazioni. I geni per gli RNA non tradotti sono numerosis- simi e non riconoscendoli siamo impossibilitati nel trattare patologie ad essi correlati. “Com’è possibile fronteggiare tale problema”? Una possibile soluzione consiste nell’inserire un RNA complementare a quello mutato che, appaiandosi a quest’ultimo, lo rende non funzionante (l’RNA mutato non interagisce più con il DNA o con i ribosomi). Questa famiglia di RNA non codificanti sono presenti anche durante la maturazione dell’mRNA primario e durante la duplicazione del DNA (un esempio sono i primer). Inoltre, questi RNA regolano la trascrizione e traduzione di altri geni che trascrivono per RNA che poi verranno tradotti in proteine. Gran parte di questo lavoro è stato avviato da Victor Ambros e Gary Ruvkun (premio Nobel per la medicina 2024). Dai loro studi sono partite poi altre indagini con ricadute in ambito medico. ORGANIZZAZIONE MORFOLOGICA DEL GENOMA: I CROMOSOMI Questa immagine confronta direttamente il genoma umano nucleare con quello mitocondriale evi- denziando le porzioni utilizzate nella sintesi proteica, quelle caratterizzate da sequenze ripetute e quelle trascritte in RNA che non vengono tradotti. Si notano numerose differenze: la più visibile è la dimen- sione di questi genomi. Il genoma mitocondriale, rappresentato come un puntino, corrisponde a 25 35 molecole di DNA mitocondriale. La scelta delle 25 molecole è stata fatta per poterlo effettivamente rappresentare. Queste molecole di DNA mitocondriale hanno una costruzione del genoma diversa da quella del genoma nucleare. La parte costituita da geni che codificano per proteine (in rosso) nel nucleo è minima (circa 1%) mentre nel genoma mitocondriale rappresenta il 66% dell’intero genoma. I geni per RNA e le sequenze di regolazione (in rosa) rappresentano una piccola porzione dell’intero genoma nucleare; invece, in quello mitocondriale corrispondono a circa un terzo. Ci sono poi sequenze duplicate, ripetute, trasposte, più o meno organizzate: nel genoma mitocondriale sono una piccolissima frazione, nel genoma nucleare costituiscono oltre il 90%. Complessivamente contando i nucleotidi si riscontra un rapporto di 190mila:1 tra il genoma nucleare e il genoma di un cromosoma mitocondriale. LA CROMATINA Abbiamo detto che il genoma nucleare di una cellula umana somatica è costituito da più di 3 miliardi di nucleotidi (corredo diploide). Se prendiamo tutte le molecole che compongono tutti i cromosomi e le leghiamo tra loro, otteniamo un filamento di DNA a doppia elica lungo 2 metri. Questo filamento dunque, è lungo 2 milioni μm. Il nucleo della cellula in cui sono contenuti i 2 milioni di micron di DNA presenta delle dimensioni comprese tra i 5 e gli 8 micron. Com’è, quindi, possibile, stipare nel nucleo un filamento così lungo? L’evoluzione ha reso possibile ciò: il DNA è morfologicamente ripiegato e avvolto grazie all’associazione delle molecole di DNA con le proteine istoniche formanti la cromatina. La cromatina si ottiene dall’associazione tra il filamento di DNA e specifiche proteine, dette istoni. Tale associazione ha permesso di condensare il DNA e stipare in modo ordinato il materiale genetico nel nucleo. La cromatina si presenta sotto due forme: 1. EUCROMATINA: cromatina poco spiralizzata e che contiene numerosi geni trascritti in RNA; 2. ETEROCROMATINA: cromatina più condensata e che contiene DNA con sequenze ripetute; Come avviene l’associazione tra istoni e DNA? Tra le proteine coinvolte, proteine basiche cariche po- sitivamente, e la molecola di DNA, acido desossiribonucleico carico negativamente, si stabiliscono dei legami ionici che rendono questa associazione stabile. Le due frazioni della cromatina, DNA e istoni, si separano solo quando il DNA deve essere duplicato o trascritto. Gli istoni che partecipano alla realizzazione della cromatina sono di 5 tipi: H1 H2a H2b → tutte insieme sono famiglie istoniche H3 H4 La cromatina si organizza in livelli via via sempre più complessi: 36 L’unità fon- damentale in cui viene am- massata la cromatina è il nucleosoma, formato da un ottamero di istoni dove ogni tipologia H2a, H2b, H3 e H4 è presente in due copie. Attorno a questo ottamero si avvolge per quasi 2 giri il filamento di DNA: la struttura che si forma viene definita nucleosoma. Esso si associa anche con la quinta molecola di istone H1 che non partecipa alla formazione del nucleo- soma ma consente di mantenere più stabile le due spire di DNA con l’ottamero istonico. Tra un nucleosoma e quello successivo c’è un piccolo tratto di DNA, detto DNA linker, che rimane libero dalle proteine. Questo tratto di DNA linker ha una lunghezza variabile tra le 30 e 60 paia basi mentre il DNA attorno all’ottamero istonico ha una lunghezza media di 140 paia basi (bp). DNA fetale e post natale: diagnosi non invasive Si riscontrano differenze tra il DNA av- volto attorno all’ottamero istonico in epoca fetale rispetto a quello avvolto in epoca post-natale o adulta e tali differenze risultano fondamentali perché permet- tono di selezionare i frammenti di DNA che, una volta morta una cellula, passano nel plasma (in esso ci sono pezzi di DNA dovuti alla degradazione della cellula). Nel plasma di una donna in gravidanza sono stati riscontrati non solo pezzi di DNA do- vuti alla degradazione delle sue stesse cellule, ma anche DNA proveniente dalle cellule della placenta (DNA fetale). Tale situazione viene sfruttata per effettuare diagnosi prenatali non invasive: si raccoglie il plasma di una donna in gravidanza e si separano le molecole di DNA della gestante da quelle fetali: per il 90/95% il DNA riscontrato deriva dalle cellule deteriorate della madre mentre la restante porzione di DNA (10/5%) deriva dagli annessi della camera di gestazione del feto e quindi conterrà il DNA di origine fetale. Sfruttando la differenza di lunghezza attesa dai frammenti di DNA provenienti dalla ma- dre e quelli fetali si può effettuare una diagnosi senza dover effettuare una pratica invasiva per prele- vare DNA fetale, che fa aumentare il rischio di aborto spontaneo. 37 Questa è una schematizzazione di come è organizzato il nucleosoma: 8 molecole di istoni, avvolto da un quasi doppio giro di DNA (striscia azzurra). Qui si può notare come non si riesca a vedere l’istone H1, invece H2 si trova sotto H2A superiore. Il diametro massimo del nucleosoma è 11nm e la distanza tra un nucleosoma e l’altro è di 7 nm. L’associazione tra istone e DNA permette a quest’ultimo di riuscire ad impacchettarsi ordinatamente nel nucleo delle cellule. Tanti nucleosomi, uno dietro l’altro, danno origine alla “collana di perle” della fibra croma- tinica visibile solo però tramite tecniche di laboratorio. Infatti, questo è il primo livello di organizzazione della cromatina che non è mai visibile direttamente nella cellula in quanto la cromatina è sempre organizzata in livelli più complessi. La seguente foto presenta una collana di perle al microscopio, Le perle sono i nucleosomi, il filamento che si interpone tra i nucleosomi è il DNA linker. Il secondo livello di organizzazione della cromatina è costituito dalla disposizione dei nu- cleosomi. Non è ancora stata stabilita la struttura secondo cui si dispongono i nucleosomi e sono stati proposti due modelli differenti: 1. Il primo, più semplice, in cui gli istoni sono sovrapposti uno sull’altro; 2. Il secondo, più complesso, dove alcuni nucleosomi si affiancano e altri si sovrap- pongono e interpongono tra questi altri nucleosomi affiancati. Qui entra in funzione un quinto istone, l'H1 che accorpa i nucleosomi sovrapponendoli a due a due (fibra cromatinica) o raggruppandoli in gruppi di 6 ciascuno (solenoide). In questo modo lo spessore passa da 11 nm a 30 nm circa. Questa è la struttura più accreditata. 38 Indipendentemente dalla struttura, co- munque, i nucleo- somi si dispongono in modo tale da stipare il DNA in una struttura con uno spessore di 30 nm. Quest’ultima non è soltanto una struttura citomorfolo- gica, con la quale il DNA è organizzato dentro il nucleo, ma è una struttura che ha anche funzioni regola- torie. Nel terzo livello di organizzazione la fibra di 30nm si ripiega in anse. Queste sono disposte ordinatamente una dietro l’altra e sono agganciate ad una base, precisamente ad una strut- tura proteica, che ha un comportamento chimico-fisico diverso da quello degli istoni (che sono caricati positivamente, motivo per cui il DNA si associa più facilmente). Quando gli istoni si ripiegano in questo dominio ad ansa, cambia il tipo di carica, questo perché la proteina non istonica è caricata negativamente. Ciò favorisce l’associazione tra la cromatina e le proteine non istoniche, che sono alla base dell’organizzazione finale del cromosoma. I nucleosomi si as- sociano fra di loro formando la fibra cromatinica, essa comincia a svilup- pare ripiegature grazie all’intervento delle condensine, ovvero proteine specializzate che condensano ulte- riormente i domini ad ansa in modo che occupino meno spazio. Le due 39 proteine nell’immagine (a forma di spille da balia) sono della stessa famiglia (proteine SMC), queste si mettono alla base di ogni ansa e fanno sì che il filamento di cromatina si organizzi in modo da costruire la base con cui si formeranno i cromosomi al momento della divisione cellulare. Per cui, in modo più schematico e sintetico, ci sono vari livelli di condensazione della cromatina: 40 Si parte dal semplice e puro filamento di DNA, lungo 2m e spesso 2nm che deve essere impacchettato nel nucleo: I. 1° LIVELLO DI CONDENSAZIONE: Ottameri istonici con il filamento di DNA che gli avvolge formanti i nucleosomi che si susseguono, interposti da brevi tratti di DNA lin- ker: la cosiddetta “collana di perle”. Struttura 5 volte più spessa del DNA: si arriva a ben 11 nm. II. 2° LIVELLO DI CONDENSAZIONE: La fibra da 30 nm di diametro è il secondo livello. In esso la cromatina as- sume un aspetto solenoidale grazie alle interazioni tra le code degli istoni di un nucleosoma, con quelle dei nu- cleosomi adiacenti, nonché grazie agli istoni H1. III. 3° LIVELLO DI CONDENSAZIONE: Come detto prima, la fibra cromatinica si ripiega in anse, o domini ad ansa, grazie anche all’aiuto di proteine non istoniche (proteine di impalcatura) sulle quali poggiano i domini ad ansa. Poiché passiamo dai 30nm di spessore della fibra cro- matinica ai 300nm. È il livello di condensazione tipico del DNA durante l’interfase della cellula. I livelli successivi di condensazione sono tipici del momento della divisione cellulare. IV. 4° LIVELLO DI CONDENSAZIONE: Successivamente, i domini ad ansa, grazie alle condensine, si sovrappon- gono e spiralizzano fra di loro a formare una struttura di ben 700nm di spessore (che corrisponde al diametro dei singoli cromatidi in metafase). V. 5° LIVELLO DI CONDENSAZIONE: in ultimo c’è la strut- tura del cromosoma metafasico che è il massimo livello di condensazione del DNA. I due cromatidi fratelli, tenuti insieme a livello del centromero, ciascuno dei quali con- tiene una molecola di DNA lunga e spiralizzata. Tutto il cromosoma metafasico ha uno spessore variabile di 1400 nm (ovvero 1.4 micron). I cromosomi sono visibili al microscopio ottico durante la metafase della mitosi cellulare. Oltre alle proteine istoniche dunque, nel cro- mosoma, ci sono proteine non istoniche, gli enzimi coin- volti nella sintesi del DNA e dell’RNA, varie proteine di 41 regolazione dell’espressione genica e poi una serie di enzimi che intervengono solo in partico- lari situazioni (come nella riparazione del DNA, ovvero le elicasi, topoisomerasi e ligasi). Le proteine di impalcatura non istoniche che costituiscono la base dei domini ad ansa e che tengono insieme le anse di cromatina sono dette proteine SCAFFOLD (proprio per il termine impalcatura). Esse sono fondamentali per la costruzione del cromosoma metafasico. I quadratini gialli nella figura sono la schematizzazione di dove si vanno a posizionare le proteine non istoniche di impalcatura. Nell’ immagine qui accanto, si notano cromosomi reali visti con il microscopio elettronico a scansione, così come appaiono nel lo