Organizzazione Geni e Cromosomi PDF
Document Details
Uploaded by Deleted User
Tags
Summary
This document discusses the organization of genes and chromosomes, focusing on the structure and function of DNA molecules within cells. It details the challenges of packing long DNA strands into the compact cell nucleus, using examples such as Escherichia Coli and the human genome, and the importance of the chromosomal structure for cell function. It also elaborates on concepts like nucleosomes, and the different types of chromatin.
Full Transcript
organizzazione geni e cromosomi Tutte le informazioni biologiche presenti all’interno delle molecole del DNA costituiscono un enorme patrimonio che definiamo genoma. Per dare una definizione più precisa possiamo dire che il genoma umano è costituito dall’insieme delle molecole di DNA corrispondenti...
organizzazione geni e cromosomi Tutte le informazioni biologiche presenti all’interno delle molecole del DNA costituiscono un enorme patrimonio che definiamo genoma. Per dare una definizione più precisa possiamo dire che il genoma umano è costituito dall’insieme delle molecole di DNA corrispondenti alla totalità del corredo aploide di un organismo. Il genoma è fondamentale per la sopravvivenza di un organismo vivente, poiché racchiude in sé tutte le informazioni necessarie all’accrescimento e al corretto funzionamento. Alterazioni a carico del genoma, infatti, portano con sé fenomeni patologici, talvolta talmente gravi da non essere compatibili con la vita stessa. Gli organismi umani, ma non solo, differenziano poi quello che è un genoma nucleare dal genoma mitocondriale. Il materiale genetico di un qualsiasi organismo, procariotico o eucariotico, è organizzato in strutture superiori definiti come cromosomi, localizzati spazialmente in una regione specifica della cellula. Un primo problema che viene immediatamente riscontrato è la lunghezza delle molecole di DNA in rapporto alle dimensioni del compartimento o della struttura cellulare che le contiene. Ad esempio, se consideriamo il genoma di Escherichia Coli esso è rappresentato da un singolo cromosoma costituito da un'unica molecola circolare di DNA comprendente circa 4x106 pb, per una lunghezza lineare di circa 1mm. Tale molecola si trova compattata nel nucleoide della cellula batterica. Ancora più problematica risulta invece essere l'organizzazione del genoma degli organismi eucariotici. Il genoma umano è costituito da un corredo diploide di 23 coppie di cromosomi, per un totale di circa 6x109 pb. Se la molecola di DNA di una singola cellula fosse distesa e allineata coprirebbe una lunghezza di circa 2m. Tuttavia, ciò non succede perché esse si trovano compattate nel nucleo cellulare che ricordiamo ha un diametro di circa 6μm. Per esprimere quantitativamente il grado di compattamento delle molecole di DNA utilizziamo il cosiddetto valore di quoziente di compattamento, cioè il rapporto tra la lunghezza del DNA e le dimensioni della struttura o del compartimento che lo contiene. Questa enorme lunghezza delle molecole di DNA rispetto alle strutture cellulari pone un rilevante problema topologico, soprattutto al momento della duplicazione cellulare. Infatti, si può facilmente immaginare come la lunghezza delle molecole possa creare dei problemi al momento della segregazione delle due copie originatesi con la replicazione del DNA. Un altro aspetto interessante spesso trascurato è che, se si calcola la concentrazione del materiale genetico nel compartimento che lo contiene, ci si rende conto che questa estremamente elevata, il che equivale a un gel a elevata viscosità in cui relativamente poche molecole di acqua si infilano negli spazi tra le macromolecole. Il materiale genetico è riscontrabile nei nuclei delle cellule eucariotiche sotto forma di cromatina, la cui organizzazione è soggetta a vistosi cambiamenti nel corso del ciclo cellulare. Durante l’interfase, che rappresenta la maggior parte del ciclo cellulare quando il DNA viene trascritto e replicato, le fibre cromatiniche si trovano disperse nel nucleo a occupare la maggior parte del volume. Durante la più breve fase mitotica, quando il DNA ormai replicato deve essere segregato nelle due cellule figlie, si assiste ad un ulteriore compattamento del genoma al fine di costituire i tipici cromosomi mitotici ben distinguibili al microscopio ottico. Le molecole di DNA che costituiscono i cromosomi in una cellula eucariotica interfasica sono associate alle proteine estoniche al fine di formare, al più basso livello di organizzazione, la fibra cromatinica da 10nm di diametro. Queste lunghissime molecole di dna sono organizzate in innumerevoli anse della lunghezza media di 30-100 kpb ancorate alla base su una struttura filamentosa che si chiama matrice nucleare. Queste ansie costituiscono dei domini topologici indipendenti in quanto sono capaci individualmente di mantenere o perdere i superavvolgimenti. Una domanda che ci si è posti è se nel DNA esistano delle sequenze specifiche per l'ancoraggio alla matrice nucleare e all'impalcatura cromosomica. Ebbene una serie di esperimenti ha permesso di isolare e analizzare queste sequenze di ancoraggio e di concludere che esistono delle sequenze uguali che sono implicate nell'ancoraggio sia alla matrice che all'impalcatura cromosomica. Queste sequenze vengono generalmente chiamate MAR, riferendosi alle regioni che legano la matrice nucleare durante l’interfase, o SAR, riferendosi alle sequenze che si legano all'impalcatura dei cromosomi mitotici. Dagli studi è emerso che le regioni contenenti le sequenze MAR sono spesso ricche di coppie A-T e, sono adiacenti a tratti di DNA intrinsecamente curvo. Inoltre, si è notato che spesso, nelle adiacenze delle sequenze MAR, siano presenti altri rilevanti siti regolativi, come siti di riconoscimento per la topoisomerasi II e siti cis-agenti per la regolazione della trascrizione. Come abbiamo avuto modo di comprendere nelle cellule eucariotiche le molecole di DNA che costituiscono i cromosomi sono strettamente associati a proteine andando a determinare la formazione del complesso nucleoproteico chiamato cromatina. Quando, infatti, si lisa il nucleo di una cellula eucariotica, è possibile osservare la fuoriuscita di un ammasso di cromatina costituito dal DNA, dall’RNA che risulta dalla trascrizione dei geni e da proteine di vario tipo. Tra queste, oltre alle innumerevoli e varie proteine più o meno acide che sono gli enzimi e i fattori implicati nei processi di replicazione e trascrizione del DNA, troviamo gli istoni, proteine basiche che rappresentano i veri costituenti strutturali della cromatina. Di fatti, è bene comprendere che le proteine della cromatina sono costituite per quasi il 90% da istoni, con la restante frazione proteica costituita perlopiù da altre piccole proteine basiche non istoniche denominate come HMG. Svariati studi hanno permesso di osservare la struttura ripetitiva della cromatina e hanno permesso di osservare come essa somigli ad una collana costituita da palline infilate su un filo, laddove queste palline sono rappresentate dai nucleosomi, le unità elementari della struttura della cromatina. Un altro importante contributo per la risoluzione della struttura della cromatina e dei nucleosomi è derivato dagli studi condotti negli anni 70 e 80 mediante digestione della cromatina con nucleasi di vario tipo. Ciò che si è notato è che, se si digerisce la cromatina con la nucleasi micrococcica, una speciale nucleasi, le dimensioni del DNA tagliato rappresentano multipli interi di un'unità nucleosomiale, pari a circa 200 pb. Se invece si effettua una digestione fino a digerire completamente il tratto di DNA linker tra due nucleosomi, si ottiene un'unica banda di lunghezza pari a 146 pb che corrisponde al DNA strettamente avvolto al nucleo del nucleosoma. Mentre le dimensioni delle unità monomeriche di DNA possono variare da organismo a organismo e, nello stesso organismo, possono variare in diversi tessuti e tipi cellulari, le dimensioni del tratto di DNA legato al nucleo del nucleosoma devono essere invece strettamente conservate. Dagli studi emerge quindi che la diversa lunghezza delle unità monomeriche è dunque dovuta alla variabilità delle dimensioni della regione linker. A questi studi effettuati tramite microscopia elettronica e mediante di gestione della cromatina con nucleasi sono seguiti poi studi strutturali più approfonditi, mediante diffrazione dei raggi X ottenuta con cristalli di nucleosomi. Ciò ha portato a modelli strutturali molto dettagliati. Si è poi potuto determinare che la forte interazione tra DNA e core istonico è mediata da circa 140 legami a idrogeno e, quasi tutti i legami si instaurano con gli atomi di ossigeno dei legami fosfodiesterici vicini al solco minore. Solo 7 di questi legami si vengono invece a formare tra le proteine e le basi attraverso il solco maggiore. Da qui la conclusione molto importante che il legame tra DNA e nucleosoma è forte ma non è sequenza specifica. Oggi sappiamo che il nucleosoma è costituito da un tratto di DNA di circa 200 pb associato con un ottamero di proteine istoniche che consiste di due copie di ciascuno degli istoni denominati come H2A, H2B, H3 e H4. Di questi H3 e H4 sono tra le proteine evolutivamente più conservate che conosciamo, indicando che svolgono una funzione importante rimasta identica in tutti gli eucarioti. Anche H2A e H2B sono molto conservati, ma presentano rispetto ai precedenti una maggiore variabilità di sequenza amminoacidica tra le specie. L’ottamero di istoni costituisce la struttura centrale, o nucleo se dir si voglia, del nucleosoma. Essa ha una struttura che ricorda un barile, possiamo pertanto definirla come una struttura all'incirca cilindrica attorno a cui la doppia elica di DNA compie quasi due giri. All’esterno di questo nucleo del nucleosoma si trova associata una molecola dell’istone H1, che quindi è presente in quantità pari alla metà di quella degli altri istoni. H1 è, tra tutti gli istoni, quello evolutivamente meno conservato, mostrando significative variazioni tra tessuti e tra specie. L’istone H1, pur non essendo un componente del nucleo del nucleosoma, contribuisce anch'esso alla struttura della cromatina. Esso interagisce con il tratto di DNA tra due nucleosomi, cioè con il DNA linker, producendo una maggiore adesione del DNA all'ottamero istonico. Possiamo quindi dire che il legame di H1 aumenta il compattamento del DNA sul nucleosoma Le proteine istoniche, che interagiscono con il DNA che sappiamo essere carico negativamente a causa della presenza del fosfato, sono fortemente basiche in quanto costituite per oltre il 20% da amminoacidi carichi positivamente quali arginina e lisina. Esse presentano una struttura conservata costituita da tre regioni ad α-elica, denominata histone-fold, e da una coda rappresentata da una regione N-terminale. La struttura histone-fold media la formazione delle coppie eterodimeriche di H2A con H2B e di H3 con H4, attraverso un'interazione testa-coda. Due coppie di eterodimero H3-H4 si associano poi a formare un tetramero. L'assemblaggio delle proteine istoniche al fine di formare l'ottamero del nucleosoma è un processo ordinato che inizia con il legame al DNA di un tetramero H3-H4 sul quale vengono poi reclutati due eterodimeri H2A-H2B che completano l'assemblaggio del nucleosoma. Le code N-terminali degli istoni sporgono all'esterno del nucleosoma e non sono necessarie per la formazione e il mantenimento della struttura dell’ottamero istonico. Infatti, se si effettua una digestione con tripsina, che agisce esclusivamente sulle code N-terminali sporgenti rimuovendole, l’ottamero istonico rimane intatto. Queste code N-terminali sono costituite da una ventina di residui amminoacidici e sono regioni bersaglio di una serie di modifiche chimiche, principalmente fenomeni di acetilazione e metilazione di lisine e fosforilazione di serine, che cambiano la carica netta della molecola proteica diminuendone la basicità. Queste modifiche hanno un effetto degli istoni per il DNA, e quindi sulla stabilità del nucleosoma, e hanno un ruolo nei processi di replicazione e trascrizione del genoma e nel controllo epigenetico dell'espressione genica. In assenza dell’istone H1 e in condizioni di bassa forza ionica la cromatina appare, al microscopio elettronico, sottoforma della cosiddetta “collana di perle” e cioè abbiamo una fibra da 10nm di diametro. Se analizziamo la cromatina in condizioni più fisiologiche essa appare sotto forma di una fibra da 30 nm, chiamata anche solenoide, in cui i nucleosomi appaiono organizzati in una struttura elicoidale con sei nucleosomi per giro. A contribuire alla formazione del solenoide sono le code N-terminali degli istoni che mediano interazioni sotto forma di legami a idrogeno tra i nucleosomi adiacenti. In verità l'impacchettamento della cromatina sui nucleosomi e nelle fibre da 30 nm è molto distante da l'impacchettamento necessario per contenere il DNA all'interno del nucleo delle nostre cellule. Il modello strutturale più accreditato prevede che dopo la formazione del solenoide si abbia un ulteriore compattamento giungendo alla formazione delle cosiddette anse cromosomiche. La formazione delle anse è permessa grazie al ripiegamento della cromatina e alla presenza di alcune proteine, dette proteine "scaffolding", che servono come base per la strutturazione delle anse. Infine, la massima contrazione della cromatina, darà luogo ai cromosomi mitotici. La fibra cromatinica risultata dall'interazione del DNA genomico con le proteine istoniche subisce notevoli variazioni della compattazione nel corso del ciclo cellulare. Durante l’interfase, quando avvengono i fenomeni di trascrizione e replicazione del DNA, la cromatina si trova dispersa nel nucleo. Nella maggior parte dello spazio nucleare queste fibre appaiono relativamente disperse, molto meno densamente compattate che nei cromosomi mitotici, cromosomi che in questa fase non sono distinguibili, e prendono il nome di eucromatina. In alcune regioni nucleari invece si osservano delle masse di cromatina più compatta che prendono il nome di eterocromatina. Quindi comprendiamo come eucromatina ed eterocromatina rappresentano dei gradi diversi di condensazione del materiale genetico. Distinguiamo poi l'eterocromatina in due tipi: − L’eterocromatina costitutiva resta sempre compatta e rappresenta regioni del genoma che, non avendo capacità codificante, non vengono mai espresse. Queste possono però avere un ruolo strutturale nel cromosoma. Fanno parte dell’eterocromatina costitutiva ad es alcuni tratti di DNA satellite che spesso si trovano nelle regioni centromeriche; − L’eterocromatina facoltativa rappresenta regioni del genoma che hanno capacità codificante, questa si esplica però solo in alcune precise condizioni, ad es il ben noto caso del cromosoma X dei mammiferi (il corpo di Barr) di cui una delle due copie presenti viene mantenuta inattiva sottoforma di eterocromatina mentre l’altra copia eucromatica si esprime normalmente; Il massimo grado di compattamento della cromatina, come sappiamo, si realizza nei cromosomi mitotici, che diventano così visibili e distinguibili solo per breve tempo al microscopio ottico, quando devono segregare nelle due cellule figlie (fase M del ciclo cellulare). Ogni cromosoma contiene un’unica molecola di DNA a doppia elica. Poiché durante la fase S il DNA è stato replicato, ogni cromosoma mitotico appare composto da due filamenti, noti come cromatidi fratelli, tenuti insieme nella regione del centromero. In alcune specie e in alcuni particolari tipi di cellule si trovano strutture e organizzazioni di cromosomi che si discostano da quelli tipici descritti in precedenza: − Cromosomi a spazzola → chiamati anche come cromosomi piumosi, si riscontrano soprattutto negli ovociti degli anfibi, dove sono visibili durante il lungo processo mitotico, che può durare anche qualche mese. Durante questo periodo i cromosomi si trovano in una forma molto distesa e possono essere facilmente osservati al microscopio ottico. Trovandoci in fase meiotica, i cromosomi a spazzola saranno rappresentati da coppie bivalenti, cioè sono costituiti da due cromosomi omologhi, tenuti uniti in punti specifici noti come chiasmi. Ognuno dei due cromosomi omologhi, costituito da una coppia di cromatidi fratelli, appare al microscopio ottico caratterizzato da un asse centrale da cui sporgono lateralmente delle anse. Queste anse sono avvolte da una matrice ribonucleoproteica, nelle quali si trovano le catene nascenti di RNA. Ogni ansa rappresenta quindi una regione di DNA estruso che viene attivamente trascritto; − Cromosomi politenici → la regola generale nella nostra organizzazione cromosomica vuole che vi sia una regolazione del ciclo cellulare che garantisca il non avvio della mitosi se non è stata dapprima completata la replicazione dei cromosomi durante la fase S. Allo stesso modo non si può avere replicazione dei cromosomi se prima non è stata completata la segregazione mitotica. A questa regola generale esistono però delle eccezioni, la più nota è la politenia. Questo processo è il risultato del susseguirsi di varie replicazioni cromosomiche non seguite da segregazione, in cui i cromatidi fratelli originati dalle varie replicazioni rimangono strettamente affiancati a formare dei fasci di fibre parallele che rappresenteranno, appunto, i cromosomi politenici. Fenomeni di politenia avvengono in vari tipi di cellule di innumerevoli organismi, tra quelli più studiati sono sicuramente i cosiddetti cromosomi giganti che si trovano nelle ghiandole salivari della Drosophila Melanogaster. Le estremità delle molecole lineari di DNA sono instabili nel tempo per varie motivazioni, tra cui ricordiamo: Degradazione da parte di esonucleasi; Impossibilità di replicare i primi nucleotidi per mancanza di un innesco; Propensione a legare altre molecole di DNA; Attivazione dei sistemi di controllo che riconoscono le rotture nel DNA ed eventualmente attivano fenomeni di apoptosi; Per ovviare a questi problemi di instabilità l'evoluzione ha escogitato vari meccanismi. In molti casi semplicemente i cromosomi non hanno estremità, cioè sono delle molecole circolari di DNA. In alcuni casi invece, non frequentemente, la molecola lineare di DNA, presenta delle sequenze uguali ripetute ai due estremi. Infine, nella stragrande maggioranza dei casi, particolari sequenze specializzate, che chiameremo telomeri, stabilizzano le due estremità della lunga sequenza di DNA lineare che costituisce ciascun cromosoma eucariotico. La lunghezza dei telomeri non è costante, a causa di variazione del numero di ripetizioni. Il progressivo accorciamento del telomero, dovuto ai problemi di replicazioni delle estremità del DNA, viene compensato da un periodo al di allungamento mediante addizione di nuove ripetizioni telomeriche. Allungamento e accorciamento dei telomeri sono quindi due fasi in equilibrio dinamico. Con quale meccanismo i telomeri conferiscono stabilità alle estremità dei cromosomi? In parte, come detto già in precedenza, mediante la sintesi di nuove unità di ripetizione (TTAGGG) che ne compensano la costante perdita. Esistono delle proteine specifiche dei mammiferi, come la TRF1 e la TRF2, che riconoscono e legano la sequenza telomeri, proteggendo così le estremità del DNA cromosomico. È stato anche osservato che le estremità dei telomeri non sono lineari, ma assumono una struttura a forma di loop denominata proprio come T-loop. Questa struttura è dovuta l'appaiamento di alcune sequenze che si trovano in corrispondenza dell'estremità 3’. La struttura che ne risulta è successivamente stabilizzata dalla formazione di complessi con innumerevoli proteine implicate nella funzione telomerica e nella protezione delle estremità del cromosoma. Inoltre, è stata descritta un'ulteriore struttura particolare del DNA che verrebbe assunta dal filamento del telomero e che potrebbe avere un ruolo rilevante nella stabilizzazione dello stesso. Questa speciale struttura, vista negli argomenti precedenti, è chiamata quartetto di G. Dopo aver visto come è organizzato e strutturato il genoma nucleare, passiamo al genoma mitocondriale. La maggior parte delle cellule eucariotiche contiene i mitocondri, organelli citoplasmatici dotati di un sistema genetico indipendente, completo dell'apparato necessario per la sua espressione. Vi sono innumerevoli evidenze dell'origine endosimbiontica dei mitocondri a partire da un alfa-proteobatterio. Una delle ipotesi più accreditate suggerisce l’endosimbiosi tra un archeobatterio metanogeneno consumatore di H2 e un'alfa proteo batterio produttore di H2. L’alfa-proteobatterio avrebbe poi dato origine al mitocondrio trasferendo gran parte dei suoi geni nel genoma dell'archeobatterio, successivamente compatimentalizzato nella struttura nucleare della primitiva cellula eucariotica. Per quanto riguarda la forma, i genomi mitocondriali sono generalmente costituiti da una singola molecola di DNA circolare. Il DNA mitocondriale contiene 37 geni, di cui 13 codificano per proteine del sistema della fosforilazione ossidativa (OxPhos), 22 codificano per tRNA e 2 codificano per rRNA. Le 13 proteine che abbiamo detto codificano per proteine del sistema della fosforilazione ossidativa entreranno infatti poi nella costituzione dei complessi respiratori e dell’ATP sintasi. Ovviamente questi complessi respiratori non sono costituiti dalle sole 13 proteine appena citate, le restanti proteine sono invece codificate da geni nucleari. In particolar modo il genoma mitocondriale si occuperà di codificare per: − 7 subunità del complesso I (il complesso della NADH deidrogenasi): da ND1 a ND6 − 1 subunità del complesso III (il complesso del citocromo c reduttasi): apocitocromo b − 3 subunità del complesso IV (il complesso del citocromo ossidasi): COX-1 COX-2 COX-3 − 2 subunità del complesso V (il complesso dell’ATP sintasi): ATPasi 6 e ATPasi 8 L'organizzazione del genoma mitocondriale nell'uomo e negli altri vertebrati è molto diversa da quella nucleare. In primo luogo è molto compatta, non avendo ne introni né consistenti regioni intergeniche, ad eccezione di due sole regioni non codificante che esplicano una funzione regolatrice e di piccoli spaziatori intergenici che hanno una lunghezza inferiore a 8 pb. Una seconda differenza che possiamo riscontrare è il fatto che i geni mitocondriali sono distribuiti in modo asimmetrico tra i due filamenti del DNA, con un filamento codificante per soli 9 geni e l'altro filamento codificante i restanti 28 geni. In terzo luogo, è da considerare che, mentre i geni nucleari sono trascritti come mRNA monocistronici, i geni mitocondriali sono trascritti in unità policistroniche che partono da due promotori situati all'interno di un'unica ampia regione non codificante che identifichiamo come D-loop. Questi due promotori prendono la nomina di LSP e HSP. Quest'unica sequenza non codificante dell'intero genoma mitocondriale umano è in realtà sede di importanti funzioni regolatrici. Una delle caratteristiche più rilevanti del genoma mitocondriale è l'eredità uniparentale, che si osserva nella maggior parte degli eucarioti e si realizza attraverso meccanismi differenti. Per esempio, trattando i vertebrati, il genoma mitocondriale è ereditato esclusivamente dalla madre. Di fatti l'ovocita materno contiene un numero estremamente elevato di mitocondri, mentre lo spermatozoo ne contiene pochissimi che vengono poi successivamente degradati dalla cellula fecondata. Anche in termini di dimensioni il genoma mitocondriale dei vertebrati risulta essere molto più piccolo del genoma nucleare e, considerando che in una cellula ci possono essere all'incirca in media 1000 mitocondri, la frazione di DNA mitocondriale rispetto a quella nucleare si aggira intorno al 2-3%. Il genoma mitocondriale dei vertebrati ha poi un tasso di mutazione molto più elevato rispetto a quello nucleare, a causa della prossimità alla catena di trasporto degli elettroni (e quindi alla presenza dei ROS) e della scarsa efficienza di sistemi di riparazione. L'elevata frequenza delle mutazioni e la trasmissione uniparentale fanno del genoma mitocondriale un sistema modello molto utilizzato per gli studi di evoluzione e filogenesi molecolare, che ha applicazioni anche nel campo della medicina forense. Nel 1990 ha inizio il progetto genoma umano, un progetto di ricerca scientifica internazionale il cui obiettivo principale era quello di determinare la sequenza delle coppie di basi azotate che formano il DNA e di identificare e mappare i geni del genoma umano (previsti circa centomila, trovati circa 20-25000) dal punto di vista sia fisico sia funzionale. Si pensava infatti che solo comprendendo e studiando i geni appartenenti al nostro genoma si potesse studiare tutto ciò che avviene all’interno di un organismo. Il progetto genoma umano è stato il primo grande progetto scientifico che ha coinvolto tutte le scienze biomediche. Migliaia di scienziati in decine di laboratori sparsi in tutto il mondo si sono adoperati per riuscire a leggere la sequenza completa delle basi nucleotidiche che compongono il patrimonio genetico della specie umana. Nel 1998 partirà poi un altro progetto, ad opera dell’azienda privata Celera Genomics. Infatti, l’ultima fase del progetto genoma umano ha visto la competizione tra il consorzio pubblico stesso e un’azienda privata. I due attori della disputa non solo applicavano diversi metodi di sequenziamento, ma soprattutto hanno incarnato lo scontro tra privatizzazione e accesso libero. Mentre la Celera Genomics avrebbe voluto far pagare per l’accesso ai dati ottenuti, il consorzio pubblico seguiva la strada opposta, rilasciando liberamente i risultati delle proprie ricerche. Nell’aprile 2003 il consorzio pubblico ha annunciato il completamento dell’intera sequenza del genoma umano. Il sequenziamento completo del genoma eucariotico ha permesso di ottenere quello che è un quadro abbastanza dettagliato circa la loro struttura e organizzazione. In realtà, i primi studi sulla quantità del DNA e quindi sulle dimensioni dei genomi negli organismi eucarioti e procarioti, precedono la risoluzione della struttura del DNA avvenuta ad opera di Watson e Crick. Nel 1948 Roger e Colette Vendrely mostrarono come tutte le cellule di una stessa specie animale possedevano una certa quantità costante di DNA che venne definita come valore C. Fu subito evidente la non correlazione tra il valore C e la complessità dell'organismo, sia perché si osservava una grande gamma di dimensioni per organismi appartenenti a uno stesso raggruppamento tassonomico, sia per il fatto che organismi apparentemente meno complessi erano caratterizzati da un valore C molto superiore rispetto a quello delle cellule umane. Questa singolarità, che fu definita come paradosso del valore C, venne poi risolta alla scoperta della frazione non codificante del genoma. Importante notare è come per alcune classi di organismi lo spettro di variabilità sia molto ampio e ciò è dovuto prevalentemente alla frazione non codificante del DNA, costituita essenzialmente da sequenze ripetute. Al contrario dei genomi procariotici, che sono prevalentemente costituiti da una singola molecola di DNA circolare, i genomi eucariotici sono costituiti da DNA in forma lineare distribuito su un numero variabile di cromosomi. Non vi è tuttavia alcuna correlazione tra le dimensioni del genoma e il numero di cromosomi, o tra questo e la complessità dell'organismo. Una delle grandi sorprese del genoma umano è stata la scoperta che solo il 2% del genoma è costituito da geni, i quali contengono tutte le informazioni necessarie per dar vita alle proteine. Si riteneva che il resto del genoma, essendo non codificante, non avesse una funzione biologica. Per questo motivo veniva spesso indicato come DNA “spazzatura” (junk DNA). Una volta terminato il sequenziamento del genoma, restava da comprendere se queste sequenze fossero davvero senza alcuna funzionalità. Nel 2003 è stato così istituito il progetto ENCODE con lo scopo di comprendere quale fosse la funzionalità degli elementi non codificanti del genoma. Giungeremo così negli anni successivi alla consapevolezza che ciò che è sempre stato definito come junk DNA ha invece una funzione importantissima andando a regolare finemente l’espressione genica. Una delle osservazioni più sorprendenti emerse dal sequenziamento del genoma è che il numero di geni è sostanzialmente conservato, indipendentemente dalle differenze, anche molto marcate, nelle dimensioni del genoma. Per comprendere meglio quanto detto possiamo trarre ad esempio il fatto che il genoma umano risulta essere molto ma molto più grande del genoma di lievito ma, tuttavia, il numero di geni codificanti proteine è pressoché dello stesso ordine di grandezza. È quindi evidente che se il numero di geni è pressoché costante, le differenze nelle dimensioni del genoma sono sostanzialmente correlate alla frazione di DNA non codificante. I geni eucariotici presentano una grande varietà di strutture e dimensioni. I geni eucariotici, a differenza di quelli procariotici, sono generalmente discontinui, ovvero vengono espressi dall'apparato trascrizionale sotto forma di lunghi RNA precursori. Questi subiscono, nel nucleo, un processo di maturazione che comporta la rimozione di tratti polinucleotidici interni, denominati introni, e la concatenazione delle restanti sequenze, denominate esoni. L'mRNA maturo così prodotto sarà poi traslocato nel citoplasma dove potrà essere tradotto dai ribosomi. Alla fine degli anni 70 del secolo scorso è stato infatti dimostrato che la sequenza nucleotidica di un RNA funzionale non è sempre co-lineare con il DNA stampo. Infatti, a livello del DNA, la sequenza di un gene può contenere dei tratti di sequenza interposti che non compaiono poi nel trascritto maturo funzionale. Tali sequenze sono state chiamate introni, mentre i tratti di sequenza che, unendosi, vanno poi a formare il trascritto maturo sono stati chiamati esoni. Geni di questo tipo ricordiamo che assumono la nomina di geni discontinui. Le dimensioni degli esoni e degli introni sono estremamente variabili ma, focalizziamo la nostra attenzione su quella che è la estrema variabilità degli introni. Sebbene vi sia un'elevatissima variabilità nella struttura dei geni umani, mediamente oltre il 90% della lunghezza degli RNA precursori è costituito da sequenze introniche. La presenza degli introni è una caratteristica comune alla maggior parte dei geni degli organismi eucariotici. Anche se la presenza degli introni appare a prima vista un'inutile complicazione nel processo di espressione genica, questi costituiscono un'eccezionale fonte di variabilità che consente di esplorare ed eventualmente acquisire un numero pressoché infinito di soluzioni. La struttura discontinua dei geni, che rende necessario il processo di splicing che nel nucleo andrà poi a generare i trascritti maturi, contribuisce in modo significativo all'espansione della capacità di espressione genica. Infatti, la maturazione del trascritto precursore attraverso fenomeni di splicing, responsabile del processo di taglia e cuci che rimuove gli introni e va a concatenare gli esoni, può avvenire in modi differenti, dando così origine a trascritti e proteine alternative a partire da uno stesso gene. Lo splicing alternativo è dunque un meccanismo funzionalmente importante per l'individuo perché permette la produzione di più proteine implicate nello sviluppo e nel funzionamento dell'organismo. Il processo di splicing è estremamente regolato e le sue disfunzioni sono responsabili di diverse malattie genetiche. Ancor prima che venissero introdotte le tecniche di sequenziamento è stata dimostrata la presenza di sequenze ripetute nel genoma eucariotico mediante lo studio della cinetica di riassociazione del DNA. Le complesse curve della cinetica di riassociazione che si osservano per il DNA di origine eucariotica dimostrano la presenza all'interno del genoma di distinte frazioni di DNA: − Una frazioni di sequenze uniche, cioè non ripetute. Questa frazione contiene la quasi totalità dei geni veri e propri che codificano per proteine, che infatti sono presenti nel genoma in un'unica o pochissime copie; − Una frazione di DNA mediamente ripetuto, con una ripetitività compresa tra una decina fino a migliaia di copie. Comprende sequenze ripetute intersperse, trasposoni, e retrotrasposoni attivi o non più attivi, ma anche alcuni geni perlopiù per RNA non codificanti, tra cui il precursore degli rRNA peresente in centinaia di copie organizzate in gruppi in tandem; − Una frazione di DNA altamente ripetuto, fino a centinaia di migliaia o anche milioni di copie. Questo è costituito da sequenze semplici o DNA satelliti; Attraverso queste scoperte si è poi potuto osservare che la maggior parte del nostro genoma è costituito da DNA non codificante. In particolare, la porzione non codificante del DNA è prevalentemente costituita da sequenze ripetute in tandem o intersperse che complessivamente occupano ben oltre il 50% dell'intero genoma umano. DNA satellite o altamente ripetuto I DNA satelliti, che costituiscono sostanzialmente la frazione altamente ripetitiva del genoma, vengono anche chiamati come DNA a sequenza semplice. Infatti, il sequenziamento di alcuni DNA satelliti ha messo in evidenza che essi sono in genere costituiti da numerose ripetizioni in tandem di una breve sequenza, in blocchi distribuiti in vari siti e in vari cromosomi. I DNA satelliti in genere non sono trascritti e si trovano nelle regioni eterocromatiche dei cromosomi. Nella specie umana sono stati identificati vari satelliti, perlopiù localizzati nelle regioni centromeriche, ma anche in altre regioni eterocromatiche. Tra questi ricordiamo la famiglia dei DNA satelliti α la cui unità monomerica sarebbe il risultato della duplicazione e divergenza di sequenze più corte. Satelliti della famiglia α sono presenti in tutti i primati del vecchio continente. Da queste e altre osservazioni possiamo concludere che l'evoluzione dei DNA satellite è il risultato di occasionali eventi di successive duplicazioni in tandem, chiamate alle volte come replicazioni saltatorie, che risultano in un improvviso e rapido aumento del numero di copie ripetute, alternati con eventi mutazionali che introducono una certa divergenza tra le copie stesse. Blocchi di sequenze ripetute possono essere anche facilmente persi. Questo meccanismo di espansione, mutazione e perdita delle sequenze del DNA altamente ripetute fa sì che, evolutivamente, i DNA satelliti cambino molto rapidamente, sia come sequenza nucleotidica che come livello di ripetitività. Infatti, specie affini hanno in genere DNA satelliti ben distinguibili, tanto che queste sequenze vengono anche utilizzate come marcatori per risolvere casi di dubbia appartenenza sistematica. DNA mediamente ripetuto: microsatelliti e minisatelliti Una frazione del genoma eucariotico è costituita dai cosiddetti minisatelliti e microsatelliti, che però solo in parte sono da accomunare con i DNA satelliti. A differenza dei satelliti, queste sequenze sono ripetute nel genoma in numero molto limitato e quindi non fanno parte della frazione altamente ripetitiva del DNA. I prefissi mini- e micro- stanno a indicare la brevità delle sequenze ma anche il basso numero di ripetizioni. I microsatelliti sono costituiti da monomeri di dimensioni variabili da 1 a 10 pb, ripetuti in tandem circa 10- 30 volte. Essi sono anche detti elementi SSR (simple sequence repeats) o STR (short tandem repeats). Loci di microsatelliti sono dispersi in moltissime localizzazioni genomiche nei diversi cromosomi. I minisatelliti invece sono costituiti da unità monomeriche di dimensioni variabili comprese tra 11 e 100 pb, formando blocchi più estesi di lunghezza fino a 20 kpb. I micro e mini satelliti mostrano un elevato grado di polimorfismo nella popolazione umana in quanto il numero di ripetizioni all'interno di uno specifico locus può variare da individuo a individuo a causa di un meccanismo noto come scivolamento della replicazione. Per questo vengono usati come marcatori dell'individualità genetica del cosiddetto test del DNA che oggi normalmente viene utilizzato dalla polizia scientifica per scoprire gli autori dei crimini. Anomale espansioni delle ripetizioni, particolarmente quelle costituite da triplette di nucleotidi, localizzati sia in regioni codificanti che in regioni non codificanti, sono associate a diverse patologie importanti.