Biologia Molecolare PDF - Struttura a quadrupla elica, RNA, e terapia genica
Document Details
![SincereAmethyst5959](https://quizgecko.com/images/avatars/avatar-12.webp)
Uploaded by SincereAmethyst5959
Università degli Studi di Udine
Asia Carpi – Anna Simonin
Tags
Summary
Questo documento di biologia molecolare tratta argomenti avanzati quali la struttura a quadrupla elica del DNA, il ruolo dell'RNA in diverse funzioni cellulari, inclusi i ribozimi, e la terapia genica. Vengono anche spiegate le strutture secondarie e terziarie dell'RNA e le loro funzioni. Il testo include esempi di ricerca e lezioni tenute il 28/10/2023.
Full Transcript
5.5.3. STRUTTURA A QUADRUPLA ELICA Questa struttura sta attirando sempre maggiore interesse ed è associata a delle strutture del nostro...
5.5.3. STRUTTURA A QUADRUPLA ELICA Questa struttura sta attirando sempre maggiore interesse ed è associata a delle strutture del nostro genoma che prendono il nome di telomeri. I telomeri sono strutture a quadrupla elica, sono detti G-quadruplex. Sono formati da un filamento di DNA che si avvolge in una quadrupla elica e da qui deriva il nome quadruplex. La lettera “G” posta all’inizio del nome indica invece la presenza di guanine il cui compito è quello di stabilizzare la quadrupla elica. Nella Figura 75, ad ogni pallino corrisponde una Figura 74 guanina. Di conseguenza queste strutture si formano in corrispondenza di regioni di DNA ricche di guanine. Queste particolari condizioni di forza ionica in cui le guanine formano legami tra di loro, vanno a costituire dei piani che prendono il nome di tetradi planari. I telomeri Figura 75 umani sono costituiti da migliaia di sequenze a loro volta formate sempre dalle stesse basi azotate: T-T-A-G-G-G dove le guanine formano le tetradi planari che vanno a stabilizzare la quadrupla elica. Queste strutture si formano per contribuire a creare un tettuccio protettivo all’estremità dei cromosomi. La perdita di questo cappuccio causa la senescenza cellulare, quindi il fatto che il DNA possa andare incontro ad erosione e possa contribuire alla formazione di cromosomi aberranti. Le cellule somatiche del nostro organismo progressivamente perdono questi elementi e quando si ha un accorciamento eccessivo si va incontro alla cosiddetta senescenza Figura 75 Figura 13 replicativa. Esistono altri tipi cellulari (cellule staminali, cellule embrionali e cellule tumorali) che viceversa sono in grado di allungare i telomeri grazie alla presenza di un enzima che si chiama telomerasi, in grado di riallungare l’estremità 3’ contenente la sequenza di T-T-A-G-G-G in maniera tale da consentire ad essa di formare il cappuccio. Queste strutture G-Quadruplex non si trovano solo nei telomeri ma anche in alcune regioni regolative, per esempio i promotori dei geni umani. Studi abbastanza recenti mostrano che queste strutture svolgono un’azione regolativa, sono una sorta di “interruttori” per regolare l’espressione o il silenziamento di un gene. Si è visto che ci sono circa 400mila elementi G-Quadruplex non telomerici nel genoma umano. Quello che si sta studiando è che molti processi coinvolti nei processi di tumorigenesi (trasformazione tumorale) hanno nei propri promotori questi elementi regolativi. Sembra che l’assenza di questi cappucci contribuisca all’insorgenza del tumore poiché non si ha una regolazione dei processi. Quindi l’ossidazione della guanina è un importante meccanismo danno-sedativo perché tende a stabilizzare la formazione di queste strutture. Alcuni studi dimostrano che oltre al DNA, anche l’RNA è in grado di formare strutture G-quadruplex, ad esempio in regioni con funzione regolativa come il micro-RNA. Esso è un RNA codificante che viene trascritto nel nucleo, subisce un processo di maturazione in parte nel nucleo e in parte nel citoplasma, e poi sottoforma di piccole sequenze di RNA di 20-22 nucleotidi va a regolare l’espressione genica degli RNA codificanti con un meccanismo post-traduzionale. I G- quadruplex impediscono o modulano il processo di maturazione. 5.6. STRUTTURE SECONDARIE ALTERNATIVE DELL’RNA Gli RNA sono prevalentemente a singolo filamento ma per motivi termodinamici tendono a formare strutture secondarie e terziarie particolari. La presenza del gruppo ossidrilico consente all’RNA di svolgere un’attività enzimatica. Dal momento che l’RNA è in grado di auto-strutturarsi, è possibile distinguere diverse classi di RNA con funzioni diverse: 50/332 RNA con funzione regolatoria nell’espressione genica, come per esempio il micro-RNA (miRNA), il non-core- RNA (ncRNA), i siRNA (silenziamento dell’espressione genica in vari organismi) Gli RNA con funzione strutturale ed enzimatica come gli RNA ribosomiali (rRNA). Essi servono da un lato per formare ribosomi e dall’altro a catalizzare la formazione del legame peptidico durante la sintesi proteica. tRNA che svolgono una funzione di raccordo fra macromolecole RNA purificanti Quindi di fatto RNA sono distinti sulla base delle caratteristiche funzionali. Oltre agli RNA sopracitati, è possibile trovarne altri con attività regolatoria: - Small-nucleolar-RNA che servono nell’editing dell’RNA, in particolare degli RNA ribosomiali e cioè nella codifica enzimatica attraverso la metilazione di rRNA - Small-nuclear-RNA che servono durante lo splicing dell’RNA. La caratteristica fondamentale dell’RNA è che nonostante sia a singolo filamento forma strutture secondarie e terziarie ben definite e molto articolate. Ciò avviene non solo grazie alla formazione di legami di Watson e Crick ma in particolare con la formazione di numerosi legami di tipo non canonico, come gli accoppiamenti G-U al posto di G-C. Questo è dovuto al fatto che termodinamicamente, in soluzione acquosa, le basi azotate tendono ad agire tra di loro e formare un core idrofobico in modo da mantenere l’acqua esternamente. I legami di Hoogsteen sono un esempio di legami di tipo non canonico. Troviamo anche numerosi processi di esclusione di basi. Tutto ciò fa sì che esistano necessariamente dei processi di folding di RNA che seguono dei particolari step sottoposti ad un continuo controllo. Come già anticipato, le sequenze di RNA hanno la capacità di autostrutturarsi formando delle strutture tridimensionali ben definite. Nella Figura 76 possiamo vedere come si struttura la molecola di RNA contenuta nella telomerasi. Parte da una molecola a singolo filamento e grazie a fenomeni di esclusione di basi e alla formazione di interazioni distanti fra le coppie di basi, Figura 76 Figura 14 si giunge ad una struttura molto complessa che viene chiamata pseudo-nodo. A livello dello pseudo-nodo si verificano diversi fenomeni, come ad esempio i legami tra basi e gruppi fosforici. Le strutture secondarie e terziarie dell’RNA necessitano di proteine in grado di aiutare il processo di folding. È un po' quello che avviene parlando dei chaperoni delle proteine che servono per aiutare la formazione di una struttura funzionale per la proteina. In questo processo sono note le proteine ribosomiali che servono prevalentemente per consentire il folding corretto dell’RNA ribosomiale. Le proteine, oltre ad essere essenziali per questo processo, servono anche per mantenere la stabilità dell’RNA. Altre proteine che appartengono alle classi delle ribonucleoproteine sono dei veri e propri chaperoni molecolari che impediscono la formazione di quelle che vengono chiamate “tappe di ripiegamento” e cioè degli intermedi non corretti dell’RNA che, se non fosse coadiuvato da questi chaperoni molecolari, darebbe un RNA con una struttura non funzionale. Queste categorie di proteine svolgono un ruolo importante nelle malattie neurodegenerative, ci sono infatti dei processi alterati e tra questi troviamo proprio quelli che mantengono la stabilità e il corretto folding delle molecole di RNA. 5.7. I RIBOZIMI L’RNA può essere catalitico e l’attività catalitica dell’RNA si esplica attraverso la reattività del gruppo ossidrilico. Il primo modello in cui è stata trovata questa attività catalitica degli RNA; quindi, quando si è iniziato a parlare di ribozimi, è 51/332 stato con l’RNA del ribozima hammerhead (“a testa di martello”) che è l’RNA di un virus che infetta alcune cellule vegetali. Cioè l’RNA forma un circolo nella cellula infettata, l’RNA polimerasi della cellula infettata replica in maniera continuativa andando a formare i concatameri che devono essere tagliati per raggiungere poi il genoma virale. Questo virus è in grado di autotagliarsi con un meccanismo enzimatico. Si ha un taglio di un certo legame fosfodiesterico, a livello di un nucleotide preciso. Ciò avviene attraverso un meccanismo dovuto alla presenza dell’idrossido di sodio, quindi tramite la deprotonazione del gruppo ossidrilico in 2’, la formazione di un ossianione e l’attacco del nucleofilo sul fosforico adiacente. Questo processo è catalizzato da un’altra porzione di RNA del virus che, attraverso la coordinazione di un atomo di magnesio e il coinvolgimento di una molecola d’acqua, è in grado di causare la deprotonazione. Oggi sappiamo che l’attività ribozimica è presente in numerosi RNA funzionali, come alcuni RNA virali, RNA intronici ed RNA ribosomiali che catalizzano la formazione del legame peptidico. Lezione 5.1 – 28/10/2023 – [Asia Carpi – Anna Simonin] Breve riassunto della lezione precedente Abbiamo già visto quali sono le caratteristiche degli acidi nucleici a singolo filamento; le più rilevanti sono: - la possibilità di formare ibridi molecolari (con molecole complementari) in grado di formare degli appaiamenti come quelli di Watson e Crick; - la capacità degli acidi nucleici di formare delle (super)strutture 6. GENE THERAPY Le caratteristiche degli acidi nucleici sono state ampiamente sfruttate in farmacologia, in particolare nello sviluppo delle strategie della gene therapy, che si occupa delle patologie come quelle causate dall’infezione da parte dei virus a RNA. Tra queste la principale è l’HIV (molto diffusa alla fine degli anni 90), causata da un virus a RNA dotato di un capside virale proteico; questo capside è selettivo per il target cellulare (in particolare per una categoria di linfociti T che esprimono il CD4 come recettore di membrana) e serve al virus per entrare all’interno delle cellule. Una volta entrato, il virus compie il proprio ‘ciclo virale’; di conseguenza c’è la possibilità che esso sia retro-trascritto a Figura 77 cDNA e che sotto questa forma si integri nel genoma della cellula ospite; per poterlo fare, però, l’apparato trascrizionale delle cellule infettate deve retro-trascrivere il genoma a RNA del virus; questo deve essere poi tradotto in forma proteica per costituire le proteine del capside. Le particelle virali in questo modo si possono formare, possono uscire dalla cellula infettata, causandone la morte e possono andare a infettarne molte altre (da qui l’immunodeficienza causata dall’infezione virale HIV). Tra le varie terapie che sono state sviluppate per l’HIV, le più importanti sono quelle schematizzate nella Figura 77. Queste generalmente prevedono: - O un’attività di silenziamento della trascrizione del genoma virale una volta integrato; - O un’attività ribozimica (i ribozimi sono molecole di RNA con attività (auto)catalitica). - N.B. I ribozimi possono avere anche attività trans-catalitica; possono anche essere molecole di RNA in grado di degradare molecole di RNA target che vengono riconosciute attraverso la formazione di ibridi molecolari e che vengono degradate attraverso un meccanismo simile a quello visto nella lezione precedente per il ribozima hammerhead. 52/332 6.1.TECNICHE DI SILENZIAMENTO Queste tecniche utilizzano i SiRNA, piccole molecole di RNA che possono essere introdotte all’interno delle cellule, sia eucariotiche che procariotiche e che svolgono un ruolo particolare: causano la degradazione di un RNA messaggero o codificante o di un genoma virale a cui si appaiano per complementarità formando degli ibridi molecolari. Questi ibridi, attraverso un meccanismo specifico delle cellule eucariotiche, vengono riconosciuti e degradati selettivamente. L’obiettivo delle tecniche di silenziamento è causare la formazione di ibridi molecolari, sfruttando la loro capacità di inserimento (tramite strategie a DNA ricombinante come la trasfezione), i quali verranno degradati con un meccanismo enzimatico specifico che le cellule umane utilizzano fisiologicamente per difendersi dai patogeni. 6.2. RNA AD ATTIVITA’ RIBOZIMICA Si utilizza un meccanismo ribozimico, ovvero: - si disegnano RNA complementari a quello del genoma virale; - gli RNA complementari degradano il genoma virale tramite attività ribozimica. 6.3. OLIGONUCLEOTIDI ANTISENSO Un’altra strategia che si basa sugli acidi nucleici (non più sull’RNA ma sul DNA) è la strategia degli oligonucleotidi antisenso, che sfrutta il processo della complementarità e riguarda l’utilizzo di sequenze oligonucleotidiche di DNA in grado di legare (in regioni opportune) l’RNA target con lo scopo di bloccarne la traduzione. 6.3.1. COME SI PUÒ BLOCCARE LA TRADUZIONE Generalmente si blocca il sito di ingresso per il ribosoma; si fa in modo di disegnare una sequenza oligonucleotidica in modo tale che si appai alla regione di RNA virale che verrà tradotto in corrispondenza del punto in cui il ribosoma inizierà la traduzione. 6.4. MOLECOLE APTAMERICHE Gli aptameri sono molecole di RNA a singolo filamento (di dimensione generalmente più lunga di quella dei siRNA o degli oligonucleotidi antisenso, di circa 100-200 nucleotidi) che vengono stabilizzate chimicamente in vitro per impedirne la degradazione spontanea (il gruppo OH viene modificato, aggiungendo al C2’ un atomo di fluoro, un gruppo amminico o uno metilico). Presentano delle strutture specifiche in grado di legarsi a ligandi di membrana o a ligandi patogeni, con lo scopo di: - inibire o innescare l’attività dei recettori - veicolare molecole con attività farmacologica/chemioterapica Si chiamano anche RNA decoys e sono molecole in grado di inibire le proteine. Nel caso dell’infezione da HIV si sono sviluppati particolari aptameri in grado di legarsi alle proteine che costituiscono il capside virale, con lo scopo di impedire la formazione e l’assemblaggio finale del virus stesso. Infatti, se il capside non si forma, il virus non matura e non compie il suo ‘ciclo virale’. Gli aptameri sono estremamente versatili; infatti, vengono utilizzati anche nella chemioterapia, nella radioterapia, nell’immunoterapia e nello sviluppo di specifici meccanismi di drug-delivery, ovvero meccanismi di targeting selettivo di un farmaco tossico che serve per la cura dei tumori o di agenti di contrasto. Possono servire anche per veicolare molecole di RNA (come i SiRNA). 6.4.1. SELEX Per selezionare le molecole aptameriche esiste un processo chiamato selex; questo processo sfrutta, su base statistica, la generazione di ‘library’ (librerie complesse di molecole di dimensione fissa ma di sequenza variabile) casuali di cui 53/332 vengono selezionate (grazie a un processo di selezione tramite il ligando) quelle che hanno una maggiore affinità con il ligando stesso. Una volta selezionate vengono modificate per renderle in grado di trasportare una molecola di farmaco/RNA regolativo o anche un liquido di contrasto. Infatti, una delle principali applicazioni di questa tipologia di molecole aptameriche è proprio la delivery, su bersaglio molecolare espresso da determinati tipi cellulari, di liquidi di contrasto in maniera selettiva per identificare specificamente un tessuto. La delivery dei mezzi di contrasto è molto importante in ambito diagnostico. Tutto questo prende il nome di molecular imaging. Figura 78 7. SUPERSTRUTTURE DEL DNA 7.1.VINCOLI TOPOLOGICI Quello delle superstrutture è un ambito molto importante; descrive le strutture che gli acidi nucleici, in particolare il DNA, possono assumere; per parlare delle superstrutture e del loro ruolo biologico verranno affrontati anche alcuni aspetti che riguardano il tema della topologia del DNA in vivo. Il DNA, infatti, è ‘topologicamente vincolato’ (quello dei vincoli topologici è un tema che riguarda tutte le molecole di DNA che si trovano nelle cellule, eucariotiche e procariotiche). Per comprendere meglio il concetto di ‘vincolo’ si può pensare al DNA circolare, topologicamente chiuso/vincolato per definizione. esempio: l’elastico o il braccialetto flessibile chiuso. Questi due oggetti presentano dei vincoli che fanno in modo che, se noi facciamo avvenire un processo di rotazione in una determinata porzione, questo si ripercuote anche sul resto della loro superficie. Nelle molecole topologicamente vincolate l’effetto di una modifica in una determinata zona viene rilasciato sottoforma di energia di rotazione anche alla loro parte restante. Esistono numerosi farmaci chemioterapici che inibiscono l’azione degli enzimi (le topoisomerasi nelle cellule umane e le girasi nelle cellule batteriche) che controllano il grado di superavvolgimento degli acidi nucleici; è importante capirne il funzionamento. 7.2. FLESSIBILITA’ DEL DNA Il DNA è una molecola flessibile che può essere piegata e ritorta attorno al proprio asse, anche se, di norma, è più facile piegare il DNA attorno al proprio asse, modificando le distanze dei gruppi fosfato, piuttosto che torcere l’asse, modificando il grado di stacking e i ponti a idrogeno tra le coppie di basi appaiate. 54/332 Quando si parla di ‘piegamento della molecola di DNA’ si intende l’avvolgimento del DNA attorno all’ottamero istonico. Quando si parla di ‘torsione dell’asse del DNA’ si fa riferimento alla denaturazione del DNA. Sono due processi complementari che avvengono in vivo: il piegamento del DNA è in equilibrio con la capacità della molecola di essere torta o denaturata. Il DNA lineare non è topologicamente vincolato perché le sue estremità sono libere. In questo tipo di molecole può essere modificato il numero di avvolgimenti di un filamento intorno all’altro attraverso una semplice rotazione reciproca o uno svolgimento di un filamento rispetto all’altro, la cui estremità ruoterà, scaricando l’energia dovuta a questo processo. In vivo tutte le molecole di DNA sono topologicamente vincolate: - Il DNA mitocondriale è topologicamente vincolato per definizione, in quanto, essendo circolare e covalentemente chiuso, non ha estremità libere (non possiede proprio estremità); - Anche il DNA cromosomico è topologicamente vincolato; presenta i telomeri che, pur essendo estremità teoricamente libere, nella cellula sono ancorati alla membrana nucleare. Inoltre, essendo molto grande, presenta dei limiti di tipo topologico. Il DNA cromosomico non è solo avvolto attorno all’ottamero istonico, ma anche attorno a proteine non istoniche che servono a strutturare la cromatina nucleare in regioni distinte; - Anche il DNA batterico è topologicamente vincolato, essendo circolare e covalentemente chiuso (sia quello plasmidico che quello cromosomico). 7.3. STRESS TOPOLOGICO Il DNA deve subire continuamente processi di torsione associati al fenomeno della denaturazione. Tutti i processi chimici che coinvolgono il DNA (replicazione, riparazione, …) prevedono la denaturazione, fondamentale per rendere disponibili agli enzimi le informazioni in esso contenute; la denaturazione, in particolare la torsione, causa stress topologico. (più avanti capiremo esattamente a cosa si riferisce il prof) 7.4. SOTTOAVVOLGIMENTO E SUPERAVVOLGIMENTO In vivo il passo della doppia elica del DNA è leggermente maggiore rispetto a quello previsto da Watson e Crick (per giro d’elica, ci sono circa 10,5 paia di basi e non 10). Questo fenomeno si chiama sottoavvolgimento (le coppie di basi impilate presentano un grado di rotazione reciproco di 34°, non di 36°) e non è casuale: è dovuto all’avvolgimento del DNA attorno all’ottamero istonico nel momento in cui si assembla il nucleosoma (da parte degli istoni) e serve per generare un particolare tipo di superavvolgimento della molecola di DNA (di tipo negativo) Figura 79 a) superavvolgimento del telefono b) superavvolgimento di un elastico doppio che consente un accumulo di energia libera, necessaria per favorire i processi di denaturazione che generano torsione e che sono associati ai fenomeni di trascrizione, traduzione e riparazione. Immaginiamo un telefono col filo elastico (Figura 79 a), che, per comodità veniva prodotto con il filo avvolto su sé stesso. Dopo una lunga telefonata, in cui chi telefona non è stato sempre fermo, possiamo osservare come il filo del telefono, già avvolto su sé stesso, sia addirittura superavvolto. Il superavvolgimento del filo su sé stesso è paragonabile al superavvolgimento del DNA. 55/332 Superavvolgimento: avvolgimento dell’asse di rotazione attorno a sé stesso. 7.4.1.MOLECOLE RILASSATE Esempio: due elastici avvolti l’uno sull’altro; quando siamo in una condizione del tipo descritto nella Figura 79 a) superavvolgimento del telefono b) superavvolgimento di un elastico doppio possiamo dire che gli elastici sono ‘rilassati’. In generale, quando l’asse di rotazione dei due filamenti giace su un unico piano la molecola è rilassata (condizione di base); se si svolgono le estremità da un lato, tenendo fisso l’altro estremo (ciò che succede in caso di molecola topologicamente vincolata), la restante parte della molecola tende a superavvolgersi su sé stessa. È esattamente ciò che succede in vivo: se io torco la molecola di DNA, essa si superavvolgerà per scaricare l’energia che io ho introdotto attraverso la torsione. 7.5. COME AVVIENE IL SUPERAVVOLGIMENTO Il superavvolgimento non è casuale, infatti: - Avviene sempre in una direzione; - Ad ogni torsione il senso dell’avvolgimento è in una direzione unica e specifica definita superavvolgimento positivo. La modalità con cui il DNA si superavvolge attorno agli istoni è un esempio di superavvolgimento negativo; quando io lo denaturo ottengo un superavvolgimento positivo, nell’altra direzione; questa considerazione ci fa comprendere un concetto fondamentale: il superavvolgimento negativo del DNA attorno all’ottamero istonico è un accumulo di energia libera che consente la realizzazione dei fenomeni di denaturazione locale che causano superavvolgimento positivo. Quindi, il superavvolgimento negativo fa sì che avvenga un superavvolgimento positivo più ‘facile’ (siccome compensa un superavvolgimento positivo) che è associato alla denaturazione. In altre parole, il superavvolgimento negativo fa in modo che i processi di denaturazione, i quali causano superavvolgimento positivo, avvengano più facilmente. Per chiarire ulteriormente questo concetto il prof ha presentato il gioco del “going” Figura 80. Dobbiamo immaginare due cavi fatti passare all’interno di un’ogiva. I due ‘giocatori’ afferrano le estremità opposte dei cavi e le allontanano a turno, facendo muovere l’ogiva. Sostanzialmente l’ogiva, scorrendo sui fili, si muove da un giocatore all’altro perché l’energia data dalla separazione dei cavi viene trasformata in energia cinetica. Figura 80 In una molecola di DNA i due filamenti non sono paralleli, ma sono avvolti l’uno sull’altro; ciò significa che quando abbiamo un enzima come la DNA o RNA polimerasi, che non viene spinto da denaturazione, ma causa denaturazione, ciò che avviene a valle rispetto al punto in cui avviene questo fenomeno è l’accumulo di un superavvolgimento positivo. A seguito della denaturazione, connessa con l’avanzamento della RNA polimerasi o della DNA polimerasi, avremo, a valle dell’enzima, un superavvolgimento; la presenza di un superavvolgimento fa fermare l’enzima e di conseguenza il DNA Figura 81 si rompe. Siccome la rottura del DNA potrebbe provocare la fissazione di mutazioni o di trasposizioni, i superavvolgimenti positivi vanno in qualche modo rimossi Figura 81. 56/332 7.6. I VINCOLI TOPOLOGICI DEL DNA CROMOSOMICO Il DNA cromosomico, molto grande, non si limita ad avvolgersi attorno alle proteine, ma ci si connette: i complessi proteici ancorano alcune parti di DNA alla membrana nucleare interna. Il fatto di essere ancorato alla membrana nucleare rappresenta un vincolo per il DNA. Nella Figura 83 possiamo osservare una porzione di cromosoma in cui: - un tratto è superavvolto - un tratto è rilassato - un tratto è avvolto su sé stesso Questi complessi proteici servono anche a una migliore organizzazione del DNA all’interno dei cromosomi, suddividendo sia il DNA che l’immensa informazione genica che esso contiene in pacchetti informativi. Si parla di domini cromatinici; è come l’organizzazione di una biblioteca: l’informazione è unica, ma è organizzata in domini distinti. Figura 82 Se io voglio trascrivere una regione cromosomica e questa mi causa un effetto di tipo topologico (perché causa denaturazione), quello che avviene in un tratto di DNA non deve avvenire in un altro. Lezione 5.2 – 23/02/2024 – [Marta Fusi – Martina Feltrin] 7.7. LA COMPATTAZIONE CROMATINICA 7.7.1.1.LA STRUTTURA CROMATINICA DIPENDE DAL CICLO CELLULARE Figura 83 Il primo grado di superavvolgimento del DNA si ottiene attorno all’ottamero istonico. Tale superavvolgimento è volto a formare la fibra cromatinica di 10 nm, che forma la collana di perle. Il superavvolgimento negativo non è casuale, infatti serve per l’accumulo di energia libera che è usata nei fenomeni che portano alla denaturazione del DNA e che causano un superavvolgimento positivo. Il DNA poi è compattato attraverso livelli di superavvolgimento addizionali che poi, nel cromosoma metafasico, comportano la formazione dei cromosomi metafasici. Il tema del vincolo topologico non si restringe alla cromatina metafasica. Quest’ultima la troviamo in una parte del ciclo cellulare in particolare in una fase temporale, che non è la principale di una cellula ma riguarda la mitosi e precede la segregazione dei cromatidi fratelli Figura 84. Figura 84 In Figura 85 è visibile un cromosoma costituito da due cromatidi fratelli, tenuti insieme dal centromero. La cellula nella metafase è tetraploide perché ha appena subito un processo di replicazione, ma il DNA è topologicamente vincolato anche nelle altre fasi del ciclo cellulare, che vanno sotto il nome di interfase (fasi G1-S-G2). Figura 9 85 57/332 La fase M, in cui è presente la cromatina nella forma di cromatina metafasica utilizzata nei cromosomi per l’analisi del cariotipo, è una breve parte dell’intero ciclo cellulare. Il vincolo topologico del DNA vale in tutte le fasi del ciclo cellulare. Soprattutto nella fase S, fase temporale, particolarmente controllata, dove la struttura cromatinica è sottoforma di struttura cromatinica interfasica ed è meno condensata rispetto a quanto ritroviamo nella cromatina metafasica. Si immagini schematicamente la rappresentazione della cromatina interfasica Figura 86, come il risultato del processo di superavvolgimento del DNA attorno all’ottamero istonico, a formare: dapprima la collana di perle e in seguito una struttura cromatinica, la cosiddetta fibra di 30 nm che si superavvolge ulteriormente a formare le strutture di ordine superiore. In azzurro sono rappresentati i complessi proteici che rimangono elettrondensi a seguito della lisi cellulare e che servono per ancorare la cromatina definendo dei domini cromatinici discreti, indipendenti l’uno rispetto all’altro. Questo serve sia per l’indipendenza (i tratti di fibra di 30 nm vengono ancorati e vincolati topologicamente a queste proteine non istoniche) sia per garantire i livelli di Figura 86 superavvolgimento degli ordini superiori di avvolgimento cromatinico, tipici della cromatina interfasica e ben visibili nell’immagine in Figura 87, ottenuta al microscopio elettronico. È una cellula interfasica, e ciò è intuibile dall’organizzazione della cromatina nucleare. Si presenta meno elettrondensa nella porzione periferica del nucleo (zona eucromatinica), mentre nella regione perinucleare ci sono zone elettrondense (zone eterocromatiniche). Corrispondono tipicamente alle regioni della cromatina ancorate attraverso le proteine prima descritte. Costituiscono l’impalcatura cromatinica e corrispondono, in termini di sequenze, alle sequenze centromeriche e telomeriche (che troviamo associate alla membrana nucleare interna). Da qui si comprende il tema dei vincoli topologici. La regione elettrondensa visibile al centro è una regione attivamente trascritta, ed eucromatinica. Si percepisce come elettrondensa perché Figura 87 ricca di RNA. È individuabile anche il nucleolo, entro cui avvengono la trascrizione degli RNA ribosomiali e l’inizio della biosintesi dei ribosomi. La zona è elettrondensa in quanto la concentrazione di macromolecole biologiche presenti nel nucleolo è molto maggiore rispetto a ciò che si trova nel nucleoplasma. Invece, il fatto che le regioni perinucleari siano elettrondense, è dovuto alla strutturazione eterocromatinica compatta (strutture di ordine superiore più compatte) e all’associazione con proteine di ancoraggio alla membrana nucleare. Quindi anche la cromatina interfasica è una cromatina topologicamente vincolata. Analizzando la relazione che sussiste tra denaturazione e superavvolgimento è possibile comprendere a cosa ci si riferisce quando si parla di superavvolgimento positivo e negativo. Come precedentemente detto, l’avvolgimento del DNA attorno all’ottamero istonico è un superavvolgimento negativo. 58/332 7.7.2.IL DNA RILASSATO E IL DNA SUPERAVVOLTO Si immaginino i superavvolgimenti positivo e negativo, come quanto rappresentato in Figura 88. A sinistra vi è una molecola topologicamente vincolata, circolare, covalentemente chiusa e rilassata perché l’asse di rotazione della doppia elica giace su un unico piano. A destra è presente una controparte in cui la stessa molecola è superavvolta, perché l’asse di rotazione non giace su uno stesso piano ma incrocia sé stesso. Analizzando gli incroci dell’asse di rotazione, si definiscono due concetti: Il grado di superavvolgiemento (positivo/negativo) L’entità quantitativa/il livello numerico del superavvolgimento Si procede dunque nel seguente modo: si guarda la disposizione della molecola, dall’alto verso il basso e si identifica la modalità dell’incrocio. Se il doppio filamento che rimane più vicino all’osservatore (immaginando una rappresentazione 3D) Figura 88 incrocia sé stesso passando da destra a sinistra, allora è un superavvolgimento negativo. In questo caso si notano tre superavvolgimenti negativi così tale molecola ha un valore di superavvolgimento negativo di -3 (*). Potenzialmente questa molecola superavvolta negativamente è convertibile in un’altra molecola denaturando una porzione di DNA. Separando i tre passi d’elica, la forma molecolare superavvolta negativamente (Figura 88 a destra) viene convertita in un’altra forma molecolare, dove il DNA è rilassato (Figura 88 al centro). In Figura 89 è rappresentata una micrografia al microscopio elettronico in cui si notano due forme topologiche della stessa molecola di DNA covalentemente chiuso. In particolare, quella soprastante è una forma rilassata, in quanto l’asse di rotazione giace su un unico piano; quella sottostante è una forma superavvolta, perché l’asse di rotazione incrocia sé stesso e si trova su tre piani diversi. Sono due topoisomeri, ovvero forme strutturali diverse ma della stessa molecola. Domanda: Come si può riconoscere il superavvolgimento Figura 89 negativo? Risposta: il superavvolgimento negativo equivale al superavvolgimento sinistrorso, che è quello che si ritrova nel DNA avvolto attorno al nucleosoma. Nella Figura 89 si riconosce che è negativo guardando la molecola superavvolta dall’alto verso il basso e identificando il senso dell’incrocio del doppio filamento che sta più vicino a noi, rispetto a quello che sta dietro. Se guardando dall’alto al basso, l’incrocio va da destra a sinistra allora quello è un superavvolgimento negativo. Un ulteriore modo per convertire una molecola da superavvolta a rilassata è introducendo un Nick nella molecola Figura 90. Un Nick corrisponde alla rottura di un legame fosfodiestereo in uno dei due filamenti. Per ottenere questa transizione bisogna tagliare in un unico punto uno dei due filamenti: le due estremità interrotte del filamento tagliato si disavvolgono e rilassano la molecola superavvolta. Quest’ultima ha un livello energetico maggiore rispetto a quella rilassata; quindi, tagliando in un unico punto i due filamenti interrotti essi si svolgono, liberando l’energia che ha condotto al superavvolgimento. superavvolgimento. 7.7.3.I PARAMETRI TOPOLOGICI DEL DNA È possibile rappresentare matematicamente gli stati rilassati o di superavvolgimento di una molecola di DNA. Grazie a una relazione che lega questi parametri, si può prevedere che cosa succederà modificando uno di questi. I parametri sono: Figura 90 1. Lk: Numero di legame o Linking number 59/332 2. Tw: Numero di avvolgimento o Twisting number 3. Wr: Numero di contorcimento o Writhe number Lk risulta essere dalla seguente relazione Lk = Wr + Tw, equivalente alla somma delle alte due variabili. Indica il numero di volte che un filamento incrocia l’altro attraverso un avvolgimento o un superavvolgimento. In altre parole, indica quante volte un filamento deve passare attraverso l’altro per separare completamente i due filamenti. Tw è il numero di passi di quell’elica, il numero di volte che un filamento si avvolge attorno all’altro. Si ottiene dividendo il numero di coppie di basi totali di quella molecola di DNA fratto il numero di coppie di basi per giro d’elica. Se c’è una molecola di DNA di 360 paia di basi, il passo dell’elica è di 10 paia di basi (si è arrotondato a 10 anziché 10.5, valore più realistico, solo per agevolezza di calcolo). Il numero di Tw di quella molecola sarà 360 ÷ 10 = 36. Se la molecola è denaturata non ci sono passi d’elica, quindi Tw = 0. Semplificando: Tw indica il grado di rotazione o la torsione. La denaturazione implica un intervento su tale parametro. Wr misura il grado di superavvolgimento, ovvero il numero di volte che l’asse di rotazione incrocia sé stesso. Corrisponde al valore -3 (*) misurato precedentemente. È negativo se il superavvolgimento è sinistrorso, è positivo se il superavvolgimento è destrorso. L’importanza di questa relazione, è che è costante se il DNA è circolare covalentemente chiuso. Ciò significa che intervenendo sul Tw, poiché il Linking number è una costante, si otterrà un effetto sul W r. Viceversa, se a seguito di un evento si ha una modifica sul Wr, si altererà il Tw. Quindi attraverso questa relazione si comprende cosa succede ad una molecola di DNA topologicamente vincolata, cambiandone superavvolgimento o denaturazione. Nel caso in cui il DNA sia covalentemente chiuso ma rilassato, il grado di superavvolgimento è zero. Quindi il valore del Linking number è equivalente al valore di Tw. Ciò che è importante da ricordare è che il Linking number rimane costante per un DNA circolare covalentemente chiuso, e per i motivi precedentemente descritti, è possibile prevedere ciò che succederà a tale molecola di DNA. Altro aspetto importante da tener presente: è energeticamente più facile piegare una molecola di DNA (ovvero modificare il W r) rispetto a torcerlo (quindi modificando il Tw). In termini di topoisomeri e in relazione a quanto detto, possiamo affermare che i topoisomeri sono molecole di DNA circolare covalentemente chiuse, aventi la stessa dimensione e composizione, ma diverso Linking number. Le topoisomerasi, importanti come target molecolare per la terapia con farmaci specifici, controllano il grado di superavvolgimento attraverso un’azione sul Linking number. Applichiamo quanto detto in Figura 91. A sinistra: molecola di DNA topologicamente vincolato (perché circolare covalentemente chiuso). Si calcolino i valori dei parametri tipologici, usando un valore medio di coppie di basi di 10; la molecola è di 360 paia di basi. Si definiscano Lk, Tw, Wr. Condizione iniziale: rilassata. Svolgimento: Wr = 0 perché non ci sono superavvolgimenti. Da ciò si deduce che Tw = Lk. Dato che Tw = numero di coppie di basi Figura 91 totali ÷ numero di coppie d basi per giro d’elica, sarà 360 ÷ 10 = 36. NB Lk 0 è la simbologia utilizzata per indicare il Linking number di una molecola rilassata. Le topoisomerasi agiscono su Lk. Si supponga che una topoisomerasi abbia ridotto Lk di 4 unità, diminuendolo così da 36 a 32. Cosa succede alla molecola in questo caso? Essa per avere un Lk di 32 deve aver mutato Tw o Wr. Una possibile modalità è modificare il Wr riducendolo di 4 unità; infatti, ciò che succede è che per ridurre Lk di 4 unità, vengono introdotti 4 superavvolgimenti negativi. 60/332 Questo risultato non è l’unico topoisomero generabile, bensì quello più stabile. Figura 92 Figura 16 Figura 93 Questa molecola Figura 92 si ottiene per azione della topoisomerasi. La topoisomerasi ha causato una riduzione di 4 unità di Lk, e dà, in termini di descrizione dei parametri topologici alla riduzione del L k, una compensazione con 4 superavvolgimenti negativi. La molecola è in equilibrio con il topoisomero di destra in Figura 93. Quest’ultimo ha Linking number di 32, ma invece di avere la riduzione del Linking number attraverso 4 superavvolgimenti negativi, viene effettuata la riduzione del Tw, mantenendo il Wr = 0. Tale molecola è in equilibrio con la forma topologica superavvolta e si ottiene per denaturazione di 4 passi d’elica che comportano un decremento di Tw da 36 a 32. Fare questo implica, oltre ad avere 40 bp denaturate, che la restante parte della molecola sottoforma di doppio filamento presenti un’alterazione del passo dell’elica, ovvero aumenti il numero di coppie di basi del giro d’elica. Quindi è possibile avere un equilibrio topologico tra più topoisomeri. Infatti, l’equivalenza tra Lw e Wr + Tw consente di prevedere sia ciò che succederà sia che il superavvolgimento negativo può essere compensato introducendo denaturazione. Denaturando un DNA, vengono aggiunti superavvolgimenti positivi che compensano i superavvolgimenti negativi presenti nella precedente molecola. Dal punto di vista termodinamico, il DNA è più facile da piegare (piegando l’asse di rotazione) che da torcere (denaturandolo). Tra le due forme molecolari quella della Figura 92 sarà quella più rappresentata perché termodinamicamente più stabile, in quanto altera la distanza tra i gruppi fosforici e non le interazioni di Stacking e dei legami a idrogeno (più stabili dal punto di vista chimico). In realtà non ci sono solo due molecole, ma una serie di molecole in equilibrio termodinamico, molto spostate verso la forma superavvolta. Il risultato è che in vivo si trova questa forma Figura 92, termodinamicamente più stabile. Lezione 6.1 – 26/02/2024 [Arianna Zappa – Sofia Del Ponte] Ripresa della lezione precedente Proiezione di un video che riassume alcuni concetti chiave inerenti alla lezione precedente, di cui a seguito un breve riepilogo per punti. La dimensione del passo dell’elica può essere modificata variando l’angolo di rotazione fra le coppie di basi durante la denaturazione (e dunque la torsione) della doppia elica stessa. La doppia elica può presentarsi in forma superavvolta destrorsa (positiva), e sinistrorsa (negativa), quest’ultima è caratteristica del DNA, in quanto l’asse di rotazione incrocia sé stesso da destra verso sinistra. Per convertire una molecola di DNA dalla forma superavvolta sinistrorsa alla forma rilassata, è necessario torce la doppia elica, ovvero modificare l’angolo di rotazione fra le coppie di basi impilate. In una molecola lineare l’angolo è di 36 gradi, e accorciando il passo dell’elica si aumenta l’angolo di rotazione a oltre 36 gradi. Al contrario, se al momento della denaturazione si aumentasse il passo dell’elica, si ridurrebbe l’angolo di rotazione, per cui sarebbero necessarie più coppie di basi per formare un passo di elica, corrispondente a un angolo di 360 gradi. 61/332 Il Linking number è una quantità topologica che rappresenta il numero totale di incroci tra le due catene di una doppia elica del DNA, ovvero indica quante volte una catena di DNA si avvolge attorno all'altra; in una molecola di DNA rilassata con superavvolgimento zero con l’asse di rotazione giacente sullo stesso piano, Lk risulta uguale al twisting number (Tw), ovvero al numero di passi di elica. Riducendo il passo dell’elica, l’avvolgimento (il Tw) aumenta e il contorcimento (il Wr) diminuisce, diventando negativo (poiché Lk= Tw+Wr). Invece, durante la denaturazione, si incrementa la lunghezza del passo dell'elica attraverso la rotazione intorno all'asse di torsione. Questo comporta una diminuzione dell'angolo di rotazione, richiedendo di conseguenza un maggior numero di coppie di basi per costituire un singolo passo dell'elica. Il risultato è un costante avvolgimento positivo della doppia elica. La forma superavvolta plectonemica è sempre positiva, mentre quella in vivo, detta toroidale, può essere sia destrorsa (positiva) sia sinistrorsa (negativa). La forma superavvolta sinistrorsa consente fenomeni di denaturazione che causano i superavvolgimenti positivi, in modo tale da controllare replicazione, trascrizione e riparazione. 8. SUPERSTRUTTURE DEL DNA 8.1. IMPLICAZIONI BIOLOGICHE DEL SUPERAVVOLGIMENTO DEL DNA Il DNA cellulare è superavvolto negativamente attorno al nucleosoma e questo consente i processi di denaturazione locale legati ai meccanismi di replicazione, trascrizione e riparazione. Gli organismi termofili, tuttavia, oltre ad avere un contenuto in GC diverso, più alto di quello umano, presentano il DNA superavvolto positivamente onde evitare che i processi di denaturazione avvengano spontaneamente. Nelle cellule umane e nelle eucariotiche il superavvolgimento positivo è introdotto dagli istoni, in particolare dagli istoni H3 e H4 che piegano l’asse di rotazione della doppia elica del DNA nelle fasi iniziali di assemblaggio della struttura cromatinica. Ad ogni modo questo equilibrio dinamico deve anche essere controllato dalle topoisomerasi, una classe di enzimi che controllano il grado di superavvolgimento, intervenendo con modalità specifiche sul Linking number. Questi enzimi sono fra i target più usati nella terapia antitumorale; l’effetto di alcuni farmaci chemioterapici inibisce infatti l’azione delle topoisomerasi, con l’esito della rottura della doppia elica a seguito dei processi che generano denaturazione (replicazione, trascrizione, riparazione ecc.). Infatti, nel momento in cui le topoisomerasi non esplicano la propria azione, lo stress topologico introdotto dalla denaturazione, che si manifesta con un superavvolgimento positivo, non è compensato sufficientemente dal superavvolgimento negativo dovuto alla piegatura del DNA attorno all’ottamero istonico, e dunque tale stress finisce per provocare la rottura della doppia elica. Tale rottura costituisce il danno più grave che il DNA possa subire poiché determina l’invio di una serie di segnali intracellulari che portano all’arresto della replicazione e dunque alla morte cellulare. 8.2. DENSITÀ DI SUPERALICA NEGATIVA Nell’uomo il DNA è superavvolto negativamente in condizioni normali; è stato possibile misurare un particolare parametro, ossia la densità di superelica negativa, che definisce il rapporto tra la differenza del numero di legame misurato (∆Lk) e il numero di legame del genoma cellulare nella forma rilassata (Lk0), dove per ∆Lk s’intende la differenza tra il numero di legame attuale e il numero di legame della forma rilassata. Figura 94. Differenza del numero di legame misurato 62/332 Figura 95. Densità di superficie negativa La densità risulta negativa a ragione del superavvolgimento negativo del DNA nella cromatina degli eucarioti e delle cellule umane. Questo fenomeno consente un accumulo di energia libera che serve per consentire i processi biochimici principali associati alla biologia del DNA (replicazione, trascrizione e riparazione), che causano denaturazione e intrinsecamente la formazione di superavvolgimenti positivi. In vivo il DNA è avvolto nella forma toroidale, sinistrorsa e antioraria, che si ottiene dalla forma Plectonemica per rotazione della molecola attorno all’ottamero istonico, grazie all’azione degli istoni H3 e H4, che piegano la molecola di DNA stessa. Figura 96. Influenza del numero di legame misurato sullo stato di superavvolgimento del DNA Figura 97. Conformazione plectonemica e conformazione toroidale del DNA 9. LE TOPOISOMERASI Le topoisomerasi controllano l’omeostasi del livello di superavvolgimento della cromatina, verificando che non vi siano né superavvolgimenti positivi in eccesso durante la replicazione e trascrizione, perché ciò è correlato a stress topologico del DNA e alla sua conseguente rottura, né superavvolgimenti negativi in eccesso, perché la molecola di DNA tenderebbe troppo spontaneamente a denaturare e a esporre le basi al solvente, portando alla fissazione di mutazioni. Risulta quindi chiara la necessità che vi sia uno stretto controllo della densità di superelica all’interno della cellula. Si osserva l’azione delle topoisomerasi nella rimozione del superavvolgimento positivo, causato dall’avanzamento della fonte di replicazione, ovvero della denaturazione.15 15 A valle della fonte di replicazione si generano in realtà superavvolgimenti positivi, motivo per cui nell’immagine la rappresentazione di un superavvolgimento negativo è un errore. 63/332 Figura 98. Azione delle topoisomerasi nella rimozione di un superavvolgimento positivo 9.1. CLASSI DI TOPOISOMERASI Vi sono diverse classi di topoisomerasi e in particolare di tipo I e II. 9.1.1. LE TOPOISOMERASI DI TIPO I Le topoisomerasi di tipo I permettono la concatenazione o decantazione del DNA, purché una delle due molecole di DNA presenti una regione a singolo filamento; esse agiscono infatti introducendo un “nick” (rottura di un legame fosfodiestereo) su uno dei due filamenti della molecola di DNA coinvolto: torcendo la molecola di DNA riducono il numero di coppie di basi per giro d’elica, aumentando conseguentemente il Tw. Le topoisomerasi di tipo I in particolare rimuovono eccessi di superavvolgimento negativo. Figura 99. Azione di una topoisomerasi di tipo I 64/332 Dal punto di vista enzimatico e biochimico agiscono attraverso la formazione di un intermedio covalente fra un amminoacido presente nel sito catalitico dell’enzima, una tirosina, e il gruppo fosforico del DNA in cui viene introdotto il nick; questo legame prende il nome di legame fosfotirosinico. A seguito della denaturazione e della formazione dell’intermedio avviene in taglio su un filamento, il filamento di DNA integro viene trasferito e il nick viene richiuso, revertendo il processo di taglio stesso. Figura 100. Confronto dell’azione di una topoisomerasi I e di una topoisomerasi II 9.1.2.LE TOPOISOMERASI DI TIPO II Le topoisomerasi di tipo II si distinguono da quelle di tipo I sia perché introducono un nick su entrambi i filamenti, sia perché necessitano di energia (ATP). Inoltre, sono coinvolte nei processi di replicazione, trascrizione e riparazione perché connessi alla denaturazione del DNA ovvero al superavvolgimento positivo del DNA, a valle del punto in cui sta avvenendo la denaturazione. Le topoisomerasi di tipo II rimuovono superavvolgimenti sia positivi sia negativi presenti in eccesso, operando un cambio di Lk per ogni azione enzimatica di più o meno due unità di misura (diversamente dalle isomerasi di tipo I che aumentano solo di 1 unità di grandezza il Lk). Figura 101. Azione di una topoisomerasi di tipo II 9.1.3.LE GIRASI I batteri nel proprio DNA non presentano istoni, per cui il DNA si avvolge a formare strutture pseudocromatiniche diverse dagli eucarioti. Questo spiega il fatto che i procarioti dispongono di una propria classe di topoisomerasi di tipo II specifica, che agisce in risposta a un eccesso di superavvolgimento positivo, ovvero la classe delle girasi. Le girasi si occupano di introdurre quel genere di superavvolgimenti negativi (introdotti nelle cellule eucariotiche dagli istoni H3 e H4) necessari a conferire una certa densità di superelica negativa che anche nei batteri (es. Escherichia coli), ad eccezione degli estremofili, è richiesta per i processi legati alla biochimica del DNA. 9.2. ASPETTI FUNZIONALI DELLE TOPOISOMERASI Le topoisomerasi sono dei target molecolari largamente utilizzati in chemioterapia; si annoverano infatti diversi farmaci, usati sia in tumori solidi (ovarici e mammari) sia ematologici, che inibiscono irreversibilmente l’azione delle topoisomerasi tramite un legame covalente. Un esempio è la camptotecina e l’etoposide, classificati come topotecani. 65/332 Bloccando l’azione delle topoisomerasi questi farmaci causano stress topologico al DNA, non risolvibile, che si estrinseca con la rottura della doppia elica; le rotture di questo tipo sono dette double strand breaks (ds-breaks) e rappresentano le lesioni citotossiche per eccellenza in quanto attivano pathway di segnalazione intracellulare che possono portare all’arresto del ciclo cellulare e alla morte della cellula e che hanno due complessi meccanismi di riparazione: per omologa hr e per non omologa nhr. Le lesioni sono sia citotossiche sia altamente mutageniche perché in corrispondenza di esse le riparazioni possono fissare mutazioni oppure possono portare ad aberrazioni cromosomiche, quali la fusione di parti di cromosomi diversi. Figura 102. Rotture del DNA di tipo “double strand breaks” causate dagli inibitori delle topoisomerasi Queste lesioni sono riconosciute da una famiglia di chinasi, proteine con attività enzimatica che fosforilano specifici substrati; un esempio è la proteina P53, principale oncosoppressore delle cellule umane che induce l’apoptosi attivando una cascata di trasduzione del segnale. Oggigiorno vi sono farmaci in particolare che bloccano l’azione delle chinasi apicali nei tumori; le chinasi si dicono “apicali” perché stanno a monte di una cascata di trasduzione del segnale, e fosforilano proteine o enzimi di riparazione della rottura della doppia elica, come BRCA1 e NES1. Uno degli istoni che costituiscono il nucleosoma, ossia l’istone H2A, possiede una particolare isoforma, la variante istonica HA2X, che viene proprio fosforilata dalla chinasi. La forma fosforilata di questa variante si chiama gamma HA2Ax e viene rilevata nelle cellule grazie a un anticorpo con delle analisi di immunofluorescenza. 9.2.1. ESPERIMENTO DI TRATTAZIONE DI UNA CELLULA TUMORALE CON L’ETOPOSIDE Un esperimento significativo per constatare gli effetti dell’inibizione delle topoisomerasi consiste nell’osservare i cambiamenti che avvengono a livello di una cellula tumorale trattata o meno con l’etoposide, un farmaco antitumorale per l’appunto, che ha proprio l’effetto di bloccare l’azione delle topoisomerasi. A destra si può osservare il nucleo cellulare colorato con una sostanza di nome ioduro di propidio, una molecola che si intercala al DNA e lo rende fluorescente per cui è possibile visualizzare il nucleo della cellula. A sinistra si vede la cellula trattata con un anticorpo che visualizza la variante istonica fosforilata, per cui presenta Figura 103. Foci di istone fosforilato H2AX nei siti di DNA ds-breaks 66/332 molti punti di localizzazione di questa, detti foci di danno, quantificabili numericamente, usati per misurare la rottura della doppia elica del DNA. Questo saggio permette dunque di visualizzare la rottura della doppia elica tramite l’analisi dello stato di fosforilazione della variante istonica, diffusa e non associata in cluster. Da quest’analisi si evince la capacità di riparazione della doppia elica e l’effetto genotossico di sostanze come il toposide. 10. GLI AGENTI INTERCALANTI Le sostanze intercalanti possono causare fenomeni di inserzione e delezione di sequenze del DNA tramite un effetto sulla topologia del DNA. Un esempio è dato dal bromuro di etidio, formato da molti anelli aromatici condensati, che si intercala nella doppia elica del DNA facendo stacking con le coppie di basi. Tale sostanza veniva largamente impiegata nell’analisi del DNA in laboratorio, ma oggigiorno risulta essere meno usata in quanto si è scoperta essere un carcinogeno molto impattante, proprio per via di questo suo effetto intercalante che consiste nell’aumentare il passo dell’elica, ovvero Figura 104. Effetto dell’Etidio Bromuro (intercalante carcinogeno) sui parametri topologici del DNA nel ridurre il Tw, e nell’ aumentare il Wr, incrementando il superavvolgimento positivo. Ogni molecola di bromuro si lega stechiometricamente col DNA ogni 2,5 copie di basi e riduce di 8 gradi l’angolo di rotazione per molecola intercalata. Si può quindi calcolare quante molecole si intercalano note le particolari concentrazioni di DNA e di etidio bromuro utilizzato. Un tempo esistevano anche agenti intercalanti contenuti negli alimenti, un esempio noto è l’aranciata, che conteneva l’arancio di acridina, ma anche la proflavina; si tratta di coloranti che in quanto agenti intercalanti sono mutageni e contribuiscono a causare errori associati allo scivolamento della DNA polimerasi, che determinano mutazioni per espansione e Figura 105. Analoghi delle basi e agenti intercalanti che causano mutazioni del DNA e favoriscono errori per scivolamento durante la replicazione. contrazione nucleotidica. Il professore inserisce un esercizio per mostrare un’applicazione pratica dei concetti presentati. 67/332 Figura 106 Lezione 6.2 – 26/02/2024 – [Costanza Maria Minen – Camilla Maino] 11.ORGANIZZAZIONE ED ARCHITETTURA DEL GENOMA PROCARIOTICO ED EUCARIOTICO La struttura dei vari genomi come è conosciuta oggi, deriva da settant’anni di studi che sono partiti dalla comprensione della struttura della doppia elica di Watson e Crick e sono progrediti con l’aumento delle tecnologie per il sequenziamento del DNA. La scienza che ne è nata è la genomica che ha come obiettivo quello di catalogare le caratteristiche principali dei vari genomi. Nel 2001 è stata pubblicata la prima versione del genoma umano e oggi, dopo oltre vent’anni, si è in prossimità del suo completamento. Uno dei grossi problemi che ha rappresentato una difficoltà nell’ assemblaggio dei dati di sequenza è la presenza di numerose regioni ripetute: in questi studi si frammenta il genoma in cromosomi e si sequenziano i pezzi, poi si assembla il puzzle e il problema è proprio assemblare le regioni ripetute per cui non si sa se appartengono a un cromosoma e in quale regione del cromosoma si trovano. Non si riesce a definire bene l’architettura. Questo tipo di studi sono aggiornati quotidianamente e a tal proposito c’è un progetto chiamato Encode (Encilopidia of DNA Elements) i cui dati aggiornati vengono pubblicati ogni anno su Nature. Attraverso gli studi di genomica comparata si è scoperto che progressivamente la dimensione del genoma aumenta in maniera sostanziale, gli organismi molto semplici come i micoplasti (batteri parassiti endocellulari obbligati) hanno dei genomi di dimensione ridotta rispetto ai mammiferi. Figura 107: tabella con vari organismi e la loro grandezza del genoma. Infatti, aumenta il valore di c. “Il prof ricorda il paradosso del valore c che esprime che la complessità biologica e morfologica degli organismi durante la filogenesi, ovvero il processo di evoluzione degli organismi sulla terra, non correla con le dimensioni del genoma.” 68/332 Ad esempio, i mammiferi hanno un genoma composto da circa un miliardo di copie di basi mentre ci sono degli anfibi che hanno 10/100 volte il genoma umano. Vi sono molte piante, in particolare le angiosperme, che hanno una quantità del genoma estremamente variabile; quindi, la dimensione del genoma non può essere la spiegazione della differenza evolutiva. Si è visto che il numero di geni non spiega la differenza evolutiva; non aumenta proporzionalmente alla dimensione del genoma. Se si confronta il genoma batterico di Escherichia Coli con il genoma umano abbiamo circa 3 ordini di grandezza di differenza in termini dimensionali ma solo 4/5 volte in più in termini di quanti geni. Quindi il numero di geni non correla con le dimensioni del genoma e nell’arco dell’evoluzione il tema centrale è la densità genica: la densità genica, intesa come rapporto tra numero di geni e dimensione del genoma e che prende anche in considerazione la dimensione del gene, progressivamente diminuisce con l’aumento della complessità degli Figura 107: tabella con vari organismi e la loro organismi. grandezza del genoma Vi è un aumento delle sequenze di DNA ripetuto e vi è un aumento importante nelle sequenze inter-geniche, cioè sequenze non codificanti che separano i geni. Le densità genica tra procarioti ed eucarioti hanno caratteristiche molto diverse tra di loro. Osservando la rappresentazione della densità genica nei procarioti nella Figura 108, in ordinata il numero di geni, dove per geni si intendono le sequenze codificanti per una proteina, e in ascissa la grandezza del genoma di un organismo. Si notano vari microrganismi a partire dal micoplasma che ha circa 500 geni ed è il batterio endocellulare obbligato più piccolo che si conosca, e progressivamente il Figura 108: rappresentazione della densità genica nei procarioti valore aumenta. Ma la caratteristica importante è la pendenza: c’è una linearità nel concetto di densità genica. Progressivamente il genoma aumenta ma aumenta anche il numero di geni: quindi nei procarioti si può dire che l’aumento di densità genica segue il valore c, ovvero segue un parametro di tipo costante. Inoltre, nei procarioti, in genere, quasi tutto il genoma è codificante e questo spiega questa osservazione: i procarioti non hanno genoma ripetuto, non sono presenti sequenze inter-geniche, tutto il genoma contiene informazione codificante, ovvero l’85/90% del genoma codifica per RNA e proteine. In Escherichia Coli la dimensione media di un gene è di circa mille paia di basi e nel caso della proteina corrisponde a circa 317 amminoacidi. Il prof suggerisce di tenere in considerazione questi valori e che poi vedremo che nell’uomo questi valori sono leggermente aumentati sia per quanto riguarda la dimensione media del gene sia per quanto riguarda la dimensione media della proteina. Facendo la stessa analisi riguardo gli organismi modello unicellulari eucarioti, si troverà una distribuzione rappresentata nella Figura 109. (Si considera sempre la densità genica in relazione alle dimensioni del genoma di quell’organismo.) 69/332 A partire da organismi a modello unicellulari come Saccharomyches Pombe e Saccharomyces Cerevisiaie, per passare alla Drosophila, alla Arabidopsi (una pianta), ai mammiferi come l’uomo e alle angiosperme come il riso: possiamo notare che non c’è linearità. Vi è un andamento leggermente progressivo ma ci sono dei paradossi (ad esempio il riso ha 40 mila geni rispetto all’uomo che ha circa 19 mila geni). Nelle piante e nelle angiosperme invece c’è un elevato numero di geni replicati, ci sono molte famiglie geniche: sono geni ottenuti da fenomeni di Figura 109: rappresentazione di densità genica in organismi unicellulari eucarioti duplicazione e fissazione di mutazioni che hanno portato a un guadagno di funzione. La grandezza media di un gene umano è diversa rispetto a quella di un gene batterico: un gene umano è di circa di 27kb tra sequenze esoniche e sequenze introniche, dove però le sequenze codificanti sono una quota inferiore di queste 27kb. Circa il 5%, ossia 1.3kb è la dimensione delle sequenze codificanti del genoma umano. Nel batterio sono circa 1kb quindi abbiamo delle sequenze codificanti leggermente più grandi; infatti, nell’uomo le proteine sono un po’ più grandi, attorno ai 450 amminoacidi rispetto ai 320 circa dei batteri. Quindi in un gene di 27kb il 5% è costituto da sequenze codificanti e il 95% da sequenze introniche che rivestono un ruolo importante in questo ampliamento dimensionale delle sequenze geniche a cui si assiste durante la filogenesi. I micoplasmi sono i batteri parassiti endocellulari obbligati che hanno un minor numero di geni e una dimensione più piccola del loro genoma, circa 500 geni e il fatto che hanno dimensioni così piccole li rende parassiti obbligati, ovvero per svolgere le funzioni complete devono parassitare un’altra cellula. Un procariote unicellulare varia tra 1500 e 7500 geni con 4 mila geni in Escherichia Coli, un eucariote unicellulare ha circa 5000 geni come la Saccharomyces, un eucariote pluricellulare come la Drosophila ha circa 13000 geni mentre l’uomo ne ha 20 mila. Nei batteri e negli eucarioti unicellulari la maggior parte dei geni sono unici mentre negli eucarioti pluricellulari ci sono famiglie geniche, per cui abbiamo questo fenomeno di duplicazione genica che spiega in parte l’aumento della dimensione del genoma. I 500 geni che si trovano nel micoplasma sono la stessa grandezza necessaria per lo sviluppo di una cellula artificiale. “A tal proposito il prof mostra il risultato di un lavoro in cui attraverso la selezione di geni essenziali si è riuscito a costruire una cellula in vitro. “ Inoltre, si è a identificato il set minimo di geni necessari alla cellula per svolgere il minimo delle funzioni biologiche, in particolare collegate alla replicazione. 11.1.GENI HOX I geni Hox sono un esempio importante di quei geni che si sono originati per eventi di duplicazione genica a partire da elementi genici ancestrali e che hanno contribuito complessivamente allo sviluppo della complessità durante la filogenesi. I geni Hox li troviamo come ortologhi, cioè presenti con funzioni simili in altri organismi, come ad esempio la Drosophila, e che hanno un’organizzazione sul cromosoma non casuale. Questi si trovano nella Drosophila in un unico cromosoma e identificano per l’asse antero-posterie. 70/332 Nei mammiferi, in particolare nell’uomo, questi geni diventano 39 e sono distribuiti su 4 cromosomi diversi; hanno un’organizzazione per cui li ritroviamo ripetuti con funzione diversa su ciascuno di questi cromosomi e il fatto che sono sullo stesso cromosoma ci suggerisce che si sono duplicati. La cosa sorprendente è che questa famiglia genica svolge le stesse funzioni o funzioni molto simili in organismi filogeneticamente distanti; infatti, tra Drosophila e uomo c’è una differenza di circa 600 milioni di anni. Si possono ritrovare funzioni analoghe che però nell’uomo sono di più e molto più complesse e che comunque anche nell’uomo servono a definire l’asse anteroposteriore nell’embrione. Mutazioni di questi geni possono essere incompatibili con la vita o causare effetti fenotipici drammatici. Nell’uomo questo tipo di mutazioni sono associate alla patogenesi di alterazioni morfologiche importanti come, per esempio, alterazioni nelle articolazioni Figura 110. I geni conservati sono geni importanti, perché sono sottoposti a forte pressione selettiva e quindi devono essere funzionalmente attivi; alterazioni di questi geni sono connesse direttamente con patologie. Figura 110: mutazione dei geni hox nell'uomo L’architettura del genoma umano è composta tipicamente da pochi o limitati geni che contribuiscono direttamente alla determinazione unica del fenotipo, cioè il fenotipo è il risultato dell’azione di più geni contemporaneamente. Le malattie che si manifestano con ereditarietà di tipo mendeliano non sono tantissime ma la maggior parte delle patologie sono il risultato dell’azione di più effetti genetici; i fenotipi sono tipicamente multi-genici. Ad esempio, l’altezza è una caratteristica fenotipica che dipende in alta misura da un assetto genico. Naturalmente si sono cercati quali fossero i geni coinvolti nella determinazione dell’altezza e in uno studio fatto su ampie casistiche, sono stati sequenziati tutti i genomi di 700 mila soggetti e si è trovato il numero di set minimo di geni che possono influenzare l’altezza nell’età adulta di 2 cm. Il contributo dei geni nelle differenze interindividuali è di tipo quantitativo e non qualitativo. La volontà di suddividere la società in etnie e di definire degli assetti genetici associati alle etnie è stata una grande idiozia. Oggi sappiamo che il colore della pelle non dipende da geni diversi che vengono espressi ma da un diverso livello di espressione del pigmento della pelle, così valgono tutte le caratteristiche genotipiche principali che identificano le varie etnie. Oggi si può anche dire che dal punto di vista genetico c’è più differenza tra soggetti della stessa etnia che tra soggetti di etnie diverse. Non abbiamo geni diversi ma siamo diversi perché quantitativamente gli stessi geni vengono espressi in maniera diversa. 11.2.PARADOSSO DEL VALORE C Per capire cos’è il paradosso del valore c e cos’è contenuto nel nostro genoma possiamo partire da una rappresentazione schematica che mostra la regione codificante per un gene conservato dell’RNA polimerasi in diversi organismi modello, a partire da Escherichia Coli, Saccharomyces, Drosophila e uomo Figura 111. 71/332 Figura 111 regione codificante per un gene conservato dell’RNA polimerasi in diversi organismi modello La regione adiacente alla regione codificante del gene è una regione genica che si ipotizza essere conservata filogeneticamente. Attraverso l'analisi delle sequenze codificanti nei diversi organismi, è possibile distinguere elementi specifici. Le sequenze geniche sono identificate in verde, le sequenze introniche in viola, mentre le sequenze ripetute e le sequenze intergeniche sono rappresentate rispettivamente in giallo e bianco. Nei procarioti c’è una regione ristretta, corrispondente al gene dell’RNA polimerasi ed eventualmente codificante, poi nelle regioni adiacenti vi sono prevalentemente sequenze di altri geni. Se ci si sposta filogeneticamente tra i vari organismi, si vede che progressivamente la sequenza codificante viene interrotta, dapprima nella Drosophila dalla presenza di sequenze introniche e poi nell’uomo dalla presenza di sequenze introniche e sequenze ripetute. In altre parole, la regione codificante progressivamente viene diluita in tratti di genoma sempre più grandi. Si ha quindi una progressiva riduzione della densità genica: le regioni ripetute non si sono accumulate durante la filogenesi dei genomi ma hanno cominciato a interessare le regioni codificanti, ampliando in termini dimensionali quello che oggi noi conosciamo come regione corrispondente a un gene, costituito non solo dalle sequenze codificanti di quel gene ma anche dalle sequenze introniche e possibilmente anche da sequenze ripetute. Le sequenze ripetute fanno parte sia delle regioni geniche che conosciamo ma anche delle regioni genomiche che troviamo nel genoma umano. Ci sono vari tipi di sequenze ripetute di varie origini e con varie caratteristiche. 11.3.GLI ELEMENTI DEL GENOMA UMANO Guardando l’architettura del genoma umano Figura 112 si può notare che circa ¼ del genoma umano contiene sequenze esoniche (codificanti) che oggi sappiamo essere meno del 2%. Le sequenze introniche sono circa il 24% mentre circa il 45% del genoma è costituito da sequenze ripetute con caratteristiche particolari, cioè quella di essere in grado di trasporsi all’interno del genoma che sono i trasposoni. Le duplicazioni di grandi dimensioni che rappresentano Figura 112: diagramma a torta che rappresenta il genoma umano circa il 5% e le ripetizioni semplici che sono sequenze di nucleotidi e rappresentano circa il 3%. La restante parte è DNA di tipo inter-genico con pseudogeni che coprono circa lo 0.1% del nostro genoma. Questi elementi ripetuti sono abbondanti e molto importanti: l’utilizzo di elementi ripetuti è alla base dell’evoluzione delle famiglie geniche; quindi, è un importante meccanismo con cui è stata garantita l’evoluzione del genoma ad acquisire nuove funzioni biologiche. In compenso però, questi stessi fenomeni che hanno garantito la genesi di famiglie geniche, sono anche alla base del riarrangiamento genico in cui la ricombinazione genica può causare inattivazione funzionale del gene stesso. 72/332 L’effetto benefico delle mutazioni è associato anche all’instabilità genomica che è presente nelle patologie di tipo tumorale o nelle malattie neurodegenerative. 11.4.SEQUENZE RIPETUTE NEL GENOMA UMANO Le sequenze ripetute contribuiscono circa per il 50% alla dimensione del genoma umano e ve ne sono di vari tipi. La prima grade tipologia di sequenze ripetute sono le ripetizioni in tandem di vari tipi di sequenze, che identificano specifiche classi funzionali in queste ripetizioni Figura 113. La seconda grande tipologia di ripetizione sono le ripetizioni interdisperse ed è il caso dei trasposoni che possono “saltare” all’interno del genoma. Tra le ripetizioni in tandem c’è il DNA satellite: ce ne sono di vari tipi, le ripetizioni di sequenze semplici identificano il tipo di satelliti: - Satelliti 2 e 3: si trovano nella maggior parte dei cromosomi e sono costituiti da unità ripetute di 5 nucleotidi. Li troviamo ad esempio nell’ eterocromatina centromerica e nelle regioni eterocromatidiche. - Satellite 1: è il primo ad essere stato identificato e si tratta di sequenze ricche in AT della dimensione di 25-48 paia di basi - DNA alfoide e DNAβ: sono sequenze semplici di dimensioni limitate ma ripetute centinaia di migliaia di volte. Mentre i satelliti 1, 2, e 3 li troviamo nell’ eterocromatina di quasi tutti i cromosomi, il DNAβ lo troviamo nell’eterocromatina centromeirca solo di alcuni cromosomi umani. - Il DNA minisatellite è di dimensioni limitate rispetto al DNA satellite e comprende le sequenze telomeriche e le famiglie ipervariabili che si trovano in prossimità dei telomeri. Figura 113 ripetizioni in tandem - il DNA microsatellite che è presente in tutti i cromosomi ed è costituito da unità ripetute di dimensione variabile da 1-8 nucleotidi e complessivamente grande da 100 a 400 paia di basi. Il DNA satellite comprende quindi sequenze centromeriche ricche in AT e il nome “satellite” deriva dal fatto che il DNA viene isolato attraverso saggi di ultracentrifugazione. Questa tecnica viene utilizzata per distinguere macromolecole sulla base del proprio volume idrodinamico, in una provetta in cui viene generato un gradiente di densità, il DNA satellite migra di meno rispetto al DNA ripetuto. Per questo si chiama satellite perché se andiamo a misurare la densità ottica della nostra provetta andiamo a definire due bande: una corrisponde al DNA ripetuto che è più denso e l’altra corrisponde al DNA satellite. Le sequenze ripetute interdisperse Figura 114 20 sono le sequenze che tra le sequenze ripetute coprono la principale quota del genoma nucleare umano e ce ne sono vari tipi: - sequenze LINE - sequenze SINE - sequenze LTR Queste sono veri e propri trasposoni, ovvero elementi genetici mobili in grado di “saltare” all’interno del genoma degli organismi. Sono largamente utilizzati nelle piante per rendere plastico il genoma rispetto all’ambiente che cambia, ovvero per cambiare il fenotipo delle piante. 73/332 Negli animali sono elementi che da un lato possono garantire l’evoluzione e dall’altro possono essere alla base di patologie. Figura 114 sequenze ripetute interdisperse Queste sequenze di distinguono per caratteristiche strutturali e per dimensione: le sequenze LINE sono quelle più presenti e coprono circa il 31% del genoma umano ma comunque tra di loro hanno un elemento distintivo, ovvero il fattore di essere trasposoni. Le LINE sono dei retrotrasposoni, cioè sono degli elementi che attraverso delle sequenze codificanti per trascrittasi inversa, cioè enzimi in grado di retro trascrivere molecole di RNA in cDNA, generano di sé stesse delle copie di DNA una volta che sono trascritte, che possono inserirsi in una porzione anche distante del luogo di produzione della sequenza stessa. Sono caratterizzate da elementi con due “freccette” che identificano sequenze nucleotidiche di duplicazione che quando si inseriscono duplicano una regione nucleotidica in corrispondenza di dove si inseriscono. Inoltre, presentano delle sequenze 5’ e 3’ UVR che identificano sequenze trascritte ma non tradotte di un gene e hanno due open reading fream, ovvero hanno due cornici di lettura aperta una delle quali codifica per una trascrittasi inversa. Quindi sono elementi minimi in grado di retrotrascrivere e trasporre sé stessi all’interno del genoma, tendenzialmente sono dei residui di retrovirus ancestrali. Le SINE sono anch’essi retrotrasposoni ma contrariamente ai primi non hanno al loro interno sequenze codificanti per trascrittasi inversa. I meccanismi epigenetici, cioè la metilazione nel DNA oppure la metilazione istonica, sembra si siano evoluti negli organismi animali per impedire un eccessivo processo di retro-trasposizione di questi elementi. Sostanzialmente sembra si siano fissati nella filogenesi per mantenere silenziata la regione genomica corrispondente a questi elementi. Si comprende che poiché i meccanismi di retro-trasposizione sono casuali, questi elementi possono inserirsi anche all’interno di geni funzionali disattivandoli. Mentre negli animali questo meccanismo di retro-trasposizione viene controllato fortemente, nelle piante il meccanismo della retro-trasposizione è un meccanismo altamente utilizzato per variare fenotipo. Se una pianta è soggetta a stress metabolico, come carenza di acqua e carenza di agenti nutritivi, questo favorisce la retro-trasposizione. Il meccanismo sembra essere utile per gli organismi viventi non in grado di spostarsi in una condizione ambientale più favorevole, viene messa in atto la retro-trasposizione per variare il fenotipo e renderlo più adatto all’ambiente circostante. 11.5.PSEUDOGENI Gli pseduogeni sono elementi che derivano da geni funzionali e possono essere di due tipi: processati o non processati. I processati sono privi di introni in quanto derivano dalla retrotrasposizione di mRNA (derivano da geni ancestrali in cui agli mRNA sono stati rimossi gli introni una volta trascritti, quindi vengono poi retro trascritti sottoforma di cDNA e reinseriti nel genoma). 74/332 L’assenza degli introni e l’assenza delle regioni regolative rendono questi pseudogeni non più funzionali; anche se la sequenza codificante viene reinserita all’interno del genoma essa non può essere né trascritta né tradotta. I non processati sono derivanti da fenomeni di duplicazione genica, quando un gene viene duplicato e accumula mutazioni tanto da essere disattivato. Gli pseudogeni sono un importante sorgente di mutazioni deleterie per l’uomo associati a patologie, e questo è perché queste sequenze non essendo più codificanti, non sono più sotto pressione selettiva e quindi non avendo un prodotto proteico che può essere selezionato mutano più rapidamente del gene da cui derivano. Siccome queste sequenze sono abbastanza simili a quelle del gene da cui derivano e visto che i meccanismi riparazione utilizzano l’omologia di sequenza per riparare ad esempio rotture della doppia elica, se queste rotture riguardano il gene funzionale e viene utilizzato lo speudogene per riparare il gene funzionale, può essere inserita una mutazione presente sullo pseudogene nel gene funzionale in un processo che si chiama conversione genica. Questo meccanismo può causare la fissazione di mutazioni ed essere causa di inattivazione funzionale di geni a seguito di processi riparativi quando vengono utilizzati gli pseudogeni. Inoltre, questo meccanismo è alla base della possibile insorgenza di patologie; molti oncosoppressori sono noti essere inattivati da questi meccanismi caratterizzati dalla presenza di uno pseudogene. Lezione 7.1 – 28/02/2024 - [Jacopo Sibau – Imodya Kapusikkuge] 12. VARIABILITÀ DEL GENOMA UMANO La variabilità del fenotipo interindividuale umano è legata a variazioni che possono essere nelle sequenze genomiche, come polimorfismi genetici sia per regioni codificanti che non codificanti, come SNP; o nell’espressione del genoma, ossia nella modalità con cui i geni vengono trascritti in termini quantitativi, quindi l’epigenoma. Il fenotipo di un organismo, sia esso una cellula, un tessuto, o in generale un organismo complesso pluricellulare, è contribuito primariamente da cosiddetto epigenotipo, che sostanzialmente riassume in sé come il genoma viene espresso, e come l’espressione di esso viene manifestata in termini di controllo dell’espressione (3 processi principali: metilazione delle citosine, modificazioni istoniche e gli RNA non codificanti). Questi meccanismi sono i principali contribuenti alla determinazione dei fenotipi, a sua volta, sull’epigenotipo, ci sono due principali contributori in termini di questi meccanismi che contribuiscono alla generazione del fenotipo cellulare, le variazioni del genotipo, quindi mutazioni, SNP, polimorfismi genetici, e le varianti strutturali, come i meccanismi che contribuiscono alla compattazione della cromatina; tramite regolatori epigenetici che possono essere endogeni, esogeni, nutrizionali, ormoni, attività fisica, interazioni sociali, età, sesso, ed esposizione a sostanze chimiche. Questi sono processi di controllo dell’epigenotipo, che hanno alla base meccanismi di ereditarietà, sono quindi estremamente importanti in termini di perpetuazione del fenotipo in maniera dinamica, in maniera plastica; per esempio, il differenziamento tissutale procede attraverso questi meccanismi. Lo 0,1% del genoma umano è responsabile delle diversità tra ogni persona, e sono dovute in gran parte a polimorfismi genetici. Un polimorfismo genetico è una variazione genetica che ha una prevalenza (intesa come rapporto fra numeri di eventi in un dato momento e la popolazione) maggiore dell’1%. Frequenze più basse dell’1% vengono chiamate ‘mutazioni’. Quindi, il polimorfismo genetico è una forma di mutazione che ha una prevalenza di almeno l’1% nella popolazione, a significare che è fissata ed è mantenuta selettivamente nella popolazione durante le replicazioni, quindi nella progenie. I polimorfismi possono essere sostituzioni, delezioni o inserzioni di basi nel DNA e possono riguardare regioni codificanti e regioni non codificanti. Gli effetti di questi polimorfismi genetici sul fenotipo possono essere visibili, sia che si trovino in regioni codificanti che non codificanti. I loci polimorfici sono le regioni genomiche contenenti le sequenze riguardanti un determinato gene, per le quali almeno il 2% della popolazione risulta eterozigote. In funzione di dove cadono, possono essere: silenti, se cadono in una sequenza codificante, ma grazie alla ridondanza del codice genetico non impattano sulla sequenza proteica; oppure se cadono in sequenze non codificanti; non silenti, se hanno un impatto sul fenotipo, quindi cadono all’interno di regioni codificanti. 75/332 I polimorfismi genetici vengono mantenuti all’interno di una popolazione attraverso i processi di selezione naturale, in maniera attiva e costante; quindi, vi è una possibilità di riscontrare loci polimorfici non solo in un singolo individuo, ma generalizzabili a tutta una parte di quella popolazione che in qualche modo presenta una caratteristica di consanguineità. Si parla di polimorfismi transitori qualora questi non siano ereditati. In Figura 115 si possono vedere i principali tipi di polimorfismi genetici ad oggi conosciuti. Figura 115 12.1. SNP (SINGLE NUCLEOTIDE POLIMORPHISM) Gli SNP sono mutazioni di singoli nucleotidi (Figura 116), quindi non di sequenze ripetute, che fanno in modo che l’allele polimorfico si sviluppi nella popolazione in una proporzione maggiore dell’1%, fissata evolutivamente. Allele 1: 5’–TTCC C TAGGTG–3’ Allele 2: 5’–TTCC T TAGGTG–3’ In base alla sua prevalenza nella popolazione, uno dei due alleli sopra descritti verrà chiamato SNP. Ce ne sono circa una ogni 300/500 coppie di basi, circa il 90% delle variazioni genetiche nell’uomo: sono pertanto molto numerose e rilevanti, e possono coinvolgere tratti genomici sia codificanti che non codificanti, anche se si è visto che la maggior parte degli SNP cade nella regione del genoma non codificante. Le sue più importanti caratteristiche: 1. Rappresentano la più frequente causa di variabilità del genoma umano; Figura 116 2. Sono le mutazioni più frequenti associate a geni che causano patologie; 3. Sono abbondanti ed hanno un basso tasso di mutazione, quindi sono ereditabili; 4. Sono facili da identificare ed analizzare; 5. Rappresentano i marcatori genetici più comunemente utilizzati in ambito biomedico. Vengono utilizzati come marcatori-identificatori di determinati geni associati a fenotipo negli studi di genotipizzazione, studi che vengono utilizzati in medicina per individuare geni che contribuiscano alla suscettibilità a determinate malattie, la resistenza a malattie multifattoriali. È uno strumento facilmente utilizzabile per prevedere la predisposizione probabilistica di un/una paziente ad una determinata patologia, prima che questa si manifesti, oppure per predire la presunta risposta di un determinato paziente ad un determinato farmaco, o come metodo diagnostico e prognostico. Volendo studiare una determinata patologia, si analizza, non sapendo i geni coinvolti, il genoma di una popolazione sufficientemente numerosa come caso e un altrettanto numerosa popolazione come controllo. Si sequenzia così il genoma, andando a trovare varianti polimorfiche che consentano a livello molecolare di identificare la popolazione di controllo e quella di caso. Questa tipologia di studi viene effettuata su di una popolazione (con un gran numero di individui), attraverso una procedura di associazione caso-controllo. 76/332 L’aplotipo è la combinazione di determinate varianti polimorfiche associate a quel fenotipo. Per esempio, nel caso dello studio di popolazione caso-controllo viene divisa la popolazione in caso (= individui malati) e controllo (= individui sani): avremo perciò la presenza di due aplotipi, uno sano e uno malato. In altre parole, è un set di marcatori genetici (SNPs) presenti su un cromosoma che tendono ad essere ereditati insieme. Possiamo quindi definire l’aplotipo come una sorta di “codice a barre”, attraverso cui a partire dalla popolazione eterogenea, si può definire, attraverso il fenotipo identificato, l’insieme delle varianti polimorfiche che distingue ciascun subset di soggetti all’interno della popolazione stessa, per cui l’insieme delle varianti polimorfiche ereditate insieme definiscono l’aplotipo. Nel caso in Figura 117 viene studiato il fenotipo del colore degli occhi, con tre possibili fenotipi: occhi verdi, azzurri e neri, queste variazioni polimorfiche sono presenti tre posizioni in cui c’è una variazione della sequenza nucleotidica, che costituiscono tre SNP, che contribuiscono alla definizione dell’aplotipo (A al posto di G; G al posto di T; una delezione al posto di A). Qu