Biologia Molecolare Tutto-pagine-14 PDF
Document Details
Uploaded by InsightfulFantasticArt
Tags
Summary
This document discusses RNA regulators, and mechanisms of regulation in prokaryotes, including riboswitches and aptamers. It also touches on the role of RNA molecules in gene regulation.
Full Transcript
RNA Regolatori Andiamo oggi a vedere altri esempi di regolazione mediata da RNA. PROCARIOTI Parliamo di small RNA, ovvero RNA non codificanti e regolatori che possono avere dimensioni più o meno lunghe 80-110 nucleotidi. Lavorano solitamente in trans, ovvero la s...
RNA Regolatori Andiamo oggi a vedere altri esempi di regolazione mediata da RNA. PROCARIOTI Parliamo di small RNA, ovvero RNA non codificanti e regolatori che possono avere dimensioni più o meno lunghe 80-110 nucleotidi. Lavorano solitamente in trans, ovvero la sequenza traduce per un locus diverso. La traduzione, ovvero la produzione di una proteina, può essere regolata da sequenze che possono schermare il ribosome binding site RBS, ovvero la sequenza di Shinde Delgarno. Questo va ad interferire con l’assemblaggio del ribosoma impedendo la trascrizione della proteina. 1. Se viene espresso uno sRNA complementare alla regione di appaiamento con il RBS, questo può competere con il legame con RBS sopratutto se a concentrazioni elevate, liberando così la regione per permettere l’inizio della traduzione. 2. Nel secondo caso c’è una sequenza molto breve prima di RBS, non si richiude a forcina, ma ci possono essere degli sRNA che si possono appaiare a delle sequenze anche vicine a Shine Delgarno. Dunque per appaiarsi in modo stabile, deve appaiarsi in varie basi, e questa regione è fondamentale per appaiarsi specificatamente a questo trascritto. Gli RNA regolatori non sono liberi nel citoplasma. Ci sono delle proteine come Hfq che lega gli sRNA facilitandone l’appaiamento con le sequenze bersaglio. Non sono dunque molecole libere che vanno alla ricerca di punti da attaccare. I sistemi cellulari sono ben specializzati e specifici, per permettere appaiamenti specifici. Possono interferire con la sintesi proteica o legarsi ad altre regioni e facilitare l’attacco di RNAasi. Possono essere positivi e facilitare l’espressione genica, legando RNA e proteggendolo dall’attività di esonucleasi che potrebbero attaccare 5’, oppure legare delle sequenze che se fossero libere si legherebbero a forcina a Shine Delgarno. La regolazione dell’espressione o della traduzione può essere legata sempre a conformazioni acquisite dall’RNA, che non è una molecola lineare, ma essendo a singolo filamento le basi tendono a trovare basi complementari per formare strutture specifiche per questi meccanismi. Quando un RNA acquisisce strutture specifiche in questo modo viene detto: APTAMERO = acido nucleico con la proprietà di legarsi a molecole o proteine. Ricorda questo termine. Sono dunque acidi nucleici a singolo filamento che grazie ad appaiamenti acqusiscono strutture specifiche. Aptameri sintetici sono molto interessanti perchè invece che sintetizzare proteine che leghino per esempio un altra proteina per test, o per nanoscienze, è molto più semplice sviluppare e pianificare un acido nucleico in vitro. È possibile farlo in due modi: - Aggiungendo nucleotide dopo nucleotide, in una sintesi senza l’utilizzo di bioreattori; - Attraverso l’utilizzo di bioreattori che producono un piccolo RNA, andandolo a clonare come abbiamo visto nelle lezioni precedenti. Possono legare piccole proteine o piccole molecole. Quando abbiamo parlato degli RNA con polycomb il concetto è proprio lo stesso, si comportano da aptameri. Riboswitch: geni del metabolismo della metionina in B. subtilis. Regola la traduzione. A monte abbiamo la sequenza di Shine Delgarno con una sequenza molto lunga prima in 5’ in grado di assumere varie conformazioni. Nel primo caso ha una conformazione in grado di legare il ribosoma. In presenza di SAM, nel secondo caso, che lega la metionina, può formare un legame con l’aptamero portando a un appaiamento della regione 1 e della regione 2. Si libera così la regione 3 che si appaia con 4 (Shine Delgarno) impedendo che si possa legare il ribosoma. Questo è un meccanismo a feedback negativo che agisce su RNA stesso. Non c’è bisogno dell’enzima per la metionina ad esempio, perchè ho molto precursore, questo si lega e fa variare gli appaiamenti al 5’ provocando il blocco della sintesi proteica. Quando c’è poco precursore, si staccherà SAM e avverrà la traduzione Questo sistema ha anche effetti sull’ attenuazione della trascrizione. Durante la trascrizione iniziano ad avvenire appaiamenti tra regioni complementari. Può attaccarsi a questo punto anche SAM. Passata la regione si forma un appaiamento a forcina che viene riconosciuto come termine della trascrizione, andando a sganciare la RNA pol, che non inizierà mai a trascrivere la regione codificante per l’enzima. Sono dunque due meccanismi appaiati, uno per RNA già prodotto, uno per RNA da produrre. CRISPR Sistema di difesa nei batteri: CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats). I ricercatori stavano analizzando il genoma dei batteri e hanno trovato la ripetizione di varie regione, che si ritrovavano in varie specie batteriche. Sono interspaziate in maniera più o meno uguale. Geni CAS a monte delle spacers: Sequenza leader di circa 500 bp ricca in A-T Sequenze ripetute di circa 30 bp Sequenze spaziatrici spacers di circa 30 bp con sequenze divergenti, corrispondevano ad alcune regioni dei fagi CRISPR è un sistema di difesa dei batteri di registrare i fagi che li hanno infettati per combattere una eventuale seconda infezione. Paragonato per questo agli anticorpi nel nostro sistema immunitario. ACQUISIZIONE C’è dunque il genoma di un esterno, che può essere un fago o altro, così prende parte della sequenza di questo genoma infettivo e lo inserisce nel proprio genoma, nel CRISPR array, per poterlo riconoscere in futuro. Il taglio non è casuale. Il sistema CRISPR taglia un punto preciso in sequenze dette PAM = protospacer-adjacent motif. Permettono di tagliare a una distanza di circa 3 nucleotidi. Nel caso di PAM di E. Coli è la sequenza AAG. Questa è una PAM. In organismi diversi se ne troveranno poi di diversi tipi. Dunque PAM è la sequenza di 3 nucleotidi dove avviene il taglio. Anche l’inserimento della regione tagliata non avviene a caso, ma secondo un meccanismo che ricorda molto integrasi e trasposoni. Avveine un taglio sfasato, così la regione ripetuta viene ripetuta in entrambi i lati. Le porzioni nere sono gli spacers, alternate dalle repeats (ripetizioni), sequenze un po’ ripetute che formano delle sequenze a forcina. Richiamo, in questa regione, il sistema CRISPR per andare a inserire il nostro spacer. Nel momento in cui è stato tagliato il pezzo del genoma del DNA invasore (diamante giallo), questo non viene inserito a caso, ma con un meccanismo simile a quello delle integrasi o dei trasposoni In rosso si osserva la PAM. Viene tagliato il frammento verde. Avviene poi un taglio sfalsato nella regione ripetuta, quando si inserisce nel DNA i sistemi di riparo trovano -OH libero e vanno a chiudere il DNA, portando a ripetizioni. Cas1 e Cas2 sono integrasi e nucleasi. Formano un complesso proteico. Il complesso va a tagliare nel genoma dell’ospite il pezzettino di DNA, si taglia in modo sfalsato la sequenza ripetuta per inserirlo in mezzo per generare altre sequenze ripetute. Nel momento in cui viene trascritto si può generare un CRISPR RNA, che forma un aptamero che viene riconosciuto da CAS9 ovvero la proteina che andrà a portare lo spacer del DNA invasore nel caso di una seconda infezione. Dunque la trascrizione del locus permette la formazione di RNA che vanno a legarsi con altri RNA per formare l’aptamero e legarsi ad altre proteine. Dalla trascrizione si generano degli RNA composti da crRNA che si appaiamo al trcRNA , detto crRNA ovvero transattivatore. Tutto il complesso è detto RNA guida, perchè la proteina azzurra (CAS9), va ad essere indirizzata a un DNA con una sequenza complementare a quella dello spacer. In questo modo CAS9 con attività endonucleasi a va a degradare il DNA invasore nel caso di una seconda infezione. Si ha il complesso, spacer+sequenza ripetuta+ crRNA, per poter trasportare CAS9 al locus del DNA invasore. Riassunto: Immaginiamo che il batterio sia infettato da un fago verde. Viene preso un frammento del DNA del fago e lo inserisce nel locus CRISPR, vengono reclutate le due regioni ripetute. Questo può essere trascritto con un unico trascritto digerito in tanti frammenti detti crRNA, che si accoppiano allo spacer formando RNAguida. Questo può associarsi a CAS9 andando alla ricerca di un DNA invasore. Immaginiamo ora che il batterio venga infettato dal fago viola, che aveva già infettato precedentemente. Si trova infatti una sequenza del fago viola in CRISPR. Si associa dunque CAS9 e va a interferire e rendere innocuo il virus. C’è dunque una memoria che nel momento di rinfezione viene utilizzata per degradare il DNA. Il DNA che invade può essere memorizzato con il DNA rosso, di modo che si possano generare degli RNA guida formati da un RNA che ha il protospacer + le sequenze ripetute. Si associa un tracrRNA e si forma una struttura che viene legata dalla CAS9. Questa porta a complessare e a legare solo i DNA che possono essere complementari con la porzione rossa (l’endonucleasi viene guidata dall’RNA guida solo in quel locus e non in altri). La memoria di una sequenza di DNA, che permette di identificare un DNA già incontrato, avviene grazie alla complementarità delle basi (è risaputo che se si va alla ricerca di un DNA, la cosa più semplice è utilizzare un altro DNA, RNA o un altro acido nucleico, per complementarità delle basi). Il DNA invasore è soprattutto DNA esogeno, poiché il batteriofago non entra con la parte proteica, inietta solo il DNA, all’interno del batterio. Si tratta di un sistema che si basa sull’acido nucleico, genera un RNA che si appaia con il DNA rosso invasore e la CAS9 taglia. crRNA + tracrRNA = RNA guida à RNA guida + CAS9 = andare a tagliare il DNA invasore Una cosa del genere è complessa da riprodurre. I biotecnologi usano un unico plasmide, dove c’è un promotore per l’espressione di CAS9, ad esempio per utilizzarla in cellule umane. Si mette dunque un promotore per fessure eucarioti, ad esempio del cytomegalovirus. È possibile inserire anche una sequenza di una ventina di nucleotidi che corrisponde da una sequenza bersaglio. Si va a cogliere una sequenza e la si va ad esprimere con un altro promotore. Hanno generato un unico RNA guida ma che risolve il problema di avere due RNA divisi. Questo si associa a CAS9.. GENOME EDITING: non sono nati con il sistema CRISPR, si erano già sviluppati sistemi in vivo. La modificazione di loci nel genoma indotta da nucleasi che generano un DSB, double strand break, necessita di: Sequenza di riconoscimento nel locus da modificare Nucleasi che genera un taglio a doppio filamento sul DNA genomico, che vada ad attivare: Sistemi di riparazione al DNA Come portare la nucleasi in regioni specifiche del genoma? Proteine che riconoscono sequenze specifiche: Fattori di trascrizione RNA che legano in modo specifico la sequenza bersaglio è chiaramente + semplice 1. Fattori di trascrizione ZINC FINGER = piccoli moduli proteici, con 2 alpha eliche e 2 beta in cui le cisteine coordinano lo ione zinco, riescono a distinguere due sequenze soltanto, sono messe duque in tandem. I biotecnologi andavano a progettare Zinc Finger che andassero a riconoscere sequenza dopo sequenza, varie Zinc Finger, per riconoscere locus specifici. Veniva loro legato un enzima di restrizione come Fok1 che va a tagliare in modo non troppo specifico. Ne servono due in quanto agiscono come dimeri. È abbastanza complesso. TALEN = sono sempre fattori di trascrizione che derivano da piante. Riconoscono base per base sempre per richiamare Fok1. CRISPR = è chiaramente il più semplice. Viene portata nel locus CAS9. L’unico requisito da ricordare è che RNA guida deve ricadere sempre prima della PAM. Il sistema non taglia a caso ma in certi punti, riconoscendo PAM. Ogni Cas è in grado di tagliare la sequenza PAM che gli è caratteristica. Ad esempio NGG è riconosciuta dalla PAM dello Streptococcu Pyrogens. Non si può dunque utilizzare RNAguida in ogni sequenza, ma solo quello subito prima di PAM dove Cas riesce a tagliare. Il taglio generato è un taglio a doppio filamento. A cellula dunque può attivarsi il sistema di riparo al DNA NHEJ, oppure fornendo DNA donatore attraverso una HDR. CRISPR può essere usato anche per modificare le basi. Si potrebbe andare a modificare nel genoma anche solo una base. Utilizzando sempre RNA guida. CAS9 detta dCas9, in cui è tolta l’attività endonucleasica per tagliare, ma ha quella di citidina deaminasi, che può quindi togliere il gruppo amminico della citosina portando a mutazioni in quanto diventa uracile. Posso dunque mutagenizzare in vivo alcuni sistemi flessibili, come questo. Questa è una proteina ricombinante biotecnologica che non esiste in natura, ma molto interessante per fare per l’appunto Base Editing. EUCARIOTI MICRORNA o miRNA MicroRNAs sono lunghi circa 21-22 nt Regolatori dell’espressione genica a livello post-trascrizionale Evoluzionarmente vecchi: trovati in alghe unicellulari, si trovano ora in tutti gli organismi Costituisco 1-2% dei geni conosciuti negli eucarioti Bioinformatica predice che regolano circa il 30% dei geni codificanti per proteine, dunque è importantissimo Variazioni nella loro espressione sono state correlate a patologie Il primo miRNA (lin-4) é stato identificato nel 1993 in un ematode (verme) ma il termine miRNA é stato introdotto nel 2001, quando si è capito che era anche in organismi superiori Coinvolti in quasi tutti i processi biologici: Sviluppo embrionale Differenziamento cellulare Proliferazione cellulare Morte cellulare Controllo metabolico Silenziamento Transposonico = piRNA Difesa antivirale Agiscono nel citoplasma, vengono trascritti da RNApol II, qui legano sequenze spesso presenti nel 3’UTR non traslato in sequenze ricche di AU : AU- Rich elements ARE Sono trascritti come RNAmessaggeri. Subiscono poi tutte le modificazioni solite. Hanno particolari regioni ad appaiamento formando delle strutture a forcina. L’RNA a singolo filamento si staccherà da questa forcina e regolererà l’espressione genica. Siamo nel nucleo. Avviene la trascrizione di un RNAm. Quando si formano queste strutture a forcina, pre- miRNA, intervengono i drosha-pasha che vanno a tagliare la regione del CAP e di poliA. Ci sono due nucleotidi protrudenti al 3’ (ricordalo!). Esce attraverso exportina e va nel citoplasma. Qui agiscono i dicer che tagliano la forcina. Si forma a un RNA a doppio filamento con due nucleotidi protrudenti in 3’. Questi sono fondamentali per essere riconosciuti e utilizzati come microRNA. I due nucleotidi sono chiave per il legame con l’enzima dicer, che va a riconoscere questo particolare RNA e lo taglia. I due nucleotidi protrudenti al 3’ vengono legati dal dominio proteico PAZ, di modo che il precursore del microRNA vada a legarsi a dicer a una distanza esatta, per cui l’attività RNasi di tipo III di dicer tagli nel punto esatto, per eliminare solo la forcina. DROSHA = RNAsi III Per togliere solo la forcina. Ci sono poi due “righelli”, uno che permette a dicer di riconoscere il microRNA. Devono avere una lunghezza ben precisa. PAZ deve essere a una distanza dalla regione elicasica di circa 22 nucleotidi + il loop. Il secondo, ha attività polimerasica di tipo III, che deve ricadere a 22 nucleotidi lasciando un 3’ protrudente di 2 nucleotidi. È così un modo di riconoscere questi precursori e andarli a processare. RECAP: c’è l’mRNA a cui vengono tolti il CAP e la cosa poli-A da Drosha e Pasha, generando i primi due DICER = AGO = argonauta nucleotidi protrudenti del pre-miRNA. Attraverso RNAsi l’esportina-5 questa molecola viene riconosciuta da III dicer, che taglia via la parte a forcina, generando il miRNA a doppio filamento con i due nucleotidi protundenti al 3’. Questi due nucleotidi sono necessari per trasferire questo RNA al sistema argonauta (proteine che aprono il filamento, grazie all’elicasi, e utilizzano, ad esempio, solo quello rosso per andare a reprimere il bersaglio). Se l’appaiamento è perfetto avviene la degradazione del DNA bersaglio, se non è perfetto (come mostrato in figura) viene bloccata la traduzione, vengono reclutate delle esonucleasi e viene degradato l’RNA comunque. MiRISC = miRNA Induced Silencing Complex Dopo il processamento, i miRNAs sono assemblati in complessi di ribonucleoproteine (RNP) chiamati micro-RNPs (miRNPs) or miRISC Argonauta è la subunità catalitica (detta Slicer) che genera il taglio del mRNAS bersaglio. È sempre presente il miRNA a doppio filamento, con i due nucleotidi protrudenti. Le proteine argonaute contengono il dominio PAZ, capace di legare, non qualunque frammento di RNA presente nella cellula, solo l’RNA a doppio filamento con i 2 nucleotidi protrudenti al 3’. A questo punto, l’elicasi apre i due filamenti e un filamento viene utilizzato per ricercare il bersaglio (in questa immagine è stato scelto il filamento blu), che trova il bersaglio nel mRNA rosso. C’è un RNAsi che va a tagliare il bersaglio, degradandolo e portando all’abbassamento dell’espressione genica. Dunque è un sistema per ridurre l’espressione genica dopo la trascrizione. Il giusto bilanciamento dei miRNA è fondamentale per il funzionamento corretto delle cellule, il malfunzionamento è correlato a patologie. L’appaiamento non è sempre perfetto. C’è una regione appaiata e una che stabilizza. I miRNA, per la maggior parte, non si appaiano perfettamente al bersaglio, ma leggendolo dal 5’ al 3’ hanno: al 5’ otto nucleotidi di appaiamento quasi perfetto, viene chiamato nucleazione (seed region) regione non appaiata regione di complementarità che stabilizza Quando i miRNA vanno alla ricerca dei siti bersaglio nel genoma non è facile, non si sa mai esattamente quante paia di basi deve cercare per la complementarità perfetta. Questo crea una difficoltà nell’identificare i bersagli dei miRNA da un punto di vista bioinformatico. Sono molto abbondanti, in diverse cellule esprimono diversi corredi di miRNA, come diversi trascritti. A volte i miRNA vengono chiamati mirtron, un tipo di miRNA che si trovano negli introni dell’mRNA che codifica per i geni dell’ospite. L’introne, presente tra i due esoni del gene rappresentato, genera un pre- miRNA quando lo spliceosoma lo taglia. Un appaiamento non perfetto porta o all’attivazione dell’RNAsi o al blocco della sintesi proteica. Nel caso in cui abbiamo un proprio promotore vengono espressi come un gene qualunque. Quando sono espressi all’interno di un gene vengono invece espressi in questo. Utilizzano il promotore di un gene per essere espresse in una cellula o l’altra. Vengono chiamati infatti hijackers, geni che utilizzano il promotore di questo gene per farsi esprimere in alcune cellule piuttosto che in altre. Siti multipli per lo stesso o per diversi miRNAs sono necessari per una repressione efficace. Quando vengono espressi in questo modo, spesso sono miRNA che agiscono in concerto per andare a regolare l’espressione di un gene. Spesso un mRNA ha siti di legame a più miRNA diversi, quindi un miRNA da solo, spesso, non è sufficiente per abbattere l’espressione genica di quel gene. Per poterlo regolare in modo negativo è necessaria l’espressione di 2/3/5 miRNA che si legano con una propria sequenza, portando il complesso miRISC e, conseguentemente, alla degradazione. Tagliando la RNAasi degrada subito. 1. Si può far esprimere il DNA a doppio filamento in modo che venga reclutato dal sistema miRISC e venga, quindi, utilizzato per bersagliare il gene di interesse (siRNA). Si ricerca una sequenza nel gene dell’ actina e si forma una molecola con la porzione verde e gialla complementare. Quando si fa entrare questo piccolo duplex di RNA e altre molecole di acido nucleico, viene subito legato dal complesso di RISC. Il sistema argonauta con attività elicasica separa i due filamenti e va alla ricerca al filamento verde complementare portando alla degradazione. Quando si chiede all’azienda di sintetizzare oligonucleotidi a RNA deve lasciare i due protrudenti. Se no la subunità dell’ argonauta con il dominio PAZ non la riconosce com miRNA. 2. Possono usare una sequenza che simula la formazione di una sequenza forcina, come avviene in vivo. Entra il plasmide, agisce un promotore eucariotico, trascrive e forma una forcina. Viene riconosciuto da drosha, enzima ubiquitario, che taglia e lascia 3’ protrudente. La forcina è traslocata nel citoplasma, legata da dicer e si torna al silenced RNA, siRNA. È detta interferenza a RNA. Questo processo viene detto silenziamento o interferenza fra RNA. Oggi è uno dei metodi più utilizzati per andare velocemente ad abbattere l’espressione genica, poiché non è complesso (sistema CRISPR molto più complicato). 2. 1. TRASPOSONI SINE AluRNA negli eucarioti = Elementi SINE, sequenza Alu, di circa 300bp sono un tipo di RETROTRASPOSONI. Più di 1 milione nel genoma e circa il 10%. Caratterizzate dal sito di restrizione Alu (AGCT). Erano detti Alu ricche di AGTC riconosciute da un particolare enzima di restrizione. Non sono casuali ma di solito trascritte all’interno di un gene. Una sequenza Alu è una breve sequenza interspersa di DNA (SINE) originariamente caratterizzata come sito di taglio riconosciuto dall’endonucleasi Alu, un enzima di restrizione. Sono un tipo di retrotrasposoni, che derivano da trasposizione per retrotrascrizione di tipo poli-A. Queste sequenze Alu rappresentano circa il 10% dei retrotrasposoni nel nostro genoma, e presentano molto frequente la sequenza AGCT, riconosciuta da un particolare enzima di restrizione. Le zone ripetute con queste sequenze vanno a reclutare proteine per la costituzione del nucleolo, dove viene modificato RNA prodotto. Genomi e Genoteche PROBLEMA = Devo clonare un particolare gene di mio interesse per poterne analizzare le caratteristiche genomiche e le regioni che ne regolano l’espressione La dimensione media di un gene umano è 10-15kb, esoni di 200bp e gli introni sono enormemente variabili. Quando è stato per la prima volta sequenziato il genoma umano ci si aspettava che venissero identificati sopratutto geni per codificare proteine. Invece si è scoperto che nel genoma esistono molti meno geni del previsto. Nel genoma umano (3.2x109 bp) esistono: circa 20.000 geni annotati 19.000 pseudogeni, che non codificano proteine e sono spesso collegati all’evoluzione e a DNA ripetitivo. DNA ripetitivo, costituito principalmente da trasposoni Gli esoni sono pochissimi, 1% Gli n possono servire per varie cose, come regolazione ecc. Ci sono altri modi per dare variabilità, che può venire dallo stesso gene con modificazioni post-traduzionali e trascrizionali. CLONAGGIO DI UN NUOVO GENE Bisogna cercare delle sequenze che corrispondono a un milionesimo del genoma praticamente. Bisogna analizzare un gran numero di sequenze. Si va a ricercare la sequenza e si effettua l’isolamento di un singolo gene dal genoma. La sequenza da clonare rappresenta meno di un milionesimo del DNA totale. Necessari metodi per analizzare rapidamente e contemporaneamente un gran numero di sequenze. Metodi per isolare e separare la sequenza di interesse STRATEGIE Ridurre il DNA in frammenti di dimensioni appropriate e clonarli tutti trasformando l’intera miscela di vettori ricombinanti in cellule ospiti. Si genera così una GENOTECA, o library. Poi la genoteca viene analizzata con procedure che permettono di identificare la sequenza desiderata. Ci sono banche dati pubbliche su cui si possono ricercare le sequenze per poi generare dele sonde per la ricerca del gene. Identificazione della sequenza di interesse mediante sistemi bioinformatici GENOTECA o LIBRARY E’ una collezione disordinata di cloni di un microorganismo ospite nel quale abbiamo introdotto, con un vettore adeguato, tutto il genoma o trascrittoma di un organismo diviso in piccoli frammenti. TIPI DI GENOTECHE Genoteche genomiche = parliamo principalmente di queste Genoteche di cDNA Genoteche di espressione Genoteche per clonaggi funzionali DNA presente nel nucleo di una cellula Tutti gli RNA messaggeri trascritti da RNApolII Se si devono generare Genoteche di Il genoma deve essere transcrittomi: clonato e poi frammentato. Si genera il cDNA con trascrittasi inversa, poi si clona questo, in quanto non sono frammenti molto grandi, i messaggeri non sono molecole grandi. LIBRARY GENOMICA Si frammenta il DNA e lo si lega tramite ligasi con plasmidi, in cui si legano varie molecole con frammenti diversi, più grandi e più piccoli del genoma. Si può trasformare in batteri, si utilizzano come bioreattori dopo selezione ad esempio in terreno con ampicillina. Nella seconda immagine si osserva bene come ogni batterio abbia un plasmide diverso. È poco probabile che una molecola acquisisca più molecole di DNA per questo è probabile che uno ne abbia una diversa, e ognuno produca la propria colonia. LIMITI IN PLASMIDI Frammenti che si possono ottenere da digestione con EcoRI (dimensione media 4kb) dal genoma umano aploide sono circa 7x10^5 poichè il genoma è circa 2.8x10^6 kb. Perciò è probabile che il DNA di interesse sia spezzato in moltissimi frammenti molto piccoli, e andrebbe così ricostruito. La dimensione media di un gene è 10^-15kb, esoni di 200bp e gli introni sono enormemente variabili. FRAMMENTAZIONE Per ovviare questi problemi, come si ottengono frammenti casuali? Rottura meccanica: clonaggio è poi impossibile. Dunque si utilizza solitamente: Maniatis (1978) mise a punto la procedura con DIGESTIONE PARZIALE con DUE enzimi (HaeIII ed AluI con sequenza riconosciuta di 4 basi. Con digestione completa porterebbero a frammenti di 250bp). Ognuno riconosce solo frammenti di 4 basi. Digestione parziale con HaeIII ed AluI si possono ottenere frammenti compresi tra 10 e 30kb. Perché scegliere la digestione parziale ? Perché taglieranno casualmente a livello di uno o l’altro sito producendo una collezione di frammenti con regioni sovrapposte. Si selezionano poi i frammenti di una certa dimensione scartando quelli piccoli mediante elettrofo. Si intende mettere gli enzimi in soluzioni saline in modo che non riescano a tagliare in tutte le regioni del genoma, lasciandole anche in per un tempo inferiore e in concentrazioni basse. In molecole diverse vengono riconosciuti siti diversi dagli enzimi e in maniera casuale. Consideriamo il genoma con: HeeIII riconosce siti rossi AluI riconosce siti verdi In una molecola si ottiene la prima sequenza, fucsia-rosa-viola-lilla. Vengono frammentati e clonati per sequenziarli. Come capisco l’ordine all’interno del genoma? Si effettua proprio la digestione parziale. Nella molecola si ottiene nei siti neri, ma in un altra molecola si ottengono i tagli viola. In questo mado si ottengono dei frammenti detti sovrapposti, cioè si sequenziano tutti i vari frammenti per tutto il genoma umano e poi proprio come un puzzle si ricostruiscono i frammenti in base alle sovrapposizioni. Leggendo così la sequenza si può ricostruire l’ordine. Stiamo considerando geni grandi su cui non si può effettuare PCR. BATTEROFAGO LAMBDA La cosa più efficiente per trasformare è l’uso di un virus. Il batteriofago lambda permette di clonare frammenti grandi (circa 20kb) in maniera estremamente efficiente. I frammenti devono essere grandi per essere clonati, perché un piccolo frammento non riuscirà a formare un batteriofago perchè c’é un limite minimo e massimo nelle dimensioni del genoma di un fago. Con frammenti di 20 000 bp l’intero genoma potrebbe essere rappresentato in 1.4x10^5 cloni (2.8x109/20x10^3). Si fa frammentazione con digestione parziale. Si ottengono vari frammenti. Si tengono solo i più grandi e li si usano per inserirsi in batteriofagi che li portano all’interno del batterio. La sequenza si inserisce in una regione non essenziale del materiale genetico del batteriofago lambda. All’estremità del genoma ci sono le due regioni cos complementari che permettono di circolarizare all’interno del genoma dell’ospite. Bisogna dunque fare entrare il DNA in modo che ogni volta che il batterio si riproduca produca anche nuovi plasmidi con la sequenza di interesse. Si vuole che infettando con ogni fago lambda venga prodotto nuovo materiale. Viene eliminata la parte dell’integrasi con il sito ATT, in modo che non possa fare ciclo lisogenico ma solo litico. Viene così sostituita la parte che serve solitamente per dare ciclo lisogenico con la parte di target DNA. Le proteine del capside si autoassemblano se messe in soluzione, andando a costituire la testa. Con le proteine Nu1 e A viene tagliato il DNA e viene inserito all’interno della cellula. Così si possono usare i batteriofagi per infettare i batteri in una piastra. RECAP Si ha il genoma di interesse che viene ricombinato all’interno del DNA del batteriofago al posto delle sequenze che danno ciclo lisogenico. Si tolgono circa 20kb e vengono sostituite con una sequenza di più o meno le stesse dimensioni per permettere l’impacchettaento. La parte arancione è eliminata e sostituita dalla azzurra. Ci sono molte molecole diverse che vengono impacchettate in fagi. Lo si usa per infettare i batteri. Ci sono i geni per produrre nuovi batteriofagi che possono seguire il ciclo di lisi, così infettano i batteri di E. Coli adiacente. Sulla piastra si osserverà parte del DNA del batteriofago che va ad essere recuperato. Per capire in quali placche di lisi si trova il gene di interesse si può effettuare un’ibridazione. Si trasferiscono e immobilizzano le placche su un filtro, questo si appiccica ai batteriofagi. Si prende il DNA e si fissa. Poi viene effettuata l’ibridazione utilizzando una sonda (tanto si conosce la sequenza del genoma) che può essere sintetizzata con PCR. Si può così ricercare dove si trova la placca con il DNA. Nel momento in cui la piastra è tonda, appoggiando il filtro, deve essere bucherellato per orientarla e capire come era messa. NUMERO DI RICOMBINANTI DA ANALIZZARE Clarke e Carbon (1976) hanno formulato: N= ln(1-P)/ln(1-1/n) N=ricombinanti da analizzare; P=probabilità di includere una sequenza; Dunque la probabilità la scelgo io in base all’esperimento. n=rapporto tra grandezza del genoma e la dimensione media dei frammenti Es: Voglio ottenere una probabilità del 95% nel vaglio di una genoteca umana con frammenti di 20kb N= ln(1-0.95) = 4.2x105 ln(1-1/1.4x10^5) COSMIDI Contengono le sequenze cos per poter impacchettare il genoma all’interno della cellula e il plasmide di per sè, non vi è il resto del DNA fagico. Si possono clonare fino a 45kb, si è perso quasi tutto il genoma di lambda, mantenendo solo le sequenze cos. Si taglia con BamHI e si clona il DNA. Si formano grossi frammenti, e si formano concatenameri grazie alle sequenze cos. Si impacchetta e si inserisce nel DNA. Non può dare ciclo litico perchè sono stati eliminati i geni. Si sfrutta il fago per avere solamente alta efficienza di trasformazione. Appena entra nel batterio le sequenze cos permettono circolarizzazione e si forma il plasmide. Si ottengono così i batteri con il DNA inserito ad esempio on resistenza di ampicillina. È simile alla trasformazione ma con una dimensione molto grande, che non potrebbe entrare nel batterio con CaCl2 o elttroporazione, così si sfruttano i batteriofagi. BAC Cromosomi artificiali batterici (BACs), Possono portare frammenti di 100-300 kb, dunque costituitscono un livello ancora superiore. Derivati dal fattore sessuale F a singola copia in E.coli. Basso numero di copie (come F) ma sono stabili e facili da maneggiare. BACs sono tra i vettori più frequentemente usati per grandi inserti nei progetti di studio dei genomi. Deve esserci un’origine di replicazione diversa da ColE1 e delle sequenze Par che mantengono le copie di vettore. SCELTA DEL VETTORE plasmidi – di solito accettano inserti < 10,000 bp (10 kbp) fage lambda - 15 - 20 kbp inserts cosmidi - combinazione di plasmidi + fagi; inserti di circa 45 kbp BACs Bacterial Artificial Chromosomes – fino a 300,000 bp YACs Yeast Artificial Chromosomes – fino a 1,000,000 bp sono molto difficili da utilizzare HACs Human Artificial Chromosomes – fino a 20,000,000 bp IDENTIFICAZIONE DI DIVERSI INDIVIDUI IN BASE A DIFFERENZE GENOMICHE Problema : una persona è affetta da una patologia infettiva al sistema respiratorio Più di 10 diversi batteri patogeni possono esserne la causa. Devo identificarlo nel più breve tempo possibile per iniziare il trattamento terapeutico opportuno. PCR MULTIPLEX Primers specifici per ogni agente patogeno che amplificano frammenti di dimensioni diverse. I primers devo essere progettati per potere lavorare insieme: identiche Tm, simili efficienze. Facendo poi una PCR su gel di agarosio si possono distinguere i diversi fattori patogeni. Non è facile disegnare questi primer diversi che lavorino a temperature di melting uguali, dato che si fa un’unica PCR. Si va ad amplificare. Si ha un controllo in cui si hanno gli stessi primer ma con tutti gli agenti patogeni, per vedere come vengono amplificati. In base a dove si trova la barra del paziente si capisce quale agente patogeno ha il paziente. Sono tra le analisi più efficienti per capire POLIMORFISMI ≠ MUTAZIONE Polimorfismi del DNA = differenze nella sequenza di DNA in diversi individui, possono essere in regioni codificanti o non. Due o più alleli ad un locus la cui frequenza nella popolazione è >1% Polimorfismi di singoli nucleotidi o in regioni ripetute. Variazioni più rare sono definite mutazioni e spesso sono legate a malattie. Sono la causa di tutte le varie differenze nei fenotipi degli individui. DNA MINISATELLITE Forma raggruppamenti di lunghezza fino a 20 kb con una unità ripetuta di 10-100 bp. DNA ripetuto in tandem, non trascritto, di modeste dimensioni e disperso Il significato dei minisatelliti non è ancora chiaro, sebbene si ritenga che siano dei punti caldi nella ricombinazione omologa nelle cellule umane. MICROSATELLITI I microsatelliti sono corti circa 150bp. La sequenza ripetuta è molto semplice e consiste di 2,3,4 nt che possono essere ripetuti da 10 a 100 volte. Il DNA microsatellite tende ad essere polimorfico si trovano nel DNA intergenico, introni ma anche in regioni codificanti dei geni La ripetizione può essere patologica, ad esempio nelle Glutammine Su queste si basano i test di paternità. PERCHÈ CI SONO? Il cromosoma paterno ha 6 ripetizioni. Durante il crossing over può essercene uno impari, che invece ad esempio di arrivare ad accoppiarsi fino all’1 si ferma al 3 perchè trova una sequenza abbastanza complementare. Si ottengono così due gameti con ripetizioni differenti, dovute a crossing over ineguali. Ci sono cellule germinali con 8 e 4 ripetizioni invece che 6 e 6. È casuale, per questo individui diversi hanno ripetizioni diverse. Esempio Un microsatellite ha ripetizioni di 3bp e viene trovato nella popolazione con la seguente frequenza: 7% 18 ripetizioni 11% 16 ripetizioni 43% 14 ripetizioni 36% 13 ripetizioni 4% 10 ripetizioni PROBLEMA: Come riesco a distinguere due individui della stessa specie se un’alta percentuale del loro genoma è identico? VNTR, Variable Number of Tandem Repeats sono lunghi più di 16 basi (103 per genoma) STR, Short Tandem Repeats sono lunghi da 2 a 4 basi (105 per genoma) Gli alleli A and B al locus X differiscono per il numero di ripetizioni di minisequenze (tandem repeats) La sonda (probe) 1 – una sonda single-locus - identifica un tratto di DNA esclusivo di un locus La sonda (probe) 2 –una sonda multiple-locus – identifica tratti di DNA che si ripetono in più loci Una famiglia tipizzata per un polimorfismo VNTR con sonda a singolo locus. Bristol 1987: primo uso del DNA fingerprinting per correlare un furto ad uno stupro. Utilizzo di una sonda che riconosce loci multipli (VNTR). Il pattern di bande che si ottiene è molto complesso: Dimostrare l’innocenza è semplice mentre la certezza dell’attribuzione dell’identità di un sospetto è legata al calcolo della probabilità. Le sonde a locus singolo sono più semplici da analizzare, si è passati da analisi di 10 loci (probabilità di identità casuale tra due persone è inferiore a 1 su 109). USA usano13 sonde. Inoltre con le sonde a locus singolo si può applicare PCR prima dell’ibridazione per amplificare il campione quando è scarso come nella scena del crimine. Nel momento in cui si raccoglie il DNA nel luogo del crimine bisogna avere sia il DNA della vittima sia del sospetto, perché il primo potrebbe essere contaminante. Si può arrivare a lavorare su loci diversi che possono costituire un’analisi estremamente utile. PATERNITÀ CORNUTO DATAZIONI E RICOSTRUZIONI STORICHE Francia 1999: origine dei vitigni del Nord-est è stata analizzata utilizzando 17 microsatelliti. Dimostrarono che le 16 diverse piante di vite derivavano da due varietà. Il DNA mitocondriale contiene VNTR: viene ereditato solo dalla madre ed identico tra fratelli; è piccolo (16-20kb) e presente in migliaia di copie per cellula; più resistente del genomico. Si è confermato l’identità di resti umani come quelli dello zar e della sua famiglia; identità di vittime di incidenti