PDF Genetica I - Giampiero Valè̀
Document Details

Uploaded by TolerableJoy8307
Università del Piemonte Orientale
Giampiero Valè̀
Tags
Summary
Questo documento tratta i principi della genetica quantitativa. L'autore, Giampiero Valè̀, introduce i concetti di base come i caratteri, i geni e l'ereditabilità, esplorando come l'ambiente influenza la variabilità dei caratteri e come i metodi statistici siano fondamentali per l'analisi e la comprensione dei fenomeni genetici.
Full Transcript
GENETICA I Giampiero Valè Genetica quantitativa. Concetti statistici. Distribuzioni fenotipiche dei caratteri quantitativi. Varianza fenotipica e ereditabilità I caratteri qualitativi, o discontinui, si manifestano in un ristretto numero di fenotipi, ben distinti fra loro Molti caratteri degli...
GENETICA I Giampiero Valè Genetica quantitativa. Concetti statistici. Distribuzioni fenotipiche dei caratteri quantitativi. Varianza fenotipica e ereditabilità I caratteri qualitativi, o discontinui, si manifestano in un ristretto numero di fenotipi, ben distinti fra loro Molti caratteri degli organismi viventi variano in modo continuo lungo una scala di variazione in cui ci sono molti fenotipi che si sovrappongono: Ci riferiamo a questi caratteri parlando di caratteri quantitativi, perché ogni singolo fenotipo può essere descritto da una misura. Esempi di caratteri quantitativi sono la statura, il peso corporeo e la pressione sanguigna nell’uomo, il tasso di crescita nei topi, il peso dei semi nelle piante, la produzione di latte nel bestiame ecc. Sono poligenici, additivi, influenzati dall’ambiente La base poligenica aumenta il numero di combinazioni alleliche e di fenotipi Se il carattere è poligenico allora sono possibili molti genotipi, parecchi dei quali producono lo stesso fenotipo. Per esempio, consideriamo una pianta la cui altezza è determinata da tre loci (A, B e C) ciascuno dei quali ha due alleli. Assumiamo che un allele in ciascun locus (A+, B+ e C+) codifichi per un ormone della pianta che la fa crescere di 1 cm al di sopra dell’altezza normale di 10 cm Se consideriamo tutti e tre i loci arriviamo a 33 = 27 possibili genotipi complessivi Anche se ci sono 27 genotipi, questi producono solo sette fenotipi Man mano che aumenta il numero dei loci che codificano per determinati caratteri, aumenta anche il numero dei potenziali fenotipi e diventa più difficile distinguere le differenze fra singoli fenotipi L’influenza dell’ambiente su un carattere può ulteriormente complicare la relazione fra genotipo e fenotipo. A causa degli effetti ambientali, lo stesso genotipo può produrre una varietà di potenziali fenotipi, e i fenotipi prodotti da diversi genotipi possono arrivare a sovrapporsi, rendendo difficile sapere se le differenze fra fenotipi sono dovute a cause genetiche o ambientali impossibile assegnare con sicurezza un genotipo a un individuo solo sulla base del suo fenotipo Esperimento di Johannsen sul peso del seme di fagiolo in linee pure Esperimenti di Nillson-Ehle sul colore della cariosside di frumento: osservò un rapporto 15:1 nella F2, ma classificando le diverse sfumature di colore ottenne una segregazione con rapporto 1:4:6:4:1 Sulla base di questa osservazione Nillson-Ehle propose l’ipotesi poligenica: un carattere quantitativo (QT, quantitative trait) è sotto il controllo di molti loci, gli alleli di ciascuno dei quali contribuiscono in maniera quantitativa al carattere. - I fenotipi bianchi e rossi sono codificati ciascuno da un solo genotipo, mentre gli altri fenotipi possono derivare da più genotipi diversi - Quando il numero di loci interessati è maggiore di due, si può avere un numero maggiore di fenotipi e alla fine può sembrare che il colore vari in modo continuo Effetti additivi nei geni che determinano QT Quindi, un QT è sotto il controllo di molti loci, i cui alleli contribuiscono in maniera più o meno additiva al carattere Per contributo additivo si intende che a un locus A con, nel caso più semplice, due alleli (A e a), l’allele A aggiunge al fenotipo basale una quantità d, mentre a non aggiunge nulla. Quindi un individuo AA avrà un fenotipo pari a base (a) + 2d, un individuo Aa avrà fenotipo base + d ecc Assumendo che anche alleli a un locus B abbiano lo stesso effetto, per la proprietà additiva, gli individui Aa bb e aa Bb avranno lo stesso fenotipo. e.g. AA=10 cm; aa=5cm effetto additivo=(10-5)/2=2,5cm, qdi Aa sarà 7,5 cm L’insieme di geni che costituiscono la base ereditaria di un carattere a variabilità continua viene detto sistema poligenico. La vasta gamma di fenotipi che si riscontra per un QT è dovuta alla segregazione degli alleli ai diversi loci: questo fa sì che il numero di genotipi per il QT sia molto elevato, anche se il numero di geni coinvolti non è elevato 2 geni: 16 combinazioni gametiche; 9 combinazioni uniche di alleli 4 geni: 256 combinazioni gametiche nel tetraibrido; 81 genotipi unici possibili 3 geni: 64 combinazioni gametiche; 27 combinazioni uniche di alleli Con 1 gene abbiamo 3 classi diverse per numero di alleli dominanti Quando molti loci influenzano un carattere, ci sono molti genotipi possibili e così la relazione fra genotipo e fenotipo diventa meno Con 2 geni abbiamo 5 classi scontata. Man mano che diverse per numero di alleli aumenta il numero di loci che dominanti influenzano un carattere, Con 5 geni abbiamo 11 classi aumentano anche le classi di diverse per numero di alleli fenotipi nella F2 dominanti Per spiegare l’uso di questo sistema supponiamo di incrociare due diverse varietà di piselli omozigoti che si differenziano in altezza di 16 cm X Varietà A alta cm 4 Varietà B alta cm 20 F1 F2 ……………………………600 piante F2 1/256 piante hanno altezza = a varietà B: ipotesi di 4 geni implicati METODI STATISTICI PER L’ANALISI DEI CARATTERI QUANTITATIVI Le distribuzioni La variazione fenotipica in un gruppo può essere adeguatamente rappresentata da una distribuzione di frequenza. In una tipica distribuzione di frequenza le classi fenotipiche sono rappresentate sull’asse orizzontale (x) e i numeri (o le proporzioni) sull’asse verticale (y). Un esempio di distribuzione di frequenza Unendo con una linea i punti della distribuzione di frequenza si ottiene una curva caratteristica di quella distribuzione. Molti caratteri quantitativi presentano una curva simmetrica che prende il nome di distribuzione normale o gaussiana. Due altri tipi comuni di distribuzione sono l’asimmetrica e la bimodale Campioni e popolazioni Il gruppo di interesse, chiamato popolazione, è spesso troppo grande per una rilevazione completa. Una soluzione consiste nel misurare un gruppo più piccolo di individui, detto campione, e usare queste misure per descrivere la popolazione nel suo insieme Il campione deve soddisfare alcune condizioni: 1) Deve essere rappresentativo dell’intera popolazione; 2) Deve essere abbastanza grande affinché le differenze casuali fra gli individui compresi nel campione e la popolazione totale non alterino la stima della misura attribuita alla popolazione La media La media fornisce delle informazioni circa il punto centrale della distribuzione Formula della media xi= singoli valori di x n= numero totale dei valori del campione La stragrande maggioranza dei caratteri presenta una distribuzione di frequenze denominata distribuzione gaussiana (o normale) descritta da due statistiche: la media (indica dove è localizzato il centro della distribuzione) e la varianza o la deviazione standard La varianza e la deviazione standard La varianza (s2 o δ2 ) si definisce come la media del quadrato degli scarti E’ sempre positiva e assume valori tanto più elevati all’aumentare della dispersione dei dati intorno alla media n-1= gradi di libertà: numero di osservazioni indipendenti Il valore al numeratore di s2 si chiama devianza o Sum of squares (SQ o SS) ed è definita dalla formula: Deviazione standard, s (o scarto quadratico medio): è la radice quadrata della varianza Mentre la varianza è espressa in unità al quadrato, la deviazione standard è espressa nelle stesse unità di misura dei valori originali; per questo motivo spesso si preferisce quest’ultima per descrivere la variabilità di una distribuzione Alcune distribuzioni possono avere la stessa media ma varianze diverse s=0,5 s=1 s=2 Una distribuzione normale è simmetrica; pertanto la media e la deviazione standard sono sufficienti a descriverne la forma 99,7% dati 95,4% dati Media +/- s include 68,27% dati La correlazione Il coefficiente di correlazione (indicato con r) misura il tipo di relazione tra due variabili, es relazione tra la statura dell’uomo (x) e la lunghezza delle braccia (y) Per calcolare r, si deve prima determinare la covarianza (cov) di x e y: n= numero di coppie xy Il coefficiente di correlazione (r) si ottiene dividendo la covarianza di x e y per il prodotto delle deviazioni standard di x e y: Il coefficiente di correlazione può variare fra –1 e +1. Caratteristiche di r 1) Un valore positivo significa che c’è un’associazione fra le variabili; 2) Un coefficiente di correlazione negativo indica che esiste una relazione inversa fra le due variabili 3) Il valore assoluto del coefficiente di correlazione descrive la forza dell’associazione fra le due variabili; valori di r vicini a –1 o a +1 indicano un forte legame fra le variabili: un cambiamento in x è quasi sempre associato a un cambiamento proporzionale in y; 4) un coefficiente di correlazione vicino a 0 indica una debole correlazione: un cambiamento in x è solo raramente associato a un cambiamento in y Caratteristiche di r 5) Si può calcolare il coefficiente di correlazione per due variabili misurate nello stesso individuo, come la statura (x) e il peso (y), oppure per la stessa variabile misurata in coppie di individui 6) Una correlazione fra due variabili indica solo che sono associate; non implica che ci sia una relazione causa-effetto fra di loro 7) La correlazione non significa che i valori delle due variabili siano gli stessi; significa solo che un cambiamento in una variabile è associato a un cambiamento proporzionale nell’altra. Per esempio, nell’elenco a lato le variabili x e y sono quasi perfettamente correlate, con un coefficiente di correlazione di 0,99 La regressione: indica l’analisi delle relazioni di causa-effetto che intercorrono tra due o più variabili, di cui una (variabile indipendente, x) non presenta variabilità, mentre l’altra (variabile dipendente, y) è il carattere in studio La relazione tra le due variabili è espressa sotto forma di una retta di regressione che può essere rappresentata dalla equazione: y= b0 + b1x x e y= valori delle due variabili b1= coefficiente di regressione (pendenza della retta) b0= intercetta sull’asse delle y (valore atteso di y quando x=0) Per il calcolo della regressione serve la somma dei prodotti degli scarti dalla media, calcolata per le coppie dei dati corrispondenti: codevianza (SP, sum of products), che si calcola con la seguente formula: n= numero di coppie di osservazioni Devianza o SS Il parametro b1 (coefficiente di regressione) si calcola: b1=SPxy/SSx Mentre l’intercetta sull’asse delle y sarà: b0 Es siamo interessati a conoscere la relazione tra il peso di topi di laboratorio e un’aggiunta proteica alla dieta; la variabile indipendente (x) è la dose di proteine, quella dipendente (y) è il peso dei topi X Y Calcoliamo la devianza delle x (SQx o SSx): SSx= (12 + 22 +32 +42 +52) – 152/5=10 Calcoliamo la codevianza x-y: SPxy=[(1x21,1)+(2x21,9)+(3x23,0)+(4x22,8)+(5x23,1)] – (15x111,9)/5=4,9 Quindi, b1=SPxy/SSx= 4,9/10= 0,49 b0 = 22,38 – (0,49 x 3)= 20,91 Coefficiente di determinazione E’ il rapporto tra devianza dovuta alla regressione e la devianza totale della variabile in studio: R2=SSb1/SSy Quindi R2 descrive quanta parte della variabilità presente nella popolazione per un carattere sia dovuta a differenze nel genotipo a quel locus R2 varia tra 0 ed 1: quando è 0 il modello utilizzato non spiega per nulla i dati; quando è 1 il modello spiega perfettamente i dati VARIANZA GENETICA E EREDITABILITA’ Componenti della varianza fenotipica La varianza fenotipica totale è indicata con Vp o Questa variabilità è il risultato sia delle differenze tra i genotipi degli individui, quindi variabilità genetica, sia delle differenze dovute agli effetti ambientali Si può quindi indicare un modello lineare: A livello del singolo individuo, il valore del carattere x sarà quindi dato da: xi= µ + Gi + Ej µ: media generale del carattere nella popolazione Gi:effetto del genotipo dell’individuo Ei: effetto dell’ambiente in cui si trova l’individuo Una ulteriore fonte di variazione: la interazione genotipo x ambiente La varianza da interazione genetico- ambientale (Vge) si osserva quando l’effetto di un gene dipende dalle caratteristiche specifiche dell’ambiente in cui si trova. In questo caso la variabilità fenotipica non può essere attribuita direttamente a componenti genetiche o ambientali, poiché c’è un’interazione fra queste componenti In sintesi la varianza fenotipica totale può essere suddivisa in tre componenti: Vp= VG + VE + VGE Componenti della varianza genetica Varianza genetica additiva (VA): comprende gli effetti additivi dei geni sul fenotipo La varianza genetica additiva determina essenzialmente la somiglianza fra genitori e progenie. Per esempio, se tutta la varianza fenotipica è dovuta alla varianza genetica additiva, allora il fenotipo medio della prole sarà esattamente intermedio fra quelli dei genitori. Varianza genetica di dominanza (VD): quando gli alleli in alcuni geni sono legati da relazioni di dominanza/recessività Varianza di interazione genica (VI): i geni di differenti loci possono interagire nello stesso modo in cui interagiscono gli alleli di uno stesso locus Un’equazione riassuntiva della varianza totale Possiamo quindi integrare queste componenti in una sola equazione che rappresenta tutti i potenziali contributi alla varianza fenotipica: VP= VA + VD + VI + VE + VGE Ereditabilità Ereditabilità in senso lato (H2) rappresenta la proporzione della varianza fenotipica ascrivibile alla varianza genetica ed è calcolata dividendo quest’ultima per la varianza fenotipica: NBNB: IL SIMBOLO H2 RAPPRESENTA L’EREDITABILITÀ ED ESSENDO UNA MISURA DELLA VARIANZA SI ESPRIME IN UNITÀ AL QUADRATO. L’ereditabilità in senso lato può assumere valori compresi fra 0 e 1. L’ereditabilità in senso stretto (h2) è uguale alla varianza genetica additiva divisa per la varianza fenotipica: Stima dell’ereditabilità Per stimare H2 bisogna pianificare un esperimento con incrocio mendeliano Le varianze per il carattere misurate a livello di P1, P2 e F1 sono stime della variabilità ambientale, e quindi si può stimare quest’ultima da una media delle tre: Mentre la variabilità nella F2 fornisce una stima della variabilità totale La variabilità genetica si ottiene sottraendo alla variabilità della F2 la componente ambientale E quindi si può infine stimare la ereditabilità Un esempio: stima dell’ereditabilità delle chiazze bianche nelle cavie Varianza fenotipica delle chiazze bianche in una popolazione geneticamente variabile: VP= 573 Quindi le cavie sono incrociate per molte generazioni per farle diventare geneticamente identiche. Misurata la varianza fenotipica per le chiazze bianche: 340. VG del gruppo = 0, quindi la loro VP = VE=340 A questo punto si può stimare la varianza genetica: E’ quindi possibile stimare l’ereditabilità in senso lato a partire dalla varianza genetica e fenotipica: Stima dell’ereditabilità mediante regressione tra genitori e progenie Si è dimostrato matematicamente che in una regressione del fenotipo medio della progenie rispetto al fenotipo medio genitoriale, l’ereditabilità in senso stretto è uguale al coefficiente di regressione: h2= b(regressione della progenie media rispetto alla media dei parentali) b1=SPxy/SSx Codevianza xy/devianza delle x Perciò il coefficiente di regressione fornisce informazioni circa il livello di ereditabilità di un dato carattere. SELEZIONE ARTIFICIALE E RISPOSTA ALLA SELEZIONE La selezione artificiale ha prodotto l’enorme diversità di forme, dimensioni, colori e comportamenti che ad esempio si osservano attualmente nelle razze di cani domestici. Il diagramma rappresenta le relazioni evolutive fra i lupi e le varie razze di cani a partire dalle analisi delle sequenze di DNA. Differenziale di selezione e risposta alla selezione Differenziale di selezione (DS): differenza fra la media fenotipica dei genitori selezionati e la media fenotipica della popolazione originale Risposta alla selezione (RS): differenza tra la media del carattere nella generazione selezionata e la media nella generazione di partenza; è determinata da ereditabilità in senso stretto e intensità di selezione La risposta alla selezione (RS) dipende dall’ereditabilità in senso stretto (h2) e dal differenziale di selezione (DS): RS= h2 x DS es, calcolo della risposta alla selezione per il numero delle setole addominali in D. melanogaster: Stima dell’ereditabilità in senso stretto del carattere nella popolazione: 0,52 Numero medio di setole nella popolazione originale : 35,3 Selezionati individui con numero medio di setole pari a 40,6 e incrociati fra loro per produrre la generazione successiva DS= 40,6 – 35,3= 5,3 RS=0,52 x 5,3= 2,8 Numero medio atteso di setole addominali: 35,3 + 2,8 = 39,1 (in realtà ne riscontrarono 37,9) Rielaborando l’equazione RS=h2 x DS si ottiene un altro modo per calcolare l’ereditabilità in senso stretto: h2= RS/DS, definita ereditabilità realizzata Uno degli esperimenti più prolungati di selezione è costituito da uno studio sui contenuti di olio nei semi di mais; questo esperimento ha avuto inizio presso la University of Illinois su 163 spighe di mais Le analisi genetiche delle linee ad alto/ basso contenuto di olio RIVELARONO CHE ALMENO 20 LOCI PRENDONO PARTE ALLA DETERMINAZIONE DEL CONTENUTO DI OLIO NEI SEMI DI MAIS Limite della risposta alla selezione La risposta di una popolazione alla selezione spesso si uniforma a un determinato livello nel corso del tempo. In un esperimento di risposta alla selezione per l’aumento delle setole delle chete nelle femmine di Drosophila, il numero è aumentato costantemente per circa 20 generazioni, poi si è stabilizzato. Limite della risposta alla selezione: 1) esaurimento della variazione genetica nella popolazione; a un certo punto, tutti gli individui sono diventati omozigoti per gli alleli che codificano per il carattere selezionato. 2) A volte la risposta alla selezione può andare a zero anche se nella popolazione è rimasta un po’ di variabilità genetica. Questo perché si crea un conflitto fra la selezione artificiale e la selezione naturale. È possibile dimostrare che il valore limite di RS per la risposta alla selezione, detto RSmax è dato da: Correlazioni genetiche tra diversi caratteri quantitativi in diversi organismi CENNI SUL CONTRIBUTO DELLA GENETICA MOLECOLARE NELLO STUDIO DEI CARATTERI QUANTITATIVI Alcune caratteristiche dei QTL Gli alleli dei QTL sono spesso alleli di loci qualitativi Molti QTL hanno piccoli effetti sul fenotipo, pochi hanno effetti rilevanti Gli alleli deleteri sono rari Presentano relazioni di dominanza, ma la maggior parte è di tipo additivo Mutazioni in geni di una catena metabolica possono rappresentare QTL Le regioni cromosomiche dove mappano i geni che controllano i caratteri poligenici prendono il nome di loci per i caratteri quantitativi (QTL) Requisiti per il mappaggio di QTL: 1) Numeri elevati di marcatori molecolari che coprono il genoma in analisi; 2) Segreganti per il fenotipo in esame (da incrocio tra individui con fenotipo contrastante o fenotipi contrastanti presenti in una popolazione); 3) Misurazione dei caratteri fenotipici da mappare; 4) Ricerca di correlazioni tra un allele marcatore e un fenotipo quantitativo Esempio di mappaggio di QTL T1 mediante T2 T1 analisi di T2 linkage indipendente Stima del linkage tra marcatore e carattere bo=y-bx 134,44 –(-77,5 x 1,5) =134,44 + 116,25=250,69 Mappatura dei QTL mediante analisi di associazione La procedura si basa sul principio del Linkage disequilibrium (LD): indica la presenza di associazione non casuale, statisticamente significativa, tra geni, marcatori, geni e marcatori, che costituiscono di solito un particolare aplotipo ancestrale, diffuso nella popolazione in cui è rilevato perché trasmesso lungo la discendenza da un comune progenitore. Per questo approccio vengono utilizzate popolazioni naturali (o costituite ad hoc) a incrocio casuale, quindi anche nell’uomo, senza richiedere la presenza di generazioni segreganti Linkage aequilibrium Linkage disequilibrium Principi del linkage disequilibrium e association mapping Linkage disequilibrium Association mapping aplotipi Nel mappaggio per associazione si possono identificare due approcci Approccio dei geni candidati: i polimorfismi vengono utilizzati all’interno dei geni candidati; con questo termine si intendono quei geni che sulla base della funzione della proteina codificata hanno elevata probabilità di essere coinvolti nel processo in studio Approccio genome wide association study (GWAS): grazie a numeri molto elevati di marcatori molecolari (in genere SNP) la ricerca di associazioni è condotta sull’intero genoma Un esempio di analisi di associazione per geni candidati Gene X Gene Y