Confronti Tra Medie - Appunti PDF
Document Details
Uploaded by SophisticatedExpressionism516
Università degli Studi di Milano
Alberto Bertoncini
Tags
Summary
Questi appunti forniscono un'introduzione ai test statistici per confrontare le medie di due o più gruppi. Vengono descritte diverse tipologie di confronti e vengono illustrati esempi pratici, con dettagli sulle ipotesi e sulla determinazione dei valori critici.
Full Transcript
INFORMATICA E BIOSTATISTICA Anno Accademico 2024-2025 Dott. Alberto Bertoncini CONFRONTI TRA MEDIE TIPOLOGIE DI STUDIO: 1)Media di un singolo gruppo (campione) confrontata con la media della popolazione 2)Questo con due casi...
INFORMATICA E BIOSTATISTICA Anno Accademico 2024-2025 Dott. Alberto Bertoncini CONFRONTI TRA MEDIE TIPOLOGIE DI STUDIO: 1)Media di un singolo gruppo (campione) confrontata con la media della popolazione 2)Questo con due casi distinti di situazioni: σ noto σ ignoto 3)Medie di due gruppi di osservazioni (campioni) che possono essere 4)Indipendenti: raccolti per due popolazioni o trattamenti 5)Appaiati: (a coppie): i dati possono essere raccolti Per due trattamenti a ciascuna unità campionaria Per due unità campionarie appaiate in base ad alcune variabili (es: età peso, ecc...) Dott. Alberto Bertoncini CONFRONTI TRA MEDIE Media di un singolo gruppo confrontata con la media della popolazione – σ noto Si utilizza la statistica Si ottiene il P-value dalle tavole della distribuzione Z Si verifica l’intervallo di confidenza al 95% utilizzando le formule note: Dott. Alberto Bertoncini CONFRONTI TRA MEDIE Problema: Variabile = concentrazione di urea nel sangue di bovini Campione di 10 animali: media = 22 mg/100 ml. In letteratura: ampia indagine → μ= 25; σ2 = 45. Domanda: posso affermare che il campione proviene da una popolazione con media 25 e varianza 45? Ipotesi nulla: il campione proviene dalla popolazione normalmente distribuita con μ= 25; σ2 = 45 H0:μ=μ0=25mg μ=media del campione μ0=media della popolazione Livello di significatività: α=0.05 Si utilizza il test a 2 code Valore critico: Z = 1.96, Z=-1.96 Dott. Alberto Bertoncini CONFRONTI TRA MEDIE Dai risultati ottenuti sia con la statistica test (1) sia con il P-value (2) si giunge alla medesima conclusione (1) z non supera il valore critico di -1.96 ► accetto H0 (2) P(z = -1.41 ) = 0.079, 0. 079 x 2 = 0. 158 > α = 0. 05 ► accetto H0 Accetto l’ipotesi nulla (ossia la media del campione è uguale a quella della popolazione) Gli intervalli di confidenza al 95% della media della popolazione sono: I1 = 22 - 1.96 * 2.12 = 17.84 mg/100 ml I2 = 22 + 1.96 * 2.12 = 26.15 mg/100 ml Siamo fiduciosi al 95% che i limiti di 17.84 e 26.15 mg/100 ml contengono la media della popolazione che è pari a 25 mg/100ml Dott. Alberto Bertoncini CONFRONTI TRA MEDIE Media di un singolo gruppo confrontata con la media della popolazione – σ non noto Si utilizza la statistica Si ottiene il P-value dalle tavole della distribuzione t Si verifica l’intervallo di confidenza al 95% utilizzando le formule note Dott. Alberto Bertoncini CONFRONTI TRA MEDIE In un campione di 36 suini è stato rilevato l’incremento medio ponderale giornaliero (IMPG, Daily Weight Gain = DWG) e si sono ottenuti i seguenti risultati L’IMPG calcolato sulla popolazione è di 607g C’è differenza tra i 2 valori? Dalle tavole: t(α=0.05, 35GL) compreso tra 2.042 e 2.021 T=2.51 > t tabulato ►Rifiuto H0 Dott. Alberto Bertoncini CONFRONTI TRA MEDIE L’intervallo di confidenza al 95%: t(n-1, α=0.05)=t(35, α=0.05)=2.03 599.194 ± 2.03 * 3.109 = (592.8, 605.5) Sono i limiti entro cui dovremmo trovare la media della popolazione (μ = 607) da cui è stato tratto il campione di 36 suini e che non comprende il valore di 607: i 36 suini non provengono (probabilmente) da una popolazione con un IMPG di 607 g Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Medie di 2 gruppi di osservazioni che possono essere Indipendenti: le unità sperimentali sono assegnate casualmente a due trattamenti Appaiati: i due trattamenti sono applicati a ciascuna unità sperimentale Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Sono campioni indipendenti estratti da popolazioni normalmente distribuite, con media μ1 e μ2, e con varianza non nota Si valuta se le differenze osservate tra le medie di 2 campioni sono troppo grandi per essere attribuite al caso: 1)Si formula un’ipotesi nulla: nella maggior parte dei casi si testa se le medie delle 2 popolazioni sono uguali 2)Si stabilisce il livello di probabilità, soglia α 3)Si calcola la probabilità di ottenere una coppia di medie così differenti 4)Se la probabilità è più piccola di α, rifiutiamo l’ipotesi nulla Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Statistica che si utilizza per il confronto di campioni indipendenti gl (gradi di liberà) è la somma dei gradi di libertà dei due campioni: (n1-1)+(n2-1) = n1+n2-2 S è l’errore standard della differenza tra le medie dei due campioni Per calcolarla è necessario calcolare la varianza ponderata Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI La tabella riporta: In alto: aree sotto la curva solo per alcune probabilità α A sinistra: i gradi di libertà Esempio Per un determinato valore di g.l., il valore della tabella rappresenta il valore di t che delimita il 5% della distribuzione (2.5% per parte) Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI È stato misurato il cortisolo ematico in 18 cani, 9 maschi e 9 femmine. Ci si chiede se il sesso influenza il livello di cortisolo. Sono stati ottenuti i seguenti risultati Domanda: le medie dei 2 sessi differiscono in modo significativo? Livello di significatività: α = 0.05 Utilizziamo la statistica test t-student Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Nella figura sono riportate la distribuzione t con g.l. =16 e le due aree di rifiuto dell'ipotesi nulla, che sommate sono pari al 5% I valori assunti da t che delimitano le due aree sono -2.1199 e +2.1199 Il valore relativo alla differenza tra le medie dei sessi è pari a -0.46 e quindi compreso nella regione di accettazione di H0 USO DELLE TAVOLE Si cerca il valore di t ottenuto per i gl in esame (16) e α =0.05 ► t = 2.120 Lo si confronta con il valore di t relativo alla differenza tra le medie ► 0.46 (in valore assoluto data la simmetria della distribuzione e dal fatto che la tavola in uso riporta il valore considerato per entrambe le code sommate, test bilaterale. Cosa fare con tavola solo destra?) Quindi: t tabulato > t trovato ► accetto H0 Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Esercizio 1 Un commerciante verifica la durata di due diverse marche di lampadine. Con 8 lampadine della marca A ottiene una media = 1237 ore con s = 36; con 7 lampadine della marca B ottiene una media di 1036 ore con s = 40. A fronte di tale risultato il commerciante vuole sapere se la differenza tra le due medie è tale da poter affermare con una probabilità del 95% che le lampadine di marca A hanno una durata superiore a quelle di marca B. Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Esercizio 1 – Soluzione 1. Formulazione delle ipotesi: H0: μa=μB H1: μa>μB 2. Calcolo di t: Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Esercizio 1 – Soluzione 3. Determinare i valori critici: Il livello di significatività richiesto è α=0.05, ricordandosi che il test è unidirezionale (controllo la coda di destra), i gradi di libertà sono 13, quindi il valore critico è t=1.771 4. Decisione Poiché tcal = 10.25 è maggiore del valore critico t=1.771, dobbiamo ricettare l’ipotesi H0. Le lampadine della marca A sono migliori (per durata) di quelle della marca B Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Confronto tra medie per dati appaiati Un ricercatore si chiede se il livello medio dell’ematocrito cambia negli atleti dopo che hanno svolto una attività fisica intensa Rileva l’ematocrito prima e dopo la gara Ogni individuo fornisce due osservazioni Ogni coppia di osservazioni (prima e dopo la gara, per ciascun individuo) ha un fattore in comune: l’individuo sulla quale è stata rilevata Se quindi ci sono 2n osservazioni, ma solo n atleti, non possiamo assumere che ci siano 2n osservazioni indipendenti come se fossero stati 2n atleti. Le due osservazioni sullo stesso soggetto non sono indipendenti, perché influenzate da fattori individuali comuni Per esempio, se un atleta ha normalmente un basso livello di ematocrito, lo avrà anche basso rispetto agli altri dopo la gara: conoscendo il primo valore posso prevedere in parte il secondo Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Il test t per dati appaiati si riduce ad un semplice test t dopo aver calcolato la differenza tra le misure effettuate su ogni unità sperimentale d è la differenza media tra le osservazioni di ogni unità ESd è l’errore standard della differenza: Data l’ipotesi nulla, la statistica t ha una distribuzione t con gl = n-1 Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI In molte specie i maschi hanno maggiori possibilità di attrarre le femmine se presentano elevati livelli di testosterone. Un’ipotesi è che i maschi con più elevati livelli di testosterone siano più vulnerabili alle malattie. Per verificare questa ipotesi, un gruppo di ricercatori hanno aumentato sperimentalmente i livelli di testosterone di 13 maschi di merlo alirosse (Agelaius phoeniceus), impiantando un tubicino permeabile contenente testosterone. Il livello anticorpale (ln[mDO/min]) è stato misurato prima e dopo l’impianto Poiché 1.27 < 2.18, accetto H0: il testosterone non ha effetto sull’immunocompetenza dei maschi Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Esercizio La tabella mostra la pressione sistolica misurata ad 11 pazienti ipertesi dopo la somministrazione di placebo e di idroclorotiazide. In base ai risultati osservati, vi è una qualsiasi evidenza di una differenza nella pressione media sistolica sanguigna a seguito di questi due trattamenti? Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Esercizio - soluzione 1. Formulazione delle ipotesi 2. Calcolo del valore t Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Esercizio - soluzione 3. Determinazione dei valori critici Assumiamo un livello di significatività di α=0.05, i gradi di livertà sono 10, quindi il valore critico è t=2.228 (stavolta verifichiamo su una tabella unilaterale, cercando la significatività, destra o sinistra, dello 0.025) 4. Decisione Poiché tcal = 6.08 è maggiore del valore critico t = 2.228 dobbiamo rigettare l’ipotesi H0 La pressione dei pazienti a cui è stato somministrato idroclorotiazide è statisticamente diversa dalla pressiona dei pazienti a cui è stato somministrato il placebo Dott. Alberto Bertoncini