Summary

Questi appunti forniscono un'introduzione ai test statistici per confrontare le medie di due o più gruppi. Vengono descritte diverse tipologie di confronti e vengono illustrati esempi pratici, con dettagli sulle ipotesi e sulla determinazione dei valori critici.

Full Transcript

INFORMATICA E BIOSTATISTICA Anno Accademico 2024-2025 Dott. Alberto Bertoncini CONFRONTI TRA MEDIE TIPOLOGIE DI STUDIO: 1)Media di un singolo gruppo (campione) confrontata con la media della popolazione 2)Questo con due casi...

INFORMATICA E BIOSTATISTICA Anno Accademico 2024-2025 Dott. Alberto Bertoncini CONFRONTI TRA MEDIE TIPOLOGIE DI STUDIO: 1)Media di un singolo gruppo (campione) confrontata con la media della popolazione 2)Questo con due casi distinti di situazioni:  σ noto  σ ignoto 3)Medie di due gruppi di osservazioni (campioni) che possono essere 4)Indipendenti: raccolti per due popolazioni o trattamenti 5)Appaiati: (a coppie): i dati possono essere raccolti  Per due trattamenti a ciascuna unità campionaria  Per due unità campionarie appaiate in base ad alcune variabili (es: età peso, ecc...) Dott. Alberto Bertoncini CONFRONTI TRA MEDIE Media di un singolo gruppo confrontata con la media della popolazione – σ noto Si utilizza la statistica Si ottiene il P-value dalle tavole della distribuzione Z Si verifica l’intervallo di confidenza al 95% utilizzando le formule note: Dott. Alberto Bertoncini CONFRONTI TRA MEDIE Problema: Variabile = concentrazione di urea nel sangue di bovini Campione di 10 animali: media = 22 mg/100 ml. In letteratura: ampia indagine → μ= 25; σ2 = 45. Domanda: posso affermare che il campione proviene da una popolazione con media 25 e varianza 45? Ipotesi nulla: il campione proviene dalla popolazione normalmente distribuita con μ= 25; σ2 = 45 H0:μ=μ0=25mg μ=media del campione μ0=media della popolazione Livello di significatività: α=0.05 Si utilizza il test a 2 code Valore critico: Z = 1.96, Z=-1.96 Dott. Alberto Bertoncini CONFRONTI TRA MEDIE Dai risultati ottenuti sia con la statistica test (1) sia con il P-value (2) si giunge alla medesima conclusione (1) z non supera il valore critico di -1.96 ► accetto H0 (2) P(z = -1.41 ) = 0.079, 0. 079 x 2 = 0. 158 > α = 0. 05 ► accetto H0 Accetto l’ipotesi nulla (ossia la media del campione è uguale a quella della popolazione) Gli intervalli di confidenza al 95% della media della popolazione sono: I1 = 22 - 1.96 * 2.12 = 17.84 mg/100 ml I2 = 22 + 1.96 * 2.12 = 26.15 mg/100 ml Siamo fiduciosi al 95% che i limiti di 17.84 e 26.15 mg/100 ml contengono la media della popolazione che è pari a 25 mg/100ml Dott. Alberto Bertoncini CONFRONTI TRA MEDIE Media di un singolo gruppo confrontata con la media della popolazione – σ non noto Si utilizza la statistica Si ottiene il P-value dalle tavole della distribuzione t Si verifica l’intervallo di confidenza al 95% utilizzando le formule note Dott. Alberto Bertoncini CONFRONTI TRA MEDIE In un campione di 36 suini è stato rilevato l’incremento medio ponderale giornaliero (IMPG, Daily Weight Gain = DWG) e si sono ottenuti i seguenti risultati L’IMPG calcolato sulla popolazione è di 607g C’è differenza tra i 2 valori? Dalle tavole: t(α=0.05, 35GL) compreso tra 2.042 e 2.021 T=2.51 > t tabulato ►Rifiuto H0 Dott. Alberto Bertoncini CONFRONTI TRA MEDIE L’intervallo di confidenza al 95%: t(n-1, α=0.05)=t(35, α=0.05)=2.03 599.194 ± 2.03 * 3.109 = (592.8, 605.5) Sono i limiti entro cui dovremmo trovare la media della popolazione (μ = 607) da cui è stato tratto il campione di 36 suini e che non comprende il valore di 607: i 36 suini non provengono (probabilmente) da una popolazione con un IMPG di 607 g Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Medie di 2 gruppi di osservazioni che possono essere Indipendenti: le unità sperimentali sono assegnate casualmente a due trattamenti Appaiati: i due trattamenti sono applicati a ciascuna unità sperimentale Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Sono campioni indipendenti estratti da popolazioni normalmente distribuite, con media μ1 e μ2, e con varianza non nota Si valuta se le differenze osservate tra le medie di 2 campioni sono troppo grandi per essere attribuite al caso: 1)Si formula un’ipotesi nulla: nella maggior parte dei casi si testa se le medie delle 2 popolazioni sono uguali 2)Si stabilisce il livello di probabilità, soglia α 3)Si calcola la probabilità di ottenere una coppia di medie così differenti 4)Se la probabilità è più piccola di α, rifiutiamo l’ipotesi nulla Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Statistica che si utilizza per il confronto di campioni indipendenti gl (gradi di liberà) è la somma dei gradi di libertà dei due campioni: (n1-1)+(n2-1) = n1+n2-2 S è l’errore standard della differenza tra le medie dei due campioni Per calcolarla è necessario calcolare la varianza ponderata Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI La tabella riporta:  In alto: aree sotto la curva solo per alcune probabilità α  A sinistra: i gradi di libertà Esempio Per un determinato valore di g.l., il valore della tabella rappresenta il valore di t che delimita il 5% della distribuzione (2.5% per parte) Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI È stato misurato il cortisolo ematico in 18 cani, 9 maschi e 9 femmine. Ci si chiede se il sesso influenza il livello di cortisolo. Sono stati ottenuti i seguenti risultati Domanda: le medie dei 2 sessi differiscono in modo significativo? Livello di significatività: α = 0.05 Utilizziamo la statistica test t-student Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Nella figura sono riportate la distribuzione t con g.l. =16 e le due aree di rifiuto dell'ipotesi nulla, che sommate sono pari al 5% I valori assunti da t che delimitano le due aree sono -2.1199 e +2.1199 Il valore relativo alla differenza tra le medie dei sessi è pari a -0.46 e quindi compreso nella regione di accettazione di H0 USO DELLE TAVOLE  Si cerca il valore di t ottenuto per i gl in esame (16) e α =0.05 ► t = 2.120  Lo si confronta con il valore di t relativo alla differenza tra le medie ► 0.46 (in valore assoluto data la simmetria della distribuzione e dal fatto che la tavola in uso riporta il valore considerato per entrambe le code sommate, test bilaterale. Cosa fare con tavola solo destra?) Quindi: t tabulato > t trovato ► accetto H0 Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Esercizio 1 Un commerciante verifica la durata di due diverse marche di lampadine. Con 8 lampadine della marca A ottiene una media = 1237 ore con s = 36; con 7 lampadine della marca B ottiene una media di 1036 ore con s = 40. A fronte di tale risultato il commerciante vuole sapere se la differenza tra le due medie è tale da poter affermare con una probabilità del 95% che le lampadine di marca A hanno una durata superiore a quelle di marca B. Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Esercizio 1 – Soluzione 1. Formulazione delle ipotesi: H0: μa=μB H1: μa>μB 2. Calcolo di t: Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Esercizio 1 – Soluzione 3. Determinare i valori critici: Il livello di significatività richiesto è α=0.05, ricordandosi che il test è unidirezionale (controllo la coda di destra), i gradi di libertà sono 13, quindi il valore critico è t=1.771 4. Decisione Poiché tcal = 10.25 è maggiore del valore critico t=1.771, dobbiamo ricettare l’ipotesi H0. Le lampadine della marca A sono migliori (per durata) di quelle della marca B Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Confronto tra medie per dati appaiati  Un ricercatore si chiede se il livello medio dell’ematocrito cambia negli atleti dopo che hanno svolto una attività fisica intensa  Rileva l’ematocrito prima e dopo la gara  Ogni individuo fornisce due osservazioni  Ogni coppia di osservazioni (prima e dopo la gara, per ciascun individuo) ha un fattore in comune: l’individuo sulla quale è stata rilevata  Se quindi ci sono 2n osservazioni, ma solo n atleti, non possiamo assumere che ci siano 2n osservazioni indipendenti come se fossero stati 2n atleti.  Le due osservazioni sullo stesso soggetto non sono indipendenti, perché influenzate da fattori individuali comuni  Per esempio, se un atleta ha normalmente un basso livello di ematocrito, lo avrà anche basso rispetto agli altri dopo la gara: conoscendo il primo valore posso prevedere in parte il secondo Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Il test t per dati appaiati si riduce ad un semplice test t dopo aver calcolato la differenza tra le misure effettuate su ogni unità sperimentale d è la differenza media tra le osservazioni di ogni unità ESd è l’errore standard della differenza: Data l’ipotesi nulla, la statistica t ha una distribuzione t con gl = n-1 Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI In molte specie i maschi hanno maggiori possibilità di attrarre le femmine se presentano elevati livelli di testosterone. Un’ipotesi è che i maschi con più elevati livelli di testosterone siano più vulnerabili alle malattie. Per verificare questa ipotesi, un gruppo di ricercatori hanno aumentato sperimentalmente i livelli di testosterone di 13 maschi di merlo alirosse (Agelaius phoeniceus), impiantando un tubicino permeabile contenente testosterone. Il livello anticorpale (ln[mDO/min]) è stato misurato prima e dopo l’impianto Poiché 1.27 < 2.18, accetto H0: il testosterone non ha effetto sull’immunocompetenza dei maschi Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Esercizio La tabella mostra la pressione sistolica misurata ad 11 pazienti ipertesi dopo la somministrazione di placebo e di idroclorotiazide. In base ai risultati osservati, vi è una qualsiasi evidenza di una differenza nella pressione media sistolica sanguigna a seguito di questi due trattamenti? Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Esercizio - soluzione 1. Formulazione delle ipotesi 2. Calcolo del valore t Dott. Alberto Bertoncini CONFRONTRI TRA MEDIE DI 2 CAMPIONI Esercizio - soluzione 3. Determinazione dei valori critici Assumiamo un livello di significatività di α=0.05, i gradi di livertà sono 10, quindi il valore critico è t=2.228 (stavolta verifichiamo su una tabella unilaterale, cercando la significatività, destra o sinistra, dello 0.025) 4. Decisione Poiché tcal = 6.08 è maggiore del valore critico t = 2.228 dobbiamo rigettare l’ipotesi H0 La pressione dei pazienti a cui è stato somministrato idroclorotiazide è statisticamente diversa dalla pressiona dei pazienti a cui è stato somministrato il placebo Dott. Alberto Bertoncini

Use Quizgecko on...
Browser
Browser