Document Details

Uploaded by Deleted User

Universitat Politècnica de Catalunya

Marta Pérez-Casany

Tags

statistical experiments design of experiments applied statistics research methodology

Summary

This document provides an introduction to experimental design, focusing on concepts and application examples from various fields. Specific examples are provided outlining variables from medicine, agriculture, industry and more. It covers topics like factors, blocks, randomization, replication and different types of experiments (fixed effects and random effects design). The text explores the contrast between experimental design and observational studies, emphasizing the importance of the appropriate design.

Full Transcript

DISSENY D’EXPERIMENTS: PART 1 GRAU D’ESTADÍSTICA Prof. Marta Pérez-Casany, phD Departament d’Estadística i Investigació Operativa Universitat Politècnica de Catalunya Facultats d’Economia i Empresa i de Matemàtiques i Estadística...

DISSENY D’EXPERIMENTS: PART 1 GRAU D’ESTADÍSTICA Prof. Marta Pérez-Casany, phD Departament d’Estadística i Investigació Operativa Universitat Politècnica de Catalunya Facultats d’Economia i Empresa i de Matemàtiques i Estadística DISSENY D’EXPERIMENTS: Definició i Conceptes Importants Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 En tots els àmbits d’investigació cal contestar preguntes que es fan els investigadors. També cal contestar preguntes, per exemple, en àmbits com la de gestió de processos. Alguns exemples: L’efecte esperat d’aquest ansiolític és superior al ansiolític estàndard? La producció de tomàquets utilitzant abods nitrogenats és similar a la obtinguda amb adobs no nitrogenats? La màquina que produeix peces circulars, ho fa amb un diàmetre de 3 mm o s’ha descentrat? La despesa en sanitat per persona i any és similar en tots els països de la UE o hi ha diferències estadísticament significatives? Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Dissenyar un experiment (DE) consisteix en base a les preguntes que es volen contestar: 1. especificar quina és la variable d’interès (Y ), també anomenada variable resposta, i quines son les variables tenen major influència en ella (Xi ), 2. especificar com es recolliran les dades, 3. especificar quin model s’utilitzarà per tal d’analitzar-les. Un cop especificat el model i obtingudes les dades, es mirarà si les dades son consistents amb el mateix i, en cas afirmatiu, es treuran conclusions que puguin ser útils per l’experimentador. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 L’origen del DE té lloc en els estudis de Sir Ronald A. Fisher en camps de cultinu d’Anglaterra a principis del segle XX. Fisher era el responsable d’Estadística i Análisi de Dades de la Rothamsted Agricultural Experiment Station a Londres. Les primeres aplicacions del DE van ser en l’àmbit de l’agricultura i la biologia, d’aquí que la nomenclatura autilitzada estigui associada a aquests àmbits. Per exemple, als factors se’ns anomena tractaments. Posterioment es va aplicar a la industria. La primera aplicació industrial del DE va ser el 1930 en les empreses textils de la llana angleses. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Les variables que influencien la variable Y , i que intervindran al model, es divideixen en dos tipus: Factors: Son variables categòriques que son controlades per l’experimentador. Per exemple: dosi d’un medicament, tipus de dieta d’un esportista, memòria d’un servidor, etc. Blocs o Covariables: Son variables categòriques que no poden ser controlades per l’experimentador. Per exemple: gènere d’un pacient, temperatura ambiental, persona que fa les meusres de l’experiment, país al que pertany un individu. Els valors que prenen els factors o blocs s’anomenen nivells. Les observacions es realitzaran sobre el que s’anomena unitats experimentals, com poden ser les persones, els camps, un determinat punt de la carretera, un programa informàtic, una universitat, una botiga, una màquina, un proveidor, etc, etc, Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Si els nivells dels factors han estat escollits per l’experimentador i son un nombre relativament petit, parlem d’un disseny d’efectes fixes. S’estudien els nivells que interessen que son un nombre no molt elevat. Si algún nivell té un nombre de nivells d’interès molt gran, o fins i tot si aquest és infinit, llavors es porta a terme el que s’anomena disseny d’efectes aleatòris que consisteix en seleccionar aleatòriament uns quants dels nivells i treballar amb aquells per tal de inferir coses sobre toda la població de nivells. Observació: La primera part de l’assignatura es centrarà en dissenys d’efectes fixes. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Estem interessats en estudiar la producció d’insulina d’un teixit pancreàtic a diferents nivells de glucosa. Pregunta: La producció d’insulina depen del nivell de glucosa a la que està sotmès? Concentració 1 1.53 1.61 3.75 2.89 3.26 2.83 2.86 2.59 2 3.15 3.96 3.59 1.89 1.45 3.49 1.56 2.44 3 3.89 4.8 3.69 5.7 5.62 5.79 4.75 5.33 4 8.18 5.64 7.36 5.33 8.82 5.26 8.75 7.10 5 5.86 5.46 5.69 6.49 7.81 9.03 7.49 8.98 Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Es vol estudiar l’absorció de Cadmi pel fetge, pàncreas i ronyons dels peixos. Pregunta: El cadmi s’absorveix de forma semblant en els diferents òrgans? Es tenen dos grups de peixos depenent de la concentració de cadmi de l’aigua: grup A: concentració de cadmi normal, grup B: elevada concentració de cadmi. S’han escollit 12 peixos a l’atzar (6 de cada grup) i s’han obrtingut les següents mesures: Fish Id. Group Liver Kidney Pancreas 1 A 0.38 0.09 0.65 2 B 0.14 0.36 0.9 3 B 0.18 0.29 0.34 4 A 0.24 0.19 0.43 Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 En el DE son importants els següents dos conceptes: Randomització: Les unitats experimentals s’assignen aleatòriament als diferents grups que determinen els factors. Tanmateix l’ordre en que es porten a terme les observacions també ha de ser aleatòri. Replicació: L’experiment es porta a terme un nombre suficientment gran de vegades per tal d’evitar que l’inevitable error de mesura impideixi detectar les veritables diferències entre els tractaments. La randomització és la que permet assumir independència entre les observacions de la variable Y. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 En contraposició als DE hi ha els anomenats estudis observacionas. Aquests estudis es limiten a observar un procés i treure conclusions de l’observat, amb les corresponents eines estadístiques. Els estudis observacionals es realitzen quan no és materialment, èticament oeconòmicament possible portar a terme un estudi experimental. Per exemple estem interessats en saber si la dieta i el fet que una gestant sigui fumadora o no afecta de forma significativa el pes del nadó al néixer. Els estudis observacionals permeten parlar de correlació però no de causalitat. No es pot inferir causalitat d’un estudi observacional. La correlació és bidireccional mentre que la causalitat és unidireccional. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Un Disseny d’anomena balancejat quan el nombre d’observacions és el mateix per a totes les condicions experimentals considerades. Un disseny és no balancejat quan almenys existeixen dues condicions experimentals amb diferent nombre d’observacions. S’ha d’intentar en la mesura del possible que els dissenys siguin balancejats. Matemàticament no és necessàri, pèrò estadísticament és convenient perquè és quan farem els tests amb major potència. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Imagineu-vos que volem comparar tres fertilitzants, en quant a la seva influència en la producció obtinguda en un camp. Disseny balancejat: Tractament: Fertilitzant 1 Fertilitzant 2 Fertilitzant 3 Tamany mostral: 20 20 20 Disseny no balancejat: Tractament: Fertilitzant 1 Fertilitzant 2 Fertilitzant 3 Tamany mostral: 15 20 18 Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 A tenir en compte: Principi de Parsimonia: D’entre models competitius que donguin lloc a un ajust adeqüat al conjunt de dades, aquell que tingui menys paràmetres és el preferit (la simplicitat del model és imnportant). (the Cambridge Dictionary of Statistics, B.S. Everitt) Per tant serà molt important seleccionar de forma apropiada els factors que intervendran en el nostre disseny. Dues cites de G. Box: "Block what you can, randomize what you can not" " Essentially, all models are wrong, but some are useful". Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 DISSENY D’EXPERIMENTS: PART 1 GRAU D’ESTADÍSTICA Prof. Marta Pérez-Casany, phD Departament d’Estadística i Investigació Operativa Universitat Politècnica de Catalunya Facultats d’Economia i Empresa i de Matemàtiques i Estadística DISSENY D’EXPERIMENTS: Comparació de dos tractaments Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 1. Mostres independents Suposem les següents situacions: Tenim dos proveidors de material i un és clarmanet més barat que l’altre. Volem saber si la puresa del material és la mateixa en ambdós, perquè si és que sí, comprarem al més barat. Volem saber si la velocitat de secat de la pintura que fabriquem és superior a la que tenim ara si hi afegim un químic nou o no li afegim. Interessa esbrinar si els estudiants del GE de la UB-UPC i la UAB tenen un salari semblant al cap de tres anys d’haver-se inserit al món laboral o no. Estem interessats en esbrinar si les notes que els estudiants treuen en una assignatura son sistemàticament inferiors a les que treuen en una altra. Ha sortit un medicament nou que és més barat que el que es fa servir habitualment. Volem saber si els benefinics son estadísticament semblants, perquè si ho son, ens passarem al nou. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Tenim una variable d’interès, Y , que mesurem en dues circumstàncies diferents (condicions experimentals), i l’interès és comparar (test d’hipòtiesi) els valors esperats de la variable en les dues circusmtàncies. Denotem, respectivament, per Y1 i Y2 la variable resposta sota les condicions experimentals 1 i 2. Assumim que ambdúes variables tenen distribució normal, i.e, Yi ∼ N(µi , σi2 ), i = 1, 2 Recollim aleatòriament i de forma independent una mostra de cadascúna de les variables: Y1 : y11 y21 y31 y41 ··· yn11 Y2 : y12 y22 y32 y42 ··· yn22 Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Volem saber si els dos valors esperats son significativament diferents o no : H0 : µ1 = µ2 vs H1 : µ1 6= µ2 (TH) Per tal de portar a terme aquest TH, essent α el nivell de significació, haurem de: 1) definir un estadístic de prova i 2) trobar-ne la distribució de referència (distrib. sota la hipòtesi nul.la) 3) trobar la regió de rebuig a través de punts crítics, o bé calcular el p-valor associat al nostre estadístic de prova. 4) Decidir si rebutgem o no H0. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Deducció de l’estadístic de prova: La decissió s’ha de basar en l’estadístic: y1 − y2. Distingirem quatres casos: 1) σ12 = σ22 = σ 2 , coneguda 2) σ12 6= σ22 , conegudes 3) σ12 = σ22 = σ 2 , desconeguda 4) σ12 6= σ22 , cdesconegudes Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 1) Si les variàncies son iguals i conegudes, tenim que: 1 1  y1 − y2 ∼ N µ1 − µ2 , σ 2 + , n1 n2 tipificant es té que: y1 − y2 − (µ1 − µ2 )  q ∼ N 0, 1. (1) 1 1  σ n1 + n2 Si H0 és certa (µ1 − µ2 = 0), rebutjarem H0 quan: y − y2 Z0 = q1  ≥ Zα/2 1 1 σ n1 + n2 essent Zα/2 el valor que acumula una probabilitat per sobre igual a α/2 en una N(0, 1). Punts crítics: −Zα/2 i Zα/2. Regió de rebuig: (−∞, −Zα/2 ) ∪ (Zα/2 , +∞). Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 2) Si les variàncies son diferents i conegudes, tenim que: σ12 σ 2  y1 − y2 ∼ N µ1 − µ2 , + 2 , n1 n2 tipificant es té que: y1 − y2 − (µ1 − µ2 )  q 2 2 ∼ N 0, 1. (2) σ1 σ2  n1 + n2 Si H0 és certa (µ1 − µ2 = 0), i per tant rebutjarem H0 quan: y1 − y2 Z0 = q ≥ Zα/2 σ12 σ22  n1 + n2 Punts crítics: −Zα/2 i Zα/2. Regió de rebuig: (−∞, −Zα/2 ) ∪ (Zα/2 , +∞). Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 3) Si les variàncies son iguals i desconeguda, hem de primer trobar uan estimació de la variància. La millor és l’estimació combinada (pooled: (n1 − 1) S12 + (n2 − 1) S22 σ̂ 2 = Sp2 = n1 + n2 − 2 Observis que: (S12 +S22 ) 1) Si n1 = n2 , Sp2 = 2. P2 Pni i 2 (n1 −1) S12 +(n2 −1) S22 j=1 (yj −yi ) 2) σ̂ 2 = Sp2 = n1 +n2 −2 = i=1 n1 +n2 −2 Atès que les mostres son independents, S12 + s22 (n1 + n2 − 2) ∼ χ2n1 +n2 −2 σ2 i per tant, independentment de si H0 és certa o no, Sp2 (n1 + n2 − 2) ∼ χ2 n1 +n2 −2. σ2 Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Tenint en compte (1) i la definició de la distrib. t-d’Student, si H0 és certa, µ1 − µ2 = 0, y − y2 q1  ∼ tn1 +n2 −2 1 1 Sp n1 + n2 Per tant rebutgem H0 quan: y − y2 t0 = q1  ≥ tα/2,n1 +n2 −2 1 1 Sp n1 + n2 Punts crítics: −tα/2,n1 +n2 −2 i tα/2,n1 +n2 −2. Regió de rebuig: (−∞, −tα/2,n1 +n2 −2 ) ∪ (tα/2,n1 +n2 −2 , +∞). Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 4) Si les variàncies son diferents i desconegudes, si H0 és certa, y1 − y2 q ∼ tν S12 S22  n1 + n2 on S2 S22 2 ( n11 + n2 ) ν= (S12 /(n1 −1)2 (S 2 /(n2 −1)2 n1 −1 + 2 n2 −1 Per tant, rebutjarem H0 quan: y1 − y2 t0 = q ≥ tα/2,ν S12 S22  n1 + n2 Punts crítics: −tα/2,ν i tα/2,ν. Regió de rebuig: (−∞, −tα/2,ν ) ∪ (tα/2,ν , +∞). Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Si volem fer el test per p-valors, s’haurà de procedir de la forma següent: El p-valor es calcularà com l’àrea per sobre z0 o t0 (segons quina sigui la distribució de referència) multiplicada per dos. S’interpeta com la probabilitat d’observar el un valor igual o més gran en valor absolut a l’estadístic de prova, en la distribució de referència. Rebutgem H0 si p − valor ≤ α Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Exemple: En una empresa de curtits de pell, hi ha una part del procés en que s’ha de submergir la pell en una solució aqüosa amb un determitat agent químic. Sempre s’ha fet servir l’agent químic A, però ara l’empresa subministradora ens proposa fer-ne servir un de nou que denotem per B. Volem veure si l’elasticitat final de les peces de pell es equivalent en solucions o no. H0 : µA = µB vs H1 : µA 6= µB Per tal de saber-ho, 1) Seleccionem 20 peces a l’atzar del nostre magatzem 2) A 10 seleccionades a l’atzar els hi assignem el tractament A i a la resta el B. 3) Fem la descriptiva de les dades per veure si hi ha dades anòmales 4) Portem a terme la comparació. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 A 24, 3 25, 6 26, 7 23, 4 24, 8 23, 8 25, 9 26, 4 25, 8 25, 4 B 24, 4 21, 5 26, 1 22, 8 25, 2 23, 5 22, 2 23, 5 23, 3 24, 7 x A = 25, 2, SA2 = 1, 212, x B = 23, 7, SB2 = 1, 96 Assumim variàncies iguals!!!!: 9 ∗ 1, 212 + 9 ∗ 1, 96 σ̂ 2 = Sp2 = = 1, 59 10 + 10 − 2 Estadístic de prova: y − y2 25, 21 − 23, 72 t0 = q1 =√ q  = 2, 65 1 1 1 1 Sp n1 + n2 1, 59 10 + 10 El p- valor associat a 2, 65 (test bilateral) en una distribució t − d 0 Student18 és 2 ∗ (1 − pt(2.654, 18)) = 0.0161 ≤ 0.05(α). Per tant concluim que rebutgem H0 i concluim que les dues dissolucions actuen de forma significativament diferent. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 IMPORTANT!!!!! Mai s’accepta la hipòtesi nul.la, es rebutja o no es rebutja Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Què passa si volem demostrar que el valor esperat de l’elasticitat amb el químic A és superior (inferior) al de l’A? En aquest cas, el test d’hipòtesis (unilateral) és: H0 : µA = (≤) µB vs H1 : µA > µB L’estadístic de prova i la distribució de referència son les mateixes, el p-valor però es calcula com la cua per sobra, i.e, 1 − pt(t0 , n1 + n2 − 2) Rebutgem H0 quan: t0 ≥ qt(1 − α, n1 + n2 − 2) Punt crític: qt(1 − α, n1 + n2 − 2) Regió de rebuig: (qt(1 − α, n1 + n2 − 2), +∞). Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Si volem a portar a terme el test (unilateral): H0 : µA = (≥) µB vs H1 : µA < µB L’estadístic de prova i la distribució de referència son les mateixes, el p-valor però es calcula com la cua per sota, i.e, pt(t0 , n1 + n2 − 2) Rebutgem H0 quan: t0 ≤ qt(α, n1 + n2 − 2) Punt crític: qt(α, n1 + n2 − 2) Regió de rebuig: (−∞, qt(α, n1 + n2 − 2)). Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 IMPORTANT!!!!!: A l’hora de definit l’alternativa, hem de tenir present que cal ser "conservador" en el sentit de que només farem un canvi si les dades apunten que aquest és profitós, altrament seguirem actuant com fins ara. En el cas dels additius de la pell, NO CANVIAREM d’additiu si µA > µB , per tant aquesta seria l’alternativa que tindria sentit. Si portem a terme: H0 : µA = µB vs H1 : µA > µB , el p-valor seria 1 − pt(2.65, 18) = 0, 008 que al ser menor que α ens porta a rebutjar H0 i conclourà que hem de seguir amb l’additiu A. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Per tal de saber si estem en el cas 3) o en el 4), haurem de fer el test de comparació de variàncies: σ12 σ12 H0 : = 1 vs H1 : 6= 1 σ22 σ22 Recordem: (n1 − 1) S12 2 (n2 − 1) S22 ∼ χ n −1 i ∼ χ2n2 −1. σ12 1 σ22 2 S1 2 σ1 Al tractar-se de mostres independents, F0 = 2 S2 ∼ Fn1 −1,n2 −1. 2 σ2 Per tant si H0 és certa, S12 F0 = ∼ Fn1 −1,n2 −1 , S22 i F0 és l’estadístic de prova i Fn1 −1,n2 −1 la distribució de referència. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Rebutgem H0 quan: F0 ≥ qf (1 − α/2, n1 − 1, +n2 − 1) o F0 ≤ qf (α/2, n1 − 1 + n2 − 1) Punts crítics: qf (α/2, n1 − 1 + n2 − 1) i qf (1 − α/2, n1 − 1 + n2 − 1) Regió de rebuig: (−∞, qf (α/2, n1 − 1, +n2 − 1)) ∪ (qf (1 − α/2, n1 − 1 + n2 − 1), +∞). p-valor: Si F0 ≥ 1, 2 ∗ (1 − pf (F0 , n1 − 1, +n2 − 1)) Si F0 ≤ 1, 2 ∗ (pf (F0 , n1 − 1, n2 − 2 − 1)). Observació: Per simplicitat, calcular F0 de forma que sempre sigui major que la unitat. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 En el cas de l’exemple de les pells, SA2 = 1, 212 i SB2 = 1, 96 SB2 1, 960 F0 = = = 1, 62 SA2 1, 212 p-valor: 2 ∗ (1 − pf (1, 62, 9, 9)) = 0, 48 Atès que p-valor és superior a α, NO rebutgem H0 i concluim que les variàncies no son estadísticament diferents en les dues mostres. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 2. Mostres aparellades Suposem que estem interessats en esbrinar si 1) Les persones amb una determinada patologia cognitiva milloren després de realitzar diàriament un set d’exercicis d’una aplicació del mòbil. 2) El desgast del vidre de les ulleres és el mateix si es banya el vídre en un líquid determinat o si no es fa. 3) Una determinada dieta és útil per tal de perdre pes de forma estable. 4) La duresa d’una peça de material després de pintar-la amb dos tipus diferents de pintura és la mateixa o canvia amb la pintura. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 En els casos anteriors es seleccionen n unitats experimentals de forma aleatòria i se’ls hi assignen els dos tractaments, de forma que es tenen dues mesures per a cada unitat experimental. Per exemple en el cas de la patologia cognitiva, es seleccionaran n persones i es mirarà el seu estat cognitiu abans i després de seguir l’entrenament amb l’app durant unt emps determinat (que serà el mateix per a totes les persones). Tindrem una taula de la forma següent: Persona | 1 2 3 4 ··· n Abans : y11 y21 y31 y41 ··· yn1 Després: y12 y22 y32 y42 ··· yn2 Ara les mostres NO son independents sino que estan aparellades Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 En aquest cas el test: H0 : µ1 = µ2 vs H1 : µ1 6= µ2 (3) és quivalent a: H0 : µd = 0 vs H1 : µd 6= 0 (4) essent µd el valor esperat de la variable diferència (Abans-Després). Persona | 1 2 3 4 ··· n1 Abans : y11 y21 y31 y41 ··· yn1 Després: y12 y22 y32 y42 ··· yn2 Diferència y1 − y12 1 y2 − y22 1 y3 − y3 y4 − y42 1 2 1 ··· yn − yn2 1 Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 El test (4) coincideix amb la comparació de la µ d’una normal amb un valor concret i, per tant si la variància és desconeguda, Rebutjarem H0 quan: xd − 0 | √ | ≥ tα/2,n−1 Sd / n Punts crítics: −tα/2,n−1 i tα/2,n−1 Regió de rebuig: (−∞, −tα/2,n−1 ) ∪ (tα/2,n−1 , +∞) Observació 1: Si el test fos unilateral, acumulariem la probabilitat a la cua corresponent. Observació 2: Si la variància fos coneguda (cas no habitual), la distribució de referència seria la normal tipificada. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Exemple: Es vol comparar el desgast del vidre d’una lent per les ulleres, si aquest es banya amb un líquid determinat o si no es fa. Es seleccionen aleatòriament 10 persones amb ulleres i a un costat es posa el tipus de lent banyat (A) i a l’altra el no banyat (B). L’ordre també és aleatòri. Els resultats mesurats del desgast al cap d’un mes son els següents: Persona A B diferència 1 7.7 7.9 0.2 2 6.0 6.8 0.8 3 4.6 5.1 0.5 4 7.2 8.0 0.8 5 6.9 8.0 1.1 6 5.0 5.6 0.6 7 6.2 6.5 0.3 8 5.5 6.0 0.5 9 5.4 5.3 -0.1 10 5.1 5.8 0.7 Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Calculant s’obté xd = 0, 55 i Sd2 = (0, 344)2. Calculant l’estadístic de prova s’obté: 0, 55 − 0 √ = 4, 97 0, 344/ 10 Que té associat un p-valor de 2 ∗ 0, 00038 = 0, 00076 ≤ 0.05 En conseqüència rebugem H0 i concluim que el desgast no és equivalent en els dos tipus de lents. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 DISSENY D’EXPERIMENTS: PART 1 GRAU D’ESTADÍSTICA Prof. Marta Pérez-Casany, phD Departament d’Estadística i Investigació Operativa Universitat Politècnica de Catalunya Facultats d’Economia i Empresa i de Matemàtiques i Estadística One-way ANOVA DISSENY D’EXPERIMENTS: ANOVA d’un factor Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Introducció Objectiu: En l’anàlisi de la variància (ANOVA) d’una factor, volem analitzar com canvia la variable resposta en funció del nivell del factor. Exemple: Volem comparar el Temps d’execució (Y ) en base a a diferents tipus de treball (X ) La variable Factor té a nivells, del nivell i-èssim es tenen ni observacions obtingudes de forma independent i completament aleatòria. Nivell Observacions 1 y11 , y12 , · · · , y1n1 y 1. 2 y21 , y22 , · · · , y2n2 y 2.... a ya1 , ya2 , · · · , yana y a. P ni Pa P ni Pa j=1 yij i=1 j=1 yij on N = i=1 ni , y i. = ni and y.. = N Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Introducció Si ni = n ∀i ∈ {1, · · · , a} tenim un disseny balancejat i, en aquest cas, a 1X y.. = y i. a i=1 Exercici: Trobeu la relació entre y.. i y i. pel cas no balancejat. El model estadístic associat a aquesta situació podria ser: yij = µi + eij , i = 1, · · · , a i j = 1, · · · , ni (1) o també: yij = µ + τi + eij , i = 1, · · · , a i j = 1, · · · , ni (2) on µi = µ + τi és la resposta esperada sota el nivell i-èssim del factor, i eij , son els errors que s’assumeixen independents, i amb distribució Normal(0, σ 2 ). Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Introducció Matricialment, el model (1) per a = 3 pren la forma:   1 0 0    1 0 0    Y11 ......    e11 ..  ...  ..  .    .     1 0 0     Y1n1     e1n1     0 1 0      Y21   e21  µ1   ..   0 1 0  ..        .  = ......  µ2  +    ... .  µ3     Y2n     e2n2   2   0 1 0     Y31     e31     0 0 1    .  ..  ..   0 0 1      .  Y3n3... e3n3 ......    0 0 0 Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Introducció El model (2) per a = 3 pren la forma:   1 1 0 0    1 1 0 0    Y11 . ......  e11 ..  .. ..   .  ...   .   Y1n1   1 1 0 0        e1n1       Y21   1 0 1 0 µ       e21  ..   1 0 1 0 τ1..         .  = ........ +   τ2 .   Y2n  ....         e2n  τ3  2  2   Y31   1 0 1 0       e31     1 0 0 1    .   .  ..   1 ..    0 0 1   Y3n3 ....... e3n3 .. ...  1 0 0 1 Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Introducció Ambdós son Models Lineals (ML), ja que responen a la forma: Y = X β + e ⇐⇒ µ = E (Y |X ) = X β Y |X ∼ N(X β, σ 2 · Idn ) Exercici : Quin dels dos us sembla més escaient? Argumenteu la resposta. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Test d’hipòtesis Veure si hi ha diferències estadísticament significatives en la variable Y en funció del nivell de X és equivalent a testar: H0 : µ1 = µ2 = · · · = µa vs H1 : ∃(i, j) µi 6= µj , (model1) per a un nivell de significació concret igual a α. Aquest test és equivalent a: H0 : τi = 0 ∀i vs H1 : ∃i τi 6= 0, (model2) Observació: quan a = 2 el problema és equivalent al de comparació de dos valors esperats amb variàncies iguals i desconegudes. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Test d’hipòtesis Observació: La regla de decisió de no rebutgem H0 quan cap de les hipòtesis nul.les de totes les comparacions dos a dos ha estat rebutjada no és escaient. El motiu és perquè, en aquest cas, α∗ = P(rebutjar H0 |H0 és certa) = 1 − (1 − α)a(a−1)/2 ≥ α, la qual cosa incrementa l’error de tipus I del test considerablement. Per exemple, si a = 5 i α = 0.05, P(rebutjar H0 |H0 és certa) = 0.4 Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Test d’hipòtesis Pensem: Figure: Dos conjunts de dades amb mateixes mitjanes i diferents variabilitats Acceptarieu la igualtat dels valors esperats en els quatre nivells? Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Test d’hipòtesis Exemple: Figure: AED de l’absorció de greix en la fabricació de donuts Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Test d’hipòtesis Exemple: Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Test d’hipòtesis La variabilitat existent a la variable resposta es dividirà en dues parts: la deguda al factor i la deguda a l’error. Atès que (yij − y.. ) = (y i. − y.. ) + (yij − y i. ), es té que: X ni a X a X ni a X X (yij − y.. )2 = ni (y i. − y.. )2 + (yij − y i. )2 + i=1 j=1 i=1 i=1 j=1 ni a X X +2 (yij − y i. ) · (y i. − y.. )2 i=1 j=1 Ara bé, es compleix que: ni a X X 2 (yij − y i. ) · (y i. − y.. )2 = 0 i=1 j=1 Exercici : Demostrar-ho. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Test d’hipòtesis Per tant doncs, la variabilitat total es descomposa com: X ni a X a X ni a X X SST = (yij −y.. )2 = ni (y i. −y.. )2 + (yij −y i. )2 = SSA +SSE , i=1 j=1 i=1 i=1 j=1 on la lletra A designa el factor, E designa l’error i T designa la totalitat de les dades. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Test d’hipòtesis Es compleix SEMPRE (independentment de si H0 és certa o no) que SSE ∼ χ2N−a (3) σ2 Demostració: Si denotem per Si2 la variància mostral de cada fila, S2 sabem que (ni − 1) σi2 ∼ χ2ni −1. Atès que les files son independents, i que la suma de χ2 indep. és una χ2 amb la suma dels graus de llibertat (g. ll.), es té que a Pa Pni X S2 i=1 j=1 (yij − y i. )2 SSE (ni − 1) i2 = = ∼ χ2N−a σ σ2 σ2 i=1 Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Test d’hipòtesis Tenint en compte que l’esperança d’un χ2 son els seus graus de llibertat, es té: SSE SSE E( ) = N − a =⇒ E ( ) = σ2 , σ2 N −a i, per tant, SSE σ12 = σ̂ 2 = = MSE N −a s’agafarà com estimació puntual de σ 2 , tant si es compleix H0 com si no. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Exercici : Demostrar que si el model és balancejat, es compleix: a SSE 1X 2 = Si N −a a i=1 Exercici : Demostrar que quan a = 2, SSE = Sp2 N −a coincideix amb l’estimació ponderada de la variància en la comparació de dos valors esperats. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Test d’hipòtesis Ara trobarem un altre estimador de σ 2 del qual li coneixarem la distribució NOMÉS SI H0 és certa. Farem el cas balancejat. Si la H0 és certa, y1. , y2. , · · · ya. ∼ N(µ, σ 2 /n). Per tant, la seva S 2 és un estimador de σ 2 /n: a 1 X σ2 E( (yi. − y.. )2 ) = a−1 n i=1 Per tant doncs, a 1 X SSA E( n (yi. − y.. )2 ) = σ 2 =⇒ σ22 = σ̂ 2 = a−1 a−1 i=1 és un estimador de la variància sota H0. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Test d’hipòtesis Ara bé, a més sabem el següent en quant a la distribució de SSA, (a − 1) S 2 (a − 1) SSA 2 ∼ χ2a−1 ⇐⇒ ∼ χ2a−1 (4) σ /n σ2 A partir de (3) i de (4) podem afirmar que Si H0 és certa, SSA σ2 F0 = SSE ∼ Fa−1,N−a σ2 I, per tant, rebutjarem H0 del test quan: F0 ≥ Fα,a−1,N−a que, a partir de p-valors, és equivalent a dir que rebutgem quan: 1 − pf (F0 , a − 1, N − a) ≤ α. Observació: La comparació correspon a un test unilateral, perquè només quan F0 és gran té sentit rebutjar Marta Pérez-Casany H0. D’EXPERIMENTS: PART 1 DISSENY One-way ANOVA Test d’hipòtesis Tot això es resumeix en el que s’anomena TAULA ANOVA: SE g. ll. MSE F SSA SSA /(a−1) Factor A SSA a−1 a−1 F0 = SSE /(N−a) SSE Error SSE N −a N−a SST Total SST N −1 N−1 Observació: Les sumes de quadrats explicades corresponen a les de Tipus I dels paquets estadístics i es computen sequencialment. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Test d’hipòtesis Exemple: Absorció de greix pels donuts. y1. = 72, y2. = 85, y3. = 76, y4. = 62, i y.. = 73, 75 S12 = 177, 95, S22 = 60, 37, S32 = 97, 61, S42 = 67, 56 Per tant, SSE 5 ∗ 177, 95 + 5 ∗ 60, 37 + 5 ∗ 97, 61 + 5 ∗ 67, 56 σ12 = = = 101, N −a 24 − 4 i SSA σ22 = = a−1 (72 − 73, 75)2 + (85 − 73, 75)2 + (76 − 73, 75)2 + (62 − 73, 75)2 5∗ 4−1 = 546 Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Test d’hipòtesis SE g. ll. MSE F Factor A 1637 3 546 F0 = 5, 40 Error 2018 20 101 Total 3655 23 Atès que 1 − pf (5, 40, 3, 20) = 0, 007 ≤ 0, 05, concluim que els diferents tipus de greix son absorvits de forma diferent Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Comparacions múltiples Quan es rebutja H0 té sentit anar més enllà, per tal de descobrir on radiquen les veritables diferències, això dóna lloc al que s’anomena comparacions múltiples. Les comparacions dos a dos, H0 : µi = µj vs H1 : µi 6= µj es poden fer, per exemple, amb algún d’aquests tres mètodes: 1) "Least Significative difference" (LSD) 2) Tukey 3) Scheffé Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Comparacions múltiples 1) LSD "Least Significative Difference". Es basa en el fet que 1 1 |y i. − y j. | ∼ N(µi − µj , σ 2 ( + )) n1 n2 rebutgem H0 si r 1 1 |y i. − y j. | ≥ tα/2,N−a + ·S n1 n2 Equival a un t-test q un cop la variància s’ha estimat a partir de totes SSE les dades (S = N−a ). Commentari: LSD pot no detectar cap diferència significativa, encara que l’Anova hagi donat significatiu. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Comparacions múltiples 2) Mètode de Tukey. Per fer les comparacions cal seguir els passos següents: a) Ordenar les mitjanes en ordre creixent, b) calcular SSE Sy2k. = , (N − a) nh on nh = a/(1/n1 + 1/n2 + · · · 1/na ) és la mitjana harmònica dels tamanys mostrals, c) rebutgem H0 quan |y i. − y j. | ≥ qα (a, N − a) Sy k. , on qα (a, N − a) és el quantil superior associat a α en la distribució del Student’s Rang. L’ordre és començant per les que disten més. Commentari: Tukey detecta almenys una diferència significativa quan l’Anova ha donat significatiu. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Comparacions múltiples 3) Mètode de Scheffé Pa Si i=1 ci = 0, comparar a X a X H0 : ci µi = 0 vs H1 : ci µi 6= 0 (5) i=1 i=1 es pren la regla de decisió de rebutjar H0 quan v a X q u a uX | ci y i. | ≥ (a − 1) Fα,a−1,N−a t( ci2 ) S 2 i=1 i=1 Commentari: Les comparacions del tipus (5) s’anomenen contrastos i si es resolen aplicant el mètode de Scheffé poden definir-se a-posteriori (un cop vistes les dades). Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Comparacions múltiples Exemple donuts, LSD: r r 1 1 1 tα/2,N−a + · S = 2, 08 ∗ ∗ 10, 48 = 12, 06 n1 n2 3 |y 1. − y 2. | = 13 ≥ 12, 06 |y 1. − y 3. | = 4 ≤ 12, 06 |y 1. − y 4. | = 10 ≤ 12, 06 |y 2. − y 3. | = 9 ≤ 12, 06 |y 2. − y 4. | = 23 ≥ 12, 06 |y 3. − y 4. | = 6 ≤ 12, 06 Trobem diferències significatives entre els greixos 1 i 2 i entre els 2 i 4. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Comparacions múltiples Exemple donuts, Tukey: a) Ordenem les mitjanes: y 4. (= 62), y 1. (= 72), y 3. (= 76), y 2. (= 85) SSE 101 √ b) Sy2i. = (N−a) nh = 6 = 16.83, per tant Sy i. = 16.83 = 4.10. Rebutgerem quan la diferència de dues mitjanes superi qα (4, 20) ∗ Sy i. = 4, 10 ∗ 4, 24 = 17, 38. c) Fem les comparacions: |y 2. − y 4. | = 23 ≥ 17, 38 (rebutgem la igualtat dels greixos 2 i 4 |y 2. − y 1. | = 10 ≤ 17, 38 (no rebutgem la igualtat dels greixos 3 i 4, per tant les comparacions que queden al mig tampoc es rebutgen) |y 3. − y 4. | = 14 ≤ 17, 38 (no rebutgem la igualtat del greixos 3 i 4, per tant les comparacions que queden al mig tampoc es rebutgen). Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Comparacions múltiples Els resultats obtinguts amb Tukey solen mostrar-se agrupant les mitjanes que no han donat lloc a diferències significatives. Pel cas dels greixos de donuts, l’agrupació quedaria així: y 4. (= 62), y 1. (= 72), y 3. (= 76), y 2. (= 85) y 4. (= 62), y 1. (= 72), y 3. (= 76), y 2. (= 85) Amb la qual cosa queden dos grups de mitjanes no estadísticament diferents. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Comparacions múltiples Exemple donuts, Scheffé: Si volem saber si el greix 1 s’absorveix de forma semblant a la mitjana de l’absorció dels greixos 3 i 4 plantegem: µ4 + µ3 µ4 + µ3 H0 : µ1 = vs H1 : µ1 6= ⇐⇒ 2 2 H0 : 2 µ1 − µ4 − µ3 = 0 vs H1 : 2 µ1 − µ4 − µ3 6= 0 P4 D’on s’obté que: C = (2, 0, −1, −1), I =1 Ci2 = 6, I, per tant, v u a q uX p √ (a − 1) Fα,a−1,N−a t ci2 S 2 = 4 ∗ 3, 09 6 ∗ 101 = 86.54 i=1 Atès que: |2 ∗ y 1. − y 3. − y 4. | = 6 ≤ 86.54, Concluim que el greix 1 s’absorveix de forma semblant a la mitjana dels altres dos. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Estimació dels paràmetres Aplicant mínims quadrats, i tenint en compte que el valor predit ŷij = µ̂ + τ̂i , l’objectiu és minimitzar la suma dels residus al quadrat. X ni a X ni a X X f (µ, τ1 , · · · , τa ) = (yij − ŷij )2 = (yij − (µ̂ + τ̂i ))2 i=1 j=1 i=1 j=1 Derivant s’obté que: ni a X ∂f X = (−2) (yij − µ̂ − τ̂i ) = 0 ∂µ i=1 j=1 ni ∂f X = (−2) (yij − µ̂ − τ̂i ) = 0, ∀i = 1..a ∂τi j=1 Pa ∂f ∂f a + 1 paràmetres i a equacions perquè i=1 ∂τi = ∂µ. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Per tal de resoldre el sistema, cal assumir alguna restricció. Les usuals son: Resticcions "Corner point", les mes habituals τ1 = 0 o τa = 0. Pa Restricció "Add up to zero" i=1 τi = 0 Important:: Les estimacions dels paràmetres canviaran depenent de la restricció assumida. La seva interpretació també canviarà. Els valors predits (ŷij = µ̂i = µ̂ + τ̂i ) seran els mateixos indep. de la restricció assumida. En el one way anova µ̂i − µ̂j també s’estima de forma única. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA La forma matricial general d’un on-way anova és:   1 1 ··· 0  ......   ....    e  Y11..  µ 11 ..    .. 1 1 · · · 0   τ1  .  .         ......   τ2  +    ....  Yij  =    eij..    ..      ..  .  1 0 ··· 1  .   ..  .     .. τa Yana .... eana   1 0 ··· 1 Observació: Tenim un problema de multicollinearitat si no assumim cap restricció. La restricció "corner point" equival a suprimir una de les darreres a columnes i la multicolinearitat desapareix. Exercici Escriure Pa com queda la forma matricial a l’assumir: a) τ1 = 0 i b) i=1 τi = 0. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Pa Assumint i=1 τi = 0, µ̂ = y.. , τ̂i = y i. − y.. Interpretació dels paràmetres: µ s’interpreta com la mitjana global, el valor esperat si no es sap de quin nivell prové la observació. τi és la desviació del valors esprat general, un cop es sap que la observació prové del nivell i-èssim. Valor predit per una observació del nivell i, ŷij = µ̂i = µ̂ + τ̂i = y i. Valor predit per la diferència de dos nivells: µ̂i − µ̂j = τ̂i − τ̂j = y i. − y j. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Assumint τ1 = 0, µ̂ = y 1. , τ̂1 = 0, τ̂i = y i. − y 1. Interpretació dels paràmetres: µ és la resposta esperada per una observació del primer nivell. τi és la desviació respecte a la resposta del primer nivell, si es sap que la observació prové del nivell i-èssim. Valor predit pel nivell i, ŷij = µ̂i = µ̂ + τ̂i = y i. Predicció per la diferència de dos nivells: µ̂i − µ̂j = τ̂i − τ̂j = y i. − y j. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Per comprobar visualment els hipòtesis del model: Portar a terme el normal quantile-quantile plot dels residus, per comprobar la normalitat. Ha d’estar proper a la recta. Portar a terme l’scatter plot residuals versus predits, per tal de comprobar que no hi ha una tendència en els residus ni en la seva dispersió. Portar a terme l’scatter plot predits versus nivells de la covariable. Novament no ’shan d’observar patrons ni tendències. Commentari: Si la magnitud relativa dels errors és menor que la resposta en un ordre de magnitud o més es poden obviar alguns patrons. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Exemple: Donuts Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Exemple: Donuts Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Exemple: Donuts Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 One-way ANOVA Exemple: Donuts Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 DISSENY D’EXPERIMENTS: PART 1 GRAU D’ESTADÍSTICA Prof. Marta Pérez-Casany, phD Departament d’Estadística i Investigació Operativa Universitat Politècnica de Catalunya Facultats d’Economia i Empresa i de Matemàtiques i Estadística Two-way ANOVA DISSENY D’EXPERIMENTS: ANOVA de dos factors Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two-way ANOVA Introducció Objectiu: En l’anàlisi de la variància (ANOVA) de dos factors, volem analitzar com canvia la variable resposta en funció de dues variables categòriques o factors. El factors poden interaccionar o no. Definició d’interacció: A term applied when two (or more) explanatory variables do not act independently on a response variable (The Cambridge dictionary of Statistics). S’anomenen Dissenys Factorials als dissenys que tenen en compte la interacció. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Introducció Exemple: Volem estudiar la variable Temps d’execució d’un programa (Y ) en base a a differents tipus de treballs (X1 ) i b nivells diferents de CPU (X2 ). Factors A i B tenen a i b nivells respectivament. Cada combinació de nivells (i, j) té nij observacions. Cas balancejat nij = n ∀(i, j) A|B 1 2 ··· b 1 y111 · · · y11n y121 · · · y12n ··· y1b1 · · · y1bn y 1.. 2 y211 · · · y21n y221 · · · y22n ··· y2b1 · · · y2bn y 2..... a ya11 · · · ya1n ya21 · · · ya2n ··· yab1 · · · yabn y a.. y.1. y.2. y.b. y... Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Introducció Pb Pnij Pa Pnij Notació: ni.. = j=1 k=1 nijk , n.j. = i=1 k=1 nijk , i a X nij b X X N= nijk i=1 j=1 k=1 Com obtenir les boservacions: a) Es seleccionen N unitats experimentals aleatòriament de la població objecte d’estudi. b) A cada unitat exp. se li assigna aleatòriament una combinació de nivells (i, j), fins a obtenir les nij observacions de cada casella. c) A poder ser, nij = n, ∀ (i, j). Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Model additiu El model two-way ANOVA additiu: yijk = µij + eijk = µ + τi + βj + eijk hipòtesis que s’assumeixen: eijk ∼ N(0, σ 2 ), indep. dels errors P P i τi = 0 j βj = 0 o bé, τ1 = 0 i β1 = 0 o τb = 0 i βb = 0. Observació 1: És possible que n = 1. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Model additiu Mirar si hi ha diferències significatives entre els nivells dels factors, en quant a la seva influència en la variable resposta equival a testar, per a un valor α fix, H01 : τ1 = τ2 = · · · = τa = 0 vs H11 : ∃i τi 6= 0, i H02 : β1 = β2 = · · · = βb = 0 vs H12 : ∃i βi 6= 0, Rebutjar H01 vol dir que el Factor A és significatiu ja que actúa de forma diferent en la resposta segons quin sigui el seu nivell. Rebutjar H02 vol dir el mateix que abans però ara amb el Factor B. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Model additiu La descomposició de la suma de quadrats total ara és de la forma següent: SST = SSA + SSB + SSE , on a X nij b X X SST = (yijk − y... )2 , i=1 j=1 k=1 a X b X SSA = ni.. (y i.. − y... )2 , SSB = n.j. (y.j. − y... )2 i=1 j=1 i a X nij b X X SSE = SST − SSA − SSB = (yijk − y i.. − y.j. + y... )2 i=1 j=1 k=1 Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Model additiu Observeu que: SSA mesura les diferències en la resposta pels diferents nivells de A, SSB mesura les diferències en la resposta pels diferents nivells de B, SSE mesura les diferències en la resposta que no expliquen els Factors A i B i que, per tant, s’adjudiquen a l’error. En realitat son diferències degudes a d’altres variables que afecten la resposta i que no es tenen en compte en el model. Nota: La SSE sempre es calcularà a partir de SST − SSA − SSB , ja que és la més difícil de calcular. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Model additiu The taula associada a un two-way ANOVA additiu és igual a: SE d. f. MSE F SSA SSA /(a−1) Factor A SSA a−1 a−1 F01 = SSE /(N−(a+b−1)) SSB SSB /(b−1) Factor B SSB b−1 b−1 F02 = SSE /(N−(a+b−1)) SSE Error SSE N −a−b+1 N−a−b+1 SST Total SST N −1 N−1 Regles de decisió: Rebutgem H01 si F01 ≥ Fα,a−1,N−a−b+1 Rebutgem H02 si F01 ≥ Fα,b−1,N−a−b+1 Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Model additiu Els mètodes de comparacions múltiples segueixen essent vàlids, i ara es poden aplicar per comparar els valors esperats del Factor A i els del Factor B per separat. Observar però que els graus de llibertat canviaran i la suma de quadrats de l’error haurà de ser la de la taula del two-way. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Model additiu Exemple: Un productor d’aiguarràs vol esbrinar quina és la combinació entre les variables "tractament amb àcid " i "forma del forat de l’aixeta" per tal d’obtenir una recolecció de resina òptima". Es van escollir aleat. 24 pins de la mateixa zona i també aleat. se’ls va assignar una combinació (Àcid, Forma) de les vuit possible. Els resultats van ser els següents: Cercle Diagonal Quadrat Rectangle 9 43 60 77 No Acid 13 48 65 70 12 57 70 91 15 66 75 97 Si Acid 13 58 78 108 20 73 90 99 Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Model additiu Una mica de ADE: Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Model additiu Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Model additiu Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Model additiu Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Model additiu Exemple: Taula anova dades Resina SE d. f. MSE F p-valor Acid 1305 1 1305 F01 = 25.87 6.56 ∗ 10−5 Forma 19407 3 6469 F02 = 128.2 8.71 ∗ 10−13 Residuals 959 19 50 Total 21671 23 Atès que ambdós p-valors son menors que α = 0.05, es rebutgen les dues hipòtesis nul.les i es conclou que ambdós factors son significatius i afecten la producció de resina. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Model additiu Comparacions múltiples: Comparem els dos nivells de la variable Àcid: Tant l’IC, que no conté el zero, com el p-valor, que és menor que el nivell de significació, ens indiquen que hi ha diferències estadísticament significatives entre els nivells de resina recaptats en presència o no d’àcid. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Comparem els quadre nivells de la variable Forma: Totes les comparacions dos a dos son estadísticament diferents. Mirant els IC podem deduir per exemple que: la forma diagonal dona més producció de resina que el cercle la forma diagonal dona menys producció que el "check", etc Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Model additiu Exercici: Considerar una situació en que es requereixi un model de tres factors i explicar els següents apartats: Com es recollirien les dades. La fórmula corresponent al model, amb les seves hipòtesis i restricions. Les hipòtesis que voldriem testar i el seu significat. La descomposició de les sumes de quadrats. La taula ANOVA. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Model amb interacció En el cas que un pensi que l’efecte que té un nivell d’un factor en la variable resposta depengui del nivell de l’altre factor amb el que estigui combinat (interacció), llavors el model a considerar és: yijk = µ + τi + βj + (γ)ij + eijk amb les hipòtesis: eijk ∼ N(0, σ 2 ), indep. dels errors P P P P i τi = 0, j βj = 0, ∀ i, j γij = 0, ∀ j, i γij = 0, Gràficament, la interacció s’observa com una manca de paral.lelisme en les poligonals obtingudes de dibuixar les mitjanes de cada cel.la. Important: Un model amb interacció requereix que nij ≥ 2, ∀(i, j). Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Model amb interacció Les hipòtesis a contrastar ara son: H01 : τ1 = τ2 = · · · = τa = 0 vs H11 : ∃i τi 6= 0, H02 : β1 = β2 = · · · = βb = 0 vs H12 : ∃i βi 6= 0, i H03 : γij = 0, ∀(i, j) vs H13 : ∃(i, j) γij 6= 0, Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Model amb interacció La descomposició de la suma de quadrats ara és: SST = SSA + SSB + SSAB + SSE , on SST , SSA i SSB es calculen com abans, a X nij b X X SSAB = (yijk − y i.. − y.j. + y... )2 , i=1 j=1 k=1 i SSE = SST − SSA − SSB − SSAB Observació: La descomposició de la suma de quadrats sempre va lligada al model. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Model amb interacció La two-way ANOVA table amb interacció és igual a: SE d. f. MSE F SSA SSA /(a−1) Factor A SSA a−1 a−1 F01 = SSE /(ab(n−1))) SSB SSB /(b−1) Factor B SSB b−1 b−1 F02 = SSE /(ab(n−1))) SSAB SSAB /(a−1)(b−1) AB SSAB (a − 1)(b − 1) (a−1)(b−1) F03 = SSE /(ab(n−1)) SSE Error SSE ab(n − 1) ab(n−1) SST Total SST N −1 N−1 Els tres test es rebutgen o no en base al p-valor o als punts crítics iagual que al cas additiu. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Model amb interacció Si la interacció és significativa, les comparacions múltiples es poden fer de manera semblant però s’ha de fixar prèviament el nivell de l’altre factor. En aquest cas s’aplicarà un total de a · b vegades el mètode escollit per les comparacions múltiples. Els resultats seran per exemple els següent: Pel primer nivell del Factor B son estadísticament equivalents els nivells u i tres i els dos, quatre i cinc del factor A. Pel segón nivell del Factor B tots els nivells del Factor A son diferents, etc i de forma semblant es tindran resultats del Factor B, fixant els nivells del Factor A. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Model amb interacció Exemple: Ajustem un model amb interacció a les dades de la Resina Tal com es pot veure, la interacció no és significativa i, per tant, el model correcta él l’additiu. Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Two way ANOVA Model amb interacció Exemple: Ajustem el model additiu amb el "lm" Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1 Marta Pérez-Casany DISSENY D’EXPERIMENTS: PART 1

Use Quizgecko on...
Browser
Browser