Tema 6. ANOVA.pptx
Document Details
Uploaded by SpiritualJoy
Comillas
Full Transcript
Tema 6. Diferencias entre más de dos grupos o variables Pablo Fernández Cáncer Pablo Nájera Álvarez Índice 1. 2. 3. 4. 5. Introducción y tipos de ANOVA ANOVA de un factor completamente aleatorizado (ANOVA A-CA) ANOVA de dos factores completamente aleatorizados (ANOVA AB-CA) ANOVA de un factor de...
Tema 6. Diferencias entre más de dos grupos o variables Pablo Fernández Cáncer Pablo Nájera Álvarez Índice 1. 2. 3. 4. 5. Introducción y tipos de ANOVA ANOVA de un factor completamente aleatorizado (ANOVA A-CA) ANOVA de dos factores completamente aleatorizados (ANOVA AB-CA) ANOVA de un factor de medidas repetidas (ANOVA A-MR) ANOVA de dos factores, uno de cada tipo (ANOVA AB-CA-MR) Introducción ANOVA significa análisis de varianza (ANalysis Of VAriance) Es un conjunto de técnicas estadísticas basados en el modelo lineal Generalización de las pruebas T: comparar medias entre… • Más de dos grupos (muestras independientes) • Más de dos variables continuas (muestras relacionadas) • Permiten estudiar más de dos variables conjuntamente Por tanto, en el ANOVA siempre va a haber: • Una Variable Dependiente (VD) cuantitativa • Una o más Variables Independientes (VI) llamadas factores Normalmente, los factores tendrán tres o más niveles, que serán los grupos El propósito del ANOVA será comparar la media de la VD entre esos grupos. Tipos de ANOVA Los modelos ANOVA se pueden clasificar atendiendo a tres criterios: 1. El número de factores 2. La asignación de individuos a los niveles del factor 3. La forma de establecer los niveles del factor Tipos de ANOVA Número de factores • En clase veremos el ANOVA de un factor (ANOVA A) y de dos factores (ANOVA AB) • Los ANOVA de más de dos factores son perfectamente posibles, pero se complica la interpretación de los resultados Queremos estudiar el efecto que tiene el nivel de estrés (bajo, medio, alto) sobre el rendimiento a la hora de completar un test de operaciones matemáticas. • ANOVA de un factor (ANOVA A) • VD: rendimiento (número de operaciones matemáticas completadas) • Factor (VI): nivel de estrés (bajo, medio, alto) Tipos de ANOVA Número de factores • En clase veremos el ANOVA de un factor (ANOVA A) y de dos factores (ANOVA AB) • Los ANOVA de más de dos factores son perfectamente posibles, pero se complica la interpretación de los resultados Queremos estudiar el efecto que tienen el nivel de estrés (bajo, medio, alto) y la dificultad de la tarea (fácil, difícil) sobre el rendimiento a la hora de completar un test de operaciones matemáticas. • ANOVA de dos factores (ANOVA AB) • VD: rendimiento (número de operaciones matemáticas completadas) • Factores (VIs): nivel de estrés (bajo, medio, alto) y dificultad de la tarea (fácil, difícil) diseño 3x2 Tipos de ANOVA Asignación de individuos a los niveles del factor • Factor completamente aleatorizado (CA): o Diseño inter-sujeto en el que cada individuo pasa por un único nivel del factor: los individuos forman muestras/grupos independientes o El factor suele tener tres o más niveles, por lo que habrá tres o más grupos entre los que compararemos su media en la VD o Generalización de la prueba T para muestras independientes (dos grupos) • Factor de medidas repetidas (MR): o Diseño intra-sujeto en el que cada individuo pasa por todos los niveles del factor: hay una única muestra/grupo o El factor suele tener tres o más niveles, que se corresponden con tres o más mediciones de la VD para el mismo grupo o Generalización de la prueba T para muestras relacionadas (dos variables) Tipos de ANOVA Asignación de individuos a los niveles del factor – ANOVA A-CA Queremos estudiar el efecto que tiene el nivel de estrés (bajo, medio, alto) sobre el rendimiento a la hora de completar un test de operaciones matemáticas. Para ello, contamos con una muestra de 30 personas. Asignaremos aleatoriamente a 10 personas a cada uno de los niveles de estrés. Después, medimos el número de operaciones matemáticas completadas. • ANOVA de un factor completamente aleatorizado (ANOVA A-CA) • VD: rendimiento (número de operaciones matemáticas completadas) • Factor (VI): nivel de estrés (bajo, medio, alto) • Tipo de factor: completamente aleatorizado (cada individuo pasa por un nivel del factor) Tipos de ANOVA Asignación de individuos a los niveles del factor – ANOVA A-MR Queremos estudiar el efecto de la frecuencia de uso de una palabra extranjera (bajo, medio, alto) con su posterior recuerdo. Para ello, contamos con una muestra de 30 personas a las que administramos un listado de 60 palabras, 20 de cada uno de los niveles de frecuencia de uso. Después, medimos el número de palabras recordadas de cada nivel. • ANOVA de un factor de medidas repetidas (ANOVA AMR) • VD: recuerdo (número de palabras recordadas) • Factor (VI): nivel de frecuencia de uso (bajo, medio, alto) • Tipo de factor: medidas repetidas (cada individuo pasa por los tres niveles del factor) Formato ancho Tipos de ANOVA Asignación de individuos a los niveles del factor – ANOVA A-MR Queremos estudiar el efecto de la frecuencia de uso de una palabra extranjera (bajo, medio, alto) con su posterior recuerdo. Para ello, contamos con una muestra de 30 personas a las que administramos un listado de 60 palabras, 20 de cada uno de los niveles de frecuencia de uso. Después, medimos el número de palabras recordadas de cada nivel. • ANOVA de un factor de medidas repetidas (ANOVA AMR) • VD: recuerdo (número de palabras recordadas) • Factor (VI): nivel de frecuencia de uso (bajo, medio, alto) • Tipo de factor: medidas repetidas (cada individuo pasa por los tres niveles del factor) Formato largo Tipos de ANOVA Asignación de individuos a los niveles del factor – ANOVA AB-CA Queremos estudiar el efecto que tienen el nivel de estrés (bajo, medio, alto) y la dificultad de la tarea (fácil, difícil) sobre el rendimiento a la hora de completar un test de operaciones matemáticas. Para ello, contamos con una muestra de 30 personas. Asignaremos aleatoriamente a 5 personas a cada uno de los 6 niveles resultantes de combinar los dos factores. Después, medimos el número de operaciones matemáticas completadas. • ANOVA de dos factores completamente aleatorizados (ANOVA AB-CA) • VD: rendimiento (número de operaciones matemáticas completadas) • Factores (VIs): nivel de estrés (bajo, medio, alto) y dificultad de la tarea (fácil, difícil) • Tipo de factores: ambos completamente aleatorizados (cada individuo pasa por un nivel de cada factor) Tipos de ANOVA Asignación de individuos a los niveles del factor – ANOVA AB-CA-MR Queremos estudiar el efecto que tienen el nivel de estrés (bajo, medio, alto) y la dificultad de la tarea (fácil, difícil) sobre el rendimiento a la hora de completar un test de operaciones matemáticas. Para ello, contamos con una muestra de 30 personas. Asignaremos aleatoriamente a 10 personas a cada uno de los niveles de estrés. Después, medimos el número de operaciones matemáticas completadas, entre las cuales habrá operaciones fáciles y operaciones difíciles. • ANOVA de dos factores, uno de ellos completamente aleatorizado y el otro de medidas repetidas (ANOVA AB-CA-MR) • VD: rendimiento (número de operaciones matemáticas completadas) • Factores (VIs): nivel de estrés (bajo, medio, alto) y dificultad de la tarea (fácil, difícil) • Tipo de factores: nivel de estrés es completamente aleatorizado y dificultad de la tarea es de medidas repetidas Tipos de ANOVA Asignación de individuos a los niveles del factor – ANOVA AB-CA-MR Formato ancho Formato largo Tipos de ANOVA Forma de establecer los niveles del factor • Factor de efectos fijos: o Las conclusiones del análisis se limitan únicamente a los niveles establecidos del factor o Hay un interés específico en los niveles seleccionados del factor • Factor de efectos aleatorios: o Las conclusiones del análisis se refieren a todos los posibles niveles del factor o Los niveles del factor son una muestra aleatoria de todos los posibles niveles para ese factor En clase veremos únicamente factores de efectos fijos Tipos de ANOVA Forma de establecer los niveles del factor – Factor de efectos fijos Queremos estudiar el efecto que tiene el nivel de estrés (bajo, medio, alto) sobre el rendimiento a la hora de completar un test de operaciones matemáticas. Para ello, contamos con una muestra de 30 personas. Asignaremos aleatoriamente a 10 personas a cada uno de los niveles de estrés. Después, medimos el número de operaciones matemáticas completadas. • ANOVA de un factor completamente aleatorizado (ANOVA A-CA) • VD: rendimiento (número de operaciones matemáticas completadas) • Factor (VI): nivel de estrés (bajo, medio, alto) • Tipo de factor: completamente aleatorizado (cada individuo pasa por un nivel del factor) y de efectos fijos (queremos estudiar únicamente los niveles de estrés bajo, medio y alto) Tipos de ANOVA Forma de establecer los niveles del factor – Factor de efectos aleatorios Queremos estudiar si la calidad de la enseñanza en bachillerato es igual (o no) en todos los centros educativos de la Comunidad de Madrid. Para ello, se seleccionan al azar 5 colegios de la Comunidad de Madrid, y se recoge la nota media en selectividad de sus estudiantes. • ANOVA de un factor completamente aleatorizado (ANOVA A-CA) • VD: calidad de la enseñanza (nota media en selectividad) • Factor (VI): colegio (colegio A, B, C, D y E) • Tipo de factor: completamente aleatorizado (cada estudiante pertenece a un colegio) y de efectos aleatorios (no nos interesan sólo los 5 colegios seleccionados, sino todos ellos) Parte I: El ANOVA A-CA ANOVA A-CA ANOVA de un factor completamente aleatorizado 1. Introducción al ANOVA A-CA 2. La lógica del ANOVA 3. El estadístico F 4. El ANOVA A-CA 5. La tabla del ANOVA 6. Tamaño del efecto 7. Comparaciones múltiples (planeadas y post hoc) 8. Información de los resultados de un ANOVA Introducción al ANOVA A-CA ANOVA de un factor completamente aleatorizado El ANOVA A-CA es una generalización de la prueba T de Student para muestras independientes cuando la variable categórica tiene más de dos niveles (es decir, cuando queremos comparar la VD en más de dos grupos) Si sólo hay dos grupos, el ANOVA A-CA es equivalente a la prueba T Ejemplos: • Comparar la eficacia (reducción del nivel de depresión) de un tratamiento farmacológico, un tratamiento psicológico, y un tratamiento combinado • Comparar el rendimiento académico en función del método de enseñanza (convencional, participativo o competitivo) • Comparar el salario medio de más de dos países La lógica del ANOVA Si queremos comparar dos grupos, usamos la prueba T para muestras independientes: 𝑌1 −𝑌 2 𝑇= 𝑡 𝑛−1 ^ 𝜎 𝑌 −𝑌 1 2 La lógica del ANOVA Si queremos comparar dos grupos, usamos la prueba T para muestras independientes: 𝑌1 −𝑌 2 1. Restar la media de los dos grupos 𝑇= ^𝑌 𝜎 𝑡 𝑛−1 1 −𝑌 2 La lógica del ANOVA Si queremos comparar dos grupos, usamos la prueba T para muestras independientes: 𝑌1 −𝑌 2 1. Restar la media de los dos grupos 𝑇= 𝑡 𝑛−2 ^ 2. Estandarizar el resultado para conocer la distribución 𝜎 𝑌 −𝑌 1 2 Para comparar más de dos grupos... • Podríamos hacer una prueba T para cada comparación posible de pares de grupos o El número de comparaciones aumenta rápidamente cuantos más grupos o La probabilidad de cometer al menos un error tipo I se dispara: # grupos (J) 2 3 4 5 6 7 8 9 10 # comps. (k) 1 3 6 10 15 21 28 36 45 0,05 0,14 0,26 0,40 0,54 0,66 0,76 0,84 0,90 La lógica del ANOVA Comparar más de dos grupos (ANOVA A-CA) • El propósito del ANOVA es evaluar si el promedio en la VD es igual para todos los niveles del factor o (todas las medias son iguales) o (al menos una media difiere de otra) • El ANOVA permite llegar a las siguientes conclusiones: o Mantener : la media de la VD es igual en todos los grupos; el factor no tiene un efecto sobre la VD (son independientes) o Rechazar : al menos la media de la VD de un grupo es distinta de la de otro grupo; el factor tiene un efecto sobre la VD (están relacionados) • Por tanto, el ANOVA permite comparar las medias de distintos grupos… • … lo que es equivalente a estudiar la relación entre el factor y la VD La lógica del ANOVA ¿Cómo comparamos la media de la VD simultáneamente en más de dos grupos? Paradójicamente, comparando sus varianzas La lógica del ANOVA Nivel de estrés Bajo Medio Alto 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 La lógica del ANOVA Variabilidad intragrupo (dentro de cada grupo) Variabilidad intergrupo (entre las medias de los distintos grupos) Nivel de estrés Bajo Medio Alto 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 La lógica del ANOVA Variabilidad intragrupo (dentro de cada grupo) Variabilidad intergrupo (entre las medias de los distintos grupos) Nivel de estrés Bajo Medio Alto 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 Ejemplo sin variabilidad intragrupo ni variabilidad intergrupo La lógica del ANOVA Variabilidad intragrupo (dentro de cada grupo) Variabilidad intergrupo (entre las medias de los distintos grupos) Nivel de estrés Bajo Medio Alto 4,0 4,0 4,0 4,0 4,0 6,0 6,0 6,0 6,0 6,0 3,0 3,0 3,0 3,0 3,0 Ejemplo sin variabilidad intragrupo, pero con variabilidad intergrupo La lógica del ANOVA Variabilidad intragrupo (dentro de cada grupo) Variabilidad intergrupo (entre las medias de los distintos grupos) Nivel de estrés Bajo Medio Alto 4,2 5,8 4,9 4,7 5,4 4,3 3,9 5,7 5,5 5,6 5,6 5,2 4,1 4,9 5,2 Ejemplo con variabilidad intragrupo, pero sin variabilidad intergrupo La lógica del ANOVA Variabilidad intragrupo (dentro de cada grupo) Variabilidad intergrupo (entre las medias de los distintos grupos) Nivel de estrés Bajo Medio Alto 3,2 4,8 3,9 3,7 4,4 5,3 4,9 6,7 6,5 6,6 3,6 3,2 3,2 2,9 2,1 Ejemplo con variabilidad intragrupo y con variabilidad intergrupo La lógica del ANOVA Variabilidad intergrupos: • Es la que nos interesa, puesto que recoge el efecto del factor sobre la VD • Es la que nos permite responder a la hipótesis del ANOVA: ¿son las medias iguales? Variabilidad intragrupos: • Es variabilidad que no se debe al efecto del factor, sino a otros factores (variables extrañas, diferencias individuales…) Nivel de estrés • En este sentido, se considera ruido o error Homocedasticidad: al igual que la prueba T para muestras independientes, el ANOVA A-CA asume que las varianzas poblacionales son iguales para todos los grupos Bajo Medio Alto 3,2 4,8 3,9 3,7 4,4 5,3 4,9 6,7 6,5 6,6 3,6 3,2 3,2 2,9 2,1 La lógica del ANOVA Hasta ahora, tenemos un modelo en el que la VD es el rendimiento, y la VI es el estrés. Pueden ocurrir dos cosas: • Que el estrés no tenga ninguna influencia en el rendimiento, lo cual se manifestará en medias iguales o similares para todos los grupos. • Que el estrés tenga una influencia en el rendimiento, lo cual se manifestará en medias distintas para cada grupo Nivel de estrés Bajo Medio Alto 3,2 4,8 3,9 3,7 4,4 5,3 4,9 6,7 6,5 6,6 3,6 3,2 3,2 2,9 2,1 La lógica del ANOVA Tenemos dos formas de estimar la variabilidad de la VD rendimiento (): a. Si asumimos igualdad de varianzas poblacionales (homocedasticidad), la varianza total será igual al promedio de las varianzas de los grupos: Nivel de estrés Bajo Medio Alto 3,2 4,8 3,9 3,7 4,4 5,3 4,9 6,7 6,5 6,6 3,6 3,2 3,2 2,9 2,1 b. Si asumimos igualdad de varianzas y de medias poblacionales, realmente estamos asumiendo que los grupos provienen de la misma distribución 2 2 𝑌 ^ =𝑛 𝜎 ∑ ( 𝑌 𝑗 −𝑌 ) 𝐽 −1 2 =5· 2 [ ( 4,0− 4,33 ) + ( 6,0 −4,33 ) +( 3,0 − 4,33 ) Media total: Media de los grupos: 3 −1 2 ] =11,67 La lógica del ANOVA Por un lado, tenemos una estimación de la varianza de la VD (rendimiento) basada únicamente en la varianza intragrupo: que recibe el nombre de media cuadrática error Por otro lado, tenemos una estimación de la varianza de la VD (rendimiento) basado en la varianza intergrupo: que recibe el nombre de media cuadrática intergrupo (). Si las medias poblacionales de los grupos son parecidas, entonces Si las medias poblacionales de los grupos son distintas, entonces El estadístico F Si , es probable que las medias poblacionales de los grupos sean parecidas A medida que sea mayor que , mayor probabilidad habrá de que las medias poblacionales de los grupos no sean parecidas ¿Cómo cuantificamos el tamaño relativo de frente a ? El estadístico F refleja el grado de parecido existente entre las medias poblacionales • Medias similares: • Medias distintas: De forma similar al estadístico X2, el estadístico F no puede obtener valores negativos El estadístico F (Supuestos) Si las poblaciones siguen una distribución normal y sus varianzas son iguales (homocedasticidad)… … entonces el estadístico F sigue una distribución F de Fisher-Snedecor: = número de grupos y = tamaño total de la muestra df1 = 1 df1 = 2 df1 = 3 df2 El estadístico F (Supuestos) Si las poblaciones siguen una distribución normal y sus varianzas son iguales (homocedasticidad)… … entonces el estadístico F sigue una distribución F de Fisher-Snedecor: = número de grupos y = tamaño total de la muestra df1 = 1 df1 = 2 df1 = 3 df2 El estadístico F (Supuestos) Si las poblaciones siguen una distribución normal y sus varianzas son iguales (homocedasticidad)… … entonces el estadístico F sigue una distribución F de Fisher-Snedecor: = número de grupos y = tamaño total de la muestra df1 = 1 df1 = 2 df1 = 3 df2 El ANOVA A-CA 1. Las hipótesis El ANOVA permite contrastar si las medias de todos los grupos son iguales o si, por el contrario, al menos dos de ellas difieren (todas las medias son iguales) (al menos dos medias difieren) El ANOVA A-CA 2. Los supuestos • J muestras aleatorias • Distribución normal de la VD en las J poblaciones • Homocedasticidad (la varianza de la VD es igual en las J poblaciones) * El supuesto de normalidad pierde importancia a medida que n aumenta El ANOVA A-CA 3. El estadístico de contraste y su distribución El ANOVA A-CA 4. Valor p y puntos críticos • Valor p: consultar en la tabla estadística de la distribución F o en esta web • Punto crítico: consultar en la tabla estadística de la distribución t o en esta web El ANOVA A-CA 5. Decisión sobre • Si o cae en la zona de rechazo rechazar : el promedio de la VD es diferente entre al menos dos de los grupos • Si o cae en la zona de aceptación mantener : no hay evidencia de que el promedio de la VD sea distinto entre ninguno de los grupos El ANOVA A-CA Un equipo de psicólogos sociales quiere estudiar si, tras pedir a una persona que realice una tarea, existe una relación entre la satisfacción de esa persona con la realización de la tarea y el grado de compensación económica que recibe por ella. Para ello, cuentan con una muestra de 30 personas, que dividen aleatoriamente en 3 grupos. A todos los grupos les piden que realicen un test de personalidad, el cual será de gran ayuda para un proyecto de investigación. Después de realizar el test, dan las gracias a todas las personas por su participación. Además, a las personas de los grupos B y C les dan una compensación económica: 0,50€ a los del grupo B y 20€ a los del grupo C. Después les piden que indiquen, en una escala de 0 a 10, su grado de satisfacción con la tarea realizada. Los resultados son los siguientes: Nivel de € 1 2 3 4 5 6 7 8 9 10 ∑Y Y0 8 6 7 8 10 8 7 4 5 9 72 7,2 3,29 Y0,50 7 6 5 8 4 3 6 6 7 2 54 5,4 3,60 Y20 9 4 7 10 8 9 9 7 8 10 81 8,1 3,21 6,9 3,37 TOTAL El ANOVA A-CA Nivel de € 1 2 3 4 5 6 7 8 9 10 ∑Y Y0 8 6 7 8 10 8 7 4 5 9 72 7,2 3,29 Y0,5 7 6 5 8 4 3 6 6 7 2 54 5,4 3,60 Y20 9 4 7 10 8 9 9 7 8 10 81 8,1 3,21 6,9 3,37 TOTAL 1. 2. 3. 4. Hipótesis: Supuestos: Estadístico de contraste: Valor p: 5. Decisión sobre : El ANOVA A-CA Nivel de € 1 2 3 4 5 6 7 8 9 10 ∑Y Y0 8 6 7 8 10 8 7 4 5 9 72 7,2 3,29 Y0,5 7 6 5 8 4 3 6 6 7 2 54 5,4 3,60 Y20 9 4 7 10 8 9 9 7 8 10 81 8,1 3,21 6,9 3,37 TOTAL 1. 2. 3. 4. Hipótesis: Supuestos: Estadístico de contraste: Valor p: 5. Decisión sobre : El ANOVA A-CA Nivel de € 1 2 3 4 5 6 7 8 9 10 ∑Y Y0 8 6 7 8 10 8 7 4 5 9 72 7,2 3,29 Y0,5 7 6 5 8 4 3 6 6 7 2 54 5,4 3,60 Y20 9 4 7 10 8 9 9 7 8 10 81 8,1 3,21 6,9 3,37 TOTAL 1. 2. 3. 4. Hipótesis: Supuestos: tres muestras aleatorias; normalidad; homocedasticidad Estadístico de contraste: Valor p: 5. Decisión sobre : El ANOVA A-CA Nivel de € 1 2 3 4 5 6 7 8 9 10 ∑Y Y0 8 6 7 8 10 8 7 4 5 9 72 7,2 3,29 Y0,5 7 6 5 8 4 3 6 6 7 2 54 5,4 3,60 Y20 9 4 7 10 8 9 9 7 8 10 81 8,1 3,21 6,9 3,37 TOTAL 1. 2. 3. 4. Hipótesis: Supuestos: tres muestras aleatorias; normalidad; homocedasticidad Estadístico de contraste: Valor p: 5. Decisión sobre : 1,89 El ANOVA A-CA Nivel de € 1 2 3 4 5 6 7 8 9 10 ∑Y Y0 8 6 7 8 10 8 7 4 5 9 72 7,2 3,29 Y0,5 7 6 5 8 4 3 6 6 7 2 54 5,4 3,60 Y20 9 4 7 10 8 9 9 7 8 10 81 8,1 3,21 6,9 3,37 TOTAL 1. 2. 3. 4. Hipótesis: Supuestos: tres muestras aleatorias; normalidad; homocedasticidad Estadístico de contraste: Valor p: 5. Decisión sobre : 1,89 El ANOVA A-CA Nivel de € 1 2 3 4 5 6 7 8 9 10 ∑Y Y0 8 6 7 8 10 8 7 4 5 9 72 7,2 3,29 Y0,5 7 6 5 8 4 3 6 6 7 2 54 5,4 3,60 Y20 9 4 7 10 8 9 9 7 8 10 81 8,1 3,21 6,9 3,37 TOTAL 1. 2. 3. 4. Hipótesis: Supuestos: tres muestras aleatorias; normalidad; homocedasticidad Estadístico de contraste: Valor p: 5. Decisión sobre : 1,89 El ANOVA A-CA Nivel de € 1 2 3 4 5 6 7 8 9 10 ∑Y Y0 8 6 7 8 10 8 7 4 5 9 72 7,2 3,29 Y0,5 7 6 5 8 4 3 6 6 7 2 54 5,4 3,60 Y20 9 4 7 10 8 9 9 7 8 10 81 8,1 3,21 6,9 3,37 TOTAL 1. 2. 3. 4. Hipótesis: Supuestos: tres muestras aleatorias; normalidad; homocedasticidad Estadístico de contraste: Valor p: 5. Decisión sobre : 1,89 El ANOVA A-CA Nivel de € 1 2 3 4 5 6 7 8 9 10 ∑Y Y0 8 6 7 8 10 8 7 4 5 9 72 7,2 3,29 Y0,5 7 6 5 8 4 3 6 6 7 2 54 5,4 3,60 Y20 9 4 7 10 8 9 9 7 8 10 81 8,1 3,21 6,9 3,37 TOTAL 1. 2. 3. 4. 5. 1,89 Hipótesis: Supuestos: tres muestras aleatorias; normalidad; homocedasticidad Estadístico de contraste: Valor p: Decisión sobre : rechazar . Existe relación entre la satisfacción y la compensación; la media de satisfacción no es la misma para los tres grupos de compensación. La tabla del ANOVA Los resultados del ANOVA suelen presentarse en una tabla con un formato más o menos estándar, la cual contiene toda la información resumida que hemos visto Fuente de variación (efecto) Suma de cuadrados Grados de (SC) libertad (gl) Media cuadrática (MC) Estadístico F Valor p Intergrupos (A) SCA = MCA(J – 1) J–1 MCA = SCA / (J – 1) F = MCA/MCE P(Fgl1; gl2 ≥ F) Intragrupos o error (E) SCE = MCE(N – J) N–J MCE = SCE / (N – J) - - Total SCT = SCA + SCE N–1 - - - Tamaño del efecto En el ANOVA, el tamaño del efecto cuantifica lo siguiente: de toda la variabilidad existente en la VD, ¿cuál es la proporción que se debe al factor (y, por tanto, no al error)? El tamaño del efecto del ANOVA se interpreta como la proporción de varianza compartida entre la VD y el factor: tiende a sobrestimar el tamaño del efecto, por lo que se propone una corrección: Tanto como pueden adoptar valores entre 0 y 1 Puntos de corte orientativos: 0,01 ≤ leve < 0,06 ≤ moderado < 0,14 ≤ grande Estos puntos de corte se interpretarían como 1%, 6% y 14% de varianza compartida. Comparaciones de tendencia • Sólo tienen sentido cuando el factor es una variable ordinal • Permiten estudiar el tipo de relación entre el factor y la VD Relación lineal Relación cuadrática Relación cúbica • Si el factor tiene k niveles, sólo se podrá estudiar hasta la relación de orden k – 1 Comparaciones de tendencia • Hipótesis nula (): no hay evidencias de que exista ese tipo de relación • Hipótesis alternativa (): sí existe una relación de ese tipo Las comparaciones de tendencia calculan un estadístico T. Al analizar la relación entre nivel de activación y rendimiento, encontramos estos resultados: Relación T p Lineal 0,91 0,363 Cuadrática 29,42 < 0,001 ¿Qué tipo de relación existe entre las variables? Comparaciones múltiples • ¿Existe relación? ANOVA • ¿Es una relación relevante? Tamaño del efecto • ¿Entre qué grupos existen diferencias? Comparaciones múltiples Las comparaciones entre pares de grupos que se realizan tras el ANOVA se llaman comparaciones post hoc o a posteriori: • Básicamente se comparan todos los pares posibles de grupos. Hay distintos tipos de pruebas estadísticas para hacer estas comparaciones. Nosotros usaremos la prueba de Tukey. • Al hacer múltiples comparaciones, el error tipo I aumenta (p. ej., ). La prueba de Tukey aplica un ajuste al nivel de significación () para mantenerlo en 0.05. # grupos (J) 2 3 4 5 6 7 8 9 10 # comps. (k) 1 3 6 10 15 21 28 36 45 0,05 0,14 0,26 0,40 0,54 0,66 0,76 0,84 0,90 0,05 0,05 0,05 0,05 0,05 0,05 0,05 0,05 0,05 Comparaciones post hoc o a posteriori Prueba de Tukey • Es una prueba que permite realizar todas las comparaciones posibles por pares: • Lo importante es saber que esta prueba sirve para realizar comparaciones entre todos los pares de medias que surgen de los niveles del factor, y que aplica una corrección para que no se infle el error tipo I. Se interpreta como una prueba T (jamovi nos dará una T y una p cuando la usemos). Esto no entra para examen: • La prueba de Tukey se basa en buscar la diferencia mínima significativa (DMS): valor más pequeño a partir del cual la diferencia de medias es significativa • El valor de se buscará en la tabla estadística correspondiente • Si la diferencia (en puntuaciones directas) entre dos medias es mayor que , entonces se rechazará y se concluirá que las dos medias comparadas son diferentes a nivel poblacional Comparaciones post hoc o a posteriori Aplicación de la prueba de Tukey (no entra para examen) Al realizar las comparaciones por pares del rendimiento en función del nivel de activación, obtenemos los siguientes resultados (; ; ): ; El valor de la DMS es: • Bajo-medio (3): supera la DMS; la media poblacional en rendimiento entre los grupos de activación bajo y medio es distinta • Bajo-alto (1): no supera la DMS; no hay evidencia de que la media poblacional en rendimiento entre los grupos de activación bajo y alto sea distinta • Medio-alto (4): supera la DMS; la media poblacional en rendimiento entre los grupos de activación medio y medio es distinta Información de los resultados de un ANOVA Se estudió la motivación intrínseca (VD) a partir el test IMI (Instrinsic Motivation Inventory) en tres grupos de estudiantes seleccionados aleatoriamente. El factor fue el curso, con tres niveles: sexto de primaria, 2º de ESO y primero de bachillerato. El modelo estadístico utilizado fue el ANOVA de un factor completamente aleatorizado. Los resultados mostraron diferencias estadísticamente significativas en al menos dos grupos (F(2,36) = 12,13, p < 0,001, η2 = 0,231). La medida de tamaño del efecto refleja diferencias importantes y relevantes en la motivación intrínseca dependiendo del curso. El grupo de estudiantes de sexto de primaria obtuvo una media de 23,34 (DT=6,98), el de 2º de ESO una media de 26,45 (DT=7,10) y el de primero de bachillerato de 29,36 (DT=5,13). A continuación, se estudiaron las diferencias de medias por pares para ver qué cursos diferían de qué otros cursos con la prueba de Tukey. Los resultados mostraron que todos los cursos difieren significativamente entre sí (p < 0,01). Parte II: El ANOVA AB-CA ANOVA AB-CA ANOVA de dos factores completamente aleatorizados 1. Introducción al ANOVA AB-CA 2. Efectos principales y efecto de interacción 3. El ANOVA AB-CA 4. Efectos simples: Interpretación del efecto de interacción 5. Tamaño del efecto 6. Comparaciones múltiples Introducción al ANOVA AB-CA ANOVA de dos factores completamente aleatorizados El ANOVA AB-CA es una generalización del ANOVA A-CA donde contamos con una VD continua y dos factores (VI categóricas) Tendremos tantos grupos como combinaciones de los niveles de los factores • ANOVA 2x3 (un factor con dos niveles y otro con 3 niveles): 6 grupos • ANOVA 3x4 (un factor con tres niveles y otro con 4 niveles): 12 grupos Más eficiente e informativo que dos ANOVA A-CA independientes Dificultad de la tarea (A) Nivel de activación (B) Fácil Difícil Bajo Medio Alto 30 personas 30 personas 20 personas 20 personas 20 personas ANOVA A: 60 personas ANOVA B: 60 personas ANOVA A + B: 120 personas Introducción al ANOVA AB-CA ANOVA de dos factores completamente aleatorizados El ANOVA AB-CA es una generalización del ANOVA A-CA donde contamos con una VD continua y dos factores (VI categóricas) Tendremos tantos grupos como combinaciones de los niveles de los factores • ANOVA 2x3 (un factor con dos niveles y otro con 3 niveles): 6 grupos • ANOVA 3x4 (un factor con tres niveles y otro con 4 niveles): 12 grupos Más eficiente e informativo que dos ANOVA A-CA independientes Activación (B) Bajo Medio Alto Total Fácil 10 personas 10 personas 10 personas 30 personas Difícil 10 personas 10 personas 10 personas 30 personas Total 20 personas 20 personas 20 personas 60 personas Dificultad (A) ANOVA AB: 60 personas Introducción al ANOVA AB-CA Notación del ANOVA AB-CA Activación (B) Dificultad (A) Bajo Medio Alto Medias Fácil 5,6 6,4 … 5,2 7,5 7,3 … 8,9 4,1 6,6 … 4,9 6,8 Difícil 3,6 5,5 … 4,0 7,8 6,4 … 8,0 4,8, 5,0 … 3,8 5,6 Medias 5,8 7,6 5,2 6,2 Introducción al ANOVA AB-CA Notación del ANOVA AB-CA Factor B Factor A … Medias … … … … … Medias • Factor A: J medias () • Factor B: K medias () • Combinación de A y B: JK medias () … … … … … Introducción al ANOVA AB-CA Notación del ANOVA AB-CA Activación (B) Dificultad (A) Fácil Difícil Medias Bajo Medio Alto Medias Efectos principales y efecto de interacción Efecto principal • Efecto de cada factor de manera independiente • Equivalente a realizar un ANOVA A-CA distinto sobre cada factor: o ; (efecto principal del factor A) o ; (efecto principal del factor B) Efecto de interacción • El ANOVA AB-CA permite estudiar un tercer efecto: la interacción entre A y B • Este efecto es normalmente el de mayor interés • Si existe efecto de interacción, no se deberían interpretar los efectos principales Efectos principales y efecto de interacción Ejemplo sin interacción Factor B Medias Factor A Medias 6 5 7 6 4 5 3 4 5 6 4 5 Efectos principales y efecto de interacción Ejemplo sin interacción Factor B Factor A Medias 6 Medias 4 5 2 5 3 4 2 7 5 6 2 6 4 5 2 • La diferencia entre y es siempre la misma, tanto en (6 – 4 = 2), como en (5 – 3 = 2), como en (7 – 5 = 2), como con las medias marginales (6 – 4 = 2) Efectos principales y efecto de interacción Ejemplo sin interacción Factor B Medias Factor A 6 Medias 4 5 1 1 1 5 3 4 2 2 2 7 6 5 6 4 5 • La diferencia entre y es siempre la misma, tanto en (6 – 4 = 2), como en (5 – 3 = 2), como en (7 – 5 = 2), como con las medias marginales (6 – 4 = 2) • La diferencia entre , y es siempre la misma, tanto en , como en , como con las medias marginales Efectos principales y efecto de interacción Ejemplo sin interacción Factor B Medias Factor A 6 Medias 4 5 2 5 3 4 2 7 5 6 2 6 4 5 • La diferencia entre los niveles de un factor condicionado a un solo nivel del otro factor es un efecto simple • En este caso, hay 3 efectos simples para el factor A y 2 efectos simples para el factor B • En este caso, son más fáciles de interpretar los efectos simples del factor A Efectos principales y efecto de interacción Ejemplo sin interacción No hay interacción cuando la diferencia de las medias poblacionales entre los niveles de un factor son las mismas independientemente de los niveles del otro factor En otras palabras, cuando no hay diferencias entre los efectos simples de los factores Efectos principales y efecto de interacción Ejemplo con interacción Factor B Medias Factor A Medias 6 4 5 5 4 5 8 6 3 4 5 5 Efectos principales y efecto de interacción Ejemplo con interacción Factor B Medias Factor A 6 Medias 4 5 2 4 8 6 –4 5 3 4 2 • La diferencia entre y no es siempre la misma: en (6 – 4 = 2), en (4 – 8 = –4), en (5 – 3 = 2), o en las medias marginales (5 – 5 = 0) 5 5 5 0 Efectos principales y efecto de interacción Ejemplo con interacción Factor B Medias Factor A 6 Medias 4 5 2 –4 –1 4 8 6 –1 5 2 5 5 3 4 5 5 • La diferencia entre y no es siempre la misma: en (6 – 4 = 2), en (4 – 8 = –4), en (5 – 3 = 2), o en las medias marginales (5 – 5 = 0) • La diferencia entre , y no es siempre la misma: en , en , o en las medias marginales Efectos principales y efecto de interacción Ejemplo con interacción Sí hay interacción cuando la diferencia de las medias poblacionales entre los niveles de un factor no son las mismas independientemente de los niveles del otro factor En otras palabras, cuando sí hay diferencias entre los efectos simples de los factores Efectos principales y efecto de interacción Efectos principales • ; • ; Efecto de interacción • ; Factor B Medias Factor A Medias 6 4 5 5 4 5 8 6 3 4 5 5 Efectos principales y efecto de interacción Efectos principales • ; • ; Efecto de interacción • ; Factor B Medias Factor A Medias 6 4 5 5 4 5 8 6 3 4 5 5 Efectos principales y efecto de interacción Efectos principales • ; • ; Efecto de interacción • ; Factor B Medias Factor A Medias 6 4 5 5 4 5 8 6 3 4 5 5 Efectos principales y efecto de interacción Efectos principales • ; • ; Efecto de interacción • ; Factor B Medias Factor A Medias 6 4 5 5 4 5 8 6 3 4 5 5 Efectos principales y efecto de interacción Factor B Medias Factor A Medias 6 4 5 5 4 5 8 6 3 4 5 5 Si hay interacción, interpretar los efectos principales puede llevar a conclusiones imprecisas o directamente erróneas Efectos principales y efecto de interacción Factor B Medias Factor A Medias 6 4 5 5 4 5 8 6 3 4 5 5 Si hay interacción, interpretar los efectos principales puede llevar a conclusiones imprecisas o directamente erróneas En este ejemplo, podríamos concluir que el factor A no tiene ningún efecto en la VD Efectos principales y efecto de interacción Factor B Medias Factor A Medias 6 4 5 5 4 5 8 6 3 4 5 5 Si hay interacción, interpretar los efectos principales puede llevar a conclusiones imprecisas o directamente erróneas En este ejemplo, podríamos concluir que el factor A no tiene ningún efecto en la VD Sin embargo, sí que influye en la VD a través de su interacción con el factor B Efectos principales, simples y de interacción No hay interacción • No hay diferencias estadísticamente significativas entre los efectos simples • Las líneas del gráfico son (±) paralelas • Sí se interpretan los efectos principales (contienen toda la información) Sí hay interacción • Sí hay diferencias estadísticamente significativas entre algún efecto simple • Las líneas del gráfico no son paralelas • No se interpretan los efectos principales (contienen información sesgada) Efectos principales, simples y de interacción Que exista efecto de interacción (AB) no significa que los factores A y B estén relacionados entre sí (aunque es posible que lo estén) Significa que el efecto del factor A sobre la VD es diferente en distintos niveles del factor B El ANOVA AB-CA 1. Las hipótesis El ANOVA AB-CA realiza un contraste para cada efecto (2 principales y de interacción) El ANOVA AB-CA 2. Los supuestos • JK muestras aleatorias • Distribución normal de la VD en las JK poblaciones • Homocedasticidad (la varianza de la VD es igual en las JK poblaciones) * El supuesto de normalidad pierde importancia a medida que n aumenta El ANOVA AB-CA 3. El estadístico de contraste y su distribución Existen cuatro fuentes de variación: la debida al efecto principal del factor A (), al efecto principal del factor B (), al efecto de interacción AB () y al error () Como estamos haciendo tres contrastes, tendremos un estadístico F para cada uno El ANOVA AB-CA 3. El estadístico de contraste y su distribución Existen cuatro fuentes de variación: la debida al efecto principal del factor A (), al efecto principal del factor B (), al efecto de interacción AB () y al error () Como estamos haciendo tres contrastes, tendremos un estadístico F para cada uno El ANOVA AB-CA 3. El estadístico de contraste y su distribución Existen cuatro fuentes de variación: la debida al efecto principal del factor A (), al efecto principal del factor B (), al efecto de interacción AB () y al error () Como estamos haciendo tres contrastes, tendremos un estadístico F para cada uno El ANOVA AB-CA 4. Valor p y puntos críticos • Valor p: consultar en la tabla estadística de la distribución F o en esta web • Punto crítico: consultar en la tabla estadística de la distribución t o en esta web o Para el efecto principal de A: o Para el efecto principal de B: o Para el efecto de interacción AB: El ANOVA AB-CA 5. Decisión sobre a. Efecto de interacción • Si o cae en la zona de rechazo rechazar : hay interacción entre los dos factores. El efecto de un factor sobre la VD no es el mismo en todos niveles del otro factor • Si o cae en la zona de aceptación mantener : no hay evidencia de que haya interacción entre los dos factores. El efecto de un factor sobre la VD es similar en todos los niveles del otro factor b. Efecto principal • Si o cae en la zona de rechazo rechazar : el promedio de la VD es diferente entre al menos dos de los grupos • Si o cae en la zona de aceptación mantener : no hay evidencia de que el promedio de la VD sea distinto entre ninguno de los grupos El ANOVA AB-CA Queremos evaluar si el nivel de activación (bajo, medio, alto) y la dificultad de la tarea (fácil, difícil) están relacionadas con el rendimiento en una tarea de solución de problemas. Para ello, contamos con una muestra de 30 personas, a las que hemos dividido en 6 grupos en función de los niveles de los dos factores. La siguiente tabla muestras las medias (y las varianzas) del rendimiento en función de los niveles de los factores: Nivel activación Dificultad tarea Bajo Medio Alto Medias Fácil 13 (8,5) 15 (5,0) 8 (6,5) 12 Difícil Medias 7 (4,0) 10 13 (6,0) 14 10 (7,5) 9 10 11 El ANOVA AB-CA Nivel activación Dificultad tarea Bajo Medio Alto Medias Fácil 13 (8,5) 15 (5,0) 8 (6,5) 12 Difícil Medias 7 (4,0) 10 13 (6,0) 14 10 (7,5) 9 10 11 1. 2. Hipótesis: Supuestos: 3. 4. 5. Estadístico de contraste: Valor p: Decisión sobre : El ANOVA AB-CA Nivel activación Dificultad tarea Bajo Medio Alto Medias Fácil 13 (8,5) 15 (5,0) 8 (6,5) 12 Difícil Medias 7 (4,0) 10 13 (6,0) 14 10 (7,5) 9 10 11 1. Hipótesis: 2. 3. 4. Supuestos: Estadístico de contraste: Valor p: 5. Decisión sobre : El ANOVA AB-CA Nivel activación Dificultad tarea Bajo Medio Alto Medias Fácil 13 (8,5) 15 (5,0) 8 (6,5) 12 Difícil Medias 7 (4,0) 10 13 (6,0) 14 10 (7,5) 9 10 11 1. Hipótesis: 2. 3. 4. 5. Supuestos: JK muestras aleatorias, normalidad, homocedasticidad Estadístico de contraste: Valor p: Decisión sobre : El ANOVA AB-CA Nivel activación Dificultad tarea Bajo Medio Alto Medias Fácil 13 (8,5) 15 (5,0) 8 (6,5) 12 Difícil Medias 7 (4,0) 10 13 (6,0) 14 10 (7,5) 9 10 11 1. Hipótesis: 2. 3. 4. 5. Supuestos: JK muestras aleatorias, normalidad, homocedasticidad Estadístico de contraste: Valor p: Decisión sobre : El ANOVA AB-CA Nivel activación Dificultad tarea Bajo Medio Alto Medias Fácil 13 (8,5) 15 (5,0) 8 (6,5) 12 Difícil Medias 7 (4,0) 10 13 (6,0) 14 10 (7,5) 9 10 11 1. Hipótesis: 2. 3. 4. 5. Supuestos: JK muestras aleatorias, normalidad, homocedasticidad Estadístico de contraste: Valor p: Decisión sobre : El ANOVA AB-CA Nivel activación Dificultad tarea Bajo Medio Alto Medias Fácil 13 (8,5) 15 (5,0) 8 (6,5) 12 Difícil Medias 7 (4,0) 10 13 (6,0) 14 10 (7,5) 9 10 11 1. Hipótesis: 2. 3. 4. 5. Supuestos: JK muestras aleatorias, normalidad, homocedasticidad Estadístico de contraste: Valor p: Decisión sobre : El ANOVA AB-CA Nivel activación Dificultad tarea Bajo Medio Alto Medias Fácil 13 (8,5) 15 (5,0) 8 (6,5) 12 Difícil Medias 7 (4,0) 10 13 (6,0) 14 10 (7,5) 9 10 11 1. Hipótesis: 2. 3. 4. 5. Supuestos: JK muestras aleatorias, normalidad, homocedasticidad Estadístico de contraste: ; ; Valor p: Decisión sobre : El ANOVA AB-CA Nivel activación Dificultad tarea Bajo Medio Alto Medias Fácil 13 (8,5) 15 (5,0) 8 (6,5) 12 Difícil Medias 7 (4,0) 10 13 (6,0) 14 10 (7,5) 9 10 11 1. Hipótesis: 2. 3. 4. Supuestos: JK muestras aleatorias, normalidad, homocedasticidad Estadístico de contraste: ; ; Valor p: 5. Decisión sobre : El ANOVA AB-CA Nivel activación Dificultad tarea Bajo Medio Alto Medias Fácil 13 (8,5) 15 (5,0) 8 (6,5) 12 Difícil Medias 7 (4,0) 10 13 (6,0) 14 10 (7,5) 9 10 11 1. Hipótesis: 2. 3. 4. 5. Supuestos: JK muestras aleatorias, normalidad, homocedasticidad Estadístico de contraste: ; ; Valor p: ;; Decisión sobre : El ANOVA AB-CA Nivel activación Dificultad tarea Bajo Medio Alto Medias Fácil 13 (8,5) 15 (5,0) 8 (6,5) 12 Difícil Medias 7 (4,0) 10 13 (6,0) 14 10 (7,5) 9 10 11 1. Hipótesis: 2. 3. 4. 5. Supuestos: JK muestras aleatorias, normalidad, homocedasticidad Estadístico de contraste: ; ; Valor p: ;; Decisión sobre : Rechazar las tres . Como hay efecto de interacción, la diferencia en rendimiento entre la tarea fácil y difícil no es igual para los tres niveles de activación. El efecto de cada factor sobre el rendimiento está condicionado por el otro factor. El ANOVA AB-CA Nivel activación Dificultad tarea Bajo Medio Alto Medias Fácil 13 (8,5) 15 (5,0) 8 (6,5) 12 Difícil Medias 7 (4,0) 10 13 (6,0) 14 10 (7,5) 9 10 11 La tabla del ANOVA AB-CA Fuente de variación (efecto) Suma de cuadrados (SC) Grados de libertad (gl) Media cuadrática (MC) Estadístico F Valor p Intergrupos (A) SCA = MCA(J – 1) J–1 MCA = SCA / (J – 1) FA = MCA/MCE P(Fgl1; gl2 ≥ FA) Intergrupos (B) SCB = MCB(K – 1) K–1 MCB = SCB / (K – 1) FB = MCB/MCE P(Fgl1; gl2 ≥ FB) Intergrupos (AB) SCAB = MCAB(J – 1)(K – 1) (J – 1)(K – 1) MCAB = SCAB / (J – 1)(K – 1) FAB = MCAB/MCE P(Fgl1; gl2 ≥ FAB) Intragrupos o error (E) SCE = MCE(N – J) N – JK MCE = SCE / (N – J) - - SCT = SCA+SCB+SCAB+SC N–1 - - - Total E Tamaño del efecto y comparaciones múltiples El tamaño del efecto se calcula de forma equivalente al ANOVA A-CA, solo que ahora tendremos tres efectos distintos (p. ej., , y ) Por otro lado, las tres hipótesis del ANOVA AB-CA sólo permiten identificar si existe alguna diferencia, pero no entre qué niveles • Efectos principales: equivalentes al ANOVA A-CA (Comparaciones de tendencia, prueba de Tukey) • Efecto de interacción: comparar efectos simples entre sí (diferencia entre diferencias) Tamaño del efecto y comparaciones múltiples El tamaño del efecto se calcula de forma equivalente al ANOVA A-CA, solo que ahora tendremos tres efectos distintos (p. ej., , y ) Por otro lado, las tres hipótesis del ANOVA AB-CA sólo permiten identificar si existe alguna diferencia, pero no entre qué niveles • Efectos principales: equivalentes al ANOVA A-CA (Comparaciones de tendencia, prueba de Tukey) • Efecto de interacción: comparar efectos simples entre sí (diferencia entre diferencias) ¿ = ? ¿ = ? ¿ = ? Parte III: ANOVA A-MR ANOVA A-MR ANOVA de un factor de medidas repetidas 1. Introducción al ANOVA A-MR 2. La variabilidad intrasujeto 3. El ANOVA A-MR 4. Tamaño del efecto y comparaciones múltiples Introducción al ANOVA A-MR ANOVA de un factor de medidas repetidas El ANOVA A-MR es una generalización de la prueba T de Student para muestras relacionadas cuando contamos con más de dos variables cuantitativas Si sólo hay dos variables, el ANOVA A-MR es equivalente a la prueba T Ejemplos: • Realizar estudios de serie temporal interrumpida para evaluar el nivel de depresión en varios momentos temporales antes y después de realizar un tratamiento • Comparar las notas medias de distintas asignaturas en un grado universitario • Comparar las opiniones de una muestra de individuos a varios productos Introducción al ANOVA A-MR Dos formas equivalentes de pensar en el ANOVA A-MR: • Contar con K variables continuas (y comparar sus promedios) • Contar con una VD continua y un factor con K niveles (y comparar el promedio de la VD entre los niveles) Queremos estudiar el efecto del paso del tiempo en el recuerdo. Para ello, presentamos una lista de 30 palabras a una muestra de 50 estudiantes. Al cabo de una hora, un día, una semana y un mes, les pedimos a los estudiantes que intenten recordar las palabras. • VD: recuerdo (número de palabras recordadas) • Factor y niveles: tiempo (una hora, un día, una semana, un mes) o Cuatro variables continuas: recuerdo tras una hora, recuerdo tras un día, recuerdo tras una semana, recuerdo tras un mes Introducción al ANOVA A-MR Dos formas equivalentes de pensar en el ANOVA A-MR: • Contar con K variables continuas (y comparar sus promedios) • Contar con una VD continua y un factor con K niveles (y comparar el promedio de la VD entre los niveles) Queremos estudiar el efecto de la valencia emocional en el recuerdo. Para ello, presentamos una lista de 30 palabras a una muestra de 50 estudiantes: 10 de ellas con valencia negativa, 10 con valencia neutra y 10 con valencia positiva. Al cabo de diez minutos, les pedimos a los estudiantes que intenten recordar las palabras. • VD: recuerdo (número de palabras recordadas) • Factor y niveles: valencia emocional (negativa, neutra, positiva) o Tres variables continuas: recuerdo de palabras con valencia negativa, recuerdo de palabras con valencia neutra, recuerdo de palabras con valencia positiva Introducción al ANOVA A-MR ANOVA A-MR Presentamos una lista de 30 palabras a una muestra de 5 estudiantes: 10 de ellas con valencia negativa, 10 con valencia neutra y 10 con valencia positiva. V. Negativa V. Neutra V. Positiva ANOVA A-CA Presentamos una lista de 10 palabras a tres grupos de 5 estudiantes: a uno de ellos le presentamos palabras con valencia negativa, a otro con valencia neutra y, a otro, positiva. V. Negativa V. Neutra V. Positiva Introducción al ANOVA A-MR Ventajas del ANOVA A-MR: • Más eficiente (menos tamaño muestral requerido) • Menor error eliminación de la variabilidad debida a las diferencias entre sujetos Desventajas del ANOVA A-MR: • Supuestos más exigentes del contraste • Efectos distorsionantes (p. ej., efecto de aprendizaje, de práctica, de arrastre) Las fuentes de variabilidad Recordemos el ANOVA AB-CA Factor B Factor A … Media s … … … Media s … … … … … … … Las fuentes de variabilidad Recordemos el ANOVA AB-CA Factor B Factor A … Media s … … … Media s … … … … … … … 𝑀𝐶 𝐴 =𝑛𝐾 ∑ ¿¿¿¿ Las fuentes de variabilidad Recordemos el ANOVA AB-CA Factor B Factor A … Media s … … … Media s … … … … … … … Las fuentes de variabilidad Recordemos el ANOVA AB-CA Factor B Factor A … Media s … … … Media s … … … … … … … Las fuentes de variabilidad El ANOVA A-MR es similar al ANOVA AB-CA, donde un factor son los sujetos Factor A Sujeto … Media s … … … … … … … … … Media … que nos interesa (el del factor A) Variabilidad intergrupos: es el efecto s Variabilidad intersujeto: no suele ser interesante (esperamos dif. individuales) Variabilidad error: recoge la discrepancia de cada puntuación () con el promedio de su grupo (k) y de su individuo (i) Las fuentes de variabilidad El ANOVA A-MR es similar al ANOVA AB-CA, donde un factor son los sujetos Factor A Sujeto … Media s … … … Media s … … … … … … … El ANOVA A-MR 1. Las hipótesis El ANOVA permite contrastar si las medias de todos los grupos son iguales o si, por el contrario, al menos dos de ellas difieren (todas las medias son iguales) (al menos dos medias difieren) El ANOVA A-MR 2. Los supuestos • J muestras aleatorias • Distribución normal de la VD en las J poblaciones • Esfericidad (la varianza y covarianzas de la VD son iguales en las poblaciones) * El supuesto de normalidad pierde importancia a medida que n aumenta El ANOVA A-MR 3. El estadístico de contraste y su distribución El ANOVA A-MR 4. Valor p y puntos críticos • Valor p: consultar en la tabla estadística de la distribución F o en esta web • Punto crítico: consultar en la tabla estadística de la distribución t o en esta web El ANOVA A-MR 5. Decisión sobre • Si o cae en la zona de rechazo rechazar : existen diferencias en el promedio de al menos dos variables • Si o cae en la zona de aceptación mantener : no hay evidencia de que el promedio de las variables sea distinto El ANOVA A-MR Queremos evaluar el efecto del paso del tiempo sobre la calidad del recuerdo. Tras pedir a 6 personas que memoricen una lista de palabras, al cabo de una hora, un día, una semana y un mes se les indica que traten de recordar el máximo número de palabras posibles. Se obtienen los siguientes resultados: Sujeto Hora Día Semana Mes 1 16 11 9 8 2 14 8 4 2 3 19 13 7 9 4 17 10 8 9 5 16 14 8 6 6 20 16 12 8 El ANOVA A-MR Queremos evaluar el efecto del paso del tiempo sobre la calidad del recuerdo. Tras pedir a 6 personas que memoricen una lista de palabras, al cabo de una hora, un día, una semana y un mes se les indica que traten de recordar el máximo número de palabras posibles. Se obtienen los siguientes resultados: 1. Hipótesis: 2. 3. 4. 5. Supuestos: Estadístico de contraste: Valor p: Decisión sobre : El ANOVA A-MR Queremos evaluar el efecto del paso del tiempo sobre la calidad del recuerdo. Tras pedir a 6 personas que memoricen una lista de palabras, al cabo de una hora, un día, una semana y un mes se les indica que traten de recordar el máximo número de palabras posibles. Se obtienen los siguientes resultados: 1. Hipótesis: 2. 3. 4. 5. Supuestos: Estadístico de contraste: Valor p: Decisión sobre : El ANOVA A-MR Queremos evaluar el efecto del paso del tiempo sobre la calidad del recuerdo. Tras pedir a 6 personas que memoricen una lista de palabras, al cabo de una hora, un día, una semana y un mes se les indica que traten de recordar el máximo número de palabras posibles. Se obtienen los siguientes resultados: 1. Hipótesis: 2. 3. 4. 5. Supuestos: cuatro muestras aleatorias; normalidad; esfericidad Estadístico de contraste: Valor p: Decisión sobre : El ANOVA A-MR Queremos evaluar el efecto del paso del tiempo sobre la calidad del recuerdo. Tras pedir a 6 personas que memoricen una lista de palabras, al cabo de una hora, un día, una semana y un mes se les indica que traten de recordar el máximo número de palabras posibles. Se obtienen los siguientes resultados: 1. Hipótesis: 2. 3. 4. 5. Supuestos: cuatro muestras aleatorias; normalidad; esfericidad Estadístico de contraste: Valor p: Decisión sobre : El ANOVA A-MR Queremos evaluar el efecto del paso del tiempo sobre la calidad del recuerdo. Tras pedir a 6 personas que memoricen una lista de palabras, al cabo de una hora, un día, una semana y un mes se les indica que traten de recordar el máximo número de palabras posibles. Se obtienen los siguientes resultados: 1. Hipótesis: 2. 3. 4. 5. Supuestos: cuatro muestras aleatorias; normalidad; esfericidad Estadístico de contraste: Valor p: Decisión sobre : El ANOVA A-MR Queremos evaluar el efecto del paso del tiempo sobre la calidad del recuerdo. Tras pedir a 6 personas que memoricen una lista de palabras, al cabo de una hora, un día, una semana y un mes se les indica que traten de recordar el máximo número de palabras posibles. Se obtienen los siguientes resultados: 1. 2. 3. 4. 5. Hipótesis: Supuestos: cuatro muestras aleatorias; normalidad; esfericidad Estadístico de contraste: Valor p: Decisión sobre : rechazar . Existe relación entre el paso del tiempo y la calidad del recuerdo; el recuerdo promedio no es el mismo para los cuatro momentos temporales Tamaño del efecto y comparaciones múltiples Tanto el tamaño del efecto como las comparaciones múltiples son muy similares a los del ANOVA A-CA Las comparaciones múltiples más frecuentes son: • Comparaciones post-hoc: comparar todos los pares entre sí • Comparaciones de tendencia: sobre todo cuando el factor de medidas repetidas es el tiempo (para ver si el efecto es lineal, cuadrático, cúbico…) Parte V: ANOVA AB-CA-MR ANOVA AB-CA-MR ANOVA de dos factores, uno completamente aleatorizado y uno de medidas repetidas 1. Introducción al ANOVA AB-CA-MR 2. La importancia de la interacción 3. El ANOVA AB-CA-MR 4. Tamaño del efecto y comparaciones múltiples Introducción al ANOVA AB-CA-MR ANOVA de dos factores, uno completamente aleatorizado y uno de medidas repetidas El ANOVA AB-CA-MR contiene dos factores: • Uno de ellos es completamente aleatorizado (cada individuo pasa únicamente por un nivel del factor) • El otro es de medidas repetidas (cada individuo pasa por todos los niveles del factor) Son muy importantes en clínica y se conocen como ensayos clínicos • VD: nivel de un trastorno • Factor CA: grupo experimental (tratamiento vs. control) • Factor MR: momento temporal (pre-tratamiento vs. post-tratamiento) La importancia de la interacción Ya vimos con el ANOVA AB-CA la importancia que tiene el efecto de interacción En el ANOVA AB-CA-MR, también tendremos tres efectos: • El efecto principal del factor CA • El efecto principal del factor MR • El efecto de interacción entre los dos factores (¡que es especialmente importante!) Queremos evaluar la eficacia de un nuevo tratamiento combinado (psicoterapia y fármacos) para la depresión. Para ello, contamos con 20 pacientes diagnosticados con depresión, a los que dividimos aleatoriamente en dos grupos: un grupo recibirá el tratamiento (grupo experimental) y otro grupo permanecerá en lista de espera (grupo control). Realizamos mediciones del nivel de depresión antes de iniciar el tratamiento, un mes después de terminar el tratamiento y dos meses después de terminar el tratamiento. • ¿VD y factores? • ¿Hipótesis? La importancia de la interacción Imaginemos que obtenemos los siguientes resultados: • ; • ; • ; En base a estos resultados, ¿sería correcto concluir lo siguiente? • Podemos concluir que la media en depresión ha sido distinta para el grupo experimental y el grupo control. • Podemos concluir que la media en depresión ha sido distinta en al menos dos momentos temporales. • Podemos concluir que no hay evidencias de interacción entre tratamiento y momento temporal. • Sabiendo que la media en depresión para grupo experimental es de 10,7 y la media para el grupo control es 15,7, podemos concluir que el tratamiento ha sido efectivo para reducir la depresión. La importancia de la interacción Imaginemos que obtenemos los siguientes resultados: • ; • ; • ; ¿Ha sido realmente efectivo el tratamiento? ¿O las diferencias entre los grupos se debían únicamente a diferencias iniciales, y no a la eficacia del tratamiento? La importancia de la interacción Imaginemos ahora los siguientes resultados: • ; • ; • ; Esperamos que no sea significativo (similitud entre los grupos antes del tto.) ¿Ha sido realmente efectivo el tratamiento? ¿Qué papel juega el efecto de interacción para llegar a esa conclusión? ¿Qué efecto simples esperamos que sean significativos? La importancia de la interacción Imaginemos ahora los siguientes resultados: • ; • ; Esperamos que sí sea • ; significativo (diferencia entre los grupos tras el tto.) ¿Ha sido realmente efectivo el tratamiento? ¿Qué papel juega el efecto de interacción para llegar a esa conclusión? ¿Qué efecto simples esperamos que sean significativos? El ANOVA AB-CA-MR 1. Las hipótesis El ANOVA AB-CA-MR realiza un contraste para cada efecto El ANOVA AB-CA-MR 2. Los supuestos • Muestras aleatorias • Distribución normal de la VD en las poblaciones • Homocedasticidad (la varianza de la VD es igual en las J poblaciones) • Esfericidad (la varianza y covarianzas de la VD son iguales en las K medidas repetidas) * El supuesto de normalidad pierde importancia a medida que n aumenta El ANOVA AB-CA-MR 3. El estadístico de contraste y su distribución Existen cuatro fuentes de variación: la debida al efecto principal del factor completamente aleatorizado A (), al efecto principal del factor de medidas repetidas B (), al efecto de interacción AB () y al error () Como estamos haciendo tres contrastes, tendremos un estadístico F para cada uno El ANOVA AB-CA-MR 4. Valor p y puntos críticos • Valor p: consultar en la tabla estadística de la distribución F o en esta web • Punto crítico: consultar en la tabla estadística de la distribución t o en esta web o Para el efecto principal de A: o Para el efecto principal de B: o Para el efecto de interacción AB: El ANOVA AB-CA-MR 5. Decisión sobre a. Efecto de interacción • Si o cae en la zona de rechazo rechazar : hay interacción entre los dos factores. El efecto de un factor sobre la VD no es el mismo en todos niveles del otro factor • Si o cae en la zona de aceptación mantener : no hay evidencia de que haya interacción entre los dos factores. El efecto de un factor sobre la VD es similar en todos los niveles del otro factor b. Efecto principal • Si o cae en la zona de rechazo rechazar : el promedio de la VD es diferente entre al menos dos de los grupos • Si o cae en la zona de aceptación mantener : no hay evidencia de que el promedio de la VD sea distinto entre ninguno de los grupos El ANOVA AB-CA-MR Queremos evaluar si un nuevo programa educativo es más eficaz que el tradicional. Para ello, evaluamos el conocimiento de 40 estudiantes antes de iniciar el curso, a quienes dividimos después aleatoriamente en los dos programas educativos. Al final del curso y 6 después de finalizar el curso, volvemos a evaluar sus conocimientos. Obtenemos los siguientes resultados: Momento temporal Programa Antes Después 6 meses Medias Novedoso 4,5 8,0 7,5 6,67 Tradicional Medias 4,0 4,25 6,5 7,25 5,0 6,25 5,17 11 El ANOVA AB-CA-MR Queremos evaluar si un nuevo programa educativ