Tema 4. ANOVA PDF
Document Details
Uploaded by Hohoho
Antonio
Tags
Summary
This document introduces Analysis of Variance (ANOVA), a statistical method used to compare the means of different groups.
Full Transcript
Tema 4. EL ANÁLISIS DE VARIANZA (ANOVA) CONTENIDO 1. Análisis de varianza unifactorial 2. Diseños factoriales Análisis de la Varianza Unifactorial Introducción Es una técnica paramétrica El Análisis de la Varianza (ANOVA) de un factor sirve para comparar la media de varios grupos en una variable...
Tema 4. EL ANÁLISIS DE VARIANZA (ANOVA) CONTENIDO 1. Análisis de varianza unifactorial 2. Diseños factoriales Análisis de la Varianza Unifactorial Introducción Es una técnica paramétrica El Análisis de la Varianza (ANOVA) de un factor sirve para comparar la media de varios grupos en una variable cuantitativa. Es una generalización de la prueba t para dos muestras independientes. H0: µH = µM H1: µH ≠ µM H0: µH = µM = µS H1: µH ≠ µM ≠ µS - Variable Dependiente (VD): Variable cuantitativa (de intervalo o razón) en la que comparamos los grupos. - Variable Independiente (VI): Variable (nominal u ordinal) que define los grupos que vamos a comparar. Análisis de la Varianza Unifactorial Introducción H0: Las medias poblacionales de la VD en cada nivel de la VI son iguales H1: Las medias poblacionales de la VD en cada nivel de la VI no son iguales ¿Por qué no usamos varias pruebas t? Nº DE GRUPOS COMPARACIONES Prob. de cometer Error Tipo I 2 3 4 5 6 7 1 3 6 10 15 21 0.05 0.143 0.265 0.401 0.537 0.659 • Conforme el número de grupos aumenta, el número de pruebas t necesarias para comparar cada posible par de medias aumenta en gran medida. Eso provoca una acumulación de probabilidades de cometer ERROR TIPO I, que rápidamente alcanza niveles insostenibles. ¿Cuándo usamos el ANOVA entonces? ● El ANOVA (Análisis de Varianza) se usa en un contraste de hipótesis con una variable independiente nominal con tres o más niveles y una variable dependiente de escala. ● De forma similar al estadístico t, el estadístico F se calcula dividiendo una medida de variabilidad entre los grupos (varianza entre-grupos) por una medida de variabilidad dentro de grupos (varianza intra-grupos). ● La varianza entre grupos es una estimación de la varianza de la población que se calcula a partir de las diferencias entre medias. ● La varianza intra-grupos es una estimación de la varianza de la población que se calcula a partir de las diferencias entre cada una de las tres (o más) distribuciones de muestras. Análisis de la Varianza Unifactorial Introducción La H0 se pone a prueba mediante el estadístico F - El numerador es un estimador de la varianza poblacional basada en la variabilidad entre las medias de cada grupo. - El denominador es un estimador de la varianza poblacional pero basada en la variabilidad dentro de cada grupo. Ejemplo de ANOVA UNIFACTORIAL • Nos interesa estudiar la Autoestima de tres generaciones de personas: • Nacidos década 60 • Nacidos década 80 • Nacidos década 00 Media60= 13,84 Media80= 12,02 Media00= 10,19 n60= 12 n80= 11 n00= 9 Ejemplo de ANOVA UNIFACTORIAL RESULTADOS Autoestima nacidos 1960 nacidos 1980 nacidos 2000 1 12,17 10,86 10,27 2 15,93 13,33 8,84 3 13,60 10,49 11,14 4 14,51 13,75 9,45 5 14,86 12,39 11,35 6 14,15 12,61 10,36 7 14,70 12,58 10,28 8 14,35 10,87 8,43 9 14,13 12,13 11,55 10 12,00 12,77 11 12,84 10,49 12 12,79 13,84 12,02 10,19 medias Ejemplo de ANOVA UNIFACTORIAL Fuentes de variabilidad intra y entre los grupos Autoestima nacidos 1960 Variabilidad Intra-grupo nacidos 1980 nacidos 2000 113,84-1,67 12,02-1,16 10,19-0,08 213,84+2,09 12,02+1,31 10,19+1,35 313,84-0,24 12,02-1,53 10,19+0,95 413,84+0,67 12,02+1,73 10,19+0,74 513,84+1,025 12,02+0,37 10,19-1,16 613,84+0,31 12,02+0,59 10,19-0,17 713,84+0,85 12,02+0,56 10,19-0,09 813,84+0,51 12,02-1,15 10,19+1,76 913,84+0,29 12,02+0,11 10,19-1,36 1013,84-1,84 12,02+0,75 1113,84+0 12,02-1,53 1213,84-1,05 Variabilidad Entre-grupo FUENTES DE VARIABILIDAD: tabla del ANOVA Fuente SS df MS F Entre SSentre dfentre MSentre F Intra SSintra dfintra MSintra Total SStotal dftotal CÓMO CALCULAR LAS FUENTES DE VARIABILIDAD Fuente Entre Intra Total SS �( −𝐆𝐆𝐆𝐆)𝟐𝟐 �(𝑿𝑿 − )𝟐𝟐 �(𝑿𝑿 − 𝐆𝐆𝐆𝐆)𝟐𝟐 df Ngrupos - 1 dftotal + dfentre = (N -1) – (Ngrupos – 1 ) = N – Ngrupos MS F SSentre / dfentre MSentre / MSintra SSintra / dfintra N-1 GM = Promedio de las medias de los Ngrupos Análisis de la Varianza Unifactorial La F es el cociente entre: la variabilidad atribuible a las diferencias entre las medias (variabilidad Inter-grupos) y la atribuible a las diferencias dentro de cada grupo (variabilidad Intra-grupos). 𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽 𝒆𝒆𝒆𝒆𝒆𝒆𝒓𝒓𝒓𝒓𝒈𝒈𝒈𝒈𝒈𝒈𝒈𝒈𝒈𝒈𝒈𝒈 𝐅𝐅 = 𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽 𝒊𝒊𝒊𝒊𝒊𝒊𝒊𝒊𝒊𝒊𝒈𝒈𝒈𝒈𝒈𝒈𝒈𝒈𝒈𝒈𝒔𝒔 Análisis de la Varianza Unifactorial Introducción No rechazar H0 implica Las medias muestrales son parecidas existiendo entre ellas diferencias atribuibles solo al azar. En ese caso la estimación del numerador reflejará el mismo grado de variación que la estimación del denominador y el cociente tomará un valor aproximado de 1. Análisis de la Varianza Unifactorial Si las medias muestrales difieren, el numerador reflejará mayor grado de variación que el denominador y F tenderá a aumentar. 1≤F≤∞ Valores próximos a 1: Medias iguales Valores próximos a ∞: Medias distintas Punto de corte significación Análisis de la Varianza Unifactorial El estadístico F se basa en el cumplimiento de supuestos, entre ellos: 1. Normalidad. La VD se distribuye normalmente en los grupos definidos por la VI. Si las muestras son grandes el ANOVA es robusto frente a su incumplimiento. 2. Homocedasticidad u homogeneidad de las varianzas. Los grupos poseen la misma varianza error. Con grupos de distinto tamaño hay que vigilar su cumplimiento ( Levene). Con muestras grandes (N > 30) el incumplimiento de los supuestos no es tan grave 3. Independencia de las observaciones. Las observaciones de distintos participantes o condiciones no deben estar relacionadas (DurbinWatson). Se corrige con aleatorización a los grupos pero afecta a diseños intrasujeto (medidas repetidas) Análisis de la Varianza Unifactorial Comparaciones a Priori y a Posteriori El estadístico F únicamente nos permite contrastar la hipótesis de que las j medias son iguales. Al rechazar la H0 sabemos que las medias comparadas no son iguales, pero no sabemos dónde se encuentran las diferencias. Para localizar las diferencias comparaciones múltiples a priori y/o a posteriori (post hoc). A priori: Se realizan antes de obtener el valor de la F y su significación Están guiadas por las hipótesis científicas del estudio Análisis de la Varianza Unifactorial Comparaciones a Posteriori Cuando las varianzas son iguales Cuando se contrasta un gran número de parejas de medias, la prueba de la diferencia honestamente significativa de Tukey. Para un número reducido de pares, Bonferroni. Cuando las varianzas no son iguales Prueba de comparaciones por parejas de GamesHowell. Análisis de la Varianza Unifactorial Comparaciones a Priori Las comparaciones a priori pueden ser comparaciones de tendencia y también permiten realizar comparaciones específicas entre pares de medias. - Polinómico. Permite realizar comparaciones de tendencia. Si el ANOVA resulta significativo se puede rechazar la hipótesis de independencia y aceptar que la VI y la VD están relacionadas. En este caso, si la VI es cuantitativa esta opción permite estudiar que tipo relación (lineal, cuadrática, cúbica,…) existe entre la VD y la VI. Los seis pasos para un ANOVA entre grupos Variable independiente = tipo de sociedad (recolectores, agricultores, uso de recursos naturales, industriales) Variable dependiente = Sentido de justicia (Juego del dictador) Recolectores: 28, 36, 38, 31. Agricultores: 32, 33, 40. Explotación de recursos: 47, 43, 52. Industrial: 40, 47, 45. Los seis pasos para un ANOVA entre grupos Paso 1 Identificar las poblaciones, las distribuciones de comparación y los supuestos Población 1: Seres humanos en sociedades recolectoras. Población 2: Seres humanos en sociedades agricultoras. Población 3: Seres humanos en sociedades que utilizan recursos naturales. Población 4: Seres humanos en sociedades industriales. La distribución de comparación es una distribución F y el contraste de hipótesis un ANOVA entre-grupos. Supuesto 1: VD es una variable de escala. Supuesto 2: El muestreo no ha sido aleatorio, tenemos que tener cuidado a la hora de generalizar los resultados. Supuesto 3: Las muestras vienen de poblaciones con homocedasticidad, es decir de poblaciones con varianzas iguales (estadístico Levene). Los seis pasos para un ANOVA entre grupos Paso 2 Formular la hipótesis nula y la hipótesis de investigación Hipótesis nula: las personas que provienen de las sociedades de los cuatro tipos examinados demuestran mismas conductas de justicia. Hipótesis de investigación: las personas que provienen de las sociedades de los cuatro tipos examinados demuestran diferentes conductas de justicia. H0: μ1 = μ2= μ3= μ4 H1: μ1 ≠ μ2≠ μ3 ≠ μ4 Los seis pasos para un ANOVA entre grupos Paso 3 Determinar las características de la distribución de comparación Los seis pasos para un ANOVA entre grupos Paso 4 Determinar los valores críticos (valores p también llamados alpha Los seis pasos para un ANOVA entre grupos Paso 5 Calcular el estadístico de la prueba Fuentes de variabilidad y cálculos para el ANOVA Fuente SS df MS F Entre SSentre dfentre MSentre F Intra SSintra dfintra MSintra Total SStotal dftotal SStotal SSintra SSentre fuentes de variabilidad con fórmulas y resultados Los seis pasos para un ANOVA entre grupos Paso 6 Tomar una decisión F(3,9)=8.27, p<0.05 Calcular el tamaño de efecto R2 = SSentre SStotal R2 es la proporción de la varianza en la variable dependiente que se puede explicar por la variable independiente Comparaciones a priori y pruebas post-hoc Recuerda: El ANOVA nos dice si hay diferencias entre por lo menos dos medias de grupos en el estudio pero no nos dice qué medias son diferentes Una comparación a priori es una prueba que se hace cuando existen múltiples grupos pero solo algunas comparaciones entre ellos (establecidas antes de la recogida de datos) son de interés Una prueba post-hoc es un procedimiento estadístico que se realiza después de rechazar la hipótesis nula en un ANOVA. Nos permite hacer múltiples comparaciones entre varios grupos Prueba Tukey HSD Muestras iguales Muestras no iguales Prueba Tukey HSD Nuestro ejemplo Prueba de Bonferroni La prueba de Bonferroni es una prueba post-hoc que se realiza con un valor crítico más estricto para cada comparación entre medias ANOVA entre grupos: un ejemplo desde una aplicación estadística Un grupo de investigación quiere contrastar la hipótesis que las personas que realizan ejercicio físico de manera regular son más capaces de enfrentar el estrés en el trabajo (coping). Hicieron un estudio con 31 participantes que separaron en cuatro grupos según su regularidad en realizar ejercicio físico (sedentarios, bajo, moderado, alto). El coping se valoró mediante una escala likert donde valores altos indican mayor coping. ANOVA entre grupos Realizamos el ANOVA para comprobar el supuesto de homocedasticidad mediante la prueba Levene ANOVA entre grupos Seleccionamos las pruebas post-hoc y la opción de estadísticos descriptivos (para tamaño del efecto se ha marcado la más adecuada para muestras pequeñas) ANOVA entre grupos Tablas de resultados ANOVA entre grupos Resultado: Se utilizó un ANOVA entre grupos para determinar si el coping en el lugar del trabajo era diferente en grupos con diferente nivel de actividad física. Los participantes se clasificaron en 4 grupos: sedentarios (n=7), bajo (n=9), medio (n=9) y alto nivel de actividad física (n=8). Los datos de la variable dependiente se aproximaron a una distribución normal, según la prueba Shapiro-Wilk (p=.215). Según la prueba Levene (p=.120) los diferentes grupos mostraron varianzas homogéneas (supuesto de homocedasticidad). El coping ha sido estadísticamente diferente entre los diferentes grupos, F(3, 27) = 8.32, p < .001, ω2 = 0.42. El valor de coping aumentó del grupo sedentario (M = 4.15, SD = 0.77) al grupo bajo (M = 5.88, SD = 1.69), moderado (M = 7.12, SD = 1.57) y alto (M = 7.51, SD = 1.24), en ese orden. Las post-hoc pruebas Tukey mostraron que el medio incremento desde el grupo de sedentarios al grupo moderado fue estadísticamente significativo (p = .002, d = 2.34), igual que el incremento desde el grupo sedentario al grupo alto (p < .001, d = 3.24). No se encontraron otras diferencias significativas. ANOVA intra grupos: Ejemplo Un investigador quiere comprobar si el ejercicio físico reduce el riesgo cardiovascular medido mediante la concentración de una variable (C-Reactive Protein, CRP) que indica inflamación. El investigador recluta 10 participantes que realizan un entrenamiento físico de 6 meses, midiendo la CPR antes (crp_pre), durante (crp_mid) y después del entrenamiento (crp_post). ANOVA intra grupos Realizamos el ANOVA de medidas repetidas para comprobar el supuesto de esfericidad ANOVA intra grupos Seleccionamos las pruebas post-hoc y la opción de estadísticos descriptivos ANOVA intra grupos Tablas de resultados ANOVA intra grupos Resultado: Se utilizó un ANOVA de medidas repetidas para determinar si existen diferencias estadísticamente significativas en la concentración de CRP antes, durante y después de un entrenamiento físico. Se encontró un outlier con la inspección de los boxplots y los datos eran distribuidos de manera normal según la prueba Shapiro-Wilk (ps = .350, .903, .372). El supuesto de la esfericidad no se cumplió según la prueba de Mauchly, p=.043 y por eso se aplicó una corrección Greenhouse-Geisser (ε = 0.648). El entrenamiento produjo diferencias significativas en la concentración de CRP, F(1.30, 11.66) = 26.94, p < .001, η2 = .75, con reducción de la concentración de CRP pasando de la condición pre (M = 4.33, SD = 0.64 mg/mL) a los 3 meses desde el inicio del programa (M = 3.94, SD = 0.57 mg/mL) y a los 6 meses, cuando se terminó el programa (M = 3.65, SD = 0.43 mg/mL). El análisis Post-hoc con la corrección Bonferroni mostró que la concentración de CRP se redujo significativamente de la condición pre a los 3 meses (M = 0.39 mg/mL, p < .001, d = 2.45), y de la condición pre a la condición post (M = 0.68 mg/mL, p = .001, d = 1.87) pero no de los 3 meses a los 6 (M = 0.29 mg/mL, p = .054, d = 0.91). Análisis de la Varianza Unifactorial Comparaciones a Priori Una posibilidad interesante en las comparaciones a priori (además de comparar pares de medias) es realizar análisis de tendencia. - Polinómico. Permite realizar comparaciones de tendencia. Si el ANOVA resulta significativo se puede rechazar la hipótesis de independencia y aceptar que la VI y la VD están relacionadas. En este caso, si la VI es cuantitativa esta opción permite estudiar que tipo relación (lineal, cuadrática, cúbica,…) existe entre la VD y la VI. Análisis de la Varianza Unifactorial Comparaciones a Priori Ejemplo Un grupo de investigadores está interesado en estudiar cómo cambia la motivación con el paso de los años. El investigador A piensa que la motivación mejora progresivamente con el tiempo mientras que otro, B, considera que es mejor en edades intermedias que en edades extremas. ANOVA DE UN FACTOR Para contrastar estas dos hipótesis se diseñó una investigación en la que se seleccionó, de manera aleatoria, a un grupo de 50 niños, divididos en 5 grupos de edad: 5, 7, 9, 11 y 13 años. A los participantes se les administró un cuestionario para medir motivación. ANOVA DE UN FACTOR Los datos obtenidos fueron: ID. 5 años 7 años 9 años 11 años 13 años 1 10 6 6 1 0 2 10 7 2 2 1 3 9 5 0 4 1 4 8 5 3 2 2 5 10 5 2 1 2 6 9 4 3 3 2 7 8 7 3 2 2 8 9 4 2 4 3 9 10 5 3 2 1 10 7 2 2 0 1 ANOVA DE UN FACTOR Las opciones del procedimiento ANOVA de un factor permiten: seleccionar algunos estadísticos descriptivos básicos obtener la prueba Levene para contrastar la hipótesis de homogeneidad de varianzas obtener una prueba de Normalidad decidir qué tratamiento se desea dar a los casos de valores perdidos. ANOVA DE UN FACTOR Una tabla que muestra el estadístico de Levene, para contrastar la hipótesis de que las varianzas poblacionales son iguales. H0: El supuesto se cumple H1: El supuesto no se cumple Como la significación es > 0,05 entonces no rechazamos la hipótesis nula y concluimos que no hay evidencia del incumplimiento del supuesto de Homocedasticidad. ANOVA DE UN FACTOR Una tabla con el resumen del ANOVA H0: Las medias son iguales H1: Al menos dos de las medias son diferentes Como la significación < 0,05, decidimos rechazar la hipótesis nula y concluimos que en las poblaciones definidas por la variable edad al menos dos de las mismas difieren en CV. ANOVA DE UN FACTOR Finalmente, aparece un gráfico de medias, que nos permite tener una idea de la tendencia de los datos ANOVA DE UN FACTOR • • • • Los resultados de estas comparaciones nos permiten ver que: 5 años difiere respecto a todas las demás. 7 años difiere también respecto a todas las demás. 9 años no difiere de 11 ni de 13. 11 años no difiere de 13. ANOVA DE UN FACTOR Diseño factorial El diseño factorial, como estructura de investigación, es la combinación de dos o más diseños simples (o unifactoriales); es decir, el diseño factorial requiere la manipulación simultánea de dos o más variables independientes (llamados factores), en un mismo experimento. Cantidad de niveles por factor 2x2, 2x2x2, 2x3, 2x3x4, etc. EFECTOS FACTORIALES ESTIMABLES 1. Efectos principales 2. Efectos secundarios EJEMPLO DISEÑO FACTORIAL • Se pretende estudiar la eficacia de dos métodos de enseñanza (presencial y a distancia) sobre el aprendizaje de dos materias (matemáticas e historia). Se forman aleatoriamente cuatro grupos y cada uno seguirá uno de los cuatro cursos resultantes de combinar las dos variables independientes. La variable dependiente de esta investigación será la puntuación obtenida por cada estudiante en un examen que realizarán al finalizar el curso. INTERACCIÓN NULA Efectos principales para la dos variables INTERACCIÓN EXISTENTE: Asignatura x Método de enseñanza