Tema 5. Diferencias entre dos grupos o variables.pptx
Document Details
![SpiritualJoy](https://quizgecko.com/images/avatars/avatar-7.webp)
Uploaded by SpiritualJoy
Comillas
Full Transcript
Tema 5: Diferencias entre dos grupos o dos variables Pablo Fernández Cáncer Pablo Nájera Álvarez Índice 1. Introducción 2. Prueba T para muestras relacionadas a. La diferencia entre puntuaciones b. La prueba T para muestras relacionadas c. Tamaño del efecto 3. Prueba T para muestras independientes...
Tema 5: Diferencias entre dos grupos o dos variables Pablo Fernández Cáncer Pablo Nájera Álvarez Índice 1. Introducción 2. Prueba T para muestras relacionadas a. La diferencia entre puntuaciones b. La prueba T para muestras relacionadas c. Tamaño del efecto 3. Prueba T para muestras independientes a. La diferencia entre medias b. La prueba T para muestras independientes c. Tamaño del efecto 4. Prueba de McNemar a. Homogeneidad marginal y simetría b. La prueba de McNemar Introducción En este tema vamos a ver los siguientes contrastes estadísticos: • Prueba T para muestras relacionadas: Evalúa la existencia (o no) de diferencias entre dos variables cuantitativas. • Prueba T para muestras independientes: Evalúa la existencia (o no) de diferencias entre dos grupos. • Prueba de McNemar: Evalúa la existencia (o no) de diferencias entre dos variables dicotómicas Cuando hablamos de comparar variables, lo que hacemos es evaluar si sus medias son diferentes. Para ello, es imprescindible que las dos variables estén en la misma métrica. Prueba T para muestras relacionadas La prueba T para muestras relacionadas permite comparar las medias de dos variables cuantitativas medidas en la misma métrica Normalmente, se emplean en el siguiente tipo de estudios: • Estudios transversales: dos variables distintas medidas en una muestra (p. ej., capacidad léxica y razonamiento visoespacial de los estudiantes de psicología) • Estudios longitudinales: una variable medida en una muestra en dos momentos distintos (p. ej., nivel de ansiedad antes y después del tratamiento) • Muestras emparejadas o díadas: una variable medida en dos muestras de personas emparejadas (p. ej., extraversión en gemelos, satisfacción marital de mujer y marido) En todos estos ejemplos, el resultado es contar con dos variables cuantitativas provenientes de muestras relacionadas o muestras repetidas Esta prueba se puede complementar con la correlación de Pearson si también se quiere estudiar la relación entre las dos variables continuas Prueba T para muestras relacionadas Estudios transversales Estudios longitudinales Muestras emparejadas ID Léxico Visoesp. ID Pre Post Par Extr. 1 Extr. 2 1 95 84 1 25 14 1 105 108 2 92 72 2 32 22 2 97 99 3 105 98 3 35 28 3 108 113 4 87 119 4 27 19 4 94 100 5 119 124 5 29 24 5 114 108 La diferencia entre puntuaciones La lógica de este contraste se basa en la diferencia entre puntuaciones En vez de operar con dos variables, vamos a operar con una: la variable diferencia (D) ID Y1 Y2 1 95 84 2 92 72 3 105 98 4 87 119 5 119 124 La diferencia entre puntuaciones La lógica de este contraste se basa en la diferencia entre puntuaciones En vez de operar con dos variables, vamos a operar con una: la variable diferencia (D) ID Y1 Y2 D 1 95 84 11 2 92 72 20 3 105 98 7 4 87 119 -32 5 119 124 -5 La diferencia entre puntuaciones La variable D recoge perfectamente la comparación entre Y1 e Y2 • Si , entonces • Si , entonces • Si , entonces Por tanto, al reducir el problema a una única variable, hemos transformado la prueba T para muestras relacionadas en la prueba T para una muestra Lo único que necesitaremos será conocer su media () y desviación típica () muestrales, y establecer la hipótesis sobre su media poblacional () ID Y1 Y2 D 1 95 84 11 2 92 72 20 3 105 98 7 4 87 119 -32 5 119 124 -5 0,20 20,12 La prueba T para muestras relacionadas 1. Las hipótesis • Contraste bilateral: ¿Tienen las dos variables el mismo promedio? • Contraste unilateral derecho: ¿Es la primera variable mayor que la segunda? • Contraste unilateral izquierdo: ¿Es la segunda variable mayor que la primera? Es equivalente usar a : lo único que cambiará será el signo del estadístico, pero las conclusiones serán las mismas La prueba T para muestras relacionadas 2. Los supuestos • Muestra aleatoria de n sujetos medida dos veces (o muestra aleatoria de sujetos emparejados) • Distribución normal de las variables Y1 e Y2* * El supuesto de normalidad pierde importancia a medida que n aumenta. Con 30 sujetos o más, no hace falta comprobar este supuesto. La prueba T para muestras relacionadas 3. El estadístico de contraste y su distribución El estadístico de contraste es equivalente al de la prueba T para una muestra 𝑌 − 𝜇𝑌 𝑇= 𝑡𝑛 − 1 Una muestra 𝑆𝑌 / √ 𝑛 Muestras relacionadas 𝐷 =𝑌 1 − 𝑌 2 𝐷 =𝑌 1 − 𝑌 2 𝑇= 𝐷 − 𝜇𝐷 𝑆 𝐷 / √𝑛 𝑡 𝑛 −1 𝑌1 −𝑌 2 𝐷 𝑇= 𝑡 𝑛− 1 𝑇 = 𝑡 𝑛− 1 𝑆𝐷/ √ 𝑛 𝑆𝐷 / √ 𝑛 Como estamos comparando si y son diferentes, el valor de comparación de será 0 y, por tanto, será 0 La prueba T para muestras relacionadas 4. Valor p y puntos críticos • Valor p: consultar en la tabla estadística de la distribución t o en esta web o Contraste bilateral: o Contraste unilateral derecho: o Contraste unilateral izquierdo: • Puntos críticos: consultar en la tabla estadística de la distribución t o en esta web o Contraste bilateral: y o Contraste unilateral derecho: o Contraste unilateral izquierdo : La prueba T para muestras relacionadas 5. Decisión sobre • Si o cae en la zona de rechazo rechazar : el promedio de las dos variables es diferente • Si o cae en la zona de aceptación mantener : no hay evidencia de que el promedio de las dos variables sea diferente * Si el contraste es unilateral, podremos concluir que el promedio de una variable es mayor que el de la otra La prueba T para muestras relacionadas 6. Cálculo del intervalo de confianza El intervalo de confianza se calcula de la misma forma que para la media Una muestra Muestras relacionadas 𝐼𝐶 1 − 𝛼 =𝑌 ± 𝐸 𝑚𝑎𝑥 =𝑌 ±|𝑡 𝑛 − 1 ; α /2| 𝑆𝑌 / √ 𝑛 𝐷 =𝑌 1 − 𝑌 2 𝐷 =𝑌 1 − 𝑌 2 𝐼𝐶 1 − 𝛼 = 𝐷 ± 𝐸 𝑚𝑎𝑥 = 𝐷 ±|𝑡 𝑛 − 1 ; α /2| 𝑆 𝐷 / √ 𝑛 La prueba T para muestras relacionadas Para evaluar la eficacia de un tratamiento de ansiedad con un diseño pre-post, se mide el nivel de ansiedad de 14 pacientes antes de iniciar el tratamiento y, tras 4 meses de tratamiento, se realiza una segunda medición. Los resultados se muestran en la siguiente tabla. ¿Podemos concluir que el tratamiento es efectivo? (Nota: ) Sujetos 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Media Y1 (pre) 24 38 21 14 19 31 34 33 22 16 17 20 18 23 23,57 Y2 (post) 15 22 21 17 11 6 15 20 8 9 5 19 7 8 13,07 D = Y1 – Y2 9 16 0 -3 8 25 19 13 14 7 12 1 11 15 ¿? 1. 2. Hipótesis: Supuestos: 3. 4. 5. 6. Estadístico de contraste: Valor p: Decisión sobre : Intervalo de confianza: La prueba T para muestras relacionadas Para evaluar la eficacia de un tratamiento de ansiedad con un diseño pre-post, se mide el nivel de ansiedad de 14 pacientes antes de iniciar el tratamiento y, tras 4 meses de tratamiento, se realiza una segunda medición. Los resultados se muestran en la siguiente tabla. ¿Podemos concluir que el tratamiento es efectivo? (Nota: ) 1. Hipótesis: (contraste unilateral derecho) 2. 3. 4. 5. 6. Supuestos: Estadístico de contraste: Valor p: Decisión sobre : Intervalo de confianza: La prueba T para muestras relacionadas Para evaluar la eficacia de un tratamiento de ansiedad con un diseño pre-post, se mide el nivel de ansiedad de 14 pacientes antes de iniciar el tratamiento y, tras 4 meses de tratamiento, se realiza una segunda medición. Los resultados se muestran en la siguiente tabla. ¿Podemos concluir que el tratamiento es efectivo? (Nota: ) 1. Hipótesis: (contraste unilateral derecho) 2. Supuestos: muestra aleatoria de 14 pacientes de la población a la que se le mide dos veces. Asumimos que la ansiedad (antes y después) tiene una distribución normal 3. Estadístico de contraste: 4. Valor p: 5. 6. Decisión sobre : Intervalo de confianza: La prueba T para muestras relacionadas Para evaluar la eficacia de un tratamiento de ansiedad con un diseño pre-post, se mide el nivel de ansiedad de 14 pacientes antes de iniciar el tratamiento y, tras 4 meses de tratamiento, se realiza una segunda medición. Los resultados se muestran en la siguiente tabla. ¿Podemos concluir que el tratamiento es efectivo? (Nota: ) 1. Hipótesis: (contraste unilateral derecho) 2. Supuestos: muestra aleatoria de 14 pacientes de la población a la que se le mide dos veces. Asumimos que la ansiedad (antes y después) tiene una distribución normal 3. Estadístico de contraste: 4. Valor p: 5. 6. Decisión sobre : Intervalo de confianza: La prueba T para muestras relacionadas Para evaluar la eficacia de un tratamiento de ansiedad con un diseño pre-post, se mide el nivel de ansiedad de 14 pacientes antes de iniciar el tratamiento y, tras 4 meses de tratamiento, se realiza una segunda medición. Los resultados se muestran en la siguiente tabla. ¿Podemos concluir que el tratamiento es efectivo? (Nota: ) 1. Hipótesis: (contraste unilateral derecho) 2. Supuestos: muestra aleatoria de 14 pacientes de la población a la que se le mide dos veces. Asumimos que la ansiedad (antes y después) tiene una distribución normal 3. Estadístico de contraste: 4. Valor p: 5. 6. Decisión sobre : Intervalo de confianza: La prueba T para muestras relacionadas Para evaluar la eficacia de un tratamiento de ansiedad con un diseño pre-post, se mide el nivel de ansiedad de 14 pacientes antes de iniciar el tratamiento y, tras 4 meses de tratamiento, se realiza una segunda medición. Los resultados se muestran en la siguiente tabla. ¿Podemos concluir que el tratamiento es efectivo? (Nota: ) 1. Hipótesis: (contraste unilateral derecho) 2. Supuestos: muestra aleatoria de 14 pacientes de la población a la que se le mide dos veces. Asumimos que la ansiedad (antes y después) tiene una distribución normal 3. Estadístico de contraste: 4. Valor p: 5. 6. Decisión sobre : rechazar . La ansiedad ha disminuido tras el tratamiento. Intervalo de confianza: La prueba T para muestras relacionadas Para evaluar la eficacia de un tratamiento de ansiedad con un diseño pre-post, se mide el nivel de ansiedad de 14 pacientes antes de iniciar el tratamiento y, tras 4 meses de tratamiento, se realiza una segunda medición. Los resultados se muestran en la siguiente tabla. ¿Podemos concluir que el tratamiento es efectivo? (Nota: ) 1. Hipótesis: (contraste unilateral derecho) 2. 3. 4. 5. 6. Supuestos: muestra aleatoria de 14 pacientes de la población a la que se le mide dos veces. Asumimos que la ansiedad (antes y después) tiene una distribución normal Estadístico de contraste: Valor p: Decisión sobre : rechazar . La ansiedad ha disminuido tras el tratamiento. Intervalo de confianza: Con un 95%, la diferencia poblacional de ansiedad pre-post se sitúa entre 6,09 y 14,91 puntos. Tamaño del efecto La prueba T sirve para evaluar si existe una diferencia entre medias, pero no nos dice nada acerca de la magnitud de esa diferencia Recordatorio: el tamaño del efecto (a diferencia del contraste de hipótesis) no depende del tamaño de la muestra El tamaño del efecto más empleado para comparaciones de medias es la d de Cohen Una muestra 𝑌 − 𝜇𝑌 𝑑= 𝑆𝑌 Muestras relacionadas 𝑑= 𝐷 − 𝜇𝐷 𝑆𝐷 La d de Cohen es una diferencia de medias tipificada: número de desviaciones típicas que una media se diferencia de otra Puntos de corte orientativos: leve < 0,5 ≤ moderado < 0,8 ≤ grande Normalidad y prueba de Wilcoxon La prueba T es la mejor opción para comparar medias de variables cuando las distribuciones poblacionales son normales. Pero en psicología, no es infrecuente verse en la necesidad de trabajar con poblaciones que no son normales. Con tamaños muestrales grandes, la ausencia de normalidad no es importante. Pero, si además de tener que trabajar con poblaciones que no son normales, hay que hacerlo con muestras pequeñas (n<30), la prueba T pierde precisión. Cuando trabajemos con muestras pequeñas, primero tendremos que evaluar el supuesto de normalidad utilizando la prueba de Shapiro-Wilk (en Jamovi). Si , significa que nuestra distribución es significativamente distinta de la normal (el supuesto NO se cumple). Normalidad y prueba de Wilcoxon Otras formas de inspeccionar la normalidad de una variable son el histograma y la gráfica Q-Q. Distribución no normal Distribución normal La gráfica Q-Q es un indicador visual de normalidad. Si los residuos (los puntos) se sitúan en línea recta y son cercanos a la línea negra, se puede decir que la variable se distribuye de forma normal (cosa que en este caso no ocurre). Normalidad y prueba de Wilcoxon Si la distribución de la variable no es normal y además el tamaño muestral es pequeño (n<30), usaremos la prueba de Wilcoxon, que es una alternativa no paramétrica a la prueba T. La interpretación es igual a la de la prueba T. Obtendremos un estadístico y un valor p asociado a él. Si , rechazaremos la . Prueba T para muestras independientes La prueba T para muestras independientes permite comparar la media de una variable en dos grupos (muestras) distintos Al contrario que en el caso de muestras relacionadas, los dos grupos no están emparejados, sino que son dos poblaciones diferentes Variables implicadas: • Una variable dicotómica que forma grupos (variable independiente) • Una variable continua (variable dependiente) El objetivo es comparar dos medias poblacionales en un diseño inter-sujetos La diferencia entre medias En la prueba T para muestras relacionadas podíamos calcular la diferencia entre las variables (porque teníamos valores emparejados) En la prueba T para muestras independientes no podemos calcular la diferencia entre las variables; sólo podemos calcular la diferencia entre las medias Queremos evaluar si es más efectivo un liderazgo transformacional que uno transaccional. Para ello, evaluamos el rendimiento (con una escala de 1-10) de distintos trabajadores, cada uno de los cuales tiene un jefe que aplica un liderazgo diferente: Liderazgo n Rendimiento Media Transformacional 6 6, 8, 5, 9, 7, 10 7,5 Transaccional 10 7, 5, 6, 4, 9, 3, 6, 2, 7, 4 5,3 ¿Son las medias lo bastante diferentes para pensar que proceden de poblaciones con diferente media? La diferencia entre medias Como estamos comparando dos poblaciones distintas, tenemos dos distribuciones, una para las puntuaciones de cada población Asumimos que la variable se distribuye normalmente en ambas poblaciones m1 Queremos conocer si es distinta (o menor, o mayor) que , y para ello compararemos las medias muestrales ( e ) Supuesto de homocedasticidad (igualdad de varianzas) s2 m2 s2 La diferencia entre medias Si se cumple el supuesto de homocedasticidad, podemos calcular la distribución muestral de la diferencia de medias () * No confundir con la distribución muestral de la diferencia de puntuaciones () La distribución de será normal con: • Media: • Error típico: Recordatorio de la distribución muestral de • Media: • Error típico: La prueba T para muestras independientes 1. Las hipótesis • Contraste bilateral: ¿Tienen los dos grupos la misma media? • Contraste unilateral derecho: ¿Tiene el grupo 1 una media mayor que el 2? • Contraste unilateral izquierdo: ¿Tiene el grupo 2 una media mayor que el 1? El orden de los grupos es arbitrario: lo único que cambiará será el signo del estadístico, pero las conclusiones serán las mismas La prueba T para muestras independientes 2. Los supuestos • Dos muestras aleatorias de tamaños n1 y n2 • Distribución normal de la variable cuantitativa en ambas poblaciones • Homocedasticidad: las varianzas poblacionales son iguales * El supuesto de normalidad pierde importancia a medida que n aumenta. La prueba T para muestras independientes 3. El estadístico de contraste y su distribución El estadístico de contraste, como sigue siendo una T, será de nuevo una comparación de medias tipificada La T se distribuye con n1 + n2 – 2 grados de libertad Si no se cumple la homocedasticidad, hay una transformación para poder calcular T: donde gl’ es una fórmula un tanto larga La prueba T para muestras independientes 4. Valor p y puntos críticos • Valor p: consultar en la tabla estadística de la distribución t o en esta web o Contraste bilateral: o Contraste unilateral derecho: o Contraste unilateral izquierdo: • Puntos críticos: consultar en la tabla estadística de la distribución t o en esta web o Contraste bilateral: y o Contraste unilateral derecho: o Contraste unilateral izquierdo : La prueba T para muestras independientes 5. Decisión sobre • Si o cae en la zona de rechazo rechazar : el promedio de los dos grupos es diferente • Si o cae en la zona de aceptación mantener : no hay evidencia de que el promedio de los dos grupos sea diferente * Si el contraste es unilateral, podremos concluir que el promedio de uno de los grupos es mayor que el del otro La prueba T para muestras independientes 6. Cálculo del intervalo de confianza El intervalo de confianza se calcula de forma similar al del resto de pruebas T La prueba T para muestras independientes Un entrenador ha desarrollado un nuevo programa de entrenamiento para lanzadores de peso. Para probar su eficacia, sigue entrenando a 5 de sus atletas con el método antiguo (1), y a los otros 5 les entrena con el método novedoso (2). Al cabo de 2 meses, realiza una prueba para medir la distancia del lanzamiento de peso. Encuentra los siguientes estadísticos en cada muestra: y ; y . ¿Es el nuevo método de entrenamiento eficaz? 1. Hipótesis: 2. Supuestos: 3. Estadístico de contraste: 4. Valor p: 5. 6. Decisión sobre : Intervalo de confianza: La prueba T para muestras independientes Un entrenador ha desarrollado un nuevo programa de entrenamiento para lanzadores de peso. Para probar su eficacia, sigue entrenando a 5 de sus atletas con el método antiguo (1), y a los otros 5 les entrena con el método novedoso (2). Al cabo de 2 meses, realiza una prueba para medir la distancia del lanzamiento de peso. Encuentra los siguientes estadísticos en cada muestra: y ; y . ¿Es el nuevo método de entrenamiento eficaz? 1. Hipótesis: 2. Supuestos: 3. Estadístico de contraste: 4. Valor p: 5. 6. Decisión sobre : Intervalo de confianza: La prueba T para muestras independientes Un entrenador ha desarrollado un nuevo programa de entrenamiento para lanzadores de peso. Para probar su eficacia, sigue entrenando a 5 de sus atletas con el método antiguo (1), y a los otros 5 les entrena con el método novedoso (2). Al cabo de 2 meses, realiza una prueba para medir la distancia del lanzamiento de peso. Encuentra los siguientes estadísticos en cada muestra: y ; y . ¿Es el nuevo método de entrenamiento eficaz? 1. Hipótesis: 2. Supuestos: muestras aleatorias, normalidad, homocedasticidad 3. Estadístico de contraste: 4. Valor p: 5. 6. Decisión sobre : Intervalo de confianza: La prueba T para muestras independientes Un entrenador ha desarrollado un nuevo programa de entrenamiento para lanzadores de peso. Para probar su eficacia, sigue entrenando a 5 de sus atletas con el método antiguo (1), y a los otros 5 les entrena con el método novedoso (2). Al cabo de 2 meses, realiza una prueba para medir la distancia del lanzamiento de peso. Encuentra los siguientes estadísticos en cada muestra: y ; y . ¿Es el nuevo método de entrenamiento eficaz? 1. Hipótesis: 2. Supuestos: muestras aleatorias, normalidad, homocedasticidad 3. Estadístico de contraste: 4. Valor p: 5. 6. Decisión sobre : Intervalo de confianza: La prueba T para muestras independientes Un entrenador ha desarrollado un nuevo programa de entrenamiento para lanzadores de peso. Para probar su eficacia, sigue entrenando a 5 de sus atletas con el método antiguo (1), y a los otros 5 les entrena con el método novedoso (2). Al cabo de 2 meses, realiza una prueba para medir la distancia del lanzamiento de peso. Encuentra los siguientes estadísticos en cada muestra: y ; y . ¿Es el nuevo método de entrenamiento eficaz? 1. Hipótesis: 2. Supuestos: muestras aleatorias, normalidad, homocedasticidad 3. Estadístico de contraste: 4. Valor p: 5. 6. Decisión sobre : Intervalo de confianza: La prueba T para muestras independientes Un entrenador ha desarrollado un nuevo programa de entrenamiento para lanzadores de peso. Para probar su eficacia, sigue entrenando a 5 de sus atletas con el método antiguo (1), y a los otros 5 les entrena con el método novedoso (2). Al cabo de 2 meses, realiza una prueba para medir la distancia del lanzamiento de peso. Encuentra los siguientes estadísticos en cada muestra: y ; y . ¿Es el nuevo método de entrenamiento eficaz? 1. Hipótesis: 2. Supuestos: muestras aleatorias, normalidad, homocedasticidad 3. Estadístico de contraste: 4. Valor p: 5. 6. Decisión sobre : rechazar . El nuevo método de entrenamiento es eficaz. Intervalo de confianza: La prueba T para muestras independientes Un entrenador ha desarrollado un nuevo programa de entrenamiento para lanzadores de peso. Para probar su eficacia, sigue entrenando a 5 de sus atletas con el método antiguo (1), y a los otros 5 les entrena con el método novedoso (2). Al cabo de 2 meses, realiza una prueba para medir la distancia del lanzamiento de peso. Encuentra los siguientes estadísticos en cada muestra: y ; y . ¿Es el nuevo método de entrenamiento eficaz? 1. Hipótesis: 2. Supuestos: muestras aleatorias, normalidad, homocedasticidad 3. Estadístico de contraste: 4. Valor p: 5. 6. Decisión sobre : rechazar . El nuevo método de entrenamiento es eficaz. Intervalo de confianza: Tamaño del efecto El tamaño del efecto más común para la prueba T para muestras independientes también es la d de Cohen Si conocemos el valor del estadístico T, hay una simplifcación Puntos de corte orientativos: leve < 0,5 ≤ moderado < 0,8 ≤ grande Homogeneidad de varianzas y Prueba T de Welch Para saber si se cumple o no el supuesto de homogeneidad de varianzas, utilizaremos la prueba de Levene. Si , significa que las varianzas son significativamente distintas (el supuesto NO se cumple). En este ejemplo, , por lo que sí se cumple el supuesto. Si no se cumpliera usaríamos la prueba T de Welch, en lugar de la prueba T de Student Se interpreta igual que la Prueba T Normalidad y Prueba de Mann-Whitney Para saber si se cumple o no el supuesto de normalidad, utilizaremos la prueba de Shapiro-Wilk. En este caso sí se cumple el supuesto de normalidad Sólo si la muestra es pequeña, y además no se cumple el supuesto de normalidad, usaríamos la prueba de Mann-Whitney (cuyo estadístico se llama U) para realizar el contraste de medias. Se interpreta igual que la Prueba T. Prueba de McNemar Recordatorio: la prueba X2 de independencia permite evaluar la existencia de relación (o de no independencia) entre 2 variables categóricas La prueba de McNemar permite comparar proporciones de variables dicotómicas Es similar a la prueba T para muestras relacionadas en el sentido de que contamos con dos variables dicotómicas medidas en una muestra relacionada: • Estudios transversales: dos variables distintas medidas en una muestra (p. ej., valoración positiva o negativa de dos productos diferentes) • Estudios longitudinales: una variable medida en una muestra en dos momentos distintos (p. ej., opinión sobre un candidato político antes y después de un mitin) • Muestras emparejadas: una variable medida en dos muestras de personas emparejadas (p. ej., opinión sobre un candidato político de mujer y marido) Prueba de McNemar Estudios transversales Muestras emparejadas Producto B Producto A Opi. marido Positiva Negativa Total Positiva 60 20 80 Negativa 30 90 Total 90 110 Opi. mujer A favor En contra A favor 170 20 190 120 En contra 70 40 110 200 Total 240 60 300 Estudios longitudinales Opi. después Opi. antes A favor En contra Total A favor 49 21 70 En contra 63 117 180 Total 112 138 250 Total Homogeneidad marginal y simetría En cualquiera de las tres situaciones, la prueba de McNemar permite comparar las proporciones de ambas variables dicotómicas Producto B Positiva Negativa Total Positiva 60 20 80 Negativa 30 90 120 Total 90 110 200 Producto A Homogeneidad marginal y simetría En cualquiera de las tres situaciones, la prueba de McNemar permite comparar las proporciones de ambas variables dicotómicas Producto B Positiva Negativa Total Positiva 0,30 0,10 0,40 Negativa 0,15 0,45 0,60 Total 0,45 0,55 1 Producto A ¿Difiere la proporción de valoraciones positivas del producto B de la del producto A? Homogeneidad marginal y simetría En cualquiera de las tres situaciones, la prueba de McNemar permite comparar las proporciones de ambas variables dicotómicas Como se trata de comparar proporciones marginales, la prueba de McNemar también recibe el nombre de prueba de homogeneidad marginal Producto B Positiva Negativa Total Positiva 0,30 0,10 0,40 Negativa 0,15 0,45 0,60 Total 0,45 0,55 1 Producto A ¿Difiere la proporción de valoraciones positivas del producto B que la del producto A? Homogeneidad marginal y simetría En estudios longitudinales, a veces la pregunta se elabora en términos de cambios ¿Ha habido más cambios en una dirección o en la otra? Opi. después A favor En contra Total A favor 49 21 70 En contra 63 117 180 Total 112 138 250 Opi. antes Homogeneidad marginal y simetría En estudios longitudinales, a veces la pregunta se elabora en términos de cambios ¿Ha habido más cambios en una dirección o en la otra? Opi. después A favor En contra Total A favor 49 21 70 En contra 63 117 180 Total 112 138 250 Opi. antes ¿Ha sido efectivo el mitin o ha sido contraproducente? Homogeneidad marginal y simetría En estudios longitudinales, a veces la pregunta se elabora en términos de cambios ¿Ha habido más cambios en una dirección o en la otra? Como estamos comparando si los cambios en una dirección y en la otra son similares, esta prueba también se la conoce como prueba de simetría Opi. después A favor En contra Total A favor 49 21 70 En contra 63 117 180 Total 112 138 250 Opi. antes ¿Ha sido efectivo el mitin o ha sido contraproducente? Homogeneidad marginal y simetría Homogeneidad marginal y simetría son equivalentes, tanto matemáticamente como a nivel interpretativo Opi. después Opi. después A favor En contra Total A favor 49 21 70 En contra 63 117 Total 112 138 Opi. antes A favor En contra Total A favor 49 21 70 180 En contra 63 117 180 250 Total 112 138 250 Opi. antes Homogeneidad marginal y simetría Homogeneidad marginal y simetría son equivalentes, tanto matemáticamente como a nivel interpretativo Opi. después Opi. después A favor En contra Total Opi. antes A favor 0,196 0,084 0,280 En contra 0,252 0,468 0,720 Total 0,448 0,552 1 Opi. antes A favor En contra Total A favor 0,196 0,084 0,280 En contra 0,252 0,468 0,720 Total 0,448 0,552 1 Si antes del mitin había un 28% de personas a favor del candidato, y después del mitin hay un 44,8% de personas a favor, es porque el porcentaje de personas que ha pasado de estar en contra a estar a favor (25,2%) es mayor que el de personas que ha pasado de estar a favor a estar en contra (8,4%). Homogeneidad marginal y simetría La prueba de McNemar emplea un estadístico X2 Aunque la lógica se base en la hipótesis de simetría (comparar los cambios en una dirección con los cambios en la otra dirección), hemos visto que esto también sirve para la hipótesis de homogeneidad marginal (comparación de proporciones) Opi. después Opi. antes A favor En contra Total A favor 49 21 70 En contra 63 117 180 Total 112 138 250 Homogeneidad marginal y simetría La prueba de McNemar emplea un estadístico X2 Aunque la lógica se base en la hipótesis de simetría (comparar los cambios en una dirección con los cambios en la otra dirección), hemos visto que esto también sirve para la hipótesis de homogeneidad marginal (comparación de proporciones) Y2 Y1 A B Total A B Total Homogeneidad marginal y simetría La prueba de McNemar emplea un estadístico X2 Aunque la lógica se base en la hipótesis de simetría (comparar los cambios en una dirección con los cambios en la otra dirección), hemos visto que esto también sirve para la hipótesis de homogeneidad marginal (comparación de proporciones) Y2 Y1 A A B Total 2 𝑋 𝑀𝑁 = B Total Su distribución es: Como sólo vale para variables dicotómicas (), siempre: (|𝑛 12 − 𝑛 2 1|− 1 ) 𝑛12 + 𝑛21 2 La prueba de McNemar 1. Las hipótesis La prueba de McNemar sólo permite contrastar si las proporciones difieren, no cuál de ellas es mayor (aunque podremos saberlo simplemente mirando los resultados) (Las proporciones son iguales) (Las proporciones no son iguales) La prueba de McNemar 2. Los supuestos • Muestra aleatoria de n participantes emparejados La prueba de McNemar 3. El estadístico de contraste y su distribución La prueba de McNemar 4. Valor p y punto crítico • Valor p: consultar en la tabla estadística de la distribución o en esta web • Punto crítico: consultar la tabla estadística de la distribución o en esta web La prueba de McNemar 5. Decisión sobre • Si o cae en la zona de rechazo rechazar : las proporciones son diferentes • Si o cae en la zona de aceptación mantener : no hay evidencia de que las proporciones sean diferentes La prueba de McNemar Se clasifican a 250 sujetos por su preferencia antes y después de un debate televisado. Estamos interesados en averiguar si las preferencias de los sujetos han cambiado tras el debate, es decir, si la proporción de personas que prefieren al líder A y la de personas que prefieren al líder B son o no las mismas antes y después del debate. Pref. después Líder A Líder B Líder A 49 21 70 Líder B 63 117 180 Total 112 138 250 Pref. antes 1. Hipótesis: 2. Supuestos: 3. Estadístico de contraste: 4. Valor p: 5. Decisión sobre : Total La prueba de McNemar Se clasifican a 250 sujetos por su preferencia antes y después de un debate televisado. Estamos interesados en averiguar si las preferencias de los sujetos han cambiado tras el debate, es decir, si la proporción de personas que prefieren al líder A y la de personas que prefieren al líder B son o no las mismas antes y después del debate. Pref. después Líder A Líder B Líder A 49 21 70 Líder B 63 117 180 Total 112 138 250 Pref. antes 1. Hipótesis: 2. Supuestos: 3. Estadístico de contraste: 4. Valor p: 5. Decisión sobre : Total La prueba de McNemar Se clasifican a 250 sujetos por su preferencia antes y después de un debate televisado. Estamos interesados en averiguar si las preferencias de los sujetos han cambiado tras el debate, es decir, si la proporción de personas que prefieren al líder A y la de personas que prefieren al líder B son o no las mismas antes y después del debate. Pref. después Líder A Líder B Líder A 49 21 70 Líder B 63 117 180 Total 112 138 250 Pref. antes 1. Hipótesis: 2. Supuestos: muestra aleatoria de medidas relacionadas 3. Estadístico de contraste: 4. Valor p: 5. Decisión sobre : Total La prueba de McNemar Se clasifican a 250 sujetos por su preferencia antes y después de un debate televisado. Estamos interesados en averiguar si las preferencias de los sujetos han cambiado tras el debate, es decir, si la proporción de personas que prefieren al líder A y la de personas que prefieren al líder B son o no las mismas antes y después del debate. Pref. después Líder A Líder B Líder A 49 21 70 Líder B 63 117 180 Total 112 138 250 Pref. antes 1. Hipótesis: 2. Supuestos: muestra aleatoria de medidas relacionadas 3. Estadístico de contraste: 4. Valor p: 5. Decisión sobre : Total La prueba de McNemar Se clasifican a 250 sujetos por su preferencia antes y después de un debate televisado. Estamos interesados en averiguar si las preferencias de los sujetos han cambiado tras el debate, es decir, si la proporción de personas que prefieren al líder A y la de personas que prefieren al líder B son o no las mismas antes y después del debate. Pref. después Líder A Líder B Líder A 49 21 70 Líder B 63 117 180 Total 112 138 250 Pref. antes 1. Hipótesis: 2. Supuestos: muestra aleatoria de medidas relacionadas 3. Estadístico de contraste: 4. Valor p: 5. Decisión sobre : Total La prueba de McNemar Se clasifican a 250 sujetos por su preferencia antes y después de un debate televisado. Estamos interesados en averiguar si las preferencias de los sujetos han cambiado tras el debate, es decir, si la proporción de personas que prefieren al líder A y la de personas que prefieren al líder B son o no las mismas antes y después del debate. Pref. después Líder A Líder B Líder A 49 21 70 Líder B 63 117 180 Total 112 138 250 Pref. antes Total 1. Hipótesis: 2. Supuestos: muestra aleatoria de medidas relacionadas 3. Estadístico de contraste: 4. Valor p: 5. Decisión sobre : rechazar . Las proporciones no son iguales (aumenta la preferencia por A). Conceptos importantes Prueba T para muestras relacionadas: Contraste que se utiliza para comparar dos variables cuantitativas en la misma métrica (en diseños transversales, pre-post, o díadas). Es equivalente a calcular una variable de diferencia y aplicarle una prueba T para una muestra. Requiere cumplir el supuesto de normalidad. Se basa en el estadístico . Prueba T para muestras independientes: Contraste que se utiliza para comparar dos grupos en una variable cuantitativa (en diseños inter-sujeto). Esto se consigue comparando las medias de los dos grupos en dicha variable. Requiere cumplir los supuestos de normalidad y homocedasticidad. Se basa en el estadístico . d de Cohen: Es una diferencia de medias tipificada que se usa como medida de tamaño del efecto en las distintas pruebas T (aunque se cacula de forma distinta en cada una de ellas). Prueba de McNemar: Contraste que se utiliza para comparar dos proporciones en muestras emparejadas (diseños transversales, pre-post, o díadas). Requiere dos variables dicotómicas y se basa en el estadístico . También se le conoce como prueba de homogeneidad marginal o simetría. Conceptos importantes Prueba de normalidad Shapiro-Wilk: Contraste que se utiliza para saber si la distribución de una variable es significativamente distinta de la distribución normal o no. Si , se concluye que la variable sigue una distribución que no es normal. Prueba de Wilcoxon: Contraste alternativo a la prueba T de Student para muestras emparejadas que se utiliza cuando la variable de diferencia no sigue una distribución normal. Prueba de Levene: Contraste que se utiliza para saber si dos variables tienen o no la misma varianza. Si , se rechaza la , y se concluye que las variables tienen distinta varianza. Prueba T de Welch: Contraste alternativo a la prueba T de Student para muestras independientes que se utiliza cuando las varianzas de los dos grupos son distintas (cuando Levene da ) Prueba de Mann Whitney: Contraste alternativo a la prueba T de Student para muestras independientes que se utiliza cuando la distribución de las variables no es normal. * Recordad que con tamaños muestrales grandes, tanto el supuesto de normalidad como el de homogeneidad de varianzas pierden importancia.