Chi-squared Test Analysis PDF

Summary

This document explains and demonstrates the Chi-squared test, a statistical method. The text includes examples, calculations, and interpretation guidance for hypothesis testing, likely used in a postgraduate level statistics course.

Full Transcript

Distribución Estadística Chi Cuadrado Si sumamos los cuadrados de 4 (k) variables con distribución normal obtendríamos una nueva variable con distribución chi2 con 4 (k) grados de libertad. Al ser una suma de cuadrados la variable solo toma valores positivos. La distribución es asimétrica. Bondad...

Distribución Estadística Chi Cuadrado Si sumamos los cuadrados de 4 (k) variables con distribución normal obtendríamos una nueva variable con distribución chi2 con 4 (k) grados de libertad. Al ser una suma de cuadrados la variable solo toma valores positivos. La distribución es asimétrica. Bondad de Ajuste Lanzamos 100 veces 1 moneda y obtenemos los siguientes resultados. Resultado Frecuencias Observadas C 53 + 47 ¿Son compatibles estos resultados con la distribución esperada si la moneda no estuviese trucada? ¿Se ajusta la distribución observada a la esperada? ¿Cúanto de bueno es el grado de ajuste entre ambas distribuciones? Nota: La distribución esperada sería una distribución uniforme, 50 cruces y 50 caras. Bondad de Ajuste El estadístico que da respuesta a nuestra pregunta es el Estadístico Chi Cuadrado: Dicho estadístico sigue una distribución Chi Cuadrado con k-1 grados de libertad. H0: Las distribuciones se ajustan. H1: Las distribuciones no se ajustan. Bondad de Ajuste Realicemos los cálculos. Resultado fo fe (fo-fe)² / fe C 53 50 (53-50)² / 50 + 47 50 (47-50)² / 50 Chi2= 0,36 Se obtiene una valor de Chi2=0.36 con 1 gl. Su p asociada es p=0.5485. Por tanto optamos por No rechazar H0 (al menos que la quieras rechazar con una probabilidad de error del 54.85%). Bondad de Ajuste Puedes utilizar el siguiente código R para realizar los cálculos bien en R, Rstudio, Editor R de Jamovi, rdrr.io , etc. obs=c(53,47) esp=c(0.5,0.5) # poner probabilidades no frecuencias chisq.test(obs,p=esp) El resultado es: Chi-squared test for given probabilities data: emp X-squared = 0.36, df = 1, p-value = 0.5485 Un poco de teoría de probabilidades: Vamos a complicar las cosas. Ahora lanzamos 100 veces 2 monedas de manera independiente. Estos son los 100 resultados que cabría esperar por puro azar. Moneda 1 Moneda 2 Frecuencias Esperadas C C + + C + C + 25 25 25 25 En formato de tabla de doble entrada o tabla cruzada Moneda 2 Moneda 1 c + c 25 25 50 + 25 25 50 50 50 100 Observa que la frecuencia de cada casilla es igual al producto de los marginales (50 x 50) dividido por el total (100). Eso es lo que ocurriría si los dos sucesos (moneda 1 y moneda 2) fueran INDEPENDIENTES. Chi2 como prueba de Independencia entre 2 variables. Veamos un ejemplo. Queremos saber si el género se asocia con la preferencia de partido político. Tomamos una muestra aleatoria simple de 500 votantes y los encuestamos sobre su preferencia de partido político. La siguiente tabla muestra los resultados empíricos de la encuesta: Republicano Demócrata Independiente Total Hombre 120 90 40 250 Mujer 110 95 45 250 Total 230 185 85 500 Chi2 como prueba de Independencia entre 2 variables. Y estos son los valores esperados para cada celda de la tabla en el caso de que ambas variables sean independientes: Republicano Demócrata Independiente Total Hombre 115 92,5 42,5 250 Mujer 115 92,5 42,5 250 Total 230 185 85 500 Chi2 como prueba de Independencia entre 2 variables. Para comprobar si ambas variables son independientes o están relacionadas comparamos mediante el estadístico Chi 2 las distribuciones empírica y teórica: Chi2 = Σ (O x E)^2 / E = 0,2174 + 0,2174 + 0,0676 + 0,0676 + 0,1471 + 0,1471 = 0,8642 El valor de p asociado para Chi2 = 0,8642 y (2-1) * (3-1) = 2 grados de libertad es 0,649198 . Observa como en este caso los gl son (filas-1) * (columnas-1). Dado que este valor p no es menor que 0.05, no rechazamos la hipótesis nula. Esto significa que no tenemos evidencia suficiente para decir que existe una asociación entre género y preferencia de partido político. https://www.statskingdom.com/310GoodnessChi.htm l The p-value equals 0.6492. It means that the chance of type I error, rejecting a correct H0, is too high: 0.6492 (64.92%). The effect size for this analysis (φ = 0.042) was found to below the range of Cohen's (1988) convention for a small effect (φ =0.1). Si prefieres utilizar R > datatable = matrix(c(120,110,90,95,40,45),nrow=2,ncol=3) #Por columnas > chisq.test(datatable,correct=FALSE) Pearson's Chi-squared test data: datatable X-squared = 0.86404, df = 2, p-value = 0.6492 El tamaño del efecto de una prueba Chi 2 se mide mediante la Phi de Cramer. Un valor φ = 0.1 se considera un efecto pequeño, 0.3 un efecto medio, y 0.5 un tamaño grande. En el anterior ejemplo φ = raíz ( 0,86404 / 500) = 0,04 por lo que se considera un efecto pequeño, casi nulo. Redacción de Resultados: Para redactar los resultados de un test de independencia Chi 2 se debe incluir • • • Los grados de libertad (gl) en paréntesis El valor Chi Cuadrado (Χ2) (También conocido como el test estadístico Chi 2) El valor p. Ejemplo • Una prueba chi cuadrado de independencia mostró una relación significativa entre el Género y el Producto Preferido, Χ2(8) = 19.7, p = .012. • Una prueba chi cuadrado de independencia no mostró ninguna relación significativa entre el Género y el Producto Preferido, Χ2(8) = 1.7, p = .450

Use Quizgecko on...
Browser
Browser