Tests de Hipótesis (2016) - PDF
Document Details
Uploaded by Deleted User
Tags
Summary
Este documento proporciona una introducción a las pruebas de hipótesis en estadística, cubriendo los casos de varianza desconocida para la media y ejemplos. Se incluyen las hipótesis, estadísticos de prueba y regiones de rechazo.
Full Transcript
Tests para la media cuando la varianza es desconocida: Supongamos ahora que la varianza es desconocida y consideremos las mismas hipótesis sobre µ. Recordemos el resultado que vimos en el contexto de Intervalos de Confianza Las posibles hipótesis son: a) Ho: µ = µo (ó µ ≤ µo) vs. H1: µ > µo b...
Tests para la media cuando la varianza es desconocida: Supongamos ahora que la varianza es desconocida y consideremos las mismas hipótesis sobre µ. Recordemos el resultado que vimos en el contexto de Intervalos de Confianza Las posibles hipótesis son: a) Ho: µ = µo (ó µ ≤ µo) vs. H1: µ > µo b) Ho: µ = µo (ó µ ≥ µo) vs. H1: µ < µo c) Ho: µ = µo vs. H1: µ ≠ µo X − µo Estadístico del test: T= n. S Bajo Ho: µ = µo , tenemos que T ~ tn-1 Región de rechazo: Como siempre la forma de la zona de rechazo depende de la hipótesis alternativa. Estará dada, en cada caso, por a) T ≥ t n −1, α b) T ≤ −t n −1, α c) T ≥ t n −1, α / 2 El tamaño de la zona de rechazo depende del nivel. Por ejemplo, consideremos el caso a). Como la alternativa es µ > µ o , la forma de la región es T ≥ K , pero como la probabilidad de rechazar Ho siendo cierta (P(Error tipo I)) debe ser α, X − µo X − µo Pµ o n ≥ K = α ⇔ 1 − Pµ o n ≤ K = α S S ⇔ 1 − FT ( K ) = α ⇔ FT ( K ) = 1 − α ⇔ K = t n −1, α donde FT designa la función de distribución de una v.a. t con n-1 grados de libertad. Función de potencia y cálculo del tamaño de muestra para obtener una probabilidad de error tipo II dada: La función de potencia de este test es complicada porque la distribución del estadístico cuando µ ≠ µo es una distribución t no central. Aunque hay tablas y gráficos que permiten obtener probabilidades para una distribución de este tipo, no los estudiaremos. Por la misma razón, no calcularemos tamaño de muestra para obtener una probabilidad de error tipo II dada para una alternativa fija. Respecto al p-valor, cuando se utilizan tablas sólo es posible obtener una cota, ya que las tablas proveen solamente algunos valores críticos de la distribución t, a menos que se utilice un paquete como el R. Veamos un ejemplo. Tests para la varianza cuando la media es desconocida: Las hipótesis a testear son a) Ho: σ 2 = σ o2 (ó σ 2 ≤ σ o2 ) vs H1: σ 2 > σ o2 b) Ho: σ 2 = σ o2 (ó σ 2 ≥ σ o2 ) vs H1: σ 2 < σ o2 c) Ho: σ 2 = σ o2 vs H1: σ 2 ≠ σ o2 (n − 1) S 2 Estadístico del test: U = σ o2. Bajo Ho: σ = σ o , tenemos que U ~ 2 2 χ n2−1 Región de rechazo: Como siempre la forma de la zona de rechazo depende de la hipótesis alternativa. En este caso, estará dada por a) U ≥ χ n −1, α 2 b) U ≤ χ n −1, 1−α 2 c) U ≥ χ n −1, α / 2 ó U ≤ χ n −1, 1-α / 2 El tamaño de la zona de rechazo depende del nivel. Por ejemplo, consideremos el caso b). Como la alternativa es σ 2 < σ o2 , la forma de la región es U ≤ K , pero como la probabilidad de rechazar Ho siendo cierta (P(Error tipo I)) debe ser α, (n − 1) S 2 Pσ 2 ≤ K = α ⇔ K = χ n2−1, α σo 2 o Ejemplo: Se toman 25 determinaciones de la temperatura en cierto sector de un reactor, obteniéndose x = 249 C y s = 2.8 C Interesa saber, a nivel 0.05 a) si existe evidencia para decidir que la temperatura media en ese sector del reactor es menor que 250 C. Calcular el p-valor. b) si existe evidencia para decidir que la varianza de la temperatura en ese sector del reactor es mayor que (2 C ). 2 a) Las hipótesis a testear son Ho: µ = 250 (ó µ ≥ 250) vs H1: µ < 250 X − 250 El estadístico del test será T = n S y la región de rechazo estará dada por los valores de T tales que X − 250 T= n ≤ −t n −1, 0.05 S En nuestro caso, n = 25 y por lo tanto − t 24, 0.05 = −1.71. Además el valor observado de T es Tobs= -1.7857 y por lo tanto se rechaza Ho, es decir que a nivel 0.05 encontramos evidencia de que la temperatura media del reactor es menor que 250 C. ¿Cuánto vale el p-valor? El p-valor lo calculamos como la probabilidad de observar un valor tan extremo del estadístico como el observado o más extremo aún, bajo Ho. En este ejemplo, rechazamos cuando observamos valores pequeños del estadístico, por lo tanto calculamos p − valor = Pµ = 250 (T ≤ TOBS ) = Pµ = 250 (T ≤ -1.7857) X − 250 siendo T = 25 ~ t 24 S Con R o cualquier otro paquete que lo permita, podemos calcular esta probabilidad, si solo disponemos de las tablas, en general nos tendremos que conformar con acotarla. En R usariamos la función pt: pt(-1.7857,24) 0.04339571 es decir que el p-valor es 0.04339571. Esto quiere decir que rechazaremos Ho cuando realicemos un test de t como el que hemos hecho cuando el nivel de significación sea α>0.04339571, mientras que no rechazaremos Ho cuando el nivel de significación del test de t sea α 4 2 2 2 (n − 1) S 2 El estadístico del test será U = , σ2 y la región de rechazo estará dada por los valores de U tales que (n − 1) S 2 U= ≥ χ n2−1, 0.05 4 En nuestro caso, n = 25 y por lo tanto χ 242 , 0.05 = 36.42. Como el valor observado de U es Uobs=47.04, se rechaza Ho. Es decir, a nivel 0.05 hay evidencia de que la varianza de la temperatura del reactor es mayor que (2 C ). 2 Tests de hipótesis de nivel aproximado (o asintótico) α para la media de una distribución cualquiera: Sea X 1 , X 2 ,..., X n una m.a. de una distribución con media µ y varianza σ2 < ∞. Aplicando el Teorema Central del Límite, sabemos que X −µ → d Z ~ N (0,1) σ/ n Además, utilizando la propiedad enunciada al construir intervalos de confianza de nivel asintótico (1- α) para la media de una distribución cualquiera, X −µ n → d N (0,1) X −µ d σ ⇒ n → N (0,1) σ p S →1 S Por lo tanto, si n es suficientemente grande, X − µ (a) n ~ N (0,1) S Supongamos que se desea testear a nivel aproximado α alguna de las hipótesis siguientes: a) Ho: µ = µo (ó µ ≤ µo) vs H1: µ > µo b) Ho: µ = µo (ó µ ≥ µo) vs H1: µ < µo c) Ho: µ = µo vs H1: µ ≠ µo X − µo y que n es suficientemente grande. Utilizando como estadístico T= n , las s siguientes regiones de rechazo proveen tests del nivel requerido para cada una de las hipótesis: a) T ≥ zα b) T ≤ − zα c) T ≥ zα / 2 Test de hipótesis de nivel aproximado (o asintótico) α para una proporción (parámetro p de la distribución binomial): n Sea X 1 , X 2 ,..., X n una m.a. de una distribución Bi(1,p). Entonces, X = ∑ X i ~ Bi(n,p). i =1 Aplicando el Teorema Central del Límite, si n es suficientemente grande, X−p → d Z ~ N (0,1) p (1 − p ) n siendo X la proporción muestral o frecuencia relativa de éxitos. Un test de nivel aproximado α para las hipótesis: a) Ho: p = po vs H1: p > po b) Ho: p = po vs H1: p < po c) Ho: p = po vs H1: p ≠ po X − po se basa en el estadístico p o (1 − p o ) , el cual, si Ho es cierta, tiene distribución n aproximada N(0,1). Las regiones de rechazo estarán dadas por X − po a) ≥ zα p o (1 − p o ) n X − po b) ≤ − zα p o (1 − p o ) n X − po c) ≥ zα / 2 p o (1 − p o ) n