Apuntes - Pruebas de hipótesis PDF

Summary

Estos apuntes de la Unidad 4 cubren el tema de Pruebas de hipótesis en Probabilidad y Estadística Descriptiva para la Universidad de Chile. Se describen conceptos básicos como hipótesis nula y alternativa, y la metodología para realizar estos tests.

Full Transcript

Curso: Probabilidad y estadística descriptiva Unidad 4 : Inferencia estadística Tema: Pruebas de hipótesis. Contenido: Pruebas de hipótesis Apuntes Unidad 4 Pruebas de hipótesis Curso: Probabilidad y estadística descriptiva Unidad 4 : Inferencia estadística Tema:...

Curso: Probabilidad y estadística descriptiva Unidad 4 : Inferencia estadística Tema: Pruebas de hipótesis. Contenido: Pruebas de hipótesis Apuntes Unidad 4 Pruebas de hipótesis Curso: Probabilidad y estadística descriptiva Unidad 4 : Inferencia estadística Tema: Pruebas de hipótesis. Contenido: Pruebas de hipótesis PRUEBA DE HIPÓTESIS Una hipótesis estadística o simplemente hipótesis corresponde a una aseveración con respecto a un parámetro de la distribución asociada a una población. Una prueba de hipótesis es una metodología que nos permite determinar si los datos de una muestra proporcionan evidencia suficiente para rechazar o no una hipótesis sobre un parámetro de la distribución de la población. En una prueba de hipótesis se debe confrontar dos afirmaciones acerca de la hipótesis de interés: Una se denomina hipótesis nula, denotada por 𝐻0, y corresponde al valor del parámetro que se cree cierto inicialmente. La otra se denomina hipótesis alternativa, que se denota como 𝐻1 y es una aseveración que indica un cambio a evaluar en el valor del parámetro respecto de 𝐻0. Esto se puede expresar como que el parámetro ha aumentado, ha disminuido, o que es distinto. Es importante tener en cuenta de que la hipótesis alternativa 𝐻1 se plantea para buscar evidencia de un cambio en el valor del parámetro, y se determina según la pregunta que se busca responder (si es mayor, menor o distinto). La hipótesis nula, 𝐻0, suele ser el complemento de lo definido en 𝐻1. Debido a que en general no es posible acceder a los datos de toda la población, debemos decidir cuál de las dos afirmaciones es correcta a partir de una muestra aleatoria. La metodología es suponer que la hipótesis nula 𝐻0 es verdadera, y se busca ver si la muestra nos provee de evidencia que contradiga esta suposición. Es importante tener en cuenta que, dada la aleatoriedad del fenómeno en estudio, no es posible afirmar con certeza que una hipótesis es verdadera, por lo que a lo más se puede “rechazar” una en favor de la otra: La hipótesis nula será rechazada en favor de la hipótesis alternativa solo si la evidencia que arroja la muestra sugiere que 𝐻0 es falsa. Curso: Probabilidad y estadística descriptiva Unidad 4 : Inferencia estadística Tema: Pruebas de hipótesis. Contenido: Pruebas de hipótesis Si la muestra no contradice fuertemente a 𝐻0 se acepta que esta hipótesis sigue siendo válida. Entonces, las dos posibles conclusiones derivadas de un análisis de prueba de hipótesis son rechazar o no 𝐻0: PRUEBAS DE HIPÓTESIS UNILATERALES Y BILATERALES En una prueba de hipótesis, 𝐻1se plantea para buscar evidencia de un cambio en el valor del parámetro, y se determina según la pregunta que se busca responder (si es mayor, menor o distinto). Las pruebas de hipótesis generalmente tendrán una de las siguientes tres formas: Hipótesis nula Hipótesis alternativa vs vs vs Curso: Probabilidad y estadística descriptiva Unidad 4 : Inferencia estadística Tema: Pruebas de hipótesis. Contenido: Pruebas de hipótesis Las pruebas de hipótesis se pueden clasificar en dos tipos, bilaterales y unilaterales. Las pruebas bilaterales corresponden a hipótesis de la forma: En este caso rechazaremos la hipótesis nula, 𝐻0, cuando el valor estimado del parámetro sea extremo, ya sea notablemente menor o mayor en comparación al valor supuesto. Las pruebas unilaterales son de dos formas: En estos casos rechazaremos 𝐻0 cuando, a partir de la muestra, el valor estimado del parámetro sea mucho mayor o mucho menor que el valor supuesto, respectivamente. PRUEBA DE HIPÓTESIS Y TIPOS DE ERROR Recordemos que una prueba de hipótesis es una metodología que nos permite determinar si los datos de una muestra proporcionan evidencia suficiente para rechazar o no la hipótesis nula 𝐻0, sobre un parámetro de la distribución de la población. Cuando decidimos rechazar o no rechazar la hipótesis nula 𝐻0, tenemos cuatro posibles escenarios: 1. Se rechaza una hipótesis verdadera. 2. No se rechaza una hipótesis verdadera. 3. Se rechaza una hipótesis falsa. 4. No rechaza una hipótesis falsa. Cuando una hipótesis es verdadera y no la rechazamos (opción 2) o si rechazamos una hipótesis falsa (opción 4), hemos tomado la decisión correcta. Pero si rechazamos una Curso: Probabilidad y estadística descriptiva Unidad 4 : Inferencia estadística Tema: Pruebas de hipótesis. Contenido: Pruebas de hipótesis hipótesis verdadera (opción 1) o no se rechaza una hipótesis falsa (opción 3) hemos cometido un error. El nivel de significancia, también denominado α se define como la probabilidad de cometer un error tipo I. El complemento del nivel de significancia α, es decir (1 − α), corresponde al nivel de confianza de la prueba de hipótesis, el cual se puede interpretar como la probabilidad de no cometer un error de tipo I. Probabilidad de cometer error tipo I Nivel de confianza La probabilidad de cometer error tipo II se denomina β. El complemento de β, es decir (1 − β), se denomina la potencia de la prueba de hipótesis. Probabilidad de cometer error tipo II Potencia de la prueba Es importante tener en cuenta que en ocasiones tanto el nivel de confianza y la potencia de la prueba pueden estar expresadas como probabilidades porcentuales: En las pruebas de hipótesis, se suele considerar el error tipo I como el más importante de controlar, por lo que se suele fijar el nivel de significancia α antes de realizar la prueba. Los niveles de significancia y por tanto de confianza, más usados son: Nivel de significancia [α] Nivel de confianza [(1 − α) · 100%] 0,1=10% 90% 0,05=5% 95% 0,01=1% 99% Curso: Probabilidad y estadística descriptiva Unidad 4 : Inferencia estadística Tema: Pruebas de hipótesis. Contenido: Pruebas de hipótesis PASOS PARA REALIZAR UNA PRUEBA DE HIPÓTESIS Para abordar un problema de prueba de hipótesis, es decir, en los que se requiere tomar una decisión entre aceptar o rechazar una proposición respecto de un parámetro, se deben seguir los siguientes pasos: 1. Plantear la hipótesis nula 𝐻0 y alternativa 𝐻1. 2. Fijar el nivel de significación de la prueba α = 𝑃(𝑒𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼). Al fijar la significancia, definimos la probabilidad de rechazar 𝐻0 cuando ésta es cierta. 3. Asumir que 𝐻0es cierta y seleccionar el estadístico de prueba con su distribución de probabilidad. 4. Establecer la región de rechazo y expresar la regla de decisión, es decir, que el estadístico tome un valor en la región de rechazo. 5. Una vez obtenido el valor del estadístico de prueba, se toma la decisión de rechazar o no 𝐻0, y se interpretar en base al contexto. En una prueba de hipótesis unilateral, una vez fijado el nivel de significación α, para determinar la región donde se rechaza 𝐻0 hay que considerar las dos formas de este tipo de pruebas. Así, la región de rechazo se puede ver de las siguientes maneras: PRUEBA DE HIPÓTESIS BILATERAL PARA LA MEDIA POBLACIONAL Recordemos que una prueba de hipótesis es una metodología que nos permite determinar Curso: Probabilidad y estadística descriptiva Unidad 4 : Inferencia estadística Tema: Pruebas de hipótesis. Contenido: Pruebas de hipótesis si los datos de una muestra proporcionan evidencia suficiente para rechazar una hipótesis sobre un parámetro de la distribución de la población. En esta lección, nos interesa estudiar pruebas de hipótesis para la media poblacional µ de la forma: donde µ0 corresponde a un valor fijo, el cual queremos saber si se ha modificado. Asumiendo 𝐻0 cierta, es decir, que la media poblacional µ es igual a µ0, usaremos el promedio muestral 𝑋‾ como estadístico de prueba, el cual sigue una distribución normal, de media µ0 y desviación estándar σ 𝑛. Para el desarrollo de esta lección asumimos que el valor de σ es conocido. Para determinar la región donde se rechaza la hipótesis nula, hay que poner atención a los valores extremos de la distribución, ya que la probabilidad de cometer error tipo I, α, se divide en partes iguales en los extremos derecho e izquierdo, generando dos regiones de rechazo. Debido a lo anterior, a este tipo de prueba se le llama bilateral. Se está en la región de rechazo cuando el estadístico de prueba toma un valor extremo, ya sea a la izquierda o derecha de la distribución. Por lo que la regla de decisión se puede expresar como: Con una confianza de (1 − α) · 100% , se rechazará la hipótesis nula, a favor de la alternativa, si se cumple alguna de las dos desigualdades. A diferencia de la prueba de hipótesis unilateral, ahora hay que determinar dos valores, 𝑎1 y 𝑎2, los cuales definirán las respectivas regiones de rechazo. Para ello debemos seguir los siguientes pasos: Paso 1: Asumiendo 𝐻0 cierta, la variable aleatoria 𝑋‾ sigue una la distribución normal con σ media µ0 y desviación estándar. En ella definiremos las regiones de rechazo, dividiendo 𝑛 la significancia α,, en dos partes iguales. Paso 2: Para calcular los valores de 𝑎1 y 𝑎2 debemos partir de las probabilidades que quedan delimitadas por las respectivas regiones de rechazo. Curso: Probabilidad y estadística descriptiva Unidad 4 : Inferencia estadística Tema: Pruebas de hipótesis. Contenido: Pruebas de hipótesis Paso 3: Para encontrar el valor de 𝑎1, lo primero es estandarizar. Paso 4: Usando una tabla de valores o un recurso, podemos encontrar el valor de 𝑧 que α genera una probabilidad acumulada de 2. Paso 5: Si igualamos la fracción a 𝑧 α y despejamos, obtenemos el valor de 𝑎1. 2 Paso 6: Para obtener el valor de 𝑎2 se procede de manera similar. FORMAS DE ABORDAR UNA PRUEBA DE HIPÓTESIS BILATERAL Una prueba de hipótesis bilateral se puede abordar de dos formas, utilizando la región de rechazo o el intervalo de confianza. Para lo siguiente, considera una población con cierta media µ desconocida y con desviación estándar σ finita y conocida. Prueba bilateral Para este caso, las hipótesis nula y alternativa acerca del valor de µ son: Resolución 1: Utilizando la región de rechazo Una prueba bilateral genera la siguiente región de rechazo, con nivel de significancia α. Curso: Probabilidad y estadística descriptiva Unidad 4 : Inferencia estadística Tema: Pruebas de hipótesis. Contenido: Pruebas de hipótesis Los valores 𝑎1 y 𝑎2 que separa las regiones en la figura anterior pueden obtenerse de la siguiente manera, si se toma la hipótesis nula como cierta: Si el valor de 𝑋‾ cae en la región de rechazo, se rechaza la hipótesis nula 𝐻0 en favor de la hipótesis alternativa 𝐻1. Sin embargo, si el valor de 𝑋‾ no cae en la región de rechazo, se acepta 𝐻0. Resolución 2: Utilizando el intervalo de confianza Una prueba bilateral genera un intervalo, con nivel de significancia (1 − α). Curso: Probabilidad y estadística descriptiva Unidad 4 : Inferencia estadística Tema: Pruebas de hipótesis. Contenido: Pruebas de hipótesis Si el valor de µ = µ0 no está contenido en el intervalo de confianza, se rechaza la hipótesis nula 𝐻0 en favor de la hipótesis alternativa 𝐻1. Sin embargo, si el valor de µ = µ0 está contenido en el intervalo de confianza, se acepta 𝐻0. Es importante notar que, si bien la resolución 1 considera una distribución en torno a 𝑋‾ y la resolución 2 en torno a µ, las áreas involucradas en ambos casos son iguales, por lo tanto también lo son las probabilidades. SÍNTESIS Una hipótesis estadística o simplemente hipótesis corresponde a una aseveración con respecto a un parámetro de la distribución asociada a una población. Una prueba de hipótesis es una metodología que nos permite determinar si los datos de una muestra proporcionan evidencia suficiente para rechazar o no una hipótesis sobre un parámetro de la distribución de la población. Curso: Probabilidad y estadística descriptiva Unidad 4 : Inferencia estadística Tema: Pruebas de hipótesis. Contenido: Pruebas de hipótesis En una prueba de hipótesis se deben confrontar dos afirmaciones acerca de la hipótesis de interés: ○ Una se denomina hipótesis nula, denotada por 𝐻0, y corresponde al valor del parámetro que se cree cierto inicialmente. ○ La otra se denomina hipótesis alternativa, que se denota como 𝐻1, es una aseveración que indica un cambio a evaluar en el valor del parámetro respecto de 𝐻0. Esto se puede expresar como que el parámetro ha aumentado, ha disminuido, o que es distinto. No es posible afirmar con certeza que una hipótesis es verdadera, por lo que a lo más se puede “rechazar” una en favor de la otra. Entonces, las dos posibles conclusiones derivadas de un análisis de prueba de hipótesis son rechazar o no 𝐻0. Las pruebas de hipótesis se pueden clasificar en dos tipos, bilaterales y unilaterales. ○ Las pruebas bilaterales corresponden a hipótesis de la forma: ○ Las pruebas unilaterales son de dos formas: Cuando decidimos rechazar o no rechazar una hipótesis nula 𝐻0, tenemos cuatro posibles escenarios: ○ Se rechaza una hipótesis verdadera. ○ No se rechaza una hipótesis verdadera. ○ Se rechaza una hipótesis falsa. ○ No rechaza una hipótesis falsa. Curso: Probabilidad y estadística descriptiva Unidad 4 : Inferencia estadística Tema: Pruebas de hipótesis. Contenido: Pruebas de hipótesis En las pruebas de hipótesis se pueden cometer dos tipos de errores: - Cometeremos error tipo I si rechazamos la hipótesis nula 𝐻0, cuando era verdadera. - Cometeremos error tipo II si no rechazamos la hipótesis nula 𝐻0 cuando esta en verdad era falsa. El nivel de significancia, también denominado α se define como la probabilidad de cometer un error tipo I. El complemento del nivel de significancia α, es decir (1 − α), corresponde al nivel de confianza de la prueba de hipótesis, el cual se puede interpretar como la probabilidad de no cometer un error de tipo I. Probabilidad de cometer error tipo I Nivel de confianza Curso: Probabilidad y estadística descriptiva Unidad 4 : Inferencia estadística Tema: Pruebas de hipótesis. Contenido: Pruebas de hipótesis La probabilidad de cometer error tipo II se denomina β. El complemento de β, es decir (1 − β), se denomina la potencia de la prueba de hipótesis. Probabilidad de cometer error tipo II Potencia de la prueba En las pruebas de hipótesis, se suele considerar el error tipo I como el más importante de controlar, por lo que se suele fijar el nivel de significancia α antes de realizar la prueba. Los niveles de significancia y por tanto de confianza, más usados son: Nivel de significancia [α] Nivel de confianza [(1 − α) · 100%] 0,1=10% 90% 0,05=5% 95% 0,01=1% 99% En general, cometer un tipo de error no es necesariamente más grave que el otro. La gravedad depende de la situación de investigación específica y de sus consecuencias, pero idealmente ambos tipos de errores deben minimizarse. Para abordar un problema de pruebas de hipótesis, es decir, en los que se requiere tomar una decisión entre aceptar o rechazar una proposición respecto de un parámetro, se deben seguir los siguientes pasos: 1. Plantear la hipótesis nula 𝐻0y alternativa 𝐻1. 2. Fijar el nivel de significación de la prueba α = 𝑃(𝑒𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼). Al fijar la significancia, definimos la probabilidad de rechazar 𝐻0cuando ésta es cierta. 3. Asumir que 𝐻0es cierta y seleccionar el estadístico de prueba con su distribución de probabilidad. 4. Establecer la región de rechazo y expresar la regla de decisión, es decir, para qué intervalo de valores del estadístico de prueba decidimos rechazar la Curso: Probabilidad y estadística descriptiva Unidad 4 : Inferencia estadística Tema: Pruebas de hipótesis. Contenido: Pruebas de hipótesis hipótesis nula. 5. Una vez obtenido el valor del estadístico de prueba, se toma la decisión de rechazar o no 𝐻0, y se interpreta en base al contexto. En una prueba de hipótesis bilateral para la media de la población µ, las hipótesis nula y alternativa se pueden plantear como: Como estadístico de prueba, se puede utilizar el promedio muestral 𝑋‾, asumiendo σ que sigue una distribución normal, de media µ y desviación estándar. 𝑛 Para determinar la región de rechazo, debemos fijar la significancia, α, la cual corresponde a la probabilidad de cometer error tipo I. Como la prueba de hipótesis es bilateral, se dividirá la significancia en dos partes iguales, las cuales estarán en los extremos de la distribución. La regla de decisión, es decir, la región donde se rechaza la hipótesis nula se puede expresar como: Para encontrar los valores de 𝑎1 y 𝑎2 debemos estandarizar 𝑋‾, buscar el valor de 𝑧 α 2 y de 𝑧 α tal que representen la probabilidad de estar en la región de rechazo. (1− 2 ) Una vez obtenido los valores de 𝑎1 y 𝑎2, se compara con el valor del estadístico de prueba y se toma la decisión de rechazar o no 𝐻0, y se interpreta la decisión en base al contexto. Al responder una prueba de hipótesis, siempre se debe reportar el nivel de significancia o el nivel de confianza utilizado en el desarrollo del problema, puesto que rechazar o no la hipótesis nula depende de este valor. Por ejemplo, puede ocurrir que con una confianza del 95% esta se rechace, pero no así con una del 90%. Una prueba de hipótesis bilateral se puede abordar de dos formas, utilizando la región de rechazo o el intervalo de confianza. Curso: Probabilidad y estadística descriptiva Unidad 4 : Inferencia estadística Tema: Pruebas de hipótesis. Contenido: Pruebas de hipótesis Para lo siguiente, considera una población con cierta media µ desconocida y con desviación estándar σ finita y conocida. Prueba bilateral Para este caso, las hipótesis nula y alternativa acerca del valor de µ son: ○ Resolución 1: Utilizando la región de rechazo Una prueba bilateral genera la siguiente región de rechazo, con nivel de significancia α. Los valores 𝑎1 y 𝑎2 que separa las regiones en la figura anterior pueden obtenerse de la siguiente manera, si se toma la hipótesis nula como cierta: Si el valor de 𝑋‾ cae en la región de rechazo, se rechaza la hipótesis nula 𝐻0 en favor de la hipótesis alternativa 𝐻1. Sin embargo, si el valor de 𝑋‾ no cae en la región de rechazo, se acepta 𝐻0. ○ Resolución 2: Utilizando el intervalo de confianza Una prueba bilateral genera un intervalo, con nivel de significancia (1 − α). Si el valor de µ = µ0 no está contenido en el intervalo de confianza, se rechaza la hipótesis nula 𝐻0 en favor de la hipótesis alternativa 𝐻1. Sin embargo, si el valor de µ = µ0 está contenido en el intervalo de confianza, se acepta 𝐻0. Curso: Probabilidad y estadística descriptiva Unidad 4 : Inferencia estadística Tema: Pruebas de hipótesis. Contenido: Pruebas de hipótesis Es importante notar que, si bien la resolución 1 considera una distribución en torno a 𝑋‾ y la resolución 2 en torno a µ, las áreas involucradas en ambos casos son iguales, por lo tanto también lo son las probabilidades.

Use Quizgecko on...
Browser
Browser