Tema 3: Introducción al Contraste de Hipótesis PDF

Tema 3 Introducción al contraste de hipótesis Contenidos 1.- Introducción. 2.- La lógica del contraste de hipótesis. 2.1.- Hipótesis estadísticas. 2.2.- Supuestos. 2.3.- Estadístico de contraste. 2.4.- Regla de decisión. 2.5.- Decisión. 3.- Errores Tipo I y Tipo II. 4.- Potencia de un contraste. 5.- Nivel crítico 6.- Estimación por intervalos y contraste de hipótesis 7.- Inferencia paramétrica 8.- Inferencia no paramétrica Referencias para preparar el tema • Amón, J. (1991). Estadística para Psicólogos II. Capítulo 10, pp. 262-289. Madrid: Pirámide. • Pardo, A. y San Martín, R. (1994). Análisis de Datos en Psicología II. Capítulo 3, pp. 125-184. Madrid: Ediciones Pirámide S.A. • Hopkins, K.D., Hopkins, B.R. y Glass, G.V. (1997, 3ª ed). Estadística Básica para las Ciencias Sociales y del Comportamiento. Capítulo 10, pp. 171-188. México: Prentice-Hall Hispanoamericana.. Introducción DEFINICIÓN Proceso mediante el cual se trata de comprobar si una afirmación sobre alguna propiedad poblacional puede ser sostenida según la información muestral disponible El proceso de contraste de hipótesis implica una decisión sobre una prueba estadística. La decisión se realiza mediante una prueba de significación Introducción Problema de conocimiento Establecer de forma operativa el comportamiento de la variable o variables involucradas en el problema Solución provisional (afirmación empíricamente contrastable) Hipótesis científica 2. La lógica del contraste de hipótesis Pasos en la verificación de una hipótesis: • Formular estadísticamente la hipótesis científica que se desea contrastar • Buscar evidencia empírica o relevante capaz de informar sobre si la hipótesis establecida es o no sostenible • Regla de decisión La lógica del Contraste de Hipótesis. Formular estadísticamente la hipótesis científica que se desea contrastar • Hipótesis científica Hipótesis estadística En términos de una o varias distribuciones poblaciones O en términos del valor de uno o más parámetros Las mujeres y los hombres no difieren en inteligencia H = M La lógica del Contraste de Hipótesis. Buscar evidencia empírica o relevante capaz de informar sobre si la hipótesis establecida es o no sostenible. Una hipótesis será compatible con los datos empíricos cuando a partir de ella sea posible deducir o predecir un resultado muestral (un estadístico) con cierta precisión. Si la hipótesis de nuestro ejemplo H = M es correcta, al extraer una muestra aleatoria debemos esperar que H = M X H = XM Una discrepancia importante entre la afirmación propuesta en la hipótesis y el resultado muestral puede indicar dos aspectos: La lógica del Contraste de Hipótesis. H = M XH ¹ XM Fluctuaciones del azar, hipótesis correcta Hipótesis incorrecta Cuestión clave: determinar cuándo la discrepancia es lo bastante grande como para considerar que el resultado muestral encontrado es incompatible con la hipótesis formulada y, por tanto, esa discrepancia no puede explicarse por fluctuaciones del azar, sino porque la hipótesis es incorrecta. La lógica del Contraste de Hipótesis. IDEA FUNDAMENTAL o Regla de decisión. Debe establecerse en términos probabilísticos debido a la necesidad de trabajar con muestras en lugar de con poblaciones. La regla de decisión que vamos a utilizar será: si el resultado muestral observado es, suponiendo correcta la hipótesis, muy poco probable, consideraremos que la hipótesis es incompatible con los datos; por el contrario, si el resultado muestral es, suponiendo correcta la hipótesis, probable, consideraremos que la hipótesis es compatible con los datos. 2.1. Hipótesis estadística Una hipótesis estadística es una afirmación sobre la forma de una o más distribuciones de probabilidad, o sobre el valor de uno o más parámetros de esas distribuciones. Las hipótesis estadísticas suelen representarse por H, seguidas de una afirmación que le da contenido. Ejemplos: H: X→N(100,15) H:  = 0.5 H:   30 H: 1 = 2 = 3 = 4 Hipótesis estadísticas La hipótesis estadística surge a partir de una hipótesis científica pero entre ambas no existe una correspondencia exacta (no son la misma cosa). Una hipótesis científica se refiere a algún aspecto de la realidad, mientras que una hipótesis estadística se refiere a algún aspecto de la distribución de probabilidad. Por tanto, existen varias formas distintas de expresar estadísticamente una hipótesis científica concreta: [MdH = MdM; FH(X) = FM(X)]. Se han propuesto diferentes enfoques para contrastar una hipótesis: Enfoque de Fisher Enfoque de Neyman y Pearson Enfoque de Bayes El enfoque de NeymanHipótesis y estadísticas Pearson • Todo contraste se basa en la formulación de dos hipótesis: hipótesis nula (H0) e hipótesis alternativa (H1). • H0→ es la que se somete a contraste. Consiste en una afirmación concreta sobre la forma de una distribución de probabilidad o sobre el valor de alguno de los parámetros de la distribución (el nombre de nula se debe a que cuando se está trabajando con dos o más parámetros, H0 suele afirmar que el valor de esos parámetros es el mismo, es decir, que la diferencia entre ellas es nula) Hipótesis estadísticas • Ejemplos de hipótesis nulas: • H0: X~N(100,15) • H0:  = 0.5 • H0:   30 • H0: 1 = 2 = 3 = 4 Hipótesis estadísticas H1 → Es la negación de la nula. Incluye todo lo que la nula excluye. Mientras que H0 suele ser una hipótesis exacta (tal parámetro es igual a otro), H1 suele ser inexacta (tal parámetro es distinto, mayor o menor que otro). Ejemplos de hipótesis alternativas: • H1: X no se distribuye según N(100,15) • H1:   0.5 • H1:  > 30 Hipótesis estadísticas • Cuando en H1 aparece el signo “” el contraste es bilateral o bidireccional • Cuando en H1 aparece el signo “<” el contraste es unilateral izquierdo o unidireccional izquierdo • Cuando en H1 aparece el signo “>” el contraste es unilateral derecho o unidireccional derecho Hipótesis estadísticas H0 y H1 se plantean como hipótesis rivales. Son exhaustivas y mutuamente exclusivas, lo que implica que si una es verdadera, necesariamente la otra es falsa. *El signo “=”, tanto si va sólo como acompañado (, ) siempre va en la H0, que es la que se somete a contrate, nunca en H1. Supuestos Una hipótesis estadística puede especificar completamente la distribución poblacional o el valor de un parámetro (por ej. H: X~N(100,15); H:  = 0.5). A este tipo de hipótesis se les llama simples. Cuando la hipótesis no especifica completamente la distribución poblacional o el valor del parámetro (por ej. H: X~N(100, ); H:  < 0.5), se les denomina compuesta. Supuestos 2.2 Supuestos del contraste de hipótesis Con frecuencia la H0 será compuesta, obligando a establecer un conjunto de supuestos que, junto con la hipótesis, permitan especificar por completo la distribución poblacional de referencia. Los supuestos son: un conjunto de afirmaciones que es necesario establecer sobre la población de partida (normalidad, simetría) y sobre la muestra utilizada (aleatoria, presentaciones independientes) para conseguir determinar la distribución de probabilidad en la que se basará la decisión sobre H0. 2.3 Estadístico de contraste Estadístico de contraste El estadístico de contraste es un resultado muestral o una transformación de él que cumple una doble condición: • Su distribución muestral es conocida cuando H0 es verdadera • Posee información empírica relevante sobre la muestra Por tanto, una vez planteadas las hipótesis es necesario seleccionar un estadístico de contraste capaz de proporcionar información relevante sobre ellas y establecer los supuestos necesarios para conseguir determinar la distribución muestral de ese estadístico. 2.4 Regla de decisión Regla de decisión La regla de decisión es el criterio que se utiliza para decidir si H0 debe mantenerse o rechazarse. Este criterio se basa en la división de la distribución muestral del estadístico de contraste en dos zonas mutuamente exclusivas: la de rechazo y la de no rechazo. Regla de decisión Zona de rechazo o zona crítica Área de la distribución muestral que corresponde a valores del estadístico de contraste que se encuentran tan alejados de la afirmación propuesta en H0, que es muy poco probable que ocurran si H0, como se supone, es verdadera. Su probabilidad es  (nivel de significación o nivel de riesgo). Zona de no rechazo Área de la distribución muestral que corresponde a valores del estadístico de contraste próximos a la afirmación propuesta en H0, y que es probable que ocurran si H0, como se supone, es verdadera. Su probabilidad es 1- (nivel de confianza). Regla de decisión Regla de decisión Rechazar H0 si el estadístico de contraste toma un valor perteneciente a la región de rechazo o crítica. Mantener H0 si el estadístico de contraste toma un valor perteneciente a la región de no rechazo. El tamaño de esas regiones se determina fijando el valor de , generalmente, 0.01 o 0.05, es decir, del 1% ó 5%, respectivamente. La forma de dividir la distribución muestral en las zonas de rechazo y no rechazo, va a depender de si el contraste es bilateral, unilateral derecho o izquierdo. Regla de decisión Contraste unilateral izquierdo 1-  Regla de decisión Contraste unilateral derecho 1-  Regla de decisión Contraste bilateral 1- /2 /2 Decisión Decisión La decisión se toma siempre respecto a H0, o se mantiene o se rechaza. Si el estadístico de contraste cae en la región crítica, se rechaza y, en caso contrario, se mantiene. Si se rechaza H0 se está afirmando que es falsa (con una probabilidad  de equivocarse). Si se mantiene, no se está afirmando que es verdadera, sino que no existe evidencia empírica suficiente como para rechazarla y puede considerarse compatible con los datos. Si el interés recae en determinar si una afirmación sobre la distribución poblacional es falsa, se planteará esa afirmación como H0. Si el interés recae en determinar si es verdadera debe plantearse como H1. 3. Errores Tipo I y Tipo2 Errores tipo I y tipo II Error tipo I Aquel que se comete al rechazar una H0 que es verdadera. La probabilidad de cometerlo es . H0 verdadera Mantener H0 Error tipo II Aquel que se comete al mantener una H0 que es falsa. La probabilidad de cometerlo es . H0 falsa Un buen contraste debe tender a minimizar ambos tipos de errores. Errores tipo I y tipo II H0 verdadera Mantener H0 Rechazar H0 Decisión correcta P = 1- Error tipo I P= H0 falsa Error tipo II P= Decisión correcta P = 1- Errores tipo I y tipo II La probabilidad de cometer error tipo I, la fija el investigador (generalmente, 0.05 ó 0.01, pero la probabilidad de cometer error tipo II () es desconocida y para un contraste concreto depende de tres factores: * La verdadera H1. * El valor de . * El tamaño del error típico de la distribución muestral utilizada para hacer el contraste. Errores tipo I y tipo II H0 H1 1-  1-  0 NO RECHAZO   1 RECHAZO Errores tipo I y tipo II H0 H1 1-   0 1-  1 NO RECHAZO  1 RECHAZO Errores tipo I y tipo II H0 H1 1-  0 1-   NO RECHAZO 1  RECHAZO 4. Potencia de un contraste La probabilidad de rechazar H0 siendo H1 verdadera Por tanto: Potencia = 1 - β Podemos calcular la potencia asignando valores concretos a la hipótesis alternativa. Por ejemplo H1: μ= 28 Nivel crítico 5. Nivel crítico Cuando realizamos un contraste de hipótesis con una computadora, el programa nos devuelve un valor del estadístico y un valor de p Por ejemplo: [F(1,20)=3,6; p=0,0002] ¿Qué significa ese valor de p exactamente? Es el nivel crítico. Se puede definir como el nivel más pequeño de α al que una hipótesis nula puede ser rechazada con el estadístico de contraste obtenido Nivel crítico En términos generales, en un contraste unilateral, p es la probabilidad de obtener valores mayores (unilateral derecho) o menores (unilateral izquierdo) que el estadístico de contraste obtenido. En un contraste bilateral, es la probabilidad asociada a los valores que se encuentran tan alejados de H0 como, al menos, el estadístico de contraste. Por tanto, se obtiene una vez efectuado el contraste

Tema 3: Introducción al Contraste de Hipótesis PDF

Document Details

Tags

Related

Summary

Full Transcript