Tema 3. Contraste de hipótesis I.pptx

Full Transcript

Tema 3: El contraste de hipótesis Pablo Fernández Cáncer Pablo Nájera Álvarez Introducción Un adivino tiene (dice) poderes adivinatorios. En particular, puede adivinar qué va a salir al tirar una moneda (cara o cruz). NO se afirma en ningún momento la existencia de un poder de adivinación perfect...

Tema 3: El contraste de hipótesis Pablo Fernández Cáncer Pablo Nájera Álvarez Introducción Un adivino tiene (dice) poderes adivinatorios. En particular, puede adivinar qué va a salir al tirar una moneda (cara o cruz). NO se afirma en ningún momento la existencia de un poder de adivinación perfecto (esto es, con 100% de aciertos). Tan sólo se habla de un cierto poder adivinatorio. Como no le creemos, el adivino insiste en que lo sometamos a prueba para demostrarlo. Lanzamos una moneda 10 veces y anotamos sus aciertos/errores. Introducción Antes de nada, una persona sin poderes adivinatorios, ¿cuántos aciertos se esperaría que tuviera? Introducción Para saber si “adivino” miente o no, tendremos que comparar el rendimiento observado del adivino con el rendimiento esperado de una persona que no es adivina (que acierta lo esperable por azar). Al hacer esto estamos contrastando la hipótesis de que el adivino tiene poderes (hipótesis alternativa; ), con la hipótesis de que no los tiene (hipótesis nula; ): • La hipótesis nula dice que la proporción de aciertos del adivino es igual (o menor) a la esperable por azar (el adivino miente). • La hipótesis alternativa dice que la proporción de aciertos del adivino es superior a la esperable por azar (el adivino no miente). Importante: Las dos hipótesis son rivales porque son exhaustivas y mutuamente excluyentes. Si una es falsa, la otra es necesariamente verdadera. Introducción En el contraste de hipótesis siempre partimos de un supuesto, que viene indicado en la hipótesis nula: • Si el supuesto inicial sobre una población es cierto, ¿cómo de probable sería haber obtenido la evidencia empírica observada a partir de una muestra? • Si el adivino no tiene poderes, ¿cómo de probable sería que acertara 8 tiradas de 10? • Si la media poblacional de CI fuese 100, ¿cómo de probable sería haber obtenido una media de 114 en una muestra de 16 personas proveniente de esa misma población? Si la probabilidad es muy baja (cercana a cero), tendremos que considerar que el supuesto inicial es incompatible con los datos y, por tanto, falso. Los contrastes de hipótesis plantean una pregunta desde la tradición falsacionista: las hipótesis (nulas) se mantienen o se rechazan, pero no se dan por verdaderas. Introducción El adivino acierta 6 tiradas de 10. Si el adivino no tiene poderes, ¿cómo de probable sería que acertara 6 o más tiradas de 10? Para calcular esta probabilidad, podemos usar esta calculadora. La probabilidad de acertar 6 o más es de 0.38 (redondeando). Por tanto, acertar 6 tiradas no parece indicador de mucha habilidad... 𝑛1 𝐵(10 ,0.5) Introducción Si realmente estoy dispuesto a plantearme la posibilidad de que el adivino tenga poderes, tengo que preguntarme: ¿cuántos aciertos son necesarios para convencerme de que tiene poderes adivinatorios? • Somos superestrictos: 10 aciertos o nada • Somos estrictos: Al menos 9 aciertos. Es decir, 9 ó 10 aciertos (si aceptamos 9, cómo no vamos a aceptar 10) • Somos permisivos: Pedimos al menos 8 aciertos . • Un punto de corte más bajo no es razonable. La regla de decisión Decidir si somos superestrictos, estrictos, o permisivos es cosa nuestra. Es decir, podemos poner el punto de corte donde queramos. En cualquier caso, hay que ponerlo en algún sitio, porque para decidir si rechazamos o no , necesitamos un criterio objetivo y claro. Esto se consigue dividiendo a la distribución muestral en: • Zona de aceptación (o de mantenimiento): rango de la distribución muestral que contiene los valores del estadístico compatibles con • Zona de rechazo: rango de la distribución muestral que contiene los valores del estadístico que serían improbables en caso de que fuera cierta. El valor que separa una zona de la otra (es decir, el punto de corte), se suele llamar punto crítico. La regla de decisión Por ejemplo, podemos poner el punto de corte en 9: • Si el adivino acierta menos de 9, mantenemos la • Si el adivino acierta 9 o más, rechazamos la La zona de aceptación abarcaría el rango de resultados de 0 a 8 aciertos, y la zona de rechazo abarcaría todos los resultados posibles iguales o mayores de 9. La regla de decisión Dónde empieza y dónde acaba cada una de las dos zonas depende del punto de corte seleccionado. Podemos ser estrictos y utilizar un punto de corte de 9. ¿Por qué elegimos este valor? Porque es muy improbable bajo el supuesto de que el adivino acierta lo esperable por azar (bajo la ). Recordemos que la probabilidad de acertar 9 o más era de La regla de decisión Cómo de improbable hace falta que sea un valor para caer en la zona de rechazo es decisión del investigador a través del nivel de significación o nivel crítico . En ciencias sociales y de la salud, suele ser igual a 0,05 (o, a veces, 0,01) • Si el estadístico obtenido tiene asociado una probabilidad () menor que cae en la zona de rechazo y, por tanto, se rechaza (). • Si el estadístico obtenido tiene asociado una probabilidad mayor que , cae en la zona de aceptación y, por tanto, se mantiene (). El estadístico de contraste Llamamos estadístico de contraste a un estadístico con una distribución conocida. Solemos llamar así al estadístico que utilizamos para realizar el contraste de hipótesis. Por ejemplo: • Cuando calculamos la probabilidad asociada a un determinado número de aciertos para ver si cae en la zona de rechazo o aceptación, el número de aciertos es nuestro estadístico de contraste. • Si hacemos lo mismo con una proporción, esa proporción será nuestro estadístico de contraste. • Su usamos una puntuación Z o una puntuación T para realizar el contraste, dicha puntuación será nuestro estadístico de contraste. La regla de decisión Nuestro adivino había acertado 6 tiradas de 10. La probabilidad de obtener este resultado era . Si utilizamos un punto de corte (nivel crítico o de significación) de , la conclusión será: • Mantenemos la , puesto que • Es decir, la probabilidad de obtener 6 aciertos o más está por encima del nivel crítico. 𝜶=𝟎.𝟎𝟓 El adivino insiste... Nuestro adivino dice que no acierta mucho, pero que algo acierta, y que repitamos el experimento. Probamos esta vez con 20 lanzamientos de moneda. Es decir: Esta vez, el adivino obtiene 12 aciertos (es decir, un 60%, igual que antes). El adivino insiste... Ya sabemos cómo proceder. Bajo el supuesto de que el adivino acierta lo esperable por azar, ¿cómo de probable es que obtenga un resultado de 12 o más aciertos? Entramos aquí y lo calculamos. La respuesta es: Por tanto, basándonos en el nivel crítico de , nuestra conclusión sería: • Mantenemos la , puesto que la probabilidad de obtener 12 aciertos está por encima del punto de corte que hemos impuesto (es decir, ) • Es decir, no existen evidencias de que el rendimiento del adivino tenga un origen otro que el puro azar. La prueba definitiva El adivino pide una última oportunidad. La prueba definitiva. 300 lanzamientos de moneda. Esta vez acierta 180 de 300 tiradas. Otra vez, el 60%. Resulta que siempre está acertando lo mismo. Y resulta que, esta vez, la probabilidad de acertar 180 o más veces es de , lo cual está muy por debajo del nivel crítico . Conclusión: Rechazamos la hipótesis nula. El adivino acierta más de lo esperable por azar. Comparación de experimentos 𝑛1 𝐵 (10 , 0.5 ) 𝑛1 𝐵(20 ,0.5 ) 𝑛1 𝐵(300 , 0.5) Recordatorio del tema 2: ¿Qué pasaría si construyéramos un intervalo de confianza? Al aumentar n, el intervalo cada vez se vuelve más estrecho porque disminuye el error típico. El estadístico obtenido en mi muestra debería ser más cercano al valor del parámetro poblacional cuanto más grande sea mi muestra. Es decir, al aumentar n, acoto el rango de valores probables del parámetro. El error típico nos indica cómo de amplio es este “rango de valores”. Por tanto ↑𝑛→↑parecido entremiestad í stico y el par ámetro→↓rango de valores probablesdel par ámetro=↓error t í pic Relación del adivino con la psicología El contenido del problema del adivino (tirar monedas) no tiene nada que ver con la psicología, pero la estructura del problema está estrechamente relacionada con cómo afrontamos la investigación científica. Imaginad una dolencia que, en un periodo de tiempo, remite para el 50% de los casos. Se aplica una terapia nueva que no llega a curar todos los casos, pero dice que puede aumentar la tasa de recuperación. ¿Qué número de recuperados necesitamos para creernos que la terapia funciona? La respuesta ya la sabemos: aquel número de recuperados que tenga una probabilidad asociada menor que . El valor de depende del investigador (normalmente 0.05 o 0.01). Variaciones azarosas y sistemáticas En psicología, es frecuente estudiar si un efecto existe o no. Este efecto puede ser la efectividad de un tratamiento, una diferencia entre grupos, un cambio terapéutico, etc. Lo que hacemos es confrontar el azar con lo sistemático: • El azar, las variaciones, son omnipresentes; todas las mediciones fluctúan: entre miembros de una población, mediciones de la misma persona... • El objetivo del investigador siempre es el mismo: detectar variaciones sistemáticas entre un montón de variaciones aleatorias. Esto puede expresarse como: Donde error se refiere al azar. Lo llamamos error porque, desde el punto de vista del investigador, todo lo que no sea un efecto sistemático de interés, no será más que error: ruido que interfiere con su detección. Las curvas Las curvas o distribuciones de probabilidad que estamos usando son la distribución muestral del estadístico de contraste. Esta distribución nos indica: 1) Los valores posibles para el estadístico 2) La probabilidad asociada a cada valor Estas curvas siempre se construyen tomando como referencia la hipótesis nula. En el ejemplo del adivino, la distribución muestral del estadístico se construye en base a lo que sería esperable de una persona sin poder adivinatorio (es decir, ) Después, se toma una muestra, se calcula el estadístico (ej. el número de aciertos), y se calcula la probabilidad asociada a dicho número tomando como referencia la distribución muestral de la . Las curvas Las curvas de probabilidad no son más que una representación gráfica de lo que sería esperable cuando el efecto de la no existe (un efecto adivinatorio, un cambio terapéutico, una diferencia entre grupos...). Es decir, son una representación de lo que ocurre cuando no hay efecto sistemático, sólo azar. Detectaremos un efecto significativo si el adivino acierta sistemáticamente más de lo esperado por azar. • Si nuestro resultado cae en la zona más o menos central de la distribución (dentro de la zona de aceptación) se asumirá que el resultado es fruto de variaciones muestrales, esperables bajo la • Si nuestro resultado cae en la zona de rechazo, se asumirá como una evidencia de que hay un efecto sistemático en esa dirección. Tipos de hipótesis En función de los objetivos de la investigación, hay tres tipos de contraste, según la dirección en la que esperamos encontrarnos el efecto de la : Hipótesis científica La proporción de aciertos es menor de 0.5 La proporción de aciertos es distinta de 0.5 La proporción de aciertos es mayor de 0.5 𝛂 𝛂/𝟐 Tipo de contraste Unilateral izquierdo Bilateral Unilateral derecho 𝛂/𝟐 𝛂 Tipos de hipótesis En función de los objetivos de la investigación, hay tres tipos de contraste, según la dirección en la que esperamos encontrarnos el efecto de la : Hipótesis científica La proporción de aciertos es menor de 0.5 La proporción de aciertos es distinta de 0.5 La proporción de aciertos es mayor de 0.5 Tipo de contraste Unilateral izquierdo Bilateral Unilateral derecho Importante: • El símbolo de siempre tiene que aparecer en la hipótesis nula. • Recordemos, las hipótesis son exhaustivas y excluyentes. Si una contiene un , la otra debe contener un . Si una contiene un , la otra debe tener un , etc. Los supuestos del contraste Para que un estadístico de contraste se distribuya según lo esperado (p. ej., ) es necesario que se cumplan una serie de supuestos. Estos supuestos serán distintos para cada estadístico y técnica de análisis de datos, aunque hay dos cosas que casi siempre se requieren: • Independencia de las observaciones (que la muestra sea aleatoria e independiente) • Distribución normal de la variable en la población (para variables continuas) El incumplimiento de los supuestos, al alterar la distribución del estadístico, puede llevar a conclusiones equivocadas Existen técnicas estadísticas para contrastar el cumplimiento de los principales supuestos de cada técnica estadística. teórica Supuestos sí Supuestos no 1,75 1,85 La receta del contraste de hipótesis Todos los contrastes de hipótesis, con independencia de la técnica estadística específica que se emplee, sigue los siguientes pasos: 1. Formular las hipótesis ( y ) Prestar atención a si el contraste es unilateral derecho, unilateral izquierdo, o bilateral 2. Conocer los supuestos del contraste Los supuestos dependen de cada contraste específico; casi siempre: independencia de las observaciones y distribución normal de la variable en la población 3. Calcular el estadístico de contraste Cada contraste específico tendrá su estadístico, con una distribución conocida 4. Buscar el valor p o ver si el estadístico de contraste cae en la zona de aceptación o de rechazo 5. Tomar una decisión con respecto a la hipótesis nula Contraste de hipótesis sobre la proporción 1. Formular las hipótesis ( y ) sobre Prestar atención a si el contraste es unilateral derecho, unilateral izquierdo, o bilateral 2. Conocer los supuestos del contraste Muestra aleatoria de tamaño n extraída de una población. 3. Calcular el estadístico de contraste 4. Buscar el valor p o ver si el estadístico de contraste cae en la zona de aceptación o de rechazo 5. Tomar una decisión con respecto a la hipótesis nula Contraste de hipótesis sobre la proporción Entre los años 2010 y 2020, la proporción de fumadores en la población joven española ha sido del 35%. Un equipo de epidemiología quiere saber si esta proporción ha variado en los últimos 3 años. Para ello seleccionan una muestra aleatoria de 64 jóvenes y comprueban que 16 de ellos fuman. ¿Qué decisión debe tomarse usando ? Contraste de hipótesis sobre la proporción Entre los años 2010 y 2020, la proporción de fumadores en la población joven española ha sido del 35%. Un equipo de epidemiología quiere saber si esta proporción ha variado en los últimos 3 años. Para ello seleccionan una muestra aleatoria de 64 jóvenes y comprueban que 16 de ellos fuman. ¿Qué decisión debe tomarse usando ? 1. Hipótesis: 2. Supuestos: 3. Estadístico de contraste: 4. Valor p: 5. Decisión sobre : Contraste de hipótesis sobre la proporción Entre los años 2010 y 2020, la proporción de fumadores en la población joven española ha sido del 35%. Un equipo de epidemiología quiere saber si esta proporción ha variado en los últimos 3 años. Para ello seleccionan una muestra aleatoria de 64 jóvenes y comprueban que 16 de ellos fuman. ¿Qué decisión debe tomarse usando ? 1. Hipótesis: y (contraste bilateral) 2. Supuestos: 3. Estadístico de contraste: 4. Valor p: 5. Decisión sobre : Contraste de hipótesis sobre la proporción Entre los años 2010 y 2020, la proporción de fumadores en la población joven española ha sido del 35%. Un equipo de epidemiología quiere saber si esta proporción ha variado en los últimos 3 años. Para ello seleccionan una muestra aleatoria de 64 jóvenes y comprueban que 16 de ellos fuman. ¿Qué decisión debe tomarse usando ? 1. Hipótesis: y (contraste bilateral) 2. Supuestos: muestra aleatoria de 64 observaciones 3. Estadístico de contraste: 4. Valor p: 5. Decisión sobre : Contraste de hipótesis sobre la proporción Entre los años 2010 y 2020, la proporción de fumadores en la población joven española ha sido del 35%. Un equipo de epidemiología quiere saber si esta proporción ha variado en los últimos 3 años. Para ello seleccionan una muestra aleatoria de 64 jóvenes y comprueban que 16 de ellos fuman. ¿Qué decisión debe tomarse usando ? 1. Hipótesis: y (contraste bilateral) 2. Supuestos: muestra aleatoria de 64 observaciones 3. Estadístico de contraste: 4. Valor p: 5. Decisión sobre : Contraste de hipótesis sobre la proporción Entre los años 2010 y 2020, la proporción de fumadores en la población joven española ha sido del 35%. Un equipo de epidemiología quiere saber si esta proporción ha variado en los últimos 3 años. Para ello seleccionan una muestra aleatoria de 64 jóvenes y comprueban que 16 de ellos fuman. ¿Qué decisión debe tomarse usando ? 1. Hipótesis: y (contraste bilateral) 2. Supuestos: muestra aleatoria de 64 observaciones 3. Estadístico de contraste: 4. Valor p: 5. Decisión sobre : Contraste de hipótesis sobre la proporción Entre los años 2010 y 2020, la proporción de fumadores en la población joven española ha sido del 35%. Un equipo de epidemiología quiere saber si esta proporción ha variado en los últimos 3 años. Para ello seleccionan una muestra aleatoria de 64 jóvenes y comprueban que 16 de ellos fuman. ¿Qué decisión debe tomarse usando ? 1. Hipótesis: y (contraste bilateral) 2. Supuestos: muestra aleatoria de 64 observaciones 3. Estadístico de contraste: 4. Valor p: 5. Decisión sobre : Como , mantenemos la hipótesis nula y, por tanto, no podemos concluir que la proporción de jóvenes fumadores haya cambiado Contraste de hipótesis sobre la media 1. Formular las hipótesis ( y ) sobre Prestar atención a si el contraste es unilateral derecho, unilateral izquierdo, o bilateral 2. Conocer los supuestos del contraste Muestra aleatoria de tamaño n extraída de una población normal. 3. Calcular el estadístico de contraste 4. Buscar el valor p o ver si el estadístico de contraste cae en la zona de aceptación o de rechazo 5. Tomar una decisión con respecto a la hipótesis nula Contraste de hipótesis sobre la media En un centro educativo se utiliza, para estimular la comprensión lectora de los niños, un método con el que se viene obteniendo alrededor de 6 puntos en una determinada prueba de comprensión lectora. Un educador especialista ofrece al centro la posibilidad de utilizar un nuevo método que, según él, es más eficaz. Para valorar esto, se aplica el nuevo método a una muestra aleatoria de 20 niños. Tras la instrucción, se pasa la prueba de comprensión lectora y se obtiene una media de 6,7 y una desviación típica de 1,3. ¿Qué decisión debe tomarse usando ? Contraste de hipótesis sobre la media En un centro educativo se utiliza, para estimular la comprensión lectora de los niños, un método con el que se viene obteniendo alrededor de 6 puntos en una determinada prueba de comprensión lectora. Un educador especialista ofrece al centro la posibilidad de utilizar un nuevo método que, según él, es más eficaz. Para valorar esto, se aplica el nuevo método a una muestra aleatoria de 20 niños. Tras la instrucción, se pasa la prueba de comprensión lectora y se obtiene una media de 6,7 y una desviación típica de 1,3. ¿Qué decisión debe tomarse usando ? 1. Hipótesis: 2. Supuestos: 3. Estadístico de contraste: 4. Valor p: 5. Decisión sobre : Contraste de hipótesis sobre la media En un centro educativo se utiliza, para estimular la comprensión lectora de los niños, un método con el que se viene obteniendo alrededor de 6 puntos en una determinada prueba de comprensión lectora. Un educador especialista ofrece al centro la posibilidad de utilizar un nuevo método que, según él, es más eficaz. Para valorar esto, se aplica el nuevo método a una muestra aleatoria de 20 niños. Tras la instrucción, se pasa la prueba de comprensión lectora y se obtiene una media de 6,7 y una desviación típica de 1,3. ¿Qué decisión debe tomarse usando ? 1. Hipótesis: y (contraste unilateral derecho) 2. Supuestos: 3. Estadístico de contraste: 4. Valor p: 5. Decisión sobre : Contraste de hipótesis sobre la media En un centro educativo se utiliza, para estimular la comprensión lectora de los niños, un método con el que se viene obteniendo alrededor de 6 puntos en una determinada prueba de comprensión lectora. Un educador especialista ofrece al centro la posibilidad de utilizar un nuevo método que, según él, es más eficaz. Para valorar esto, se aplica el nuevo método a una muestra aleatoria de 20 niños. Tras la instrucción, se pasa la prueba de comprensión lectora y se obtiene una media de 6,7 y una desviación típica de 1,3. ¿Qué decisión debe tomarse usando ? 1. Hipótesis: y (contraste unilateral derecho) 2. Supuestos: muestra aleatoria de tamaño 20 de una población normal 3. Estadístico de contraste: 4. Valor p: 5. Decisión sobre : Contraste de hipótesis sobre la media En un centro educativo se utiliza, para estimular la comprensión lectora de los niños, un método con el que se viene obteniendo alrededor de 6 puntos en una determinada prueba de comprensión lectora. Un educador especialista ofrece al centro la posibilidad de utilizar un nuevo método que, según él, es más eficaz. Para valorar esto, se aplica el nuevo método a una muestra aleatoria de 20 niños. Tras la instrucción, se pasa la prueba de comprensión lectora y se obtiene una media de 6,7 y una desviación típica de 1,3. ¿Qué decisión debe tomarse usando ? 1. Hipótesis: y (contraste unilateral derecho) 2. Supuestos: muestra aleatoria de tamaño 20 de una población normal 3. Estadístico de contraste: 4. Valor p: 5. Decisión sobre : Contraste de hipótesis sobre la media En un centro educativo se utiliza, para estimular la comprensión lectora de los niños, un método con el que se viene obteniendo alrededor de 6 puntos en una determinada prueba de comprensión lectora. Un educador especialista ofrece al centro la posibilidad de utilizar un nuevo método que, según él, es más eficaz. Para valorar esto, se aplica el nuevo método a una muestra aleatoria de 20 niños. Tras la instrucción, se pasa la prueba de comprensión lectora y se obtiene una media de 6,7 y una desviación típica de 1,3. ¿Qué decisión debe tomarse usando ? 1. Hipótesis: y (contraste unilateral derecho) 2. Supuestos: muestra aleatoria de tamaño 20 de una población normal 3. Estadístico de contraste: 4. Valor p: 5. Decisión sobre : Contraste de hipótesis sobre la media En un centro educativo se utiliza, para estimular la comprensión lectora de los niños, un método con el que se viene obteniendo alrededor de 6 puntos en una determinada prueba de comprensión lectora. Un educador especialista ofrece al centro la posibilidad de utilizar un nuevo método que, según él, es más eficaz. Para valorar esto, se aplica el nuevo método a una muestra aleatoria de 20 niños. Tras la instrucción, se pasa la prueba de comprensión lectora y se obtiene una media de 6,7 y una desviación típica de 1,3. ¿Qué decisión debe tomarse usando ? 1. Hipótesis: y (contraste unilateral derecho) 2. Supuestos: muestra aleatoria de tamaño 20 de una población normal 3. Estadístico de contraste: 4. Valor p: 5. Decisión sobre : Como , rechazamos la hipótesis nula y, por tanto, concluimos que el nuevo método es más eficaz que el antiguo Conceptos clave • Población: conjunto de elementos con características comunes objeto de estudio (inaccesible) • Muestra: subconjunto de elementos de la población (accesible) • Parámetro: valor numérico, desconocido y constante, asociado a una población (p. ej., la media o ) • Estadístico: valor numérico, conocido y variable, asociado a una muestra (p. ej., la media o ) • Distribución muestral: distribución de un estadístico al considerar todos los muestreos posibles de una población con tamaño n • Hipótesis nula o : afirmación sobre el valor de un parámetro que guía el contraste de hipótesis • Hipótesis alternativa o : negación de la hipótesis nula (inexacta) • Estadístico de contraste: estadístico con distribución muestral conocida (p. ej., ) • Zona de rechazo: rango de valores de la distribución improbables si fuese verdadera • Zona de aceptación: rango de valores de la distribución compatibles con que sea verdadera 19 Conceptos clave • Contraste unilateral izquierdo: la zona de rechazo cae a la izquierda de la distribución • Contraste bilateral: la zona de rechazo se divide a ambos lados de la distribución • Contraste unilateral derecho: la zona de rechazo cae a la derecha de la distribución • Punto/s crítico/s: valor/es de la distribución que separan la/s zona/s de aceptación y de rechazo • Nivel de significación o : probabilidad asociada a la zona de rechazo • Nivel de confianza o : probabilidad asociada a la zona de aceptación • Nivel crítico o : probabilidad de obtener, en la distribución del estadístico de contraste, un valor igual o superior al estadístico de contraste 20

Use Quizgecko on...
Browser
Browser