Tema 2: Estimation of Parameters PDF
Document Details
Uploaded by Hohoho
Antonio
Tags
Summary
This document, a PDF, discusses estimation of parameters in statistics. It covers topics such as point estimation, confidence intervals, and the properties of estimators, including unbiasedness, consistency, efficiency, and sufficiency. The document also explores the concept of error calculation.
Full Transcript
Tema 2 Estimación de parámetros Objetivos ₪ Comprender el concepto de estimador y los criterios utilizados habitualmente para seleccionar un buen estimador. ₪ Aplicar las técnicas de estimación y evaluar de forma crítica la adecuación de cada una de ellas dependiendo de la situación planteada....
Tema 2 Estimación de parámetros Objetivos ₪ Comprender el concepto de estimador y los criterios utilizados habitualmente para seleccionar un buen estimador. ₪ Aplicar las técnicas de estimación y evaluar de forma crítica la adecuación de cada una de ellas dependiendo de la situación planteada. Contenidos 1.- Introducción 2.- Estimación puntual 2.1.- Criterios para seleccionar un buen estimador. 2.1.1.- Carencia de sesgo 2.1.2.- Consistencia 2.1.3.- Eficiencia 2.1.4.- Suficiencia 2.1.5.- Error cuadrático medio 3.- Estimación por intervalos de confianza 3.1.- Intervalos de confianza para algunos parámetros 3.2.- Precisión de la estimación y tamaño de la muestra Referencias para preparar el tema • Amón, J. (1991). Estadística para Psicólogos II. Capítulo 9, pp. 243-261. Madrid: Pirámide. • Pardo, A. y San Martín, R. (1994). Análisis de Datos en Psicología II. Capítulo 2, pp. 87-124. Madrid: Ediciones Pirámide S.A. • Hopkins, K.D., Hopkins, B.R. y Glass, G.V. (1997, 3ª ed). Estadística Básica para las Ciencias Sociales y del Comportamiento. Capítulo 9, pp. 143-170. México: Prentice-Hall Hispanoamericana. Introducción Introducción La estimación de parámetros es un tipo de inferencia en la que utilizamos la información muestral para hacernos una idea sobre alguna propiedad de una población. Introducción Introducción Al inferir un parámetro podemos: 1. atribuirle un único valor. En ese caso estaremos realizando una Estimación puntual. 2. atribuirle un rango de valores. En ese caso estaremos realizando una Estimación por intervalos. Estimación puntual Estimación puntual Constituye la más simple de las inferencias estadísticas y consiste en asignar un valor muestral concreto al parámetro poblacional que se desea estimar. Ese valor muestral va a depender del método de estimación que se utilice. Podemos usar el método de los momentos de Pearson: atribuir al parámetro el valor tomado por el estadístico correspondiente en una muestra concreta Estimación puntual Estimador y Estimación Llamamos Estimador al estadístico calculado en la muestra para inferir el parámetro correspondiente. Llamamos Estimación a cada uno de los valores que puede tomar el estimador en las k muestras de tamaño n que pueden extraerse de la población Para referirnos a un parámetro cualquiera utilizaremos: Para referirnos a un estimador utilizaremos: θ Estimación puntual Problema de la estimación puntual: Dado un parámetro concreto siempre es posible disponer de más de un estadístico distinto para hacer la estimación (media poblacional por media muestral, mediana, media truncada…) y no es fácil determinar cuál es el mejor para hacer una estimación concreta. Por eso, es necesario determinar cuáles son las propiedades que debe reunir un estadístico para ser considerado un buen estimador. Estimación puntual Criterios para seleccionar un buen estimador Para que un estadístico sea considerado un buen estimador de su parámetro debe reunir las siguientes propiedades: Ser insesgado Ser consistente Ser eficiente Ser suficiente Estimación puntual Carencia de sesgo • Un estimador es insesgado si el valor de la esperanza matemática de su distribución muestral coincide con el valor del parámetro que se quiere estimar. Por tanto, el sesgo de un estimador puede definirse como la distancia que hay entre su esperanza matemática y el valor del parámetro Estimación puntual Consistencia Un estimador es consistente si tiende a ser centrado y el valor de la varianza de su distribución muestral tiende a cero cuando el tamaño de la muestra tiende a infinito si n Estimación puntual Eficiencia Dados dos estimadores de un mismo parámetro, diremos que es mas eficiente de los dos aquel cuya distribución muestral tenga menor varianza. La eficiencia expresión: relativa puede medirse mediante la Donde el estimador más eficiente es el del denominador. Por tanto, cuanto mayor sea el cociente, mayor la eficiencia de ˆ2 respecto a ˆ1 Estimación puntual Suficiencia Un estimador es suficiente si se basa en toda la información contenida en la muestra, es decir si él solo se basta para estimar el parámetro. Estimación puntual No todos los estimadores cumplen las cuatro propiedades que acabamos de enunciar Estimador X S Insesgado Consistente Eficiente Suficiente 2 x ~ S P r 2 x xy Estimación puntual ESTIMADOR INSESGADO Y EFICIENTE Estimación puntual ESTIMADOR INSESGADO E INEFICIENTE Estimación puntual ESTIMADOR SESGADO Y EFICIENTE Estimación puntual ESTIMADOR SESGADO E INEFICIENTE Estimación puntual ¿Cómo elegir entre estimadores con Lo razonable es seleccionar, de entre los posibles propiedades contrapuestas? estimadores de un parámetro, aquel que tenga el error promedio de predicción más pequeño, es decir, el que tenga menor ERROR CUADRÁTICO MEDIO E.C.M. (ˆ ) = [sesgo (ˆ)]2 + VAR (ˆ) Estimación por I.C. Estimación por intervalo de confianza • Consiste en calcular un intervalo o rango de valores dentro del que esperamos que se encuentre el verdadero valor del parámetro con una probabilidad alta y conocida • Si no se necesita de manera forzosa un valor concreto para el parámetro poblacional puede realizarse una estimación del mismo mediante intervalos • Este método posee la ventaja de que permite conocer cómo de precisa es la estimación, es decir, puede obtenerse el valor del error muestral • Para ilustrar la estrategia de la estimación por intervalos vamos a volver al ejemplo que habíamos desarrollado para el concepto de distribución muestral: Estimación por intervalo de confianza Estimación por I.C. La estrategia utilizada para la estimación por intervalos consiste en pensar que el valor del parámetro, en el ejemplo el valor de µ, no se alejará del valor del estimador en más de una determinada cantidad, que es el error máximo que estamos dispuestos a cometer en la estimación del parámetro. Error máximo μ Cantidad Ejemplo trabajado en clase Estimación por I.C. ¿Qué pasos se siguen en la práctica? Determinar el valor del coeficiente confidencial o nivel de confianza Por ejemplo: 0,95 El error que sería en este caso 0,05 se le denomina El nivel de confianza por tanto sería 1- A partir de ahí determinamos la amplitud del intervalo confidencial en términos de número de desviaciones típicas. Eso nos lleva a conocer el error máximo. Es obvio que consideramos siempre este cálculo sobre la distribución muestral (que debe ser conocida) Intervalos de confianza para algunos parámetros Estimación por I.C. Intervalo de confianza para la media poblacional (μ) Ejemplo: Supongamos que un psicólogo del deporte quiere determinar el tiempo que le lleva a un corredor de maratón mejorar su marca en 1 minuto siguiendo una intervención de su invención. Puesto que la intervención es muy laboriosa decide probar sólo con 5 corredores. Estimación por I.C. Las puntuaciones obtenidas, en días, por los cinco corredores dan como resultado una media de 540 días con una desviación típica insesgada de 299 días. Calcular un intervalo en torno a la media muestral que contenga la media poblacional con un nivel de confianza del 95% Vamos a trabajar para establecer el intervalo de confianza! Sabemos que la Media poblacional está entre dos valores con un nivel de confianza (1-α) Si supiéramos la amplitud de ese intervalo podríamos establecerlo para cualquier media Vamos a trabajar para establecer el intervalo de confianza! Volviendo a nuestro ejemplo: Teníamos una media de 540 con una desviación típica insesgada de 299. ¿Dónde podemos situar la media poblacional con un grado de confianza del 95%? Pero nuestro cálculo no es del todo correcto. Deberíamos haber tenido en cuenta que la desviación típica que nos dan es la muestral insesgada Deberíamos usar el valor de la t de student con grados de libertad n-1 P(-tα/2≤ t4 ≤t α/2) =0,95 I.C. para algunos parámetros INTERVALOS DE CONFIANZA PARA LA MEDIA IC PARA LA MEDIA: - CONOCIDA : IC: X z / 2 · n S 2 - DESCONOCIDA : IC: X / 2 t n 1 · n 1 2 I.C. para algunos parámetros IC PARA LA VARIANZA: - MUESTRAS PEQUEÑAS Y UTILIZANDO VARIANZA SESGADA COMO ESTIMADOR Li nS 2 2 1 / 2 n 1 y Ls nS 2 2 / 2 n 1 - MUESTRAS PEQUEÑAS Y UTILIZANDO VARIANZA INSESGADA COMO ESTIMADOR Li ( n 1)S 2 2 1 / 2 n 1 y Ls LA ( n 1)S 2 2 / 2 n 1 LA Estimación por I.C. Ejemplo: Queremos saber cuál es la proporción de personas con una discapacidad auditiva en España que se consideran felices. Después de preguntarle a una m.a.s. de 1000 personas, observamos que 550 se consideran felices, ¿podemos considerar, con un nivel de confianza del 99% que hay más personas felices que no felices en esa población? Estimación por I.C. I.C. para algunos parámetros Tabla resumen UNA MEDIA Conocida 2 X z / 2 · n Desonocida 2 ~ S X / 2tn1 · n DOS MEDIAS (muestras independientes) Desconocidas 21 = 22 Conocidas 21 y 22 2 2 (X X ) z · 1 2 1 2 / 2 n1 n2 ~ ~ (n1 1)S12 (n2 1)S22 1 1 (X X ) t · · 1 2 / 2 n n 2 1 2 n1n2 2 n1 n2 UNA VARIANZA nS , 1 / 2 2n 1 2 2 n 1 /2 nS 2 ~2 ~2 (n 1)S , (n 1)S 2 2 1 / 2 n 1 / 2 n 1 S 2 Z / 2 S 2 UNA PROPORCION z2 P(1 P) z 2 n P z / 2 2 2 n n 4n 2 n z P(1 P) ·P z / 2 n ( = 0) 2 n ~1 / 2 Fn 2 1, n1 1 , ~1 1 / 2 Fn 2 1, n 2 1 2 2 S2 S2 (P1 P2 ) z / 2 · n1·P1 n 2 ·P2 1 n1·P1 n 2 ·P2 1 1 n n n n n n 1 2 1 2 1 2 ( = k 0) 1 1 r 1 Z / 2 · ln 2 1 r n 3 (X X ) z · 1 2 / 2 DOS VARIANZAS (muestras ~2 independientes) ~S 2 S DOS PROPORCIONES (muestras independientes) Desconocidas 1 = 2 UN COEFICIENTE 2 r t n 2 , / 2 (1 rxy ) /(n 2) xy Desconocidas 21 22 ~2 ~2 S1 S2 n1 n2 DOS MEDIAS (muestras dependientes) Conocida 2 Desonocida 2 D z / 2 · d n S~ D / 2tn1· d n DOS VARIANZAS (muestras dependientes) No es fácil de determinar DOS PROPORCIONES (muestras dependientes) Desconocidas 1 2 (P1 P2 ) z / 2 · P1 (1n P1 ) P2 (1n P2 ) 1 2 DOS COEFICIENTES (muestras independientes) (1-2) 1 1 ( r1 r2 ) z / 2 . n 3 n 3 2 1 (Pb Pd ) z / 2 · DOS COEFICIENTES (muestras dependientes) (12-13) b d n 2 2 p p z / 2 (b d) / n 1· ·1 Precisión de la estimación y tamaño de la muestra En este contexto, precisión se refiere a la longitud del intervalo de confianza Precisión y tamaño PRECISION DE LA ESTIMACION Y TAMAÑO DE LA MUESTRA Se puede determinar qué tamaño tiene que tener n para alcanzar una determinada precisión: 2 z Para la MEDIA: n 2 / 2 E 2MAX 2 z Para la VARIANZA: n 2 4 / 2 E 2MAX (podemos sustituir la varianza poblacional por la varianza muestral sesgada o insesgada, si no se conoce). Precisión y tamaño • En un experimento sobre velocidad perceptiva, a una muestra de 100 personas se les ha presentado un estímulo visual 10 veces, registrando el tiempo de reacción medio ante las 10 presentaciones. Interesa estudiar la variabilidad de los tiempos de reacción mostrados por los participantes. Si la varianza obtenida ha sido de 124.4 centisegundos, empleando un 1-= 0.99, indicar qué tamaño muestral necesitaremos para conseguir una precisión de 25 centisegundos. 2 2 z ( 2 . 58 ) n 2 4 / 2 = 2(124.4) 2 329.63 330 2 2 25 E MAX Precisión y tamaño Para la PROPORCION: n P(1 P) 2 z /2 E 2MAX Se quiere utilizar una lista de 7 pares asociados, como prueba de diagnóstico. Para considerarla discriminativa, la proporción se personas capaces de memorizarla en una única presentación no tiene que ser superior a 0.75 ni inferior a 0.25. Seleccionada una muestra aleatoria de 40 personas, se encontró que 18 fueron capaces de memorizarla. Con un 1 - = 0.95, indicar cuál debería ser el tamaño de la muestra para lograr una amplitud de 0.1 Para lograr una amplitud de 0.1, es decir, un E MÁX = 0.05, n debe ser: n P(1 P) 2 z /2 E 2MAX (1.96) 2 = 0.45 0.55 380.32 380 2 0.05