Estadística Inferencial - MÓDULO III - PDF
Document Details
![ExemplaryVenus](https://quizgecko.com/images/avatars/avatar-7.webp)
Uploaded by ExemplaryVenus
Universidad Nacional del Altiplano, Facultad de Ingeniería Económica
Dr. Carlos Ramirez Cayro
Tags
Summary
This document is a presentation on Statistical Inference, specifically focusing on statistical estimation. It includes definitions, examples and concepts related to statistical inference. A presentation on estimating population parameters based on sample data.
Full Transcript
UNIVERSIDAD NACIONAL DEL ALTIPLANO FACULTAD DE INGENIERIA ECONÓMICA Curso: EstadísticA Inferencial PARTE III: ESTIMACIÓN ESTADÍSTICA Dr. Carlos Ramirez Cayro Docente Principal de la F I E 1 ESTIMACION ESTADISTI...
UNIVERSIDAD NACIONAL DEL ALTIPLANO FACULTAD DE INGENIERIA ECONÓMICA Curso: EstadísticA Inferencial PARTE III: ESTIMACIÓN ESTADÍSTICA Dr. Carlos Ramirez Cayro Docente Principal de la F I E 1 ESTIMACION ESTADISTICA Sea el caso de un negocio que esta interesado establecer una sucursal en un barrio que tiene ingresos superiores a la media nacional ¿cómo se puede hallar la media de los ingresos de ese barrio? Un procedimiento caro pero exacto es encuestar a cada familia. Pero para realizar la misma inferencia se podría calcular una muestra y calcular la media muestral que sería el estimador de la media de la población. De la misma manera si queremos saber la dispersión entonces podemos calcular a partir de la muestra un estimador de la varianza poblacional. 2 Estimación Estadística LA INFERENCIA ESTADÍSTICA Es la generalización de los resultados a partir de la medición de una muestra. Definición.- La estimación estadística consiste en utilizar datos muéstrales, para determinar los valores de los parámetros desconocidos de una población. (Máximo Mitac). ¿Qué es un estimador? Es aquel valor de una muestra muy semejante al parámetro de la población. 1. Ejemplo, se puede decir que X está muy próximo al verdadero valor de µ. Para ello X tiene que cumplir una serie de requisitos. (Taro Yamane, Pág. 108) 3 ¿Cuáles son los requisitos de un buen estimador? 1. Es insesgado 2. Consistente 3. Eficiente 4. Suficiente 4 Estimador Insesgado. Cuando el valor esperado de un estadístico empleado como estimador es igual al parámetro: E(ô) = . Estimador Consistente. Cuando un estimador se aproxima al parámetro de la población que se va estimar aumentando el tamaño de la muestra. 5 Estimador Eficiente. Se dice que un estimador ô1 es más eficiente que otro estimador ô2 para si el primero tiene una menor varianza que el segundo. Estimador Suficiente. Es un estimador que utiliza toda la información que posee una muestra sobre el parámetro que se estima. 6 La Estimación Estadística comprende dos pasos. 1) Estimación Puntual 2) Estimación Interválica o por intervalos. 7 Estimación Puntual. Es aquel proceso mediante el cuál a través de la información de la muestra se obtiene un estimador puntual del parámetro. La desventaja de la estimación puntual es que no exiate modo de medir el error de la estimación Estimación Interválica Es la estimación de un parámetro por un intervalo, llamado Intervalo de Confianza, cuyos puntos finales L y U (L U), son funciones de las variables aleatorias observadas tales que la probabilidad de que quede satisfecha la desigualdad L U, se expresa en términos de un número determinado: 1 - . 8 TEOREMA DEL LÍMITE CENTRAL Si X es la media de una muestra aleatoria de tamaño “n” de una población con media y variancia conocida 2, entonces la forma límite de la distribución de: X z n y si P(-Z/2 Z Z/2) = 1 - . 9 X 1. Entonces P(-Z/2 Z/2) = 1 - . n 2. Si el muestreo es sin reemplazo en una población finita de tamaño N: X z N n n N 1 y P(-Z1-/2 Z Z1-/2) = 1 - . X P(-Z1-/2 N n Z1-/2) = 1 - . n N 1 10 INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL , DE UNA POBLACIÓN NORMAL CON VARIANZA 2 CONOCIDA Si: z X n y P(-Z1-/2 Z Z1-/2) = 1 - . P(-Z1-/2 X z Z1-/2) = 1 - . n Luego el Intervalo de Confianza es: P( X- Z1-/2 n X+ Z1-/2 n) = 1 - . 11 X = Estimador de . 1 - . = Probabilidad del IC. = Parámetro media de la población. n = Tamaño de la muestra. RA 1- RA 1 - RC RC /2 RC /2 70 Z - Z/2 0 Z/2 Intervalo de 12 Si se desea saber de que tamaño debe ser “n” para asegurar que el error en la estimación de será menor que una cantidad específica e : 2 z / 2 n e Cuando la población es finita de tamaño N, y el tamaño de la muestra constituye más del 5% del tamaño de la población, se debe usar el factor de corrección de población finita para modificar las desviaciones estándar de la formulas, así el estadístico que se utilizara será: X z : N n n N 1 13 El intervalo de confianza de (1 - ) 100% para es : Si se desea saber de que tamaño debe ser “n” para asegurar que el error en la estimación de será menor que una cantidad específica e. Si el error estadístico es: N n e Z 1 / 2 n N 1 Despejando “n” se tiene: Z 12 / 2 2 N n 2 Z 1 / 2 2 e 2 ( N 1) 14 Ejemplos Una máquina de empacar bolsitas de café esta regulada para empacar bolsitas cuyos pesos se distribuyen normalmente con media 500 gramos y desviación estándar de 10 gramos. Supongamos que la máquina esta desregulada y deseamos saber el nuevo promedio , una muestra aleatoria de 25 paquetes arroja una media de 485 grs Hallar un intervalo de confianza del 95% de confianza. 15 2. ¿Dentro de qué límites caería el 95 % central de la distribución muestral de las medias muestrales de tamaño 81 dado que µ = 30 y σ = 1.8. Zt = 1.96, (Rpta: P(29.6,30.4)=0.95. 16 El gerente de Electrolima quería estimar la facturación mensual promedio de luz eléctrica en el mes de Julio en casas unifamiliares en el distrito de Lince. Con base a estudios efectuados en otros distritos, se supone que la desviación estándar es de 1/. 20. El gerente quería estimar la facturación promedio de Julio con aproximación de 1/. 5 del promedio real con 99% de confianza. ¿Qué tamaño de muestra se necesita? 17 Un investigador desea hacer una encuesta en un gran sed de un área metropolitana para determinar el ingreso familiar promedio los 30,000 hogares de ese sector. El investigador desea que el valor del timador de la media se encuentre a 1/. 3,000 de la media verdadera con nivel de confiabilidad de 99 %. Se va utilizar una desviación estándar muestral igual al/. 20,000 que se obtuvo en una encuesta anterior como estridor de la desviación estándar de la población. ¿Qué tamaño debe tener la muestra que se necesita? 18 EJERCICIO. De un embarque de 2200 secadoras de mano se probó 81 secadoras al azar. La vida promedio en la muestra fue de 3.2 horas con una desviación estándar de 0.9 horas. Construya in intervalo de confianza del 095 % para la vida media de las secadoras del embarque. (Rpta. P(3.008, 3.396)=0.95. ¿Cuál será el tamaño de la muestra “n” al 95% central con un error estadístico aceptado: e = 0.15? (R. Moya. Pag 654) 19 Se quiere conocer la permanencia media de pacientes en el hospital loayza, con el fin de estudiar una posible ampliación del mismo, se tiene datos referidos a la estancia expresada en días de 600 pacientes, obteniéndose los sgtes resultados: media x=12,3 s=8días - Hallar un intervalo de confianza del 95% para la estancia media - ¿Cuál es la probabilidad de riesgo de que µ>13? 20 Intervalo de Confianza (IC) para la media poblacional De una población normal con Varianza 2 desconocida. CASO 1 Muestras de tamaño inferior o igual a 30, n≤ 30. Si se desconoce y n ≤ 30, se puede usar la desviación estándar muestral S para aproximar . El IC se plantea así: P(-t1-/2.n-1 t t1-/2,n-1) = 1 - . Por tanto el estadístico es: X t S n 21 Si X y S son la media y la desviación estándar de una muestra aleatoria de una población normal de tamaño “n” de una población con variancia conocida 2 , el intervalo de confianza de (1- ) 100% para es: P( X-t1-/2,n-1 S /√n X+ t1-/2,n-1 S /√n ) = 1 - . Si se desea saber de que tamaño debe ser “n” para asegurar que el error en la estimación de será menor que una cantidad específica e: 2 t 1 / 2 ,n 1 S n e 22 , Observación. Cuando la población es finita de tamaño N, y el tamaño de la muestra constituye más del 5% del tamaño de la población, el intervalo de confianza con coeficiente de varianza y=1-, para la media , de una distribución normal de varianza desconocida y muestras pequeñas es:. Y para muestras grandes N n N n P( X - Z1-/2 /√n N 1 X + Z1-/2 /√n ) = 1 - . N 1 23 Ejemplo: Las cajas de un cereal producidos en una fábrica, deben tener un contenido de 16 onzas. Un inspector tomó una muestra que arrojó los siguientes pesos en onzas. 15.7,15.7,16.3,15.8,16.1,15.9,16.2,15.9,15.8,15.66 Indicar si es razonable que el inspector, usando un coeficiente de confianza de 95% ordene que se multe al fabricante. 24 Durante los 12 meses pasados el volumen diario de ventas de un restaurante fue de 1/. 20,000. El gerente piensa que los próximos 25 días serán críticos con respecto al volumen de ventas normal debido a las medidas económicas tomadas por el gobierno. Al finalizar los 25 días, el volumen de ventas promedio y su desviación estándar fueron de 1/. 19,000 Y 1/. 2,000, respectivamente. Supóngase que el volumen de ventas es una v.a. con distribución normal. El gerente del restaurante, ¿tendría alguna razón para creer, con base a este resultado, que hubo una disminución en el volumen de ventas promedio diario? 25 Una compañía de seguros emplea 300 agentes de ventas. En una m.a. de 30 cuentas de gastos de representación en una semana del mes de Julio, los auditores encontraron un gasto promedio de $ 500, con una disviación estándar de $ 50. a) ¿Cuál es el valor del estimador puntual para la cantidad promedio de gastos? b) Establezca un intervalo de confianza de 99% para la cantidad promedio de gastos. 26 Una m.a. de 200 observaciones tiene una media de 60 y desviación estándar de 5. a) Obtenga un valor con el cual usted tenga 95% de confianza de que no excederá la media de la población b) ¿Cuál es la probabilidad de riesgo de que u > 61? 27 Ejercicio. Una muestra aleatoria de 10 frascos de conservas de palmito de la empresa agroindustrial “La Palma” de Iquitos ha dado los siguientes pesos netos en gramos: 278, 285, 280, 290, 285, 275, 284, 295, 280, 287. Estime un intervalo de confianza del 95 %. (Rpta. P(279.66,288.14)=0.95 ¿Cuál será el tamaño de la muestra “n” al 95% central con un error estadístico aceptado: e = 3.5?. (Córdova Z. Pag. 64) 28 Intervalo de Confianza (IC) para la diferencia entre dos medias: 1 y 2 y con varianzas 21 y 22 supuestas conocidas. n 30. Si X1 y X2 , son las medias de dos muestras aleatorias independientes de tamaños n1 y n2 seleccionadas respectivamente de dos poblaciones con medias 1 y 2 y variancias 21 y 22, supuestas conocidas. El estadístico es: X 1 X 2 ( 1 2 ) z 12 22 n1 n2 29 Si: y P(-Z/2 Z Z/2) = 1 - . Reemplazando el estadístico Conforme n es la distribución normal estándar: N(0,1): X 1 X 2 ( 1 2 ) P ( Z 1 / 2 2 2 Z 1 / 2 ) 1 1 2 n1 n2 30 Luego el Intervalo de Confianza es: p X 1 X 2 Z1 / 2 X1 X 2 1 2 X 1 X 2 Z1 / 2 X1 X 2 1 2 2 1 2 X1 X2 n1 n2 31 Ejercicio. La media y la desviación estándar de las cargas máxima soportada por 100 cables producidos por la compañía “Duramas” son 20 toneladas y 1.1 tonelada. La media y la desviación estándar de 60 cables preoducidos por la Compañía “Cableco” son 16 toneladas y 0.8 toneladas, respectivamente. Determinar un intervalo de confianza del 95 % para la diferencia de cargas máximas medias. (Rpta. P(3.7,4.3)=0.95. (R. Moya, Pag. 660)..n1 = 100; X1 = 20; S1 = 1.1; Z = 1.96.n2 = 60; X2 = 16; S2 = 0.8. 32 1. Una m.a. de tamaño 36 es seleccionada de una población N(1, 9), donde X1 = 70. otra muestra de tamaño 25 es seleccionada de otra población N(), dando X2 ₧ 60. construir el intervalo de confianza para con 96%) de confianza. 33 Intervalo de Confianza (IC) para la diferencia entre dos medias de dos poblaciones normales con varianzas poblacionales 21 y 22 supuestas desconocidas. Caso 1 Tamaños muestrales pequeños n1,n2≤30, y varianzas DESCOOCIDAS PERO IGUALES 21 = 22 = 2 X 1 X 2 ( 1 2 ) Las variables aleatorias son: z 1n 1n 1 2 De acuerdo al Teorema que dice “Si S2 es la variancia de una muestra aleatoria de tamaño “n” tomada de una población normal que tiene la variancia 2, entonces el estadístico: ( n 1) S 2 2 2 34 Tiene una distribución ji cuadrada con V=n-1 grados de libertad. Por tanto las dos variables aleatorias (n1-1)S21/2 y (n2-1)S22/2 tienen distribuciones ji cuadradas con n1 –1 y n2 –1 grados de libertad. Por otro lado son variables ji cuadradas independientes. Por consiguiente se suman: ( n 1 1) S 12 ( n 2 1) S 22 ( n 1 1) S 12 ( n 2 1) S 22 V 2 2 2 35 Siguiendo el Teorema “Sea Z una variable aleatoria normal estándar y V una variable aleatoria ji cuadrada con v grados de libertad. Si Z y V son independientes, entonces la distribución de la variable aleatoria T, donde:” Z T Tenemos la siguiente expresión: V v ( X 1 X 2 ) ( 1 2 ) 2 (1 / n 1 ) (1 / n 2 ) T Tiene distribución “t” con ( n 1 1) S 12 ( n 2 1) S 22 v = n1 + n2 –2 grados 2 ( n1 n 2 2 ) de libertad 36 Una estimación puntual de la variable común desconocida puede obtenerse combinando las variables muestrales. Al representar el estimador de ambas con S2p se tiene: 2 2 2 ( n 1 1 ) S 1 ( n 2 1 ) S 2 Sp n1 n 2 2 Al reemplazar el estadístico S2p en T: X 1 X 2 ( 1 2 ) T S p 1n 1n 1 2 37 Al utilizar el estadístico T se tiene: P(-t/2,gl t t/2,gl) = 1 - . (gl = n1 + n2 –2) X 1 X 2 ( 1 2 ) P ( t1 / 2 t1 / 2 ) 1 S p 1n 1n 1 2 38 Luego el IC es: (WM, pag 259); p X 1 X 2 t1 / 2,n1 n2 2 S X1 X 2 1 2 X 1 X 2 t1 / 2,n1 n2 2 S X1 X 2 1 S X1 X2 S p 1 1 n1 n2 39 Ejemplo. una compañía esta tratando de decidir cual de los dos tipos de neumáticos va a comprar. Es deseo del directorio de la compañía comprar los neumáticos de marca G a menos que haya alguna evidencia de que la marca F resulte mejor. Se hace un experimento en el que se utilizan 12 neumáticos de cada marca. Los resultados obtenidos fueron: Marca F: X1 = 40,000 km , S1 = 5,000 km Marca G: X2 = 49,000 km , S2 = 3,000 km ¿Bajo que supuestos se puede resolver el problema? ¿Qué marca de neumático decidirá comprar la compañía 40 Ejercicio.un inversionista desea comparar los riesgos asociados con diferentes mercados. A y B. el riesgo de un mercado dado se mide por la variación en los cambios diarios de precios. El inversionista piensa que el riesgo promedio asociado con el mercado B es mayor que el del mercado A. se obtienen muestras aleatorias de 15 cambios de precios diarios para cada mercado. Se obtienen los siguientes resultados. Mercado A Mercado B XA = 0.3 XB = 0.4 SA = 0.25 SB = 0.45 ¿Estos datos apoyan la creencia del inversinista? (Use ). ¿Cuántos cambios de precios diarios mas se deben observarse para cada mercado para detectar una diferencia en la variación de precios 0.2 con un 97% de confianza?. 41 Caso 2 Tamaños muestrales pequeños n1,n2≤30, y varianzas desconocidas pero distintas 21 22 Si y S21 y ,y S22 son las medias y variancias de muestras pequeñas independientes de tamaños n1 y n2 respectivamente, de distribuciones aproximadamente normales con variancias diferentes y desconocidas. El estadístico es: T X1 X 2 1 2 S 21 S 2 2 n1 n2 42 Un intervalo de confianza aproximada de (1 - )100 % para está dado por: (WM, pag 262); p X 1 X 2 t1 / 2,V S X 1 X 2 1 2 X 1 X 2 t1 / 2,V S X 1 X 2 1 S 12 S 22 Donde t es el valor t con: S X 1 X 2 n1 n2 ( S 12 / n 1 S 22 / n 2 ) 2 V ( S 1 2 / n 1 ) 2 / n 1 1) ( S 22 / n 2 ) 2 / ( n 2 1) Grados de libertad, con un área de /2 a la derecha 43 EJEMPLO. un fabricante de radio esta desarrollando un modelo de radio y para este fin se pueden utilizar dos tipos de esquemas transistorizados. El fabricante selecciona una muestra de esquemas transistorizados del primer tipo de tamaño 13 y otra del segundo tipo de tamaño 15. los datos maestrales respecto a la vida de cada esquema son los siguientes: X1 = 1,400 h , S1 = 30 h , n1 = 13 X2 = 1,500 h , S2 = 17 h , n2 = 15 Construir un intervalo de confianza del 90% para la diferencia de vida media de cada tipo de esquema. 44 Caso 3 Tamaños muestrales grandes n1,n2>30 y varianzas poblacionales desconocidas. Si X y X, son las medias de dos muestras aleatorias independientes de tamaños n1 y n2 seleccionadas respectivamente de dos poblaciones cuyas poblaciones son no normales con variancias 21 y 22, supuestamente desconocidas. Los parámetros 21 y 22, se estiman por ŝ21 y ŝ22. El estadístico es: X 1 X 2 1 2 Z S1 S 2 n1 n2 45 El Intervalo de Confianza es: p X 1 X 2 Z1 / 2 S X1 X 2 1 2 X 1 X 2 Z1 / 2 S X1 X 2 1 s12 s 22 sX1 X2 n1 n2 46 Ejercicio. En una discusión sobre reajuste salarial entre empresarios y el sindicato de los empleados se llego a un impase. Los empresarios afirman que el salario medio de la categoría es de 7.6 salarios mínimos (SM), y los empleados dicen que es de 6.5 SM. Para eliminar dudas, cada uno de los grupos resolvió seleccionar muestras independientes. Los empresarios, con una muestra de 90 empleados, observaron un salario medio de 7.0 SM, con una desviación estándar de 2.9 SM. El sindicato, con 60 empleados obtuvo una media de 7.1 SM y una desviaciçon estándar de 2.4 SM. En base a un intervalo de confianza del 95% para , donde 1 es el salario medio del sindicato por los empresario y 2 es el salario medio sostenido por los del sindicato, responda a la siguiente pregunta. ¿Las muestras obtenida justifican las respectiva afirmaciones de los dos grupos?. 47 Ejercicio. Una compañía exportadora de café quiere escoger la mejor calidad de café de exportación entre dos variedades de café en grano: A (Chanchamayo) y B (Quillabamba). Elegirá la variedad de café que contenga el menor porcentaje de impurezas por saco de un quintal. Se sabe que los porcentajes de impurezas de saco de cada variedad de café tienen distribución normal y con la misma varianza. (Córdova Manuel, Pág. 76) Dos muestras aleatorias independientes una de 10 sacos de A y la otra de 12 sacos de B, revelaron los siguientes porcentajes de impurezas por saco de café: A: 4, 3, 6, 6, 5, 6, 7, 4, 7, 6 B: 7, 6, 10, 8, 9, 8, 7, 6, 7, 9, 5, 8 Estime mediante un intervalo de confianza del 95% la diferencia entre los dos promedios de porcentajes de impurezas por saco de toda la producción de las dos variedades de café. ¿qué variedad de café debería elegir para la exportación?. Rpta. P(-3.354, -0.846)=0.95. 48 Ejercicio.- El jefe de personal de una empresa de confecciones quiere comparar las medias de los tiempos en minutos que operarios hombres y mujeres utilizan para confeccionar una camisa. Se supone que las dos poblaciones de tiempos tienen distribución normal con varianza homogenea. Dos muestras aleatorias de tamaño 16 revelaron las sgtes estadísticas X1=38, S1=6, y X2=35, s2=4, utilizando un intervalo de confianza del 95%, ¿se puede concluir que en promedio los hombres y las mujeres utilizan el mismo tiempo?, suponiendo varianzas iguales pero desconocidas. (Cordova manuel Pag.100). 49 Intervalo de Confianza (IC) para la diferencia entre dos medias pareadas Sea (X1,Y1), (X2,Y2),... (Xn, Yn), una muestra aleatoria de “n” datos aparejados, donde las muestras X1,X2,...Xn e Y1,Y2,...Yn correlacionados son seleccionados respectivamente de dos poblaciones normales X N(1, 21) e Y N(2, 22). 50 Se puede establecer “n” diferencias: D1 = X1 – Y1, D2 = X2 – Y2,...Dn = Xn – Yn, como una muestra aleatoria seleccionada de una población de diferencias D = X – Y cuya distribución es normal N(d, 2d) con media d = 1 - 2 y variancia 2d = 21 - 22 – 2 cov(X,Y). El estimador insesgado de d = 1 - 2 es la estadística: d ( X Y) X Y d X Y n n n n 51 Cuyo valor d= ∑d/n es la estimación insesgada de d. Si 2d es conocida, la diferencia tiene distribución normal N(d, 2d). Por consiguiente la estadística: d ( 1 2 ) z d n reemplazando en P(-Z1-/2 Z Z1-/2) = 1 - . se tiene el IC:S Sd d P( d – Z1-/2 n d d + Z1-/2 n ) = 1 - . 52 Si d y Sd son la media y la desviación estándar de una muestra aleatoria de “n” las diferencias de “n” pares de datos de una población normal con variancia d supuesta desconocida, entonces el intervalo de confianza de (1- ) 100% para d = 1 - 2 es: Sd Sd P( d – t1-/2,v d d + t1-/2,v ) = 1 - . n n V = n-1 53 Ejercicio. El gerente de operaciones de una empresa de confecciones debe tomar la decisión entre dos procesos de manufactura A y B para la fabricación de una prenda. Eligió 10 operaciones eficientes y cada uno de ellos utilizó los dos procesos de manufactura para fabricar la prenda, resultando los siguientes tiempos en minutos para los procesos de manufactura A y B. (Córdova Manuel. Pág. 80) n Sd 2 2 di d n ( d ) d i 1 n 1 n 54 Operador 1 2 3 4 5 6 7 8 9 10 Proceso A 10 10 11 12 12 13 13 15 15 16 Proceso B 8 11 11 10 9 11 10 12 14 15 Diferencia di d 2i Utilizando un intervalo de confianza del 98 %, ¿se puede afirmar que el proceso de manufactura B reduce el tiempo medio de fabricación de la prenda?. Suponga distribución normal de la diferencia de los tiempos. Rpta. P(0.3958, 2.8042)=0.98 55 INTERVALO DE CONFIANZA PARA UNA PROPORCION POBLACIONAL Un estimador puntual de la proporción p en un experimento binomial está dado por el estadístico p = X/n, donde X representa el número de éxitos en “n” intentos. De acuerdo con el Teorema de Límite Central, para una “n” lo bastante grande, p está distribuida aproximadamente en forma normal con media = E(p) = E[X/n] = np/n = p variancia: 2p = 2x/n = npq/n2 =pq/n 56 p Si: z pq / n y P(-Z/2 Z Z/2) = 1 - . Tenemos: p P(-Z/2 pq / n Z/2) = 1 - . Luego el IC es: pq pq P( p -Z/2 n p + Z/2 n ) = 1 - . 57 Intervalo de Confianza (IC) para la media de una muestra grande El estadístico para la prueba de hipótesis es: p z pq / n 58 Luego el IC es: pq pq P( P-Z/2 n P+Z/2 n ) = 1 - . Donde Z/2 es el valor de Z P = Estimador de . 1 - . = Probabilidad del IC. = Parámetro media de la población. n = Tamaño de la muestra. 59 Al (1 - .) 100 % el error no excederá de:.e = Z/2 p q n Si se desea saber de que tamaño debe ser “n” para asegurar que el error en la estimación de será menor que una cantidad específica es: Z 2 / 2 pq n e2 60 Ejercicio Durante cierta semana, una tienda de departamentos observo y registró que 5,750 de las 12500 personas que entraron en la tienda hicieron por lo menos una compra. Tratando esto como una muestra al azar de todos los clientes potenciales, hallar el intervalo de confianza del 99 % para la proporción real de personas que entran en la tienda y que harán por lo menos una compra. (Rpta: p(0.45,0.47)=0.99. (R. Moya. Pag. 662). ¿Cuál será el tamaño de la muestra “n” al 99% central con un error estadístico aceptado: e = 0.015?. 61 Ejercicio. para verificar si una dado era sesgado, se lanzó el mismo 120 veces, obteniéndose 25 veces el número 5. hallar un intervalo de confianza del 99% para la proporción p. ¿Se puede decir que el dado es sesgado?. 62 Ejercicio De una población de 3,000 empleados de una empresa industrial se seleccionó una m.a. de 300 para que participen en una encuesta. Entre los comprendidos en la muestra. 240 manifestaron que estaban satisfechos por completo con todas las condiciones laborales de la empresa. Construir el intervalo de confianza del 95% para la proporción real que opinan de esta manera. 63 Ejercicio. Una organización de salud se interesa en actualizar su información con respecto a la proporción de hombres que fuman. Con base a estudios previos, se cree que la proporción es del 40%. La organización lleva a cabo una encuesta en la que se selecciona en forma aleatoria 1,200 hombres a los cuales se les pregunta sus hábitos de fumador. De los encuestados, 420 son fumadores. Emplee un método aproximado para determinar se ésta evidencia apoya al estudio previo. Use 0.01. 64 Intervalo de Confianza (IC) para la media de poblaciones finitas El estadístico para una población finita sin reemplazo es: P Z pq N n n N1 El error estadístico es: e = Z/2 pq N n n N 1 65 Luego el intervalo de confianza aproximado de (1- ) 100% para el parámetro binomial es: pq N n P( P-Z1-/2 n N 1 P + Z1-/2 pq n N n N 1 ) = 1 - . Si se desea saber de que tamaño debe ser “n” para asegurar que el error en la estimación de será menor que una cantidad específica es: Z 2 / 2 pq N n Z 2 / 2 pq e 2 ( N 1) 66 Ejercicio. el director de u Colegio Nacional desea calcular la proporción de los 1,000 alumnos de último año que piensan seguir estudios en la universidad. ¿Qué tamaño debe tener la muestra que necesita tomar el director si su estimación debe estar a 0.04 del valor verdadero, con 99% de confianza?. El año anterior, el 70% de los alumnos encuestados dijeron que tenían planeado seguir estudios en la universidad. 67 Intervalo de Confianza (IC) para la diferencia de dos proporciones poblacionales Si se seleccionan muestras independientes de las dos poblaciones, las variables P1 y P2 serán independientes y entonces, por la propiedad reproductiva de la distribución normal se acepta que P1 – P2 está distribuida aproximadamente en forma normal con media: 1 - 2 = 1 - 2 y varianza 2 p1q 1 p 2 q 2 P1 p 2 n1 n2 68 El estadístico para la prueba de hipótesis es: p 1 p 2 ( 1 2 ) z p1q 1 p2 q 2 n1 n2 Conforme n es la distribución normal estándar: N(0,1) reemplazando en: P(-Z/2 Z Z/2) = 1 - . p 1 p 2 ( 1 2 ) Tenemos: P ( Z/2 Z /2 ) 1 p1q 1 p2 q 2 n1 n2 69 Luego el intervalo de confianza aproximado de (1- ) 100% para la diferencia de proporciones es: PP1 P2 Z1 / 2 P1 P 2 1 2 P1 P2 Z1 / 2 P1 P 2 1 p1q 1 p2 q 2 p p2 n1 n2 1 70 Ejercicio. Se ha encontrado que 25 de 250 cinescopios de televisión producidos por el proceso A son defectuosos y que 14 de 180 producidos por un proceso B son defectuosos. Suponiendo que el muestreo es aleatorio, determinar el intervalo de confianza del 99 % de confianza para la diferencia verdadera es la proporción de defectuosos, de los dos procesos. (Rpta, p(-0.049, 0.093). (R. Moya, Pag. 669). 71 Ejercicio. una compañía que hace sus negocios con el sistema “Club” donde los individuos se comprometen a recibir emisiones periódicas de una producto (libros, discos, etc.) se interesó en averiguar cuál era la tasa de éxito de las colecciones que vendía. Se tomó una muestra de 69,249 informes y se encontró que en el 70% las personas habían completado colecciones. La gerencia, no estando muy seguro de la exactitud del resultado, pidió que se sacara otra muestra. En la segunda de 68,011 facturas hubo un 75% de éxito. ¿Piensa que la gerencia debería estar satisfecha, ahora? 72 Ejercicio. En un articulo del periódico El espectador se leía: “Unos detectives siguieron a 1647 compradores deambulando por las tiendas de Monterrey. Descubrieron que 7.4% de las mujeres y 5% de los hombres se involucraron en actos de robo. El valor promedio de artículos robados se estimó en I/. 50,000. eso es lo que reporta una agencia policial privado”. Suponiendo que 70% de los compradores fueron mujeres, determinar, usando un intervalo de confianza del 90% si hay evidencia suficiente en este reporte para declarar diferencia real entre los sexos en lo que respecta al robo en tiendas de Monterrey. 73 Intervalo de Confianza (IC) para la Varianza DE UNA POBLACION NORMAL Estimador puntual de la variancia 2 es la variancia muestral: S2 (X i X ) 2 n 1 S2 es la estimación puntual de 2, para determinar el IC para la variancia se utiliza el estadístico: 2 2 ( n 1) S 2 cuya distribución es Ji cuadrada con n-1 g.l. donde n > 2. 74 Si: P(2/2.n-1 2 21-/2,n-1) = 1 - P(2/2.n-1 ( n 1 ) S 2 2 2 1-/2,n-1) = 1 - . El intervalo de confianza es: ( n 1) S 2 ( n 1) S 2 P( 2 1 / 2.n 1 2 2 / 2.n 1 ) = 1 - . 75 Distribución Ji 1- /2 /2 2/2.n-1 21-/2,n-1 76 Los sgtes números son las notas de 15 estudiantes del curso de estadística aplicada II. 13,08,10,12,15,07,16,09,14,11,08,11,17,13,11 Suponiendo que la población de notas esta normalmente distribuida , construir el intervalo de confianza del 95% para 2 y . 77 Se selecciona una muestra de 80 empleados de una compañía;se registra el salario anual de cada empleado de la muestra y se calcula la media y la varianza muestral de los salarios obteniendose X= I/. 7,750 y S2=640,000, suponiendo que la población de salarios esta normalmente distribuida, construya el intervalo de confianza del 95% para 2 78 11. Intervalo de Confianza (IC) para la razón de dos varianzas Un estimador puntual de la razón 21 / 22 es el estadístico: S21/S22. Para determinar el IC de la razón de dos varianzas se utiliza el estadístico F definido por S 12 12 F S 22 22 79 P(/2,V1, V2 F 1-/2,V1, V2) = 1 - Reemplazando: S 12 12 P(/2,V1,V2 S 22 1-/2,V1,V2) = 1 - . 22 80 Si S21 y S22 son dos varianzas de dos muestras aleatorias independientes de tamaños n1 y n2 seleccionadas respectivamente de dos poblaciones normales, entonces, el IC de 1 - por 100 % para 21 / 22 es: S 1 2 12 S 12 P( S 2 2 /2,V2,V1 2 S 2 1-/2,V2,V1) = 1 - . 2 2 81 Ejercicio Se preparan dos diferentes tandas de cemento, y de cada una se fabrica gran número de tabiques. Se toma una muestra de seis tabiques de cada tanda, y la fuerza de tensión en 1b/pulg2, se mide para cada tabique de las dos muestras. Suponiendo que en la tanda i la fuerza de tensión está normalmente distribuida con varianza σ2i, i = 1,2. Obtenga un intervalo de confianza de 95 % para la razón de las dos desviaciones típicas, σ1/σ2. (R. Moya, Pág. 687). Tanda 1: 536, 492, 528, 572, 582, 506 Tanda 2: 555, 567, 550, 550, 535, 540 82 Ejercicio. Se dividió en dos grupos una clase de Estadística Aplicada II de 40 alumnos. Cada grupo utilizo durante un ciclo un metodo de enseñanza diferente. Al final del ciclo los alumnos se sometieron a una misma prueba de rendimiento obteniendose los sgtes resultados: N1=19, s21=280 N2=21 S22=200 Suponer Que los datos constituyen muestras aleatorias independientes extraidas de poblaciones normalmente distribuidas. ¿Puede afirmarse que las varianzas poblacionales son iguales? Tome γ=90% 83 Ejercicio. Entre 29 aspirantes a un empleo en una empresa pública, 13 acababan de completar un curso de secretariado de seis meses y 16 acababan de terminar estudios de bachillerato donde habían tomado clases de comercio. A cada aspirante se le aplicó la misma prueba de eficiencia. La varianza de los puntajes para el primer grupo fue de 525 y para el segundo, de 350. Construir el intervalo de confianza del 90% para 21 y 2 y 21/22 donde 21 y 22 son las varianzas de las poblaciones de calificaciones de los aspirantes. ¿Qué suposiciones hay que hacer para resolver este problema? 84 Bibliografía: CÓRDOVA ZAMORA, Manuel. 1999. “Estadística Inferencial” Publicaciones Moshera. Lima Perú. MOYA Rufino y ZARAVIA Gregorio. “Probabilidad e Inferencia Estadística”. Lima Perú YAMANE, Taro. 1973 “Estadística”. Harla, México WALPOLE y MYRES. 1991 “Probabilidad y Estadística”. Mc Graw Hill 85