MÓDULO IV ESTADÍSTICA INFERENCIAL PDF
Document Details
Uploaded by ExemplaryVenus
Universidad Nacional del Altiplano Facultad de Ingeniería Económica
Dr Carlos Ramirez Cayro
Tags
Summary
Este documento es una presentación sobre estadística inferencial, enfocada en pruebas de hipótesis, con ejemplos de aplicación y conceptos relacionados. Proporciona información sobre la formulación de hipótesis nula y alternativa, el cálculo de probabilidades, procedimientos para tomar decisiones, y ejemplos de diferentes tipos de pruebas.
Full Transcript
UNIVERSIDAD NACIONAL DEL ALTIPLANO FACULTAD DE INGENIERIA ECONÓMICA Curso: Estadística Inferencial PARTE IV: PRUEBA DE HIPOTESIS Dr Carlos Ramirez Cayro Docente Principal de la F I E PRUEBAS DE HIPOTESIS Definición.- Es una aseveración que se hace ace...
UNIVERSIDAD NACIONAL DEL ALTIPLANO FACULTAD DE INGENIERIA ECONÓMICA Curso: Estadística Inferencial PARTE IV: PRUEBA DE HIPOTESIS Dr Carlos Ramirez Cayro Docente Principal de la F I E PRUEBAS DE HIPOTESIS Definición.- Es una aseveración que se hace acerca de la distribución de probabilidad de una o más variables aleatorias. En la práctica la distribución de la población es a menudo implícitamente supuesta especificándose una hipótesis con el valor o valores del parámetro o los parámetro que la definen. PRUEBA DE HIPOTESIS ESTADISTICA Una prueba de hipótesis estadística H,es una regla de decisión que permite rechazar o aceptar la hipótesis H en base a la información dada por la muestra aleatoria X1……..Xn extraída de una población en estudio. 2 Ejemplos: Son ejemplos de Hipotesis Estadística El promedio poblacional de la altura de los peruanos es 1.60 m.esto es =1.60 La varianza poblacional de los salarios de los profesores de un colegio es (500)² 2 =(500)²=250,000 Al arrojar una moneda la probabilidad de que salga cara es ½. Al nacer un niño; la probabilidad de que sea hombre también es ½. En todos los casos podemos plantearnos la hipótesis nula: Ho: = p y la hipótesis alternativa Ha: p. 3 TIPO DE ERRORES EN LA TOMA DE DECISIONES. En una prueba de hipótesis estadística se puede cometer 2 errores Decisión HIPOTESIS NULA HIPOTESIS NULA VERDADERA FALSA Aceptación de la CORRECTO ERROR DE TIPO II hipótesis 1-∞ β Rechazo de la ERROR DE TIPO I No hay error hipótesis ∞ 1-β 4 Tipo de errores en la toma de decisiones Error de tipo I.- Se produce cuando rechaza una hipótesis que es verdadera. Error de tipo II.- Se produce cuando se acepta una hipótesis falsa 5 Ensayos de hipótesis: Para probar la validez de tales hipótesis estadísticas se hacen pruebas o experimentos. En estas pruebas se verifica si se acepta o se rechaza la hipótesis o se determina si las muestras observadas difieren significativamente o no de los resultados esperados. (Córdova Z. Manuel). 6 Entonces, definimos el Nivel de Significación como la probabilidad máxima con la que el ensayo de una hipótesis se puede cometer un error del Tipo I. Si se elige un nivel de significación del 0.05 o 5 % al diseñar un ensayo de hipótesis, entonces hay aproximadamente 5 ocasiones de 100 en que se rechazaría la hipótesis cuando debería ser aceptada, es decir, se está con un 95 % de confianza de que se toma la decisión adecuada. 7 PASOS PARA UNA PRUEBA DE HIPOTESIS 1. Formular la hipótesis nula y alternativa de acuerdo al problema. 2. Escoger un nivel de significancia o riesgo. 3. Escoger la estadística apropiada cuya distribución por muestreo sea conocido en el supuesto de que la Hipótesis nula es cierta 4. Establecer la región crítica, es decir determinar el valor o valores críticos. 5. Calcular los valores de la prueba estadística de una muestra aleatoria de tamaño n. 6. Conclusión rechazar o aceptar. 8 1.- Formular la hipótesis nula y alternativa de acuerdo al problema. Modos de planteamientos de hipótesis: Se asume que es un valor del parámetro desconocido de una población cuya distribución se supone desconocida. 1. Ho: = o y Ha: o Dos colas Bilateral 2. Ho: o y Ha: o Cola a la derecha 3. Ho: o y Ha: o Cola a la izquierda 9 2.- Escoger un nivel de significancia o riesgo, se refiere al nivel ∞ ∞ = 0.05 Significativo ∞ = 0.01 Altamente significativo 10 3.- Escoger la estadística apropiada cuya distribución por muestreo sea conocido en el supuesto de que la Hipótesis nula es cierta. La prueba estadística es la relacionada con la naturaleza de la población y de la muestra. La pruebas estadísticas mas comunes que se usan son: La normal, Binomial, las no paramétricas (T student, F, Z, X²) 11 4. Establecer la región crítica, es decir determinar el valor o valores críticos Consiste en determinar las zonas de aceptación y de rechazo, que pueden ser pruebas de dos colas o de una cola y el intervalo de confianza. 5. Calcular los valores de la prueba estadística de una muestra aleatoria de tamaño n Efectuar los cálculos numéricos de acuerdo al estadístico definido por el paso 3. 12 6. Conclusión: Rechazar o aceptar Tomar la decisión correspondiente, comparando los cálculos con el criterio establecido en 4. 13 Regla de decisión: Después de definir las hipótesis nula y alternativa, se establece la regla de decisión con la cual se rechaza o se acepta la hipótesis nula Ha. Se define la regla de decisión dividiendo la distribución muestral en dos campos: Región Crítica (RC) y en Región de aceptación (RA). 14 Ejemplo. Supongamos una población normal N(µ,σ2 ) con varianza conocida σ2 = 9 y que se trata de probar la hipótesis nula Ho µ = 70 contra Ha µ > 70, para una n = 40 y α = 0.05 determinar el valor crítico K. Si X es un buen estimador de µ la usaremos para determinar la región crítica. 0.05 = P( rechazar Ho, cuando Ho es verdadera) = P( X > K/ µ = 70). 15 X K 70 K 70 0.05 P P Z 3 0.474 n 40 (K-70)/0.474 = 1.645, luego K = 70 + 1.645 * 0.474 = 70.78 Por tanto, la región crítica en el rango de variación de X es el intervalo RC = < 70.78, + ∞ > La regla de decisión es: si x es el valor de X obtenido a partir de una muestra aleatoria de tamaño 40, se rechazará Ho si x > 70.78 16 RA 1- RC 70 K=70.78 17 1. Prueba de hipótesis acerca de la media : varianza 2 supuesta conocida Si la población es normal N(, 2), entonces, la distribución de la estadística X esa exactamente normal N(x, 2/n), para cualquier valor de n (n ≥ 2). Si la población no es normal, pero el tamaño de la muestra es suficientemente grande (n ≥ 30), entonces, la distribución de X es aproxidamente normal N(x, 2/n). Luego el estadístico es: z X n 18 Prueba bilateral 01.- El gerente de ventas de la empresa H & B afirma que las ventas diarias se distribuyen según el modelo de la probabilidad normal con una media de $ 400 y una desviación estándar de $ 20. Para verificar la hipótesis con respecto a la media, un analista escogió una muestra aleatoria de las ventas de 100 días y encontró que la media de las ventas es igual a $ 395. Si el analista utiliza una hipótesis alternativa bilateral y el nivel de significación del 5 %, ¿cuál sería su conclusión?. (Córdova Z. Manuel. Pág. 115). 19 1. Hipótesis: Ho: = 400 y Ha: 400 2. Nivel de significancia: = 0.05 3. Estadística: Para una población normal con varianza conocida: Z= (X-)/(/n) 4. Región Crítica: RC = Z -1.96; Z 1.96 5. Cálculos: Z = (395 – 400)/(20/100) = - 2.5 6. Decisión: Como: - 2.5 -1.96 se rechaza la Ho. Es decir se rechaza la afirmación del gerente de que la media de ventas diarias de la empresa es de $ 400. 20 Una maquina que empaca bolsas de café automáticamente esta regulada para embalar bolsas cuyos pesos se distribuyen normalmente con media y varianza 400. El valor puede ser fijado en un mostrador situado en una posición un poco inaccesible de esa maquina. La maquina fue regulada para = 500gr. Se decide escoger una muestra de 16 bolsas a cada media hora con la finalidad de verificar si la producción esta bajo control o no esto es si =500 gr. O no Si una de esas muestras tiene una media X=492 gr. ¿Ud pararía o no la producción para verificar si el mostrador esta o no en la posición correcta? 21 Prueba unilateral de cola a la izquierda Ejercicio. Al estudiar si conviene tener o no una sucursal en la ciudad de Tarapoto, la gerencia de una gran tienda comercial de Lima, establece el siguiente criterio para tomar una decisión: Abrir la sucursal sólo si el ingreso promedio familiar mensual en dicha ciudad es no menos de $ 500 y no abrirla en caso contrario. Si una muestra aleatoria de 100 ingresos familiares de esa ciudad ha dado una media de $ 480 y una desviación estándar de $ 80. (Córdova Z. Manuel. Pág. 118). 22 a) ¿ Cuál e s la d e c is ió n a t o m ar al nive l d e s ig nifi c anc ia d e l 5 % ? 1. Hipótesis: Ho: 500; se abre la sucursal Ha: 500; No se abre la sucursal 2. Nivel de significancia: = 0.05 3. Estadística: Población no normal, n = 100, σ= S = 80, por el teorema del límite central la estadística apropiada es Z= (X-)/(/n), cuya distribución es aproximadamente normal N(0.1) 4. Región Crítica: Se rechaza la Ho si en la RC = Z -1.645 5. Cálculos: Z = (480 – 500)/(80/100) = - 2.5 6. Decisión: Como: - 2.5 -1.96 se rechaza la Ho, se decide no abrir la sucursal en la Ciudad de Tarapoto 23 se sabe que el consumo mensual “per cápita” de una determinado producto tiene distribución normal, con una desviación estándar de 2 kgr. El gerente de una firma que fabrica ese producto resuelve retirar el producto de la línea de producción si la media del consumo per cápita es menor que 8 kgr. En caso contrario, continuará fabricando. Fue realizada una investigación de mercado; tomando una muestra de 25 individuos se verificó que 25 Xi 180kgr ; donde Xi i 1 representa el consumo mensual del i=ésimo individuo de la muestra. – ¿Construya una prueba de hipótesis adecuado, utilizando = 0.05, y en base a la muestra seleccionada, determine la decisión a ser tomada por el gerente?. – ¿Cuál es la probabilidad de tomar una decisión errada si, en realidad la media poblacional es = 7.8 krg? – Si el gerente hubiese fijado = 0.01, ¿la decisión sería la misma?. – Si la desviación estándar de la población fuese 4 kgr, ¿cuál seria la decisión?. 24 Ejercicio. Los registros del puntaje de un test de aptitud académica tomado a los aspirantes a primer año de la Universidad revelaron que el puntaje medio aritmético era 110 y la desviación típica es 10. Aplicado el test a los nuevos aspirantes se vio que para una muestra de 400 el puntaje medio era 106. ¿Hay razón para creer que el rendimiento medio de estos nuevos aspirantes ha cambiado?. Use α = 0.05. Encuentre un intervalo de confianza del 95 % para el puntaje medio de estos nuevos aspirantes. (Rufino Moya, página 720). 25 2. Prueba de hipótesis acerca de la media : Varianza 2 supuesta conocida. ( población finita de tamaño n, muestreo sin reemplazo, N 30). El estadístico es: X z N n n N 1 26 Ejemplo. Los registros de un propietario de una estación de combustible indican que la media del número de galones de gasolina que vende a sus clientes es igual a 4 galones. Además, los registros muestran que los consumos de gasolina de sus clientes tienen una distribución normal. Sin embargo, debido a la reciente alza en el precio de la gasolina se cree que este consumo ha bajado. (Zamora Manuel. Pág. 125. 27 Para verificar esta hipótesis se escogió una muestra aleatoria 15 de sus clientes resultando los siguientes consumos de gasolina en galones: 4.25, 3.75, 4.05, 3.8, 3.5, 4, 3.75, 2.5, 6.1, 2.5, 2.5, 3.4, 3.2, 2.8, 5. Con estos datos y con un nivel de significación de 0.05, ¿el incremento en el precio de la gasolina ha disminuido en la baja del consumo promedio?, ¿Cuál es el valor de la probabilidad P?. 28 1. Hipótesis Ho: u =4; u < 4 2. Nivel de Α = 0.05 significancia 3. Estadística Como n < 30 usamos la distribución “t”..t = (X-u)/(s/√n) con gl = 14 → (n-1) 4. Región crítica RC={tc < - 1.761}; t14,0.05 = 1.761 5. Cálculos t = (3.6733 - 4)/(0.9812/√15) = - 1.2895 6. Decisión Como la tc > tt no se rechaza la Ho. Es decir, el incremento en el precio de la gasolina no bajó el consumo promedio. El valor de la probabilidad es: P(t 238 2. Nivel de significancia: = 0.05 3. Estadística: Como n < 30 usamos la distribución “t”: T = (X-)/(/n) con n-1 gl: 25 4. Región Crítica: RC = t > 1.708; t25, 0.05 = 1.708 5. Cálculos: t = (240 – 238)/(10/26) = 1.02 6. Decisión: Como: tc tt no se rechaza la Ho. Es decir no es suficiente prueba para pensar que el verdadero promedio sea mayor que 238. 35 Ejercicio: Una fábrica produce clavos cuya longitud media es 1 pulgada. Después de efectuadas algunas modificaciones en los dispositivos de las máquinas de dicha fábrica y con respecto a la producción de clavos durante los últimos meses se han recibido continuos reclamos de los compradores quienes han manifestados que los clavos presentan un incremento en más de 0.1 pulgadas en su longitud, lo que perjudica a los usuarios. (MOYA Rufino y ZARAVIA Gregorio, pagina 712) 36 Para verificar lo manifestado por los compradores, el fabricante tomó una m. a. de 10 clavos cuyas longitudes resultaron: 1.14, 1.12, 1.11, 1.10, 1.16, 1.09, 1.08, 1.12, 1.11, 1.10. Usando α = 0.05 ¿podrá el fabricante aceptar lo manifestado por los compradores? Construir un intervalo de confianza del 95% para la longitud media de los clavos fabricados después de las modificaciones efectuadas en los dispositivos de las máquinas (MOYA Rufino y ZARAVIA Gregorio, pagina 716) 37 4. Prueba de hipótesis para la diferencia entre dos medias: 1 y 2 y con varianzas 21 y 22 supuestas conocidas. n 30. Si X1 y X2 , son las medias de dos muestras aleatorias independientes de tamaños n1 y n2 seleccionadas respectivamente de dos poblaciones con medias 1 y 2 y variancias 21 y 22, supuestas conocidas. El estadístico es: X 1 X 2 ( 1 2 ) z 12 22 n1 n2 38 Ejemplo. El gerente de ventas de la gran compañía C & P analiza dos técnicas de ventas A y B. Escogió dos muestras aleatorias independientes de 50 vendedores. La primera aplicó la técnica A y la segunda la técnica B. Al final de un mes el número de ventas por vendedor ha dado las medias respectivas de 67 y 60 y las varianzas respectivas 225 y 100. (Córdova Z. Manuel, pag 137). 39 Al nivel de significancia del 5 %, ¿presentan los resultados muestrales suficiente evidencia que indique que la técnica A da mejores resultados que la técnica B?. Sean X1 y X2 las ventas obtenidas con las técnicas A y B respectivamente y µ1 y µ2 medias respectivas. Se desconocen las distribuciones de probabilidades de X1 y X2, pero las muestras son grandes 40 1. Hipótesis: Ho: 1 = 2 y Ha: 1 > 2 2. Nivel de = 0.05 significancia: X1 X 2 Z 3. Estadística: El estadístico apropiado: S12 S 22 n1 n2 4. Región Crítica: RC = Z > 1.645 67 60 5. Cálculos: Z 2.7456 225 100 50 50 6. Decisión: a) Como: Zc > Zt se rechaza la Ho. Es decir, la técnica A da mayores resultados que la B. 41 Ejercicio. Un inversionista está por decidir entre dos localidades para abrir un centro comercial. Para esto debe probar la hipótesis de que hay diferencia en la media de los ingresos mensuales de los hogares de las dos provincias. Se escogió una muestra aleatoria de cada lugar y se obtiene la tabla de resultados en dólares:(Córdova Z. Manuel. Pág. 171) Localidad A B Tamaño muestral 300 400 Media muestral 400 420 Varianza muestral 8100 14400 42 En la Facultad de Ciencias Matemáticas de la U.N.M.S.M., se seleccionó una m.a. de 20 estudiantes (grupo A) de una población de estudiantes pertenecientes a familias en que ambos padres trabajan. Se seleccionó también una m.a. de 16 estudiantes (grupo B) entre aquellos estudiantes que pertenecen a familias en que solamente el padre trabaja. El análisis de los puntajes de rendimiento académico de los dos grupos dio los siguientes resultados. Grupo Promedio muestral A 14 B 17 La experiencia muestra que las poblaciones de puntajes para ambos grupos están distribuidas en forma aproximadamente normal, con varianzas if-A = 36 Y if-B = 20 ¿Se puede concluir, con estos datos, que la media de la población de la que se seleccionó el grupo A es inferior a la media de la población de la que se seleccionó el grupo B? 43 Dos técnicas de ventas son aplicados por dos grupos de vendedores; la primera (Técnica A), por 12 vendedores y la segunda (Técnica B), por 15 vendedores. Se espera que la técnica B da mejores resultados. Al final de un mes, se obtuvieron los siguientes resultados. Ventas Técnica A Técnica B Media 78 82 Varianza 45 70 ¿Hay diferencia significativa entre las ventas resultantes de las dos técni- cas?. 44 6. Estimación de una Proporción Un estimador puntual de la proporción p en un experimento binomial está dado por el estadístico p = X/n, donde X representa el número de éxitos en “n” intentos. De acuerdo con el Teorema de Límite Central, para una “n” lo bastante grande, p está distribuida aproximadamente en forma normal con media = E(p) = E[X/n] = np/n = p variancia: 2p = 2x/n = npq/n2 =pq/n 45 7. Prueba de hipótesis para la media de una muestra grande El estadístico para la prueba de hipótesis es: p z pq / n 46 Ejemplo: El gerente de un banco afirma que el porcentaje de clientes que son atendidas en las ventanillas por más de 5 minutos es igual a 0.30. Con el fin de evaluar esta afirmación se escogió una muestra aleatoria de 400 clientes atendidos en las ventanillas del banco y se encontró que 100 de ellos demoraron más de 5 minutos. 47 a) Al nivel de significancia del 1%, ¿presenta esta muestra suficiente evidencia que indique que el porcentaje de clientes que demoraron más de 5 minutos en las ventanillas es diferente de 0.30? b) Calcular la probabilidad de tomar la decisión errada de aceptar la afirmación del gerente cuando la verdadera proporción de todos los clientes que sobrepasan los 5 minutos de atención es de 0.20?. (Córdova Z. Manuel, pag 154). 48 1. Hipótesis: Ho: p = 0.30 y Ha: p ≠ 0.30 2. Nivel de = 0.01 significancia: 3. Estadística: Si “n” es grande el estadístico es: 4. Región Crítica: Se rechaza la Ho si en la RC = Z -2.575 o Z > 2.575; α/2 = 0.005; 1- α/2 = 0.995 5. Cálculos: p = x/n = 100/400; Zc = (0.25 – 0.30)/(0.3*0.7/400) = -2.18 6. Decisión: Como: zc zt no se rechaza la Ho. Es decir no deberíamos rechazar Ho al 1 %. 49 p b) al sustituir en la RC la variable: z pq / n P 0.3 2.575 0.30.7 p 0.3 2.575 0.30.7 400 400 0.99 P(0.241 < p < 0.359), luego la probabilidad de aceptar Ho: p = 0.3 cuando realmente p= 0.2 (error tipo II) es igual a: β= p( aceptar Ho/p = 0.2) = p(0.241 < p < 0.359 /p = 0.2) 0.241 0.2 0.359 0.2 P Z P2.05 Z 7.95 0.02 0.20.8 0.20.8 400 400 50 Ejercicio. En una conferencia de prensa, una alta autoridad anuncia que el 90 % de los habitantes adultos del país están a favor de cierto proyecto económico del gobierno. Una muestra aleatoria de 625 adultos indica que 550 están a favor del proyecto. Si usted desea rechazar una hipótesis verdadera no más de una vez en 100. ¿Concluiría que la popularidad del proyecto ha sido exagerado por la autoridad.? (MOYA Rufino y ZARAVIA Gregorio, pagina 748) 51 1. Hipótesis: Ho: p = 0. y Ha: p 2. Nivel de = 0. significancia: 3. Estadística: Si “n” es grande el estadístico como aproximación a la binomial es: p z pq / n 4. Región Crítica: Se rechaza la Ho si en la RC = 5. Cálculos: 6. Decisión: 52 8. Prueba de hipótesis para la media de poblaciones finitas El estadístico para la prueba de hipótesis es: P Z pq N n n N1 53 9. Prueba de Hipótesis para la diferencia de dos proporciones Si se seleccionan muestras independientes de las dos poblaciones, las variables P1 y P2 serán independientes y entonces, por la propiedad reproductiva de la distribución normal se acepta que P1 – P2 está distribuida aproximadamente en forma normal con media: 1 - 2 = 1 - 2 y varianza 2 p1q 1 p 2 q 2 P1 p 2 n1 n2 54 El estadístico para la prueba de hipótesis es: p 1 p 2 ( 1 2 ) z p1q 1 p2 q 2 n1 n2 55 Ejemplo: Un patrocinador de un programa de TV afirma que el programa representa un atractivo mayor para los televidentes hombres que para las mujeres, pero, el personal de producción del programa piensa que es igual el porcentaje de televidentes hombres y mujeres que ven el programa especial. (Córdova Z. Manuel, pag 157) 56 Si una muestra aleatoria de 300 hombres y otra de 400 mujeres reveló que 120 hombres y 120 mujeres estaban viendo el programa especial de televisión. ¿Puede considerarse significativa la diferencia al nivel de α = 0.05? Sea P1 y P2, respectivamente, las proporciones de hombres y mujeres que ven el programa especial de televisión. 57 1. Hipótesis: Ho: p1 = p2 y Ha: p1 > p2 2. Nivel de = 0.05 significancia: p 1 p 2 ( 1 2 ) 3. Estadística: N(0,1) z p1q 1 p2 q 2 n1 n2 4. Región Crítica: RC = Z > 1.645 5. Cálculos: Hombres: p1 = 120/300 = 0.4; q1 = 0.6 Mujeres: p2 = 120/400 = 0.3; q2 = 0.7 0.4 0.3 Z 2.75 0.40.6 0.30.7 300 400 6. Decisión: Como: Zc > Zt rechaza la Ho. 58 10. Prueba de Hipótesis para la Varianza Estimador puntual de la variancia 2 es la variancia muestral: S 2 2 (X X) i n 1 S2 es la estimación puntual de 2, para determinar el IC para la variancia se utiliza el estadístico: 2 2 ( n 1) S 2 cuya distribución es Ji cuadrada con n-1 g.l. donde n > 2. 59 Distribución Ji 1- /2 /2 2/2.n-1 21-/2,n-1 60 Ejemplo. Un fabricante de tornillos asegura que la longitud de un tipo especial de sus tornillos de alta precisión tiene distribución normal con una desviación estándar igual 0.2 milímetros. Una muestra aleatoria de diez de estos tornillos ha dado las siguientes longitudes en milímetros: 20.5, 20.8, 20.26, 20.72, 20.69 20.37, 20.7, 20.32, 20.96, 20.4 Al nivel de significación de 0.05, ¿se justifica la afirmación que la desviación estándar verdadera es 0.2 milímetros? (Córdova Z. Manuel, pag 130). 61 1. Hipótesis: Ho: σ2 = (0.2)2 ; Ha: σ2 ≠ (0.2)2 2. Nivel de = 0.05 significancia: 3. Estadística de Población normal, con n =10 el estadístico es: 2 prueba: Gl = 9 2 ( n 1 ) S 2 4. Región Crítica: 2α/2,n-1 =20.025,9=2.7 derecho; 21-α/2,n-1 = 20.925,9 = 19.02 izquierdo. RC = {2 < 2.7, 2 > 19.02} 5. Cálculos: S2 = 0.05457 (n 1) S 2 9 * 0.05457 2 12.278 2 0.02 2 6. Decisión: Como: 2 c está en la RA no se rechaza la Ho. Es decir la desviación estándar es igual a 0.2 mm. La probabilidad P = P{2(9) > 12.278} = 12.278 62 Ejercicio. Se ha puesto un examen durante varios años con µ = 70 y σ2 = 9. Una escuela que utiliza por primera vez este examen lo puso para 25 alumnos, que obtuvieron X = 71 y una s2 = 12. ¿Hay razón para creer que las calificaciones de todos los estudiantes de escuela tuvieran una varianza de 9 con un nivel de significancia del 10%?. (MOYA Rufino y ZARAVIA Gregorio, pagina 741) 63 11. Prueba de Hipótesis para la razón de dos varianzas Un estimador puntual de la razón 21 / 22 es el estadístico: S21/S22. Para determinar el IC de la razón de dos varianzas se utiliza el estadístico F definido por S 12 12 F 2 S2 22 64 Un corredor de valores de la bolsa de Lima estudia los porcentajes de rendimiento de las empresas del sector minero y del sector financiero. Se sabe que tasas de los rendimientos independientes tienen distribución normal. Dos muestras aleatorias de las tasas de 8 empresas del sector minero (M) y de 6 empresas del sector financiero (F) han dado los siguientes valores de rendimiento en porcentajes:(Córdova Z. Manuel, pag 134). 65 Sector M: 17, 23, 25, 18, 24, 20, 21, 16. Sector F: 13, 16, 14, 12, 15, 14. Con un nivel de significación de 0.05, ¿se puede concluir que hay mas variaciones en los valores del sector minero? SOLUCION. Sean X1 y X2 las variables que representan los valores de rendimiento de los sectores M y F respectivamente. Estas variables tienen distribuciones normales con varianzas desconocidas respectivas: σ21 σ22. de las muestras se obtienen S21 = 11.1429 y S22= 2 66 1. Hipótesis: Ho: σ21 = σ22 ; Ha: σ21 ≠ σ22 2. Nivel de = 0.05 significancia: 3. Estadística de Poblaciones anormales, con n1 = 8 y n2 = 6 el prueba: estadístico es: S12 F S 22 4. Región Crítica: La región crítica es: RC = {F > 4.88} para una F(7, 5) y α = 0.05 5. Cálculos: De los datos de la muestra se obtiene: , fc = S21/S22 = 11.1429/2 = 5.5714 6. Decisión: Como la F c está en la RC se rechaza la Ho. Es decir los valores del sector F tienen menor variación. La probabilidad P = P{F>5.5714} = 0.0383 67 Ejercicio. Los salarios en dólares del personal de la compañía A y B se distribuyen según el modelo de probabilidad normal con igual media. Para determinar cuál de ellas tiene salarios más homogéneos, se escogió una muestra aleatoria de 10 salarios de A y 9 de B resultando las varianzas 100 y 225 respectivamente. En el nivel de significancia = 0.01, ¿hay razón suficiente para decidir que en la compañía A los salarios son más homogéneos?. (Córdova Z. Manuel, pag 170). 68 12. Prueba de Hipótesis para la diferencia entre dos medias pareadas Sea (X1,Y1), (X2,Y2),... (Xn, Yn), una muestra aleatoria de “n” datos aparejados, donde las muestras X1,X2,...Xn e Y1,Y2,...Yn correlacionados son seleccionados respectivamente de dos poblaciones normales X N(1, 21) e Y N(2, 22). 69 Se puede establecer “n” diferencias: D1 = X1 – Y1, D2 = X2 – Y2,...Dn = Xn – Yn, como una muestra aleatoria seleccionada de una población de diferencias D = X – Y cuya distribución es normal N(d, 2d) con media d = 1 - 2 y variancia 2d = 21 - 22 – 2 cov(X,Y). El estimador insesgado de d = 1 - 2 es la estadística: d ( X Y) X Y d X Y n n n n 70 Cuyo valor d = ∑d/n es la estimación insesgada de d. Si 2d es conocida, la diferencia tiene distribución normal N(d, 2d). Por consiguiente la estadística: d ( 1 2 ) z d n n d 2 n( d ) 2 d i Sd d i 1 n 1 n 71 Si d y Sd son la media y la desviación estándar de una muestra aleatoria de “n” las diferencias de “n” pares de datos de una población normal con variancia d supuesta desconocida, entonces la estadística es: V = n-1 d t Sd n 72 Ejemplo: Un administrador está probando la posibilidad de usar un nuevo paquete de computación. Cambiará de paquete si hay prueba que el nuevo usa menos tiempo que el antiguo al procesar determinada tarea. A fin de tomar una decisión se seleccionó una muestra aleatoria de 10 operadoras y se registró el tiempo de procesamiento en segundo con ambos paquetes tal como se da en la tabla que sigue:(Córdova Z. Manuel pag 150). 73 Operadora 1 2 3 4 5 6 7 8 9 10 P. antiguo 7 8 10 12 13 13 14 14 15 16 P. nuevo 6 9 7 11 10 11 15 12 13 12 Diferencia di 1 (-1) 3 1 3 2 (-1) 2 2 4 d2i 1 1 9 1 9 4 1 4 4 16 ¿Se cambiará el paquete de cómputo antiguo por el nuevo? Use un nivel de significancia del 5 % y haga las suposiciones necesarias 74 1. Hipótesis: Ho: d = 0 y Ha: ≠ 0 2. Nivel de significancia: = 0.05 3. Estadística de prueba: Como n < 30 usamos la distribución “t”: T = D/(Sd/n) con n-1 gl: 9 4. Región Crítica: Para una prueba bilateral α/2 = 0.025 con V= n-1 = 9, t0.025, 9 = 2.262, la RC = t > 2.262; 5. Cálculos:.d = 16/10 = 1.6; Sd = 1.64655 t = 1.6/(1.64655/10) = 3.073 6. Decisión: Como: tc > tt se rechaza la Ho. Es decir los tiempo promedios no son iguales de ambos procesos. 75 Ejercicio. La gerencia de ventas de una cadena de mercados diseño un plan de incentivos para sus vendedores. A fin de evaluar este plan se seleccionaron doce vendedores al azar y se registraron sus ventas diarias en dólares antes y después de aplicar el plan. Suponga que las ventas antes y después del plan tienen distribución normal. Use α = 0.05 para determinar si hubo incremento significativo en las ventas de todos sus vendedores debido a la aplicación del plan. (Córdova Z. Manuel, pag 177). 76 Vendedor 1 2 3 4 5 6 7 8 9 10 11 12 Antes 89 87 70 83 67 71 92 81 97 78 94 79 Después 94 91 68 88 75 66 94 88 96 88 95 87 Diferencia di.d2i 77 Bibliografía: CÓRDOVA ZAMORA, Manuel. 1999. “Estadística Inferencial” Publicaciones Moshera. Lima Perú. MOYA Rufino y ZARAVIA Gregorio. “Probabilidad e Inferencia Estadística”. Lima Perú YAMANE, Taro. 1973 “Estadística”. Harla, México WALPOLE y MYRES. 1991 “Probabilidad y Estadística”. Mc Graw Hill 78 Ejercicios a resolver para el examen: Una media: diapositivas 30, 35, 39 Diferencias de medias: diapositiva 45 Una proporción: diapositiva 52 Diferencias de proporciones: Ejercicio 65 página 178 del texto Estadística inferencia de Zamora. Una varianza: diapositiva 64. Razón de varianzas: diapositiva 69. Diferencia de medias pareadas: Diapositiva 77 79