Unidad 4 Métodos no paramétricos (temas y ejercicios) PDF

Summary

This document is a set of exercises and topics on non-parametric methods in statistics. It includes various exercises and the topics discussed in the course Estadística Administrativa 2 at the Instituto Tecnológico de Cancún in Mexico in 2024.

Full Transcript

Tecnológico Nacional de México. Instituto Tecnológico de Cancún. Carrera: Contador Público. Materia: Estadística Administrativa 2. Tema: Unidad 4 Métodos no paramétricos. Tarea: Ejercicios y Prácticas de la Unidad 4. Equipo 2: Integrantes Semestre: Aguirre...

Tecnológico Nacional de México. Instituto Tecnológico de Cancún. Carrera: Contador Público. Materia: Estadística Administrativa 2. Tema: Unidad 4 Métodos no paramétricos. Tarea: Ejercicios y Prácticas de la Unidad 4. Equipo 2: Integrantes Semestre: Aguirre Jiménez Alejandro. Tercer Semestre Brito Moguel Daniel Eduardo. Tercer Semestre Canche Cuevas Diego Alberto. Tercer Semestre Chan Harfuch Ricardo. Tercer Semestre Woods May Oscar. Tercer Semestre Fecha y salón: Fecha 22/11/2024, Salón O10. Profesor: Adolfo Chora Sánchez. ÍNDICE TEMA: Métodos no paramétricos...........................................................Pág 03 TEMA: Prueba de los signos...................................................................Pág 04 SUBTEMAS: Caso de muestras pequeñas. Caso de muestras grandes. Prueba de hipótesis acerca de la mediana. EJERCICIOS: Ejercicio N° 06.............................................................................................Pág 05 Ejercicio N° 07.............................................................................................Pág 06 Ejercicio N° 08.............................................................................................Pág 07 Ejercicio N° 09.............................................................................................Pág 08 Ejercicio N° 10.............................................................................................Pág 09 TEMA. MÉTODOS NO PARAMÉTRICOS. Los métodos no paramétricos suelen requerir suposiciones menos restrictivas acerca del nivel de medición de los datos y menos suposiciones acerca de la forma de las distribuciones de probabilidad generadas por los datos muestrales. Una de las consideraciones para determinar si lo apropiado es un método paramétrico o un método no paramétrico es la escala de medición empleada para generar los datos. Todos los datos son generados por una de las cuatro escalas de medición: nominal, ordinal, de intervalo o de razón. A continuación, se definen y se proporcionan ejemplos de cada una de las cuatro escalas de medición: 1. Escala nominal. Una escala de medición es nominal si los datos son etiquetas o categorías que se usan para definir un atributo de un elemento. Los datos nominales pueden ser numéricos o no numéricos. 2. Escala ordinal. Una escala de medición es ordinal si los datos pueden usarse para jerarquizar u ordenar las observaciones. Los datos ordinales pueden ser numéricos o no numéricos. 3. Escala de intervalo. Una escala de medición es de intervalo si los datos tienen las propiedades de los datos ordinales y los intervalos entre observaciones se expresan en términos de una unidad de medición fija. Los datos de intervalo tienen que ser numéricos. 4. Escala de razón. Una escala de medición es de razón si los datos tienen las propiedades de los datos de intervalo y el cociente (o razón) entre dos medidas tiene sentido. Los datos de razón tienen que ser numéricos. La mayor parte de los métodos estadísticos conocidos como métodos paramétricos requieren el uso de datos de las escalas de intervalo o de razón. Con estos niveles de medición, tienen sentido las operaciones aritméticas y medias, varianzas, desviaciones estándar, etc., pueden calcularse, interpretarse y usarse en el análisis. Con datos nominales y ordinales no es apropiado calcular medias, varianzas ni desviaciones estándar; por tanto, no pueden emplearse los métodos paramétricos. La única manera de analizar esos datos para obtener conclusiones estadísticas es emplear los métodos no paramétricos. En general, para que un método estadístico se clasifique como método no paramétrico, debe satisfacer, por lo menos, una de las condiciones siguientes: 1. Ser un método que pueda ser usado con datos nominales. 2. Ser un método que pueda ser usado con datos ordinales. 3. Ser un método que pueda ser usado con datos de intervalo o de razón cuando no sea posible hacer suposiciones acerca de la forma de la distribución de la población. TEMA. PRUEBA DE LOS SIGNOS. En una aplicación de investigación de mercado de la prueba de los signos se usa una muestra de n clientes potenciales para que indiquen su preferencia por una de dos marcas de un producto. Las n expresiones de preferencia son datos nominales, ya que el consumidor simplemente nombra una preferencia. Dados estos datos, el objetivo es determinar si existe diferencia en las preferencias entre los dos artículos que se comparan. SUBTEMAS. Caso de muestras pequeñas: En muestras pequeñas, la prueba de los signos se enfoca en comparar pares de datos (como en estudios antes y después) y evaluar si la mayoría de las diferencias son positivas o negativas. Se basa únicamente en la dirección (signo) de las diferencias, ignorando su magnitud, lo que la hace especialmente útil cuando los datos no cumplen con los supuestos de normalidad o hay outliers. El caso de la muestra pequeña es siempre que n < 20. Caso de muestras grandes: Si la hipótesis nula es H0: p = 0.50 y el tamaño de la muestra es n > 20, la distribución muestral del número de signos más se aproxima mediante una distribución normal. Aproximación normal de la distribución muestral del número de signos más cuando h0: p = 0.50 Media μ = (0.50) (n) Desviación estándar σ = Raíz cuadrada de (0.25) (n) Forma de la distribución: aproximadamente normal siempre que n > 20. Prueba de la hipótesis acerca de la mediana: En esta prueba, se evalúa si una muestra presenta suficiente evidencia para concluir que la mediana de la población difiere de un valor específico (hipótesis nula) o si existen diferencias significativas entre las medianas de grupos. La comparación se basa en el conteo de valores por encima y por debajo de la mediana, ignorando la magnitud de las diferencias. EJERCICIOS. Ejercicio 06. En el mercado de las computadoras personales la competencia es intensa. En una muestra de 500 compras, se encontró que 202 eran compras de la marca A, 158 de la marca B y 140 de otras marcas. Con un nivel de significancia de 0.05 pruebe la hipótesis de que las marcas A y B tienen la misma participación en el mercado de las computadoras personales. ¿Cuál es la conclusión? n = 500-140=360 Media= 0.5n= 0.5 (360) = 180 Desviación estándar= √0.25𝑛=√0.25 (360) = 9.48 202−180 z= = 2.32 9.48 z= 0.9898 Valor-p = 2(1-0.9898) =0.0204 Η0 = 0.05 Η𝑎 ≠ 0.05 Es posible observar que se tiene que rechazar la hipótesis nula en donde se dice que tanto la marca A como la marca B tienen la misma participación en el mercado. Ejercicio 07. El ingreso mediano anual de los suscriptores de la revista Barron es $131 000 (barrons.mag.com, 28 de julio de 2000). Suponga que en una muestra de 300 suscriptores a The Wall Street Journal, 165 suscriptores posean un ingreso mayor que $131 000 y 135 posean un ingreso menor que $131 000. ¿Puede concluir que hay diferencia entre los ingresos medianos de los dos grupos de suscriptores? Emplee α 0.05 como nivel de significancia, ¿a qué conclusión llega? n = 300-0=300 Media= 0.5n= 0.5 (300) = 150 Desviación estándar= 0.25n−−−−−√0.25n = √0.25(300)= 8.6602= 8.6 z= 165-150/8.6= 1.74 z= 0.9591 Valor-p = 2(1-0.9591) =0.0818 H0=0.05 Ha≠0.05 No se puede rechazar la hipótesis de que hay diferencia entre los ingresos medianos de los grupos de suscriptores. Ejercicio 08. En una muestra de 150 partidos de básquetbol universitario, el equipo de casa ganó 98 partidos. Realice una prueba para determinar si los datos sustentan la hipótesis de que en el básquetbol universitario el equipo de casa tiene ventaja. ¿A qué conclusión llega con α = 0.05? Para la primera parte del desarrollo del ejercicio tenemos que tomar la siguiente formula: Media μ = (0.50) (n) Sustituyendo los datos (que son el número de partidos jugados) quedaría de la siguiente manera: Media μ = (0.50) (150) Media μ = 75 Luego tomamos la fórmula de la desviación estándar: Desviación estándar σ = √ (0.25) (n) Desviación estándar σ = √ (0.25) (150) Desviación estándar σ = √ 37.5 Desviación estándar σ = 6.12372 Ahora sacaremos cuánto vale Z, con la siguiente formulación: Z = 98 – 75 / 6.12372 Z = 23 / 6.12372 Z = 3.7558, ó redondeado 3.76 Para Z = 3.76, el área en la cola es menor de 0.001. Con dos colas, p-valor es menor de 0.002. Entonces p-valor ≈ 0 Dado que p-valor ≤ 0.05, se Rechaza H0. Conclusión: Se concluye que si existe una ventaja para el equipo. Ejercicio 09. El año pasado, en una determinada ciudad, la mediana del número de empleados de tiempo parcial en un restaurante de comida rápida era 15. Es posible que esta cantidad esté aumentando. En una muestra de nueve restaurantes de comida rápida se encontró que en siete de ellos trabajaban más de 15 empleados de tiempo parcial, en uno había exactamente 15 empleados que trabajaban de tiempo parcial y en otro había menos de 15 empleados que trabajaban de tiempo parcial. Realice una prueba con a = 0.05 para determinar si el número mediano de empleados que trabaja de tiempo parcial ha aumentado. Datos: En 7 restaurantes tienen más de 15 empleados, se usará el signo + En 1 restaurante tienen menos de 15 empleados, se usará el signo - En 1 restaurante se tiene exactamente 15 empleados, no se tomará en cuenta para el análisis debido a que coincide con la hipótesis nula. Esto nos deja una nueva muestra de n = 8, y seguidamente de las hipótesis: 𝐻0 : 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 𝑖𝑔𝑢𝑎𝑙 𝑎 15 𝐻𝑎 : 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 𝑚𝑎𝑦𝑜𝑟 𝑎 15 Con un nivel de significancia de a = 0.05 Al tener n = 8 y el valor de p = 0.50, en esa cola tenemos las probabilidades de 7 y 8 (al ser los casos en donde la mediana es diferente a 15). Al sumar estas probabilidades se obtiene 0.0313 + 0.0039 = 0.352. Al duplicar este valor se obtiene el valor-p = 2(0.352) = 0.0704. Como el valor-p ≥ 𝑎 = 0.05, se rechaza 𝐻0 , concluyendo que la mediana del número de trabajadores de tiempo parcial ha aumentado. Ejercicio 10. De acuerdo con un estudio nacional, el ingreso anual mediano que los adultos dicen haría realidad sus sueños es $152 000. Suponga que en Ohio, de 225 personas tomadas en una muestra, 122 indican que el ingreso necesario para hacer realidad sus sueños sea menor que $152 000, y 103 informen que esta cantidad sea mayor que $152 000. Pruebe la hipótesis nula de que en Ohio, el ingreso medio anual para que una persona haga realidad sus sueños es $152 000. Use α 0.05. ¿A qué conclusión llega? Planteamiento de la hipótesis: Hipótesis nula (H0): La proporción de personas que consideran $152,000 suficiente es igual a 50% (p=0.5) Hipótesis alternativa (Ha) La proporción de personas que consideran $152,000 suficiente no es igual a 50% (p≠0.5) Esto corresponde a una prueba bilateral. Datos y estadísticos clave: 1. Tamaño de la muestra (n): 225. 2. Número de personas que consideran un ingreso menor a $152,000 (x1): 122. 3. Número de personas que consideran un ingreso mayor a $152,000 (x2): 103. 4. Proporción muestral (p^): p^=x1/n=122/225≈0.542 5. Nivel de significancia (α\alphaα): 0.05. Estadístico de prueba: Utilizamos la fórmula para el estadístico z: z=p^−p0/(1−p0)nz Donde: p^=0.542 (proporción muestral). p0=0.5 (proporción bajo la hipótesis nula). n=225. Sustituyendo:z=0.542−0.50/(1−0.5)225 Calculemos el valor de zzz. El valor calculado del estadístico z es 1.27 y el valor crítico para una prueba bilateral con α=0.05 es z crıtico=±1.96 Decisión: Dado que ∣z∣=1.27 es menor que 1.961.961.96, no rechazamos la hipótesis nula (H0 ).. z = 1.27 Valor-p = 0.2040 No rechazar H0

Use Quizgecko on...
Browser
Browser