Distribuciones Muestrales - Métodos Cuantitativos Semana 4 PDF
Document Details
Uploaded by PermissibleOrangutan
Universidad de Valparaíso
Jimena Neira
Tags
Summary
Estos apuntes presentan conceptos clave sobre distribuciones muestrales en métodos cuantitativos. Se explican diferentes tipos de distribuciones muestrales, se introducen ejemplos prácticos, y se hace referencia al teorema del límite central y a la media muestral.
Full Transcript
DISTRIBUCIONES MUESTRALES Métodos Cuantitativos Semana 4 Ing. Jimena Neira OBJETIVO ESPECÍFICO Al terminar la unidad el alumno identificará e interpretará los diferentes tipos de distribuciones muestrales Distribuciones Muestrales Las muestras aleatorias obte...
DISTRIBUCIONES MUESTRALES Métodos Cuantitativos Semana 4 Ing. Jimena Neira OBJETIVO ESPECÍFICO Al terminar la unidad el alumno identificará e interpretará los diferentes tipos de distribuciones muestrales Distribuciones Muestrales Las muestras aleatorias obtenidas de una población son, por naturaleza propia, impredecibles. No se esperaría que dos muestras aleatorias del mismo tamaño y tomadas de la misma población tenga la misma media muestral o que sean completamente parecidas. Puede esperarse que cualquier estadístico, como la media muestral, calculado a partir de las medias en una muestra aleatoria, cambie su valor de una muestra a otra, por ello, se quiere estudiar la distribución de todos los valores posibles de un estadístico. Tales distribuciones serán muy importantes en el estudio de la estadística inferencial, porque las inferencias sobre las poblaciones se harán usando estadísticas muestrales. Como el análisis de las distribuciones asociadas con los estadísticos muestrales, podremos juzgar la confiabilidad de un estadístico muestral como un instrumento para hacer inferencias sobre un parámetro poblacional desconocido. Como los valores de un estadístico, tal como x, varían de una muestra aleatoria a otra, se le puede considerar como una variable aleatoria con su correspondiente distribución de frecuencias. La distribución de frecuencia de un estadístico muestral se denomina distribución muestral. En general, la distribución muestral de un estadístico es la de todos sus valores posibles calculados a partir de muestras del mismo tamaño. Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población grande. Se calcula la madia muestral x para cada muestra; la colección de todas estas medias muestrales recibe el nombre de distribución muestral de medias, lo que se puede ilustrar en la siguiente figura: Suponga que se eligen muestras aleatorias de tamaño 20, de una población grande, y se calcula la deviación estándar de cada una. La colección de todas estas desviaciones estándar muestrales se llama distribución muestral de la desviación estándar, y lo podemos ver en la siguiente figura: El teorema central del límite El enunciado formal del teorema del límite central es el siguiente: Si en cualquier población se seleccionan muestras de un tamaño específico, la distribución muestral de las medias de muestras es aproximadamente una distribución normal. Esta aproximación mejora con muestras de mayor tamaño Si se seleccionan muestras aleatorias de n observaciones de una población con media 𝜇, y desviación estándar σ, entonces, cuando n es grande, la distribución muestral de medias tendrá aproximadamente una distribución normal con una media igual a 𝜇, y una desviación σ estándar de. La aproximación será 𝑛 cada vez más exacta a medida de que n sea cada vez mayor. Ejemplo 1 Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la población de valores 0, 2, 4 y 6. Encuentre: 1. 𝜇, la media poblacional 2. 𝜎, la desviación estándar poblacional. 3. 𝜇𝑥 , la media de la distribución muestral de medias. 4. 𝜎𝑥 , la desviación estándar de la distribución muestral de medias. Solución 0+2+4+6 1. La media poblacional 𝜇= =3 4 2. La desviación estándar de la población es: 0−3 2 + 2−3 2 + 4−3 2 + 6−3 2 𝜎= = 2.236 4 3. A continuación se listan los elementos de la distribución muestral de la media y la correspondiente distribución de frecuencias. Muestra ഥ 𝒙 ഥ 𝒙 f 0,0 0+0=0 0 0 1 0,2 0+2=2 1 1 2 0,4 0+4=4 2 2 3 0,6 0+6=6 3 3 4 2,0 2+0=2 1 4 3 2,2 2+2=4 2 5 2 2,4 2+4=6 3 6 1 2,6 2+6=8 4 4,0 4+0=4 2 4,2 4+2=6 3 4,4 4+4=8 4 4,6 4+6=10 5 6,0 6+0=6 3 6,2 6+2=8 4 6,4 6+4=10 5 6,6 6+6=12 6 La media de la distribución muestral de medias es: σ 𝑓 ∙ 𝑥ҧ 0 ∙ 1 + 1 ∙ 2 + 2 ∙ 3 + 3 ∙ 4 + 4 ∙ 3 + 5 ∙ 2 + 6 ∙ 1 48 𝜇𝑥 = = = =3 σ𝑓 16 16 4. La desviación estándart de la distribución muestral de medias es: σ 𝑥ҧ − 𝜇𝑥 2 ∙𝑓 𝜎𝑥 = σ𝑓 0−3 2 ∙1+ 1−3 2 ∙2+ 2−3 2 ∙3+ 3−3 2∙4+ 4−3 2 ∙3+ 5−3 2 ∙2+ 6−3 2 ∙1 𝜎𝑥 = = 1,58 16 𝜎 2,236 De aquí que podamos deducir que: 𝜎𝑥 = = = 1,58 𝑛 2 n = tamaño 2 Como para cualquier variable aleatoria, la distribución muestral de medias tiene una media o valor esperado, una varianza y una desviación estándar, se puede demostrar que la distribución muestral de medias tiene una media igual a la media poblacional. Esto es: 𝜇𝑥 = 𝐸 𝑥ҧ = 𝜇 = 3 Como regla de cálculo, si el muestreo se hace sin reemplazo y el tamaño de la población es al menos 20 veces el tamaño de la muestra (N ≥ 20), entonces se puede usar la fórmula. 𝑁−𝑛 El factor se denomina factor de corrección para una población finita. 𝑁−1 El muestreo con reemplazo es aquel en que un elemento puede ser seleccionado más de una vez en la muestra para ello se extrae un elemento de la población se observa y se devuelve a la población, por lo que de esta forma se pueden hacer infinitas extracciones de la población aun siendo esta finita. Ejemplo: Suponga que la tabla siguiente muestra la antigüedad en años en el trabajo de tres Profesores universitarios de física: Suponga además que se seleccionan muestras aleatorias de tamaño 2 sin reemplazo. Calcule la antigüedad media para cada muestra, la media de la distribución muestral y el error estándar, o la desviación estándar de la distribución muestral. entonces sería: (6, 4), (6, 2), (4,2) Solución: Se pueden tener 3 muestras posibles. La tabla lista todas las muestras posibles de tamaño 2, con sus respectivas medias muestrales. 6+4 6+2 4+2 Media Muestral: = 5; = 4; =3 2 2 2 2+4+6 La media poblacional es 𝜇= =4 3 σ 𝑓 ∙ 𝑥ҧ 5 ∙ 1 + 4 ∙ 1 + 3 ∙ 1 La media de la distribución muestral es: 𝜇𝑥 = = =4 σ𝑓 3 La desviación estándar de la población es: 6−4 2 + 4−4 2 + 2−4 2 𝜎= = 1.63 3 El error estándar o la desviación estándar de la distribución muestral es: 5−4 2 + 4−4 2 + 3−4 2 𝜎𝑥 = = 0,816 3 𝜎 1,63 Si utilizamos la fórmula del error estándar sin el factor de corrección tendríamos que: 𝜎𝑥 = 𝑛 = 2 = 1,152 Por lo que observamos que este valor no es el verdadero. Agregando el factor de corrección obtendremos 𝜎 𝑁 − 𝑛 1,63 3 − 2 𝜎𝑥 = 𝑁−1 = ∙ 3 − 1 = 0,816 𝑛 2 Teorema del límite central Las dos medidas fundamentales de esta distribución son la media y la desviación típica. La media y la desviación típica La distribución muestral de medias La distribución muestral de medias El estudio de determinadas características de una población se efectúa a través de diversas muestras que pueden extraerse de ella. El muestreo puede hacerse con o sin reposición. Población de partida puede ser infinita o finita Una población muy grande puede considerarse como infinita. En todo nuestro estudio vamos a limitarnos a una población de partida infinita o a muestreo con reposición. POBLACIÓN Consideremos todas las posibles muestras de tamaño n en una población. Para cada muestra podemos calcular un estadístico (media, desviación típica, proporción,...) que variará de una a otra. Así obtenemos una distribución del estadístico que se llama distribución muestral. Distribución muestral Hay que hacer notar que si el tamaño de la muestra es lo suficientemente grande, las distribuciones muestrales son normales y en esto se basarán todos los resultados que alcancemos. Cada muestra de tamaño n que podemos extraer de una población proporciona una media. Si consideramos cada una de estas medias como valores de una variable aleatoria podemos estudiar su distribución que llamaremos distribución muestral de medias. Si tenemos una población normal N (μ,n) y extraemos de ella muestras de tamaño n, la distribución muestral de medias sigue también una distribución normal 𝜎 𝑁 𝜇, 𝑛 Si la población no sigue una distribución normal pero n>30, aplicando el llamado Teorema central del límite la distribución muestral de medias se aproxima también a la normal anterior La distribución muestral de la proporción Hoy es bien sabido que si la investigación produce datos mensurables tales como el peso, distancia, tiempo e ingreso, la media muestral es en ocasiones el estadístico más utilizado, pero... si la investigación resulta en artículos “contables” como por ejemplo: cuántas personas de una muestra escogen la marca “Pepsi” como su refresco, o cuántas personas de una muestra tienen un horario flexible de trabajo, utilizar la proporción muestral es generalmente lo mejor. Mientras que la media se calcula al promediar un conjunto de valores, la “proporción muestral” se calcula al dividir la frecuencia con la cual una característica dada se presenta en una muestra entre el número de elementos de la muestra, es decir: 𝑥 𝑝Ƹ = 𝑛 Donde: x = número de elementos de una muestra que tienen la característica. n = número de elementos de la muestra RESUMEN El teorema central del límite es útil para entender que la distribución de las medias de muestras tomadas de una misma población y del mismo tamaño es aproximadamente normal y que esta aproximación mejora a medida que se incrementa el tamaño de la muestra; dando pie al estudio de la distribución muestral para la media y para la proporción y a la elaboración de “intervalos de confianza” que se analizarán después. GLOSARIO Distribución muestral Es una distribución de probabilidades que consta de todos los valores posibles de un estadístico de muestra. Error estándar Es la desviación estándar de un estimador puntual. Teorema del límite central También conocido como teorema central del límite, es un teorema que permite usar la distribución de probabilidad normal para aproximar la distribución de muestra de 𝑥ҧ y 𝑝ҧ cuando el tamaño de la muestra es grande. CUESTIONARIO DE REFORZAMIENTO 1. ¿Qué es una distribución de muestreo? 2. Si el estadístico utilizado es la media muestral, ¿qué nombre recibe la distribución de este estadístico? 3. ¿Qué es la distribución muestral de las medias de las muestras? 4. ¿Qué relación existe entre la media de las medias de la muestra y la media de la población? 5. ¿Cómo es la dispersión de las medias de la muestra en comparación con la de los valores de la población? 6. ¿Cómo es la forma de la distribución muestral de las medias de muestras y la forma de la distribución de frecuencia de los valores de la población? 7. ¿Cómo es la desviación estándar de las medias de las muestras comparada con la desviación estándar de la población?