Introducción a la Estadística Descriptiva PDF
Document Details
Uploaded by WellRoundedFeynman4754
Universidad de El Salvador
Lic. Noé Wilber Vásquez González
Tags
Summary
Este documento presenta una introducción a la estadística descriptiva. Se exploran las definiciones, ramas y tipos de muestras. Se detallan los diferentes tipos de variables y su aplicación.
Full Transcript
UNIVERSIDAD DE EL SALVADOR CURSO DE ESTADÍSTICA DESCRIPTIVA LIC. NOÉ WILBER VÁSQUEZ GONZÁLEZ DEFINICIONES Etimológicamente La palabra estadística no esta bien determinada, pues, existen diversas opiniones y referencias. Para algunos proviene de la voz griega STATERA, que significa “b...
UNIVERSIDAD DE EL SALVADOR CURSO DE ESTADÍSTICA DESCRIPTIVA LIC. NOÉ WILBER VÁSQUEZ GONZÁLEZ DEFINICIONES Etimológicamente La palabra estadística no esta bien determinada, pues, existen diversas opiniones y referencias. Para algunos proviene de la voz griega STATERA, que significa “balanza”. Otros sostienen que deriva del latín STATUS, que significa “situación” Para otros esta proviene del alemán STATT, que significa “estado”, pues era la función principal de los estados establecer registros de población, nacimientos, defunciones, etc. “Es la ciencia que le facilita al hombre el estudio de datos masivos, proporcionando un conjunto de métodos científicos para recolectar, resumir, clasificar, analizar e interpretar el comportamiento de los datos con respecto a una característica, materia de estudio o investigación, pasa de esa manera a sacar conclusiones valederas y efectuar predicciones razonables de ellos y así mostrar una visión de conjunto clara y de más fácil apreciación con respecto a la fuente de información que nos permiten tomar decisiones óptimas en casos de incertidumbre” RAMAS DE LA ESTADÍSTICA ESTADÍSTICA DESCRIPTIVA ESTADÍSTICA INFERENCIAL Es la parte de la Estadística relacionada con Es la parte de la Estadística relacionada con la descripción y clasificación de los datos. la extracción de conclusiones a partir de los (Ross, M. 2007). datos. (Ross, M.2007). Describir grandes colecciones de datos empíricos reduciéndolos a un pequeño número de características que concentra la parte más importante y significativa proporcionada por los datos. Hacer un análisis estadístico de datos experimentales y de los fenómenos observados. Predecir o determinar el comportamiento de los fenómenos en el futuro, lo cual constituye la máxima aspiración práctica de toda ciencia. SELECCIÓN DE LA MUESTRA Población: conjunto de individuos y objetos en los que los cuáles el investigador esta interesado. Parámetro: medición numérica que describe algunas características de una población. Muestra: conjunto de individuos u objetos que representan a la población que se esta estudiando Estadístico: medición numérica que describe algunas características de una muestra. TIPOS DE POBLACIÓN POBLACIÓN FINITA POBLACIÓN INFINITA Cuando se tiene un número determinado Cuando el número de elementos es indeterminado, o de elementos. tan grande que pudiesen considerarse infinitos. Población ≤10,000 Población >10,000 El tamaño de la población se denota “N” El tamaño de la muestra se denota “n” TIPOS DE MUESTREO Muestro no probabilístico Muestreo probabilístico El investigador escoge los elementos de acuerdo con Son procedimientos de muestreo en los que, con la su juicio, necesidades o conveniencia. Otras muestras ayuda de la probabilidad, pueden determinarse tanto que son de este tipo, son las muestras voluntarias en el tamaño de muestra requerida como el grado de las que los receptores de lo solicitado, deciden si error de la muestra. deben contestar o no. Ninguno de estos procedimientos son estadísticamente aceptables, sin embargo, su uso se vuelve una alternativa en ciertos casos. El investigador emplea su propio juicio para elegir a los Muestra por juicio individuos que debe incluir en la muestra. Son aquellas en las cuales el individuo participa sin Muestreo no probabilístico Muestra voluntaria ninguna restricción y por su propia voluntad. Muestro por Se basa en la conveniencia en cuanto al tiempo y costos conveniencia a emplear que suponen para el investigador.. Ejemplo: Seleccionar una muestra aleatoria de Es aquel en el que todos los elementos de la 10 alumnos: Aleatorio población tienen la misma probabilidad de ser a. De la cátedra simple elegidos. b. De la Universidad Puede ser con reemplazo y sin reemplazo. c. Describa una forma errónea de elegir la muestra con este muestreo, explíquela. Es recomendable para poblaciones grandes, De una carrera “x” de 1000 Muestreo heterogéneas y ordenadas aleatoriamente. estudiantes, se requiere obtener una probabilístico muestra sistemática de 100 alumnos. Paso 1. Conocido el tamaño de la población y el ¿Cómo seleccionarlos? tamaño de la muestra, se calcula k=N/n (en caso de resultar decimal, se redondea al entero más N=1000 próximo. N=100 Sistemático K=10 Paso 2. Elegimos del primer grupo una unidad aleatoriamente, la cual será identificada como 1-10; 11-20;21-30;31-40….1000 “i”; entonces del segundo se tomará la Seleccionar aleatoriamente un identificada con el número “i”+ k; del tercero i + número del primer grupo 2k; del cuarto i + 3k; del quinto i + 4k y así Ejemplo: 4 sucesivamente hasta completar n. 4: segundo i+k=8; i+2k=12... N Se utiliza para poblaciones heterogéneas, se agrupan los individuos según las características homogéneas. Al hacer la estratificación, los grupos se establecen de modo que las unidades de muestreo tiendan a ser homogéneas dentro de cada estrato, y los estratos tiendan a ser diferentes entre sí. Pasos. 1. Se divide la población en subpoblaciones relativamente homogéneas, llamadas estratos; estos no se deben traslapar y Muestreo Muestreo deben conformar la población completa, de modo que cada probabilístico estratificado unidad de muestreo pertenezca exactamente a un estrato. 2. Se hace muestreo aleatorio en cada estrato y, posteriormente reunimos la información para obtener la estimaciones globales de la población. Selección simple: se reparte la muestra total en partes iguales para cada estrato ( más sencillo pero menos recomendable). Selección proporcional: se obtiene dividiendo la muestra total en partes proporcionales a la población de cada estrato. Se utiliza cuando no hay ninguna lista utilizable de unidades para ser enumeradas y de la cual seleccionar la muestra. Surge por la necesidad de seleccionar grandes unidades o conglomerados en vez de seleccionar elementos directamente de la población. Pasos: 1. Identificar subdivisiones posibles de la población (conglomerados). Las diferencias entre los conglomerados se hacen tan pequeñas Muestreo Muestreo por como sea posible en tanto que las diferencias entre los elementos probabilístico conglomerados individuales dentro de cada conglomerado se hacen tan grandes como sea posible. Lo ideal es que cada conglomerado fuera una miniatura de toda la población. 2. Tomar una muestra aleatoria de conglomerados, y analizar a cada individuo perteneciente a los conglomerados seleccionados. Los elementos individuales de la población sólo participan en la muestra si pertenecen a un conglomerado incluido en la muestra. VARIABLES SEGÚN SU NATURALEZA Tipos de variables Definición Ejemplos Cuando expresan una cualidad, Estado civil, los colores, lugar de nacimiento, Variables cualitativas o característica o atributo, sus datos se profesiones, actividad económica, causas de estadísticas de atributos expresan mediante una palabra, no es accidentes, etc. numérico. Cuando el valor de al variable resulta de Hijos por familia, número de accidentes por Discreta la operación de contar, su valor esta día, trabajadores por rubro, población de representado por números naturales. municipios, habitaciones por vivienda, etc. Variables cuantitativas Cuando el valor que se obtiene por medición o comparación con una Área de parcelas, ingresos monetarios, unidad o patrón de medida. Pueden producción de maíz, pero, estatura, tiempo de Continua tener cualquier valor dentro de su rango servicios, horas trabajadas, niveles de o recorrido, por lo que pueden empleo, etc. expresarse por cualquier número real. TIPOS DE VARIABLES SEGÚN ESCALA DE MEDICIÓN Tipos de variables Definición Ejemplos Datos que consisten exclusivamente en Respuestas de sí, no, nombres, etiquetas o indeciso. Nominal categorías. Los datos no Tipo de colores de pueden acomodarse en automóviles. un esquema de orden. Variables Cualitativas Calificaciones de un curso. Datos que se pueden Orden de llegada de acomodar en un orden, competidores. Ordinal sin poderse determinar Clasificación de las diferencias entre los ciudades según su nivel de valores de los datos. seguridad. Tipos de variables Definición Ejemplos Datos que se pueden acomodar en un orden con una propiedad en la que la diferencia entre dos valores Temperaturas corporales cualquiera tiene un significado. De intervalo Años Este nivel de intervalo no tiene Escalas de terremotos como punto de partida un cero natural (donde nada de la cantidad Variables está presente). cuantitativas Similar al intervalo, pero con la condición de que existe un punto de partida, un cero natural (donde Peso de objetos, personas. De razón este indica la ausencia de valor). Precios Siendo así que las diferencias como las proporciones tienen significado.. CÁLCULO DE LA MUESTRA PARA ESTUDIOS DESCRIPTIVOS PARA ESTUDIOS CUYA VARIABLE PRINCIAL ES DE TIPO CUANTITATIVO n: tamaño de la muestra N: tamaño de la población Z: valor z crítico, calculado en las Para poblaciones tablas del área de la curva normal. infinitas Llamado también nivel de confianza. S²: varianza de la población en estudio (que es el cuadrado de la desviación estándar y puede obtenerse de estudios similares o pruebas pilotos). d: nivel de precisión absoluta. Para poblaciones finitas Referido a la amplitud del intervalo de confianza deseado en la determinación del valor promedio de la variable en estudio. CÁLCULO DE LA MUESTRA PARA ESTUDIOS CUYA VARIABLE PRINCIAL ES DE TIPO CUALITATIVO n: tamaño de la muestra N: tamaño de la población Z: valor z crítico, calculado en las Para poblaciones tablas del área de la curva normal. infinitas Llamado también nivel de confianza. p: proporción aproximada del fenómeno en estudio en la población de referencia. q: proporción de la población de referencia que no presenta el fenómeno en estudio (1-p). Nota: la suma de “p” y “q” debe dar 1 Para poblaciones finitas d: nivel de precisión absoluta. Referido a la amplitud del intervalo de confianza deseado en la determinación del valor promedio de la variable en estudio.