Estadística Descriptiva - Unidad 2 - PDF
Document Details
Universidad Ecotec
Mónica Rojas Ramirez
Tags
Summary
Esta presentación introduce los conceptos básicos de estadística descriptiva. Incluye temas como distribución de frecuencias, medidas de tendencia central (media, mediana, moda), medidas de dispersión (varianza, desviación estándar) y sus aplicaciones. Se explican las fórmulas y diferentes tipos de datos y su uso.
Full Transcript
Unidad 2 Estadística Descriptiva Mgtr. Mónica Rojas Ramírez 1 [email protected] Estructura de la materia Unidad Didáctica 2: Estadística Descriptiva 1. Distribución de frecuencias 2. Presenta...
Unidad 2 Estadística Descriptiva Mgtr. Mónica Rojas Ramírez 1 [email protected] Estructura de la materia Unidad Didáctica 2: Estadística Descriptiva 1. Distribución de frecuencias 2. Presentación de los datos en gráficos 3. Medidas de tendencia central: media aritmética, mediana y moda. 4. Medidas de variabilidad: rango, varianza, desvío estándar y coeficiente de variación. 5. Medidas de posición: Cuantiles, cuartiles, deciles y percentiles. 6. Medidas de forma: asimetría y curtosis. 7. Diagrama de cajas Ing. Mónica Rojas Ramírez, Mgtr. 2 OBJETIVO DE LA SESIÓN Calcular e interpretar las medidas de dispersión para datos no agrupados y datos agrupados Ing. Mónica Rojas Ramírez, Mgtr. 3 Uso de la calculadora con las opciones estadísticas Ing. Mónica Rojas Ramírez, Mgtr. 4 Medidas Descriptivas por Nivel de Medición Frecuencias, Porcentajes Nominal Moda Medida de dispersión Frecuencias, Porcentajes Ordinal Mediana, Moda Media, Mediana, Moda Intervalo Medidas de dispersión Media, Mediana, Moda Razón Medidas de dispersión Ing. Mónica Rojas Ramírez, Mgtr. 5 Medidas Descriptivas Describe la dispersion o Valores que ordenados de La tendencia central, variabilidad de una menor a mayor, dividen a la describe el punto medio de distribución o conjunto de distribución en partes datos iguales, de tal manera que una distribución o conjunto Cuanto mayor sea ese valor, cada una de ellas contiene de datos. mayor será la variabilidad, el mismo número de cuanto menor sea, más homogénea será a la media frecuencias. Tendencia Dispersión Posición Central Ing. Mónica Rojas Ramírez, Mgtr. 6 Medidas de Dispersión Medida Definición (Min y Max) o (Xmin y Xmax): Valor mínimo y máximo del Mínimo y Máximo conjunto de datos R = Max – Min o Xmax– Xmin Rango Diferencia entre Valor máximo y mínimo 𝝈𝟐 : medida de cuán dispersos están los datos, definido como Varianza el promedio de diferencias al cuadrado de la media 𝝈: Raíz cuadrada de la varianza y mide la cantidad de variación Desviación stándar o dispersión en un conjunto de datos. 𝑪𝑽: Medida de la variación relativa de un conjunto de datos, Coeficiente de definida como la relación entre la desviación estándar y la variación media. Ing. Mónica Rojas Ramírez, Mgtr. 7 Desviación Media 𝒇𝒊 : frecuencia absoluta de cada clase 𝒙𝒊 :Cada uno de los datos u Datos No Agrupados Datos Agrupados observaciones. σ𝑛 𝑖=1 |𝑥𝑖 −𝜇| σ𝑘 𝑖=1 𝑓𝑖|𝑥𝑖 −𝜇| 𝑚𝒊 : puntos medios de cada 𝐷𝑀 = 𝐷𝑀 = 𝑁 𝑁 clase 𝒙 ഥ : media aritmética de los σ𝑛 𝑖=1 |𝑥𝑖 −𝑥|ҧ σ𝑛 𝑖=1 |𝑥𝑖 −𝑥|ҧ datos 𝐷𝑀 = 𝐷𝑀 = 𝑛−1 𝑛−1 N, n : número total de datos en población y muestra Por intervalo: 𝒙𝒊 = 𝒎𝒊 k : número total de clases Ing. Mónica Rojas Ramírez, Mgtr. 8 Dispersión Datos No Agrupados Ing. Mónica Rojas Ramírez, Mgtr. 9 Varianza y desviación estándar, ejemplos y ejercicios La varianza y la desviación estándar son medidas de dispersión o variabilidad, es decir, indican la dispersión o separación de un conjunto de datos. Hay que tener en cuenta que las fórmulas de la varianza y la desviación estándar son diferentes para una muestra que para una población. 𝒇𝒊 : frecuencia absoluta de cada clase 𝒙𝒊 : Cada uno de los datos u observaciones. 𝒙 ഥ : media aritmética muestral 𝜇 : media aritmética poblacional N, n : número total de datos en 1.Se calcula la media. población y muestra 2.Se calcula la varianza. 3.Se calcula la desviación estándar, que es la raíz cuadrada positiva de la varianza. Ing. Mónica Rojas Ramírez, Mgtr. 10 Ejemplo 1: Calcular la varianza y la desviación estándar de los siguientes datos: 2, 4, 6 y 8 sabiendo que corresponden a una población. Solución: Nos indican que estos datos forman una población, por lo tanto, usaremos las fórmulas de varianza y desviación estándar para la población, teniendo en cuenta que tenemos 4 datos, es decir, N = 4. Empezamos calculando la media poblacional: Ahora calculamos la desviación estándar, Ahora calculamos la varianza poblacional: teniendo en cuenta que es la raíz cuadrada de la varianza. Ing. Mónica Rojas Ramírez, Mgtr. 11 Ejemplo 2: Calcular la varianza y la desviación estándar de los siguientes datos: 1, 3, 5, 7 y 9 sabiendo que corresponden a una muestra Solución: Nos indican que estos datos forman una muestra, por lo tanto, usaremos las fórmulas de varianza y desviación estándar para la muestra, teniendo en cuenta que tenemos 5 datos, es decir, n = 5. Empezamos calculando la media de la muestra: Ahora calculamos la varianza de la muestra: El valor de la varianza muestral, es de 10. Ahora calculamos la desviación estándar, teniendo en cuenta que es la raíz cuadrada de la varianza Ing. Mónica Rojas Ramírez, Mgtr. 12 Ejemplo 3: Calcular la varianza y la desviación estándar de los siguientes datos: 10, 12, 13, 16, 9, 8, 12, 8, 6, 16 sabiendo que corresponden a una población. Solución: Empezaremos calculando la media y la varianza usando las fórmulas de la población. Agregamos 2 columnas más a nuestra tabla para llegar a la forma de la varianza: En este caso, como tenemos muchos datos, recurriremos a una tabla para mantener el orden. Colocaremos los valores de los elementos de la población (xi) y sumaremos los valores. Teniendo en cuenta que tenemos 10 datos (N = 10), calculamos la media: Con el valor de la media, vamos en busca de la varianza poblacional: Ing. Mónica Rojas Ramírez, Mgtr. 13 Dispersión Datos Agrupados Sin intervalo (Variable discreta) Ing. Mónica Rojas Ramírez, Mgtr. 14 Varianza y desviación estándar de datos agrupados de variable discreta Si trabajamos con una tabla de frecuencias con datos agrupados de una variable discreta, es decir, la variable toma valores puntuales, no intervalos de valores, podemos calcular la varianza y la desviación estándar usando las fórmulas que veremos en esta clase. fi: frecuencia absoluta de cada valor, es decir, número de veces que aparece el valor en el estudio. xi: valor de los elementos de la población. σ2: varianza de la población. σ: desviación estándar de la población. μ: media poblacional. s2: varianza de la muestra. s: desviación estándar de la muestra. x̄: media de la muestra. k: número de clases. N, n : número total de datos en población y muestra Ing. Mónica Rojas Ramírez, Mgtr. 15 Varianza y desviación estándar de datos agrupados de variable discreta Tenemos siempre que fijarnos si estamos trabajando con datos que forman una población o con datos que forman una muestra, pues las fórmulas son diferentes. Podemos ver también que la fórmula de la varianza se presenta de 2 formas diferentes, puedes tomar cualquiera de ellas, obtendrás el mismo resultado. En los problemas, seguiremos los siguientes pasos: 1. Calculamos el número de elementos. 2. Calculamos la media. 3. Calculamos la varianza. 4. Calculamos la desviación estándar, que es la raíz cuadrada de la varianza. Ing. Mónica Rojas Ramírez, Mgtr. 16 Ejemplo 1: Calcular la varianza y la desviación estándar de las edades de una población de niños que asisten a una fiesta infantil. Y así obtenemos el número de elementos de la población (N). Solución: Para calcular la varianza y la desviación estándar, empezamos A continuación, calculamos la media poblacional calculando el número de elementos de la población: partiendo de su fórmula: En la tabla, sumamos las frecuencias fi: Ing. Mónica Rojas Ramírez, Mgtr. 17 En la tabla de frecuencias agregamos la columna xi · fi Ahora sí, calculamos la media poblacional: A continuación, recordamos la fórmula de la varianza de la población: Ing. Mónica MónicaRojas RojasRamírez, RamírezMgtr. 18 En la tabla, agregamos 3 columnas más, para buscar la expresión de la fórmula: Usamos la fórmula: El valor de la varianza de esta población es de 1,8 (años)2. Ten en cuenta que la varianza queda expresada en las unidades originales elevadas al cuadrado, por ello, nos quedaría en (años)2. Finalmente calculamos la desviación estándar, teniendo en cuenta que es la raíz cuadrada positiva de la varianza: El valor de la desviación estándar poblacional es de 1,34 años. Ing. Mónica Rojas Ramírez, Mgtr. 19 Dispersión Datos Agrupados por intervalo Ing. Mónica Rojas Ramírez, Mgtr. 20 Varianza y desviación estándar para datos agrupados por intervalos k: número de clases. fi: frecuencia absoluta de cada clase, es decir, el número de elementos que pertenecen a dicha clase. xi: marca de clase. Es el punto medio del límite inferior y del límite superior. σ2: varianza de la población. σ: desviación estándar de la población. μ: media de la población. s2: varianza de la muestra. s: desviación estándar de la muestra. x̄: media de la muestra. N, n : número total de datos en población y muestra Ing. Mónica Rojas Ramírez, Mgtr. 21 Varianza y desviación estándar para datos agrupados por intervalos Tenemos siempre que fijarnos si estamos trabajando con datos que forman una población o con datos que forman una muestra, pues las fórmulas son diferentes. En los problemas, seguiremos los siguientes pasos: 1.Calculamos el número de elementos. 2.Calculamos las marcas de clase. 3.Calculamos la media. 4.Calculamos la varianza. 5.Calculamos la desviación estándar, que es la raíz cuadrada de la varianza. Ing. Mónica Rojas Ramírez, Mgtr. 22 Ejemplo 1: Calcular la varianza y la desviación estándar de una población de niños a partir de la siguiente tabla: 2. Calcularemos las marcas de clase. Recordemos que la marca de clase xi, es el punto medio del límite inferior y el límite superior de cada intervalo. Se calcula con la siguiente fórmula: Agregamos una columna más a nuestra tabla para la Solución: marca de clase xi: En este caso, nos dicen que los datos pertenecen a una población de niños, por lo tanto, usaremos las fórmulas de la población. 1. Calculamos el número de elementos de la población N: Ing. Mónica Rojas Ramírez, Mgtr. 23 3. Calculamos la media poblacional µ: 4. Calculamos la varianza de la población: Agregamos una columna más a nuestra tabla, dónde colocaremos los valores de xi・fi: Agregamos más columnas a nuestra tabla, buscando la forma de la fórmula de la varianza: Aplicamos la fórmula: La media poblacional µ tiene un valor de 4 años. Ing. Mónica Rojas Ramírez, Mgtr. 24 Aplicamos la fórmula de la varianza de la población: Recuerda que la varianza queda expresada en unidades al cuadrado, por ello, nos queda en años al cuadrado. 5. Y último paso, calculamos la desviación estándar, recordando que es la raíz cuadrada positiva de la varianza. El valor de la desviación estándar poblacional σ es de 2,175 años. Ing. Mónica Rojas Ramírez, Mgtr. 25 Coeficiente de Variación Es una medida de dispersión relativa (libre de unidades de medida), permite comparar las dispersiones de dos distribuciones distintas, siempre que sus medias sean positivas. Generalmente se expresa en porcentaje y es útil para comparar dos o mas grupos de datos y determinar que grupo es mas homogéneo o tiene mayor dispersión. se define como el cociente de la desviación estándar entre la media aritmética. Su fórmula es la siguiente: Donde: σ: desviación estándar de la población. μ: media de la población. s: desviación estándar de la muestra. x̄: media de la muestra. Ing. Mónica Rojas Ramírez, Mgtr. 26 Ejemplo 1: Una población de alumnos tiene una estatura media de 160 cm con una desviación estándar de 16 cm. Estos mismos alumnos, tienen un peso medio de 70 kg con una desviación estándar de 14 kg. ¿Cuál de las 2 variables presenta mayor variabilidad relativa? Solución: Vamos a comparar la dispersión de 2 variables, la estatura y el peso, usando el coeficiente de variación. Podemos que ver que CVP > CVE , por eso, el peso de esta población de alumnos tiene mayor variabilidad relativa que la estatura. Ing. Mónica Rojas Ramírez, Mgtr. 27 Bibliografía: ✓ Lind, Marchal, Wathen (2012). Estadística Aplicada a los Negocios y la Economía. México: McGraw-Hill/Irwin ✓ Walpole, Myers, Myers (2012). Probabilidad y Estadística para Ingenierías y Ciencias. México: Pearson Educación. ✓ Levin, Rubin, Balderas, Del Valle, Gómez. Estadísticas para la Administración y Economía: Pearson Educación, Prentice Hall Ing. Mónica Rojas Ramírez, Mgtr. 28 Gracias Mónica Paola Rojas Ramírez Ingeniera en Estadística e Informática – ESPOL. Magister en Estadística Aplicada – UGR (Universidad de Granada – España) [email protected] mónica-paola-rojas-ramírez 29