Summary

This presentation introduces fundamental statistical concepts, including measures of central tendency and examples using data on financial transactions and loans.

Full Transcript

MEDIDAS ESTADÍSTICAS Medidas Medidas Medidas Medidas de de de de Tendenci Dispersió Posición Forma a n Central...

MEDIDAS ESTADÍSTICAS Medidas Medidas Medidas Medidas de de de de Tendenci Dispersió Posición Forma a n Central Media Aritmétic Medidas Rang Cuartile a simple de o s Asimetrí a Desviaci Medidas Median Decile ón de a Media s Apuntamien to Mod Varianz Percentile a a s Media Desviaci Ponderad ón a Estánda r MEDIDAS DE TENDENCIA CENTRAL Indican con alta precisión cual es el valor más cercano o Dan lugar a una central de la síntesis de la información para información considerarlo como el representante de toda la población MEDIA ARITMÉTICA SIMPLE O MEDIA ARITMÉTICA (PROMEDIO) Se calcula sumando todas 𝑆𝑢𝑚𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 las observaciones de un Media se 𝑀𝑒𝑑𝑖𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 = conjunto de datos, dividendo representa 𝑑𝑎𝑡𝑜𝑠 𝑥ҧ el total para el número de con elementos involucrados. Más o igual a Menos de 30 30 con con rango σ Datos No Datos rango igual menora o estrictament σ 𝑥𝑖. cinco e mayor a 𝑥 𝑥 unidades cinco Agrupados Agrupados unidades ҧ 𝑥 𝑖 ҧ 𝑓𝑖 EJEMPLO 1 DATOS N O AGRUPADOS: SE TIENEN LOS SIGUIENTES VALORES DE FACTURACIÓN EN MILES DE DÓLARES: 10, 3, 9, 7, 2. ¿CUÁL ES EL MONTO DE VENTAS PROMEDIO? 𝑥ҧ σ 𝑥𝑖= 10 + 3 + 9 + 7 +=2 = 6.2 𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 𝑑ó𝑙𝑎𝑟𝑒𝑠 = 𝑁 31 = 5 5 $6200 EJEMPLO 2 DATOS AGRUPADOS: LA DISTRIBUCIÓN DE FRECUENCIAS DE LA TABLA SIGUIENTE MUESTRA LOS DATOS DE LAS CANTIDADES DE 40 PRÉSTAMOS PERSONALES. OBTENER EL MONTO PROMEDIO DE fi PRÉSTAMOS. Cantidad Número de xi fi.xi de Préstamos σ 𝑓𝑖𝑥𝑖 44400 𝑥ҧ = = = Préstamo 300 + 𝑁 40 $300 – 700 13 500 6500 700 /2 $1110 700 – 1100 11 900 9900 1100 – 1500 6 1300 7800 1500 – 1900 5 1700 8500 1900 – 2300 3 2100 6300 2300 – 2700 1 2500 2500 2700 – 3100 1 2900 2900 40 44400 MEDIA PONDERADA ◾ En tres cursos de un mismo nivel los promedios de las calificaciones fueron 5.6; 6.1 y 4.9; si los cursos tenían 𝑥1 ∙ 𝑛1 + 𝑥2 ∙ 𝑛2 + … respectivamente 34; 30 y 36 alumnos, 𝑥ҧ + 𝑥𝑝 ∙ 𝑛𝑝 𝑛1 + 𝑛2 + … + determine la calificación promedio de los 3 = 𝑛𝑝 5.6 34 + 6,130 + (4,9) 549, cursos. 𝑥ҧ (36) = 8 = 5,498 ≈ 34 + 30 + 10 = 5,5 36 0 El promedio de las calificaciones de los tres cursos es 5,5 MEDIANA Es el valor que se No se ve afectada Deben estar encuentra en el por ordenados en Su símbolo es centro de una observaciones forma creciente o secuencia extremas en un Me. decreciente. ordenada de datos conjunto de datos Datos: 4, 7, 5, 6, 3, 2, 7 𝑀𝑒 = La mediana es el Muestr 𝑥𝑛+1 2 dato que se Datos Ordenados: 2, 3, 4, 5, 6, 7, as encuentra en el centro de dicha 7 𝑀𝑒 = 𝑥𝑛+1 = 𝑥4 = 5 n= impare 1, 3, 5, 7, 9, 11, 13, 15, ordenación. s 2 17, 35, 19, 37, 21, 39, 23, 41, 25, 43, 27, 45, 29, 47, 31, agrupados Datos No 49, 33, 67, 51, 69, 71, 73, 53, 55, 75, 77, 57, 59, 61, 79, 63, 83, 65, 81, 85, 87, 89, 91, 93, 95, Datos: 12,15, 14, 16, 11, 10, 10, 𝑥𝑛+ 97, 99. 13 𝑥2𝑛+1 𝑀𝑒 2 2 Muestr = La mediana es el promedio de los Datos Ordenados: 16, 15, 14, 13, 12, as datos centrales 11, 10, 10 13 + 𝑀𝑒 𝑥4+ = 12 = pares = 12,5 n= 2, 4, 6, 8, 10, 12, 14, 16, 𝑥5 2 18, 38, 20, 40, 22, 42, 24, 44, 26, 46, 28, 48, 30, 50, 32, 52, 34, 2 54, 36, 74, 56, 76, 58, 78, 60, 80, 62, 82, 64, 84, 66, 86, 68, 88, 70, 90, 72, posición 92, 94, 96, 98 y 100 MEDIANA PARA DATOS AGRUPADOS 𝑛 𝑀𝑒 = 2 𝑖− Posición anterior Cantidad Número Fi xi fi.xi 𝑓 1 − 𝐹 de Fi ( frecuencia 𝐿𝑖 + ∙ absoluta de de 𝑖 acumulada) Préstamo Préstamo s fi $300 – 700 13 13 500 6500 i = primer intervalo cuya frecuencia acumulada 700 – 1100 11 24 900 9900 n/ supera a 1100 - 700 1100 – 1500 6 30 1300 7800 =400 Li 2 = es el límite real inferior del intervalo de la 1500 – 1900 5 35 1700 8500 mediana 1900 – 2300 3 38 2100 6300 𝐹𝑖−1 = frecuencia acumulada anterior al n = número de datos 2300 – 2700 1 39 2500 2500 2700 – 3100 1 40 2900 2900 𝑛 intervalo de la mediana 2 ≤ fi = frecuencia absoluta del intervalo de la 40 44400 𝑛 𝐹𝑖 = = 20 ≤ 2 40 mediana 24 40 a = amplitud del intervalo −1 2 intervalo: i 𝑀𝑒 = 700 2 3 ∙400 = 11 + $954.55 2° =2 a = 400 F1 = 13 f3 = 6 L6 = 699.50 MODA La Moda es el valor de un conjunto de datos que aparece Datos No Agrupados con mayor frecuencia. Datos: 2, 4, 5, 6, 7, 7, 8, 7, 6 Se obtiene fácilmente a partir de un arreglo Mo = 7 ordenado. Datos: 1,1,3, 1, 1, 2, 2, 4, 2, 3, 2, No se afecta ante la ocurrencia de valores 5, 6 extremos Mo = 1 y 2 Datos: 0, 0, 2, 3, 4, 5 Sólo se utiliza la moda para propósitos descriptivos porque es más variable para distintas Mo = 0 muestras. Datos: 0, 1, 2, 3, 4, 5 Un conjunto de datos puede tener más de una Mo = No existe moda o ninguna. MODA PARA DATOS AGRUPADOS fi Cantidad Número Fi xi fi.xi fi de de i = intervalo Li = es el límite más alta Préstamo Préstamo s de mayor real inferior del $300 – 700 13 13 500 6500 frecuencia intervalo de la 700 – 1100 11 24 900 9900 absoluta moda 1100 – 1500 6 30 1300 7800 𝑑 𝑀𝑜 = 𝐿𝑖 1500 – 1900 5 35 1700 8500 𝑑11+ ES DECIR, fi + ∙ Intervalo que se 1900 – 2300 3 38 2100 6300 𝑑2 repite más veces 2300 – 2700 1 39 2500 2500 2700 – 3100 1 40 2900 2900 d1 = fi – fi-1 d2 = fi – fi+1 𝑀𝑜 = 300 ∙400 = 13 40 44400 13+ + a = amplitud 2 Posición siguiente Posición anterior de Fi ( frecuencia de Fi ( frecuencia absoluta del intervalo absoluta $646.67 acumulada) acumulada) MEDIA GEOMÉTRICA ◾ La media geométrica es un tipo de media que se calcula como la raíz del producto de un conjunto de números estrictamente positivos. ◾ Todos los valores se multiplican entre sí. De modo que si uno de ellos fuera cero, el N: Número total de producto total sería cero. observaciones. ◾ Uno de sus principales usos es para calcular x: La variable X sobre la que se medias sobre porcentajes, pues su cálculo calcula la media geométrica. ofrece unos resultados más adaptados a la i: Posición de cada observación. realidad. MEDIDAS DE POSICIÓN Las medidas de posición relativa se llaman en general cuantiles Se clasifican en tres grandes grupos: Cuartiles, quintiles, deciles, percentiles. Las medidas de posición dividen a una distribución ordenada en partes iguales. Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor. CUARTILES (QK ) Son los tres valores de la Ejemplo: Calcular Q3 entre los siguientes datos variable de una distribución 3, 5, 2, que la dividen en cuatro 7, 6, 4, 9 partes iguales Paso 1: Ordenar los datos ascendentemente 25% 50% 2, 3, 4, 5, 6, 7, 9 75% Paso 2: Calcular la posición de Q3 Q3 = 3(7/4) = 21/4 = 𝑄número 𝑘 = 𝑘(de4)quartil 𝑛 5,25 Paso 3: Calcular Q3 = 6+7 = Q3 2 6.5 Q k = Cuartil número 1, 2, 3 ó 4 n = total de datos de la distribución La posición del segundo cuartil corresponde a la ubicación de la mediana: Q2 = Mediana 0% 25% 50% 75% 100% CUARTILES PARA DATOS AGRUPADOS Li = límite real inferior de la clase donde se encuentra el cuartil. N = tamaño de la muestra o población Fi-1 =frecuencia acumulada anterior a la clase del cuartil. ai = la amplitud de la clase. Q1 16.25 ≤ Fi 16.25 ≤ 18 DECILES Y PERCENTILES Desde D1 hasta D9 Desde P1 hasta P99 Percentile Decile D5 = Mediana P50 = Mediana No agrupados Pn = kn/100 No agrupados Dn = kn/10 s 𝐾𝑛 𝐾𝑛 10 𝑖−1 1 𝑃𝑛 = 𝐿𝑖 s 𝑖−1 𝐷𝑛 = 𝐿𝑖 + 0− 𝐹 𝑓 ∙ 0 𝐹𝑓 − Agrupados + 𝑖 Agrupados ∙ 𝑖 MEDIDAS DE FORMA MEDIDAS DE ASIMETRÍA O SESGO MEDIDAS DE APUNTAMIENTO O KURTOSIS MEDIDAS DE ASIMETRÍA O SESGO Permite identificar y describir la manera cómo los datos tienden a reunirse de acuerdo Tipos de con la frecuencia con que se hallen dentro de la distribución. Asimetría Asimetría Simétrica Asimetría Negativa o Cuando los datos Positiva o a la la se distribuyen derecha Permite identificar las izquierda aproximadamente Cuando la características de la a ambos lados Cuando la de la media minoría de los distribución de datos sin 𝑥ҧ = 𝑀𝑑 = minoría de los aritmética. datos están en la 𝑀𝑜 necesidad de generar datos están en la parte derecha de parte izquierda de la media gráfico. 𝑥ҧ < 𝑀𝑑 < 𝑥ҧ > 𝑀𝑑 > la media. aritmética. 𝑀𝑜 𝑀𝑜 COEF. < 0 COEF. = 0 COEF. > 0 COEFICIENTE DE ASIMETRÍA DE PEARSON Horas Número Se calculan las siguientes 𝑆𝑘1 = 𝜇 − 𝑀𝑜 3(𝜇 − de de = 𝑀𝑒) auditor empresas medidas con las fórmulas 𝜎 𝑆𝑘2 ía 𝜎 0 – 24.9 2 revisadas en clase: 25 – 49.9 4 μ = 87.45 50 – 74.9 12 Me = 89.12 75 – 99.9 30 Mo = 89.95 100 – 124.9 18 σ = 26.73 125 – 149.9 4 3(87.45 − 𝑆𝑘 = 87.45 −89.95 𝑆𝑘2 89.12) = = 26.7 = −0.187 Sesgo a la 26.73 1 3 izquierda −0.094 MEDIDAS DE APUNTAMIENTO O KURTOSIS Apuntamiento es el grado de concentración alrededor de la media Coeficiente de Fisher Datos Agrupados Datos No agrupados Permite identificar las características Si α < 3 ? la distribución es platicúrtica de la Si α = 3 ? la distribución es normal o distribución de mesocúrtica datos sin necesidad de Si α > 3 ? la distribución es leptocúrtica generar gráfico. EJEMPLO DE KURTOSIS Horas Número xi xi.fi (xi-𝒙ഥ)^4 fi(xi-𝒙ഥ)^4 de de σ = 26.73 auditor empresas ía 125000000 0 – 24.9 2 12.45 24.9 31640625 63281250 𝛼 = = 70(26.73)4 25 – 49.9 4 37.45 149.8 6250000 25000000 50 – 74.9 12 62.45 749.4 390625 4687500 3.5 75 – 99.9 30 87.45 2623.5 0 0 100 – 124.9 18 112.45 2024.1 390625 7031250 125 – 149.9 4 137.45 549.8 6250000 25000000 70 6121.5 125000000 6121. 𝑥ҧ 5 = LEPTOCURTIC 7 = 87.45 A 0 Característica s Evolución del Cuantificación Análisis Estadísti de la Covarian co za Se cuantifica a Coeficientes que integran en un nivel descriptiva e valor estimado, información con inferencial respecto a la varianza conjunta entre dos variables El nivel de Análisi Objetivo: Definir la magnitud sentido de y el la relación covarianza de dos s entre lasvariabl variables Bivaria es Se determina do Análisis conjunto de las la varianzas de dos variables (X y relación entre variabl Y) permite identificar la las es relación empírica entre éstas El análisis bivariado busca someter a contrastación la tesis de asociación y hasta causalidad entre dos variables definidas. VariablesDependientes e Independientes Variable Variable Independiente Dependiente Es el resultado que se medirá, como el grado Es una variable “controlada y desangre la azúcarque en se obtendrá luego de conocida”en manipula queel se administrar un medicamen estudio. to. Será un valor o serie de Ejempl conocidos y valores o Los efectos del consumo de carbohidratos en el peso de los manipulables. Ejemplo: la medida de la dosis de un jóvenes: independiente: La cantidad de carbohidratos Variable que se suministrará en medicamento que se cree que ayuda a los gramos. La variable dependiente: el peso de los diabéticos a regular el azúcar de sangre. chicos.. Analizar el efecto que un plan de entrenamiento basado en la técnica Facilitación Neuromuscular Propioceptiva (FNP) (variable independiente) produce sobre la movilidad articular de la cadera (variable dependiente). Supuestos teóricos considerados Los cambios en una variable (X) no se asocian con cambios en una variable (Y) que permanece constante Si una variable variar La inferencia se basará en el uso de la deja de se función de distribución t para convierte en unaante determinar la probabilidad de error al const tomar de nulidad la de decisión la de aceptar la No se puede hablar hipótesis relación. ausencia de de Distribución de los datos covarianza bivariadosde comporta semanera normal Variabilidad propia de cada Cont aste de variable r hipótesis Supuesto s Representación gráfica de una relación Bivariad a La representación gráfica de las correlaciones obedece a los principios del análisis matemático de funciones La representación de funciones parte de la noción clave del sistema de coordenadas cartesianas. Se encuentra conformado fundamentalmente por dos ejes: el eje de las abscisas (X) y el eje de las ordenadas (Y) Representación gráfica de una relación Bivariad a Noción de El punto es la mínima punto expresión de una línea. La línea que IV describe el comportamiento de un IV conjunto de puntos se define III por una función. III Toda función se define como una relación entre variables, entonces el punto define la mínima expresión Cada pareja de una ordenada (x, relación entre variables y) le corresponde (x, y) un punto del plano, y viceversa. 6 Gráficos de funci una ón Si m >0 la recta es CRECIENTE Si m

Use Quizgecko on...
Browser
Browser