Introducción a la Estadística I PDF

Document Details

CourtlyVitality2041

Uploaded by CourtlyVitality2041

Universidad de Guayaquil

Ingrid Giraldo Martínez

Tags

statistics introduction to statistics statistical methods data analysis

Summary

This document is an introduction to statistics. It covers the history, origins, and fundamental concepts of statistics, including data collection, analysis, and interpretation. The document also includes examples and methodology for different aspects of statistics.

Full Transcript

INTRODUCCIÓN A LA ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ, MSC NATURALEZA Y DEFINICIÓN DE LA ESTADÍSTICA Comienzos de la Representaciones Símbolos en pieles, civilización gráficas rocas, madera y...

INTRODUCCIÓN A LA ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ, MSC NATURALEZA Y DEFINICIÓN DE LA ESTADÍSTICA Comienzos de la Representaciones Símbolos en pieles, civilización gráficas rocas, madera y paredes de cuevas Datos sobre producción agrícola Pequeñas tablillas de 3000 A.C. Babilonios arcilla Géneros vendidos o cambiados mediante trueque Orígenes 594 A. C. Griegos Censos Para cobrar impuestos Siglo X X X I A.C. D atos de la población Censos de población Egipcios y renta del país de Israel Censos ordenados Chinos – 2200 A. C. por el Emperador Tao La superficie y la renta Recopiló datos de la de todos los Imperio Romano territorios bajo su población control Europa (Edad Media) 758 A.C. y 762 A.C. Inglaterra (1086) Alemania (1691) España (Siglo XVI) Estudios de las propiedades de la Iglesia Estudios sobre la tasa de Rey Guillermo I mortalidad Reportes de impuestos católica Censo Registro de nacimientos y defunciones 1662 Prime estudio estadístico de la población ETIMOLOGÍA DE LA PALABRA ESTADÍSTICA Necesidad de Necesidad de Administración Juego en el datos acopiar y de los estados siglo XVII numéricos en analizar datos Recopilación y análisis los Estados numéricos Recreación de las Impulsó a desarrollar de los datos relativos Sociedad medieval en noblezas de Inglaterra métodos para facilitar a la población y a la la Europa O ccidental y Francia la labor riqueza Información sobre los Juegos deAzar que recursos del país: Comenzó a utilizarse Considerado condujo al desarrollo número de enAlemania como importante hasta la de la teoría de las ciudadanos de las “Statistik” era moderna probabilidades ciudades,condados o provincias INTRODUCCIÓ N A LA ESTADÍSTICA Tareas principales de la Estadística Estadística Nace de las necesidades reales del hombre Reunir información integrada por un Necesaria para la toma de conjunto de datos decisiones Importante herramienta de Obtener conclusiones del trabajo comportamiento de éstos Hacer inferencia sobre comportamientos futuros USO Y APLICACIÓN DE LA ESTADÍSTICA Control de la Relaciones Finanzas Política Ciencias Investigación Toma de Productividad Comerciales Sociales decisiones y la Calidad CONCEPTOS DE ESTADÍSTICA Webster’s New Rama de las matemáticas que estudia la recolección, análisis, College Dictionary interpretación y presentación de masas de información numérica. Estadística es la rama del método científico que estudia los datos Stuart y Ord obtenidos por contar o medir las propiedades de poblaciones. Se ocupa esencialmente de procedimientos para analizar Rice información, en especial aquella que en algún sentido vago tenga un carácter aleatorio. DEFINICIÓN DE ESTADÍSTICA Ciencia Permite tomar Recolecta y decisiones organiza acertadas y a tiempo Estadística Conocer Presenta, características analiza e sobre el comportamiento interpreta de algún suceso o datos evento numéricos Facilitar la solución de problemas TIPOS DE LA ESTADÍSTICA Estadística Descriptiva o Deductiva Se utiliza en la descripción y análisis de conjuntos de datos o población. Tablas,gráficas cuadros y modelos Estadística Inferencial o Inductiva Hace posible la estimación de una característica de una población o la toma de una decisión con respecto a una población, con base en resultados muestrales. PROCESO DE LA ESTADÍSTICA DESCRIPTIVA Obtención de parámetros estadísticos Representación gráfica de los Números que sintetizan los aspectos resultados más relevantes de una Elaboración de distribución estadística tablas de frecuencia Obtención del valor Clasificación de los individuos dentro de de cada individuo cada característica en los caracteres Selección de seleccionados características o Mediante encuesta o caracteres a ser medición estudiados RECOPILACIÓN DE DATOS ESTADÍSTICOS Técnicas de Reunir,recoger o unir investigación Escalas actitudinales y ciertos datos de una documental, encuesta, opiniones población cuestionario,entrevista, test Validez y confiabilidad ORGANIZACIÓN DE DATOS RECOPILADOS Clasificación Organización Agrupación Tabulación Corrección cuidadosa Datos agrupados Elementos semejantes Cronológica son enumerados Registrados de acuerdo Geográfica Omisiones Datos No agrupados a la clasificación seleccionada Cuantitativa Inconsistencia Cualitativa Cálculos Respuestas irrelevantes PRESENTACIÓN DE DATOS ORGANIZADOS Escrita o mediante enunciados Cuadros o tablas estadísticas Gráficas o diagramas estadísticos C onveniente para presentar pocas Da al lector solo un valor aproximado de los Da al lector un valor exacto de los hechos características hechos Diagramas de punto Descriptivo Frecuencia relativa Polígonos Histórico Frecuencia absoluta Ojiva Informe Diagramas de pastel Resumen ANÁLISIS DE LOS DATOS PRESENTADOS Análisis Análisis de Inducción Análisis de Estadístico Tipo paramétrico Series de Estadística Relaciones Simple Descriptivo Tiempo Descriptivo:analiza Medir los cambios en Probabilístico Analiza una población individualmente cada las actividades de los o un universo pregunta y luego en negocios forma conjunta Sistemático:Estudia el problema en a los Basado en el Dentro de varios resultados del análisis Tipo No paramétrico muestreo períodos descriptivo para interrelacionar cada variable Análisis e identificación de la problemática:Base para identificar diferentes promedios INTERPRETACIÓN DE LOS DATOS ANALIZADOS Relacionar la Interpretación de información Conclusiones Tomar los datos analizados recopilada con la válidas del estudio decisiones teoría correctas Tipo de análisis aplicado Resultados obtenidos ALCANCES Y APLICACIONES DE LA ESTADÍSTICA Área Financiera Área de Área deVentas Área de Calidad Área de Área de costos Área de Producción Distribución Auditoría Métodos de Problemas de Prever las ventas: muestreo Estimaciones Inversiones de diseño y productos Distribución del Tendencia de aplicados por porcentuales o capital estructura de una conocidos o ingreso costo anual investigadores de valor fábrica nuevos mercado Encuestas sobre Factores de Evaluación de preferencias del producción: poblaciones: Proyección Tamaño y Estudio de nuevos consumidor sobre trabajo,tierra, Prevenir y estimar inventarios y financiera localización mercados ciertas marcas de capital y habilidad costos a futuro deudas productos de la competencia empresarial incobrables Inventario, Estudiar los Oferta y demanda Manejo de la Pérdidas y programación y mercados de control de de productos utilidad Ganancias capital producción Desarrollar planes sólidos de financiamiento e Tráfico y manejo inversión a largo de materiales plazo ABUSOS DE LA ESTADÍSTICA Supuestos falsos Sesgo del usuario Indicación falsa de relación Comparación impropia Errores matemáticos Datos inadecuados Conclusiones falsas Datos no comparables ABUSOS DE LA ESTADÍSTICA (II) El razonamiento Los datos Datos ilógico y Propensión = estadísticos no Descuidos de Datos suficientes pero superficial o uso Falsedad se obtienen de omisión insuficientes no indebido de los la nada representativos datos Grado muy alto Cuidado y de Destruyen el Desacreditación Deben atención en incertidumbre C onclusiones valor de un del todo el reducirse al todos los respecto a sin valor estudio trabajo mínimo detalles cualquier conclusión Los datos deben tener Prestigio de la algún valor y no persona rechazarse sin causa alguna ESTADÍSTICA I Presentación de la Información Estadística Datos NO agrupados Distribuciones de Frecuencia para variables cuantitativas Datos Agrupados Gráficos de Puntos Datos NO agrupados Gráficos de Líneas Presentación de la información estadística Gráfico Acumulativo Histogramas Datos Agrupados Representación gráfica de las Polígonos distribuciones de frecuencia Pictogramas Gráfico de barras De disco Otros tipos de gráficas para Circulares variables cualitativas De Pastel De área y volumen Mapas estadísticos TABULACIÓN DE LOS DATOS Experimentos Distribución Estadísticos de Frecuencia Población N = Tamaño de la Población Estudiada Tabla de resumen en la que Muestra se disponen los datos n = Tamaño de la muestra (parte de divididos en grupos la población) ordenados numéricamente que se denominan clases o categorías Rango Diferencia entre el valor mayor y el valor menor de los datos numéricos DATOS NUMÉRICOS Datos No agrupados Frecuencia Función Agrupados En el sentido matemático de Más de 30 con Menos de 30 con que hay una rango Número de veces rango menor o correspondencia estrictamente que ocurre un igual a cinco entre los datos y mayor a cinco dato unidades el número de unidades veces que ocurren estos DISTRIBUCIÓN DE FRECUENCIA Organizar los Distribución de Tabla de Frecuencia datos en un listado frecuencia o en grupos Tipos de distribución de N < 30 Datos no Simple agrupados frecuencia Rango ≤ 5 N ≥ 30 Intervalos Datos agrupados Rango > 5 TABULACIÓN DE DATOS NO AGRUPADOS Tabla Tamaño de la muestra (n) Frecuencia Absoluta (fi) Muestra el número de casos en Cantidad de elementos que Número de veces que se repite cada categoría conforman la muestra una variable 𝑛 = σ𝑚𝑖=1 𝑓𝑖 Frecuencia Relativa (hi) Frecuencia Absoluta Frecuencia Relativa Es la proporción de los datos Acumulada (Fi) Acumulada (Hi) que se encuentran en una clase Indica la cantidad de datos que Es la proporción de datos 𝑓𝑖 ℎ𝑖 = , 𝑑𝑜𝑛𝑑𝑒 σ ℎ𝑖 = 1 se encuentran hasta cierta clase acumulados que se encuentran 𝑛 hasta cierta clase 0 ≤ hi ≤ 1 𝐹𝑖 = σ𝑖𝑗=1 𝑓𝑗 𝐻𝑖 = σ𝑖𝑗=1 ℎ𝑗 EJEMPLO: El director del programa de capacitación de cierta empresa tiene 16 solicitudes para su admisión al próximo período. Las calificaciones de la prueba aplicada a los solicitantes son: 26 27 27 28 27 25 26 28 27 28 26 28 25 27 25 26 Rango = Xmax – Xmin Rango < 5 Datos NO agrupados Rango = 28 – 25 = 3 Calificaciones Solicitantes Fi hi Hi xi fi 25 3 3 3/16 = 0,1875 0,1875 26 4 7 4/16 = 0,2500 0,4375 27 5 12 5/16 = 0,3125 0,7500 28 4 16 4/16 = 0,2500 1,000  16 1,0000 TABULACIÓN DE DATOS AGRUPADOS Rango o Recorrido → R = Xmáx - Xmín Frecuencia Absoluta (fi) → σ𝑚 𝑖=1 𝑓𝑖 Número de intervalos o clases → m = 1 + 3,3log(n), donde n es el número de datos de la muestra 𝑓𝑖 Frecuencia Relativa (hi) → ℎ𝑖 = 𝑛 𝑅𝑒𝑐𝑜𝑟𝑟𝑖𝑑𝑜 𝑅 Amplitud (a) → 𝑎 = 𝑁º 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 = 𝑚 Frecuencia Absoluta Acumulada (Fi) → Límites reales de un intervalo: Promedio entre Límite superior 𝐹𝑖 = σ𝑖𝑗=1 𝑓𝑗 de una clase y el Límite inferior de la siguiente clase. Frecuencia Relativa Acumulada (Hi) → 𝐻𝑖 = Marca de clase (Xi): Es el punto medio de un intervalo σ𝑖𝑗=1 ℎ𝑗 EJEMPLO: Las comisiones ganadas por ocho miembros del equipo de ventas en una cierta empresa, durante el primer trimestre del año en dólares, fueron: 1550 1495 1810 1480 1630 1810 1650 1590 1990 1765 Montos de las xi fi Fi hi Hi comisiones 1490 1880 1475 1625 1875 1545 1515 1560 1760 1485 1400 – 1500 1450 6 6 6/30 6/30 1642 1500 1815 1468 1540 1510 1655 1595 1910 1540 1500 – 1600 1550 10 16 10/30 16/30 1600 – 1700 1650 5 21 5/30 21/30 Organice los ingresos mensuales en una distribución de frecuencias 1700 – 1800 1750 2 23 2/30 23/30 utilizando de $1400 hasta $1500 como la primera clase. 1800 – 1900 1850 5 28 5/30 28/30 1900 – 2000 1950 2 30 2/30 30/30 Organice los ingresos mensuales en una distribución de frecuencias TOTAL 30 30/30 = 1 utilizando la regla de Sturges K = 1+3.3Log N N = 30 Sin límites reales Con límites reales K = 1 + 3.3 Log (30) K = 5.9187  6 clases Montos de las fi Montos de las fi comisiones comisiones 𝑅𝑎𝑛𝑔𝑜 522 Tamaño de la clase = = = 87 1468 – 1554 13 1468 – 1555 13 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 6 Rango = 1990 – 1468 = 522 1555 – 1641 5 1555 – 1642 6 1642 – 1728 3 1642 – 1729 2 1729 – 1815 5 1729 – 1816 5 1816 – 1902 2 1816 – 1903 2 1903 – 1990 2 1903 – 1990 2 TOTAL 30 TOTAL 30 TABULACIÓN DE DATOS AGRUPADOS: EJERCICIO Los siguientes datos corresponden a las notas obtenidas por 100 alumnos en un curso de Estadística: 100 87 54 82 93 47 40 53 88 58 a. Construya la correspondiente distribución de 84 65 57 66 25 70 85 36 61 34 frecuencia: 33 33 100 69 77 88 63 17 42 55 b. ¿En qué clase se concentra el mayor número de notas 98 70 68 70 65 70 84 52 60 54 c. ¿Cuál es la frecuencia absoluta del cuarto intervalo? d. ¿Qué porcentaje de los alumnos tienen una nota 57 47 57 86 25 66 40 100 32 39 inferior a 57? 90 83 64 95 85 100 67 60 42 65 e. ¿ Qué porcentaje de los alumnos tienen una nota 82 85 62 72 65 76 23 96 30 45 superior a 46? 77 55 100 80 55 52 85 68 53 82 f. Interprete la frecuencia absoluta acumulada del sexto 55 51 47 47 64 75 65 60 45 75 intervalo g. Interprete la frecuencia relativa acumulada del quinto 62 93 98 58 95 83 33 70 51 60 intervalo ESTADÍSTICA I Representación Gráfica de las Distribuciones de Frecuencia REPRESENTACIÓN GRÁFICA  Su objetivo es captar la información obtenida en los datos en forma rápida por cualquier persona  Cada representación debe llevar un título adecuado  Las normas en la construcción de gráficas estadísticas son similares a los de gráficos de funciones  Las variables independientes se ubican en las abscisas y las dependientes en las ordenadas  En la rotulación de los ejes se utiliza tipografía legible.  La leyenda se ubica dentro de los límites de la gráfica.  La longitud de los ejes debe ser suficiente para acomodar la extensión de la Barra TIPOS DE GRÁFICAS Datos No Agrupados Histogramas Otro tipo de gráfica Frecuencias Datos Agrupados Diagrama de absolutas, Puntos relativas y Frecuencias Frecuencias Acumuladas Absolutas (fi) y Polígono de Diagramas circulares Relativas (hi) Frecuencia Diagrama de Líneas Frecuencia Pictogramas absoluta Ojiva acumulada Gráfica de la Frecuencias distribución de Acumuladas (Fi y Hi) frecuencias Mapas estadísticos acumulativas Frecuencia relativa Ojiva acumulada porcentual DIAGRAMA DE PUNTOS Una gráfica de puntos muestra cada elemento de un conjunto de datos numéricos por encima de una recta numérica, o eje horizontal. Facilitan ver los espacios vacíos y los agrupamientos en un conjunto de datos, así como la manera en que se distribuyen los datos a lo largo del eje. INVESTIGACIÓN: UNA MIRADA AL PULSO SANGUÍNEO EN ESTA INVESTIGACIÓN SE USAN DATOS SOBRE RAPIDEZ DE PULSO. EL PULSO VARÍA DE UNA PERSONA A OTRA, PERO POR LO GENERAL, EL PULSO DE UNA PERSONA SALUDABLE EN REPOSO SE MANTIENE ENTRE CIERTOS VALORES. UNA PERSONA CON UN PULSO MUY RÁPIDO O MUY LENTO PODRÍA NECESITAR ATENCIÓN MÉDICA. Este conjunto de datos refleja los pulsos, expresados en pulsaciones por minuto (ppm), de un grupo de 30 estudiantes. Categorías fi Para hacer una gráfica de puntos sobre los pulsos, Por cada valor del conjunto de datos, colocar 56 2 primero traza una recta numérica con el valor un punto sobre el valor en la recta mínimo, 56, en el extremo izquierdo. numérica. 60 2 Seleccionar una escala y marcar intervalos iguales Cuando un valor aparece más de una vez, apila 64 3 hasta que alcances un valor máximo de 92. los puntos. 68 6 72 5 76 4 80 4 84 2 88 1 92 1 30 GRÁFICO BARRA O DIAGRAMA DE LÍNEA fi 140 120  Se utiliza para representar tablas de frecuencia con 100 80 atributos o con variables discretas y pocos valores 60 40  Sobre el eje horizontal se construyen bases de 20 rectángulo del mismo ancho cada uno 0 A B C D E correspondiente a una modalidad del atributo, sobre fi estas bases se levantan rectángulos cuya altura es proporcional a la frecuencia absoluta de la modalidad  El espacio entre ellas debe ser uniforme  Las barras pueden ser horizontales o verticales EJEMPLO DE DIAGRAMA DE BARRAS Activos de la Compañía de  La cantidad de activos en las compañías de seguros Seguros de vida en un cierto país, al final de cada año de 2004 Activoss de la Compañía de Seguros a 2014, está dada en la tabla siguiente: 2014 149470 Final del año Activos Final del año Activos 2013 141121 2012 133291 2004 84.486 2010 119.576 2011 126816 2010 119576 2005 90.432 2011 126.816 2009 113650 2008 107580 2006 96.011 2012 133.291 2007 101309 2007 101.309 2013 141.121 2006 96011 2005 90432 2008 107.580 2014 149.470 2004 84486 2009 113.650 GRAFICA DE LA DISTRIBUCIÓN DE FRECUENCIAS ACUMULATIVAS  Se obtiene a partir del acumulamiento del gráfico de línea  Se trata del desplazamiento vertical respectivo de cada una de las líneas (barra) de los valores de los datos  Correspondencia de los datos y sus frecuencias acumuladas respectivas manteniéndose el gráfico horizontal constante entre dato y dato. EJEMPLO DE GRÁFICA ACUMULATIVA  En una prueba de habilidad psicomotora resultaron Categoría fi Fi las puntuaciones, indicadas en la siguiente gráfica: 18 2 2 19 1 3 4 20 3 6 21 1 7 3 22 2 9 23 4 13 2 24 1 14 28 1 15 1 29 2 17 30 1 18 18 20 22 24 26 28 30  Dibújese la gráfica acumulativa Categoría fi Fi 18 2 2 19 1 3 20 3 6 18 21 1 7 22 2 9 16 23 4 13 14 24 1 14 28 1 15 12 29 2 17 30 1 18 10 8 6 4 2 18 20 22 24 26 28 30 HISTOGRAMA  Adecuado cuando los datos están ordenados en Histograma tablas con intervalos (variables continuas) 12  Es una conformación de rectángulos, pero el uno al 10 lado del otro, cuya área es proporcional a la 8 frecuencia de cada intervalo 6  Los extremos de la base de cada rectángulo son los límites reales del intervalo 4 2 Frecuencias Absolutas Frecuencias Acumuladas 0 Histogramas 4,5 -8,5 8,5 - 12,5 12,5-16,5 16,5-20,5 20,5-24,5 24,5-28,5 Frecuencias Relativas Frecuencias Relativas Acumuladas Serie 1 EJEMPLO DE HISTOGRAMA Importaciones  Las importaciones anuales de un grupo selecto de comerciantes de artículos básicos se muestran en la siguiente distribución de frecuencias: Importaciones Número de (millones $) comerciantes 2–5 6 5–8 13 8 – 11 20 11 – 14 10 14 – 17 1 POLÍGONO DE FRECUENCIA  Sirve para mostrar la tendencia de la variable  Se puede determinar a partir del histograma, uniendo los puntos medios superiores de cada rectángulo del histograma  Se determina el polígono uniendo los puntos formados por la marca de clase con la frecuencia absoluta del intervalo respectivo Frecuencias Absolutas Frecuencias Absolutas Polígono Acumuladas Frecuencias Relativas Frecuencias Relativas Acumuladas OJIVA  Se utiliza para mostrar como se acumulan las frecuencias absolutas, relativas o porcentuales  Se obtiene al unir los puntos formados por los límites superiores de cada intervalo con la frecuencia absoluta o relativas acumuladas del intervalo respectivo  Si se consideran las frecuencias acumuladas se llama OJIVA PORCENTUAL. GRÁFICO CIRCULAR  Llamada también diagrama de pastel PERSONAL POR DEPARTAMENTO A (1) B (2) C (3) D (4) E (5)  Representar distribuciones de razones o variables cualitativas 9% 15%  El círculo total es dividido en partes en formas de cuña por medio del trazado de razones 15% (proporciones)  Se multiplica el porcentaje de cada componente por 360. 28%  Empezando en la parte superior, se marcan los grados para cada componente sucesivamente en la 33% dirección de las manecillas del reloj EJEMPLO DE DIAGRAMA CIRCULAR Los porcentajes de estudiantes matriculados en cursos de estadística elemental que están en diversos campos Estudiantes matriculados en cursos de académicos son: estadística elemental por campos disciplinarios Ciencias Exactas 11% CAMPO ACADÉMICO % Ciencias Sociales Ciencias Sociales 33% Ciencias 33% Biológicas Administración de Empresas 17% 22% Humanidades 17% Administración de Empresas Ciencias Biológicas 22% 17% Humanidades Ciencias Exactas 11% 17% PICTOGRAMA  Es un gráfico cuyo uso es similar al de sector circular, pero la frecuencia es representada por medio de una figura o dibujo que identifique a la variable en estudio.  Se utiliza para mostrar producciones en una serie cronológica. EJEMPLO DE PICTOGRAMA 2010  Suponga que el número de Televisores vendidos en una empresa productora en 2010 fue de 6000 TV y en 2015 fue de 8500. Cómo representaría esta información? = 1000 TV 2015 = 500 TV INTERPRETACIÓN DE GRÁFICAS Una vez creada una gráfica o Examinar el lugar de la distribución gráficas, para un conjunto de datos, de datos. ¿Qué se debe buscar al tratar de describir Primero, verificar las escalas ¿Dónde está el centro de distribución del los datos? horizontales y verticales, de eje horizontal? Si se comparan dos manera que haya claridad respecto distribuciones, a lo que se mide. ¿Están centradas en el mismo lugar? Examinar la forma de la Buscar cualesquiera mediciones distribución. poco comunes o resultados ¿La distribución tiene un “pico” un punto atípicos. Esto es, que es más alto que cualquier otro? Si es ¿hay mediciones mucho mayores o menores Es frecuente que las distribuciones así, ésta es la medición o categoría que se que todas las otras? Estos resultados se describan según sus formas. presenta con más frecuencia. atípicos pueden no ser representativos de ¿Hay más de un pico? ¿Hay un número los otros valores del conjunto. aproximadamente igual de mediciones a la izquierda y derecha del pico?

Use Quizgecko on...
Browser
Browser