MÓDULO 1 Gestión de datos para la toma de decisiones PDF

MÓDULO: 1 Gestión de datos para la toma de decisiones La guía de aprendizaje se centra en abordar la optimización de procesos decisionales empresariales a través del análisis de datos, focalizándose en dos planos, uno más conceptual y genérico vinculado con las posibilidades actuales de acceso y gestión de datos, y el otro, básicamente aplicado. En primer lugar, se aborda la importancia y el valor de los datos en las decisiones de las empresas. En este apartado, se explorará cómo la correcta utilización de los datos puede impactar directamente en la eficiencia y efectividad de las decisiones empresariales. Se analizará cómo la disponibilidad de información precisa puede transformar la toma de decisiones estratégicas y operativas, aportando valor tanto a nivel individual como organizacional, en el contexto de Big data. En la segunda parte del módulo presentan las herramientas elementales de la estadística descriptiva y el análisis exploratorio de datos. Comenzaremos explorando conceptos fundamentales como las medidas de posición, de dispersión, entre otras, así como su aplicación para resumir y presentar grandes conjuntos de datos. Posteriormente, nos adentraremos en el análisis exploratorio de datos, como herramienta adecuada para identificar patrones, outliers y tendencias a través de herramientas visuales y técnicas analíticas. Unidad 1. La importancia y el valor de los datos en las decisiones de las empresas Unidad 2. Estadística descriptiva Unidad 3. Gráficos estadísticos. Herramientas de visualización de datos Unidad 4. Análisis exploratorio de datos Desafío Referencias Lección 1 de 6 Unidad 1. La importancia y el valor de los datos en las decisiones de las empresas Unidad 1. La importancia y el valor de los datos en las decisiones de las empresas Big data: la revolución de los datos. Implicancias para la toma de decisiones empresariales El término "Big Data" hace referencia al enorme conjunto de datos que las empresas recopilan a diario, provenientes de diversas fuentes y en una amplia variedad de formatos. La importancia del Big Data en el ámbito empresarial radica en su potencial para extraer información significativa y crear valor a partir de esos datos. En el contexto actual, marcado por la digitalización y la interconexión global, el Big Data se convierte en un activo estratégico para las empresas más innovadoras. Las empresas que logran aprovechar el Big Data obtienen beneficios significativos en términos de toma de decisiones más informadas, identificación de tendencias del mercado, personalización de servicios para los clientes y optimización de procesos internos. Las organizaciones que incorporan el análisis de Big Data en su estrategia empresarial tienen una ventaja competitiva, ya que les permite adaptarse rápidamente a los cambios del entorno, anticipar necesidades futuras y mejorar la eficiencia operativa. Al momento de definir y caracterizar al fenómeno de Big Data, tradicionalmente se emplean letras V como iniciales de tales palabras clave. Presentamos las 5 más relevantes entre las diversas habitualmente mencionadas. Las "5 V" del Big Data que se consideran prioritarias son características fundamentales que describen la naturaleza de estos conjuntos de datos, aportando una visión holística sobre su complejidad y alcance. Estas son: 1 Volumen: Se refiere a la cantidad masiva de datos generados continuamente. En un mundo digitalizado, las empresas se enfrentan a enormes volúmenes de información que deben ser gestionados y analizados de manera eficiente. 2 Velocidad: Hace referencia a la velocidad con la que se generan, procesan y transmiten los datos. La rapidez con la que se puede acceder y analizar la información es crucial para la toma de decisiones en tiempo real. 3 Variedad: Los datos pueden presentarse en diferentes formatos y fuentes, como texto, audio, video, redes sociales, sensores, entre otros. La capacidad de manejar esta diversidad de datos es fundamental para obtener insights significativos. 4 Veracidad: La precisión y confiabilidad de los datos son esenciales para la toma de decisiones acertadas. Las empresas deben asegurarse de la calidad y la integridad de los datos que utilizan en sus análisis. 5 Valor: En última instancia, el objetivo del Big Data es convertir estos enormes volúmenes de información en valor añadido para la empresa. A través del análisis y la interpretación adecuada de los datos, las organizaciones pueden obtener conocimientos valiosos que las impulsen hacia el éxito. En el caso de FastDelivery, Big Data está involucrado directamente a su operativa diaria. La posibilidad de captar una gran cantidad de información sobre las rutas de entrega, tiempos de respuesta, preferencias de los clientes y niveles de satisfacción representa una oportunidad para optimizar sus servicios y mejorar la experiencia del cliente. La georreferenciación de datos permite una gestión más eficiente de las entregas, optimizando las rutas y reduciendo tiempos de entrega. La disponibilidad de información en la nube y el uso de dispositivos móviles facilitan la conectividad y el acceso a los datos en tiempo real, lo que contribuye a una operativa ágil y efectiva. Además, la interconexión de todos los integrantes del sistema y la recopilación permanente de datos permiten a FastDelivery evaluar constantemente su desempeño de sus asociados, identificar áreas de mejora y construir una reputación sólida en el mercado del delivery. El Big Data se presenta como un activo estratégico para empresas como FastDelivery, brindando herramientas poderosas para la toma de decisiones, la mejora de procesos y la creación de valor a partir de la información recolectada en su operativa diaria. La capacidad de adaptarse y aprovechar el potencial del Big Data se convierte en un factor determinante para el éxito empresarial en un entorno cada vez más competitivo y digitalizado. Los datos para la toma de decisiones Recopilación de datos internos y externos a las organizaciones. En el marco del análisis de datos para la toma de decisiones, existen dos tipos principales de datos: internos y externos. Los datos internos son aquellos obtenidos por la propia empresa en sus diversas operaciones, como producción, gestión, logística y administración. Si consideramos el caso de FastDelivery, la información sobre tiempos de respuesta en las entregas, niveles de satisfacción de los usuarios, distancias recorridas por los repartidores, horarios de demanda y servicio, entre otros, corresponden a datos internos. Por otro lado, los datos externos son información sectorial, macroeconómica u otro tipo de datos producidos por organizaciones externas que pueden incorporarse a los análisis de contexto. Estos datos pueden incluir estudios de mercado, tendencias del sector de delivery, datos demográficos de las zonas de servicio de FastDelivery, entre otros. Por ejemplo, al analizar datos externos sobre las preferencias de los consumidores en la industria de la entrega a domicilio, FastDelivery podría adaptar su servicio y oferta de productos para satisfacer mejor las necesidades del mercado local. Datos transversales y longitudinales En cuanto a la diferencia entre datos de corte transversal y datos longitudinales, los primeros se refieren a datos recopilados en un único momento en el tiempo, mientras que los datos longitudinales implican una recopilación de datos a lo largo de un período temporal específico. En el caso de la toma de decisiones empresariales, los datos de corte transversal suelen utilizarse para realizar análisis puntuales y comparativos en un momento dado, mientras que los datos longitudinales permiten observar tendencias, cambios y evoluciones en el tiempo. En FastDelivery, el análisis transversal de datos podría utilizarse para evaluar el rendimiento de cada sucursal en un momento dado, mientras que el análisis longitudinal podría ayudar a la empresa a identificar patrones estacionales en la demanda de los clientes y ajustar sus estrategias operativas en consecuencia. El valor de los datos en la toma de decisiones La capacidad de la información recopilada y analizada para aportar insights valiosos que respalden y orienten las decisiones empresariales es lo que en definitiva a evidenciar el valor de los datos. Determinar este valor implica evaluar cómo los datos pueden contribuir a mejorar la eficiencia, la efectividad, la rentabilidad y la competitividad de una empresa. El valor de los datos se puede determinar a través de diversos aspectos clave: 1 Relevancia: Los datos deben ser relevantes para los objetivos y necesidades de la empresa, aportando información significativa para la toma de decisiones. 2 Calidad: La precisión, confiabilidad y actualidad de los datos son fundamentales para asegurar un análisis preciso y una toma de decisiones acertada. 3 Accesibilidad: La facilidad para acceder y utilizar los datos en diferentes niveles de la empresa es crucial para aprovechar su potencial en la toma de decisiones. 4 Contexto: Entender el contexto en el que se generan los datos y su relevancia para el negocio permite interpretarlos de manera adecuada y aplicarlos eficazmente en la toma de decisiones. 5 Capacidad predictiva: Los datos deben tener la capacidad de predecir tendencias, comportamientos o resultados futuros que guíen las decisiones estratégicas. El valor de los datos justifica las inversiones en su recopilación, almacenamiento, análisis y mejora debido a varios motivos: 1 Optimización de procesos: Los datos permiten identificar oportunidades de mejora en los procesos internos y externos de la empresa, aumentando la eficiencia y reduciendo costos. 2 Decisiones basadas en evidencia: Al utilizar datos confiables y precisos, las decisiones empresariales se fundamentan en información objetiva en lugar de suposiciones o intuiciones. 3 Mejora del rendimiento: La aplicación de datos para la toma de decisiones conduce a una mejor comprensión del mercado, los clientes y la competencia, lo que se traduce en una ventaja competitiva y un mejor rendimiento empresarial. 4 Identificación de oportunidades: Los datos revelan oportunidades de crecimiento, nuevos mercados y posibles mejoras en productos/servicios, guiando las decisiones estratégicas orientadas al éxito a largo plazo. 5 Adaptación ágil: La capacidad de analizar datos en tiempo real permite a las empresas adaptarse rápidamente a cambios en el entorno empresarial, manteniéndose ágiles y competitivas. El valor de los datos radica en su capacidad para aportar información significativa que respalde la toma de decisiones efectivas, impulsando el crecimiento, la competitividad y la sostenibilidad de las empresas en un entorno empresarial cada vez más dinámico y competitivo. C O NT I NU A R Lección 2 de 6 Unidad 2. Estadística descriptiva Unidad 2. Estadística descriptiva Frecuencias, medidas de tendencia central (o posición) y medidas de dispersión El análisis de datos generalmente comienza con una descripción exhaustiva del conjunto de datos a analizar (denominado en varias de las disciplinas de datos, dataset). Esta etapa tiene varios propósitos, entre los que se destacan por una parte, revisar si los datos son consistentes, completos y no contienen duplicaciones, entre otros errores. Además, el análisis descriptivo ayuda a reconocer comprensivamente el contexto de las principales variables de interés, sus valores típicos o representativos, así como la relación entre los valores de las variables entre sí. Tipos de Datos Si bien en todos los casos el análisis descriptivo trata de sintetizar en unos pocos indicadores de uso generalizado la información, las posibilidades de cada tratamiento estadístico de los datos va a depender del tipo de datos que se analicen. Los datos se clasifican en: Datos Cualitativos: Nominales: Representan categorías sin un orden específico. Ejemplo: Tipo de producto entregado (comida, electrónicos, etc.). Ordinales: Expresan categorías con un orden o jerarquía específica. Ejemplo: Nivel de satisfacción del cliente (bajo, medio, alto). Datos Cuantitativos: Discretos: Valores numéricos específicos que se pueden contar. Ejemplo: cantidad de pedidos diarios. Continuos: Valores numéricos que se pueden medir con precisión. Ejemplo: Distancia recorrida por los repartidores. En el caso de datos cualitativos, se utilizan tablas de frecuencia y medidas como la moda para resumir la información. Una tabla de frecuencias contiene los valores de la variable y la cantidad de veces que aparece cada valor en el conjunto de datos que se analiza (en esa variable en particular). Tabla 11: Tabla de frecuencia de los tipos de productos repartidos en el día por FastDelivery Tipo de Producto Frecuencia Comida 120 Electrónicos 80 Indumentaria 50 Total 250 Fuente: Elaboración propia La tabla 1 indica en la columna frecuencia la cantidad de repartos que corresponde a cada tipo de productos. Estas frecuencias podrían también representarse en términos relativos o porcentuales con respecto al total de repartos del día, y en ese caso se indicarían frecuencias relativas (Tabla 2). Tabla 11: Tabla de frecuencia de los tipos de productos repartidos en el día por FastDelivery Tipo de Producto Frecuencia Comida 0,48 Electrónicos 0,32 Indumentaria 0,20 Total 1 Fuente: Elaboración propia La Moda corresponde al valor de la variable que más veces se repite en la serie de datos. En este caso, la moda sería el tipo de producto con mayor frecuencia, Comida. Cuando se trata de sintetizar a través de medidas o indicadores, una variable cuantitativa, se emplean medidas como la media, la mediana, los cuantiles, como representaciones de posición del conjunto de datos, y el rango, la varianza y la desviación estándar como indicadores de la dispersión de los valores. Media (o Promedio). Se calcula sumando todos los valores y dividiéndolos por la cantidad de datos. Por ejemplo, si los montos de los deliverys son: $20, $30, $40, la media sería ($20 + $30 + $40) / 3 = $30. Mediana: Valor que separa en dos partes la serie de datos ordenada de menor a mayor. Por ejemplo, en un conjunto de datos ordenados: 10, 20, 30, 40, 50; la mediana sería 30. Cuantiles: Valores que dividen una distribución en partes específicas, como los percentiles. Tabla 3: Cuantiles Divide a la serie Medida Ejemplos en Cuartiles 4 partes El primer cuartil separa el 25% de casos de menor Divide a la serie Medida Ejemplos en valor del 75% restante de casos. La mediana es el segundo cuartil. El tercer cuartil separa al 75% de los casos de menor valor del restante 25% de casos. Agrupación de los hogares en 5 segmentos, en cada uno de ellos Quintiles 5 partes se ubica un 20% de hogares de menor a mayor gasto promedio mensual. Deciles 10 partes Agrupación de los individuos que trabajan en 10 Divide a la serie Medida Ejemplos en segmentos, en cada uno de ellos se ubica un 10% de individuos de menor a mayor ingreso laboral. Organización del total de datos de peso al nacer en las estadísticas de Percentiles 100 partes un hospital, donde cada grupo se refiere al 1% del total de casos de acuerdo al peso. Fuente: Elaboración propia Cada una de las medidas mencionadas ayuda a describir de manera resumida el conjunto de valores específicos de una variable, con una cantidad acotada o resumida de valores. Para conocer si los valores de una variable son relativamente homogéneos (es decir, parecidos entre sí) o no, se utilizan medidas de dispersión. Las siguientes son las más usadas: Rango: Diferencia entre el valor máximo y mínimo. Si los tiempos de entrega varían entre 20 y 35 minutos, el rango sería 35 - 20 = 15 minutos. Varianza: Mide la dispersión de los datos respecto a la media. Se calcula como la media de los cuadrados de las diferencias entre cada dato y la media. Por ejemplo, si los tiempos de entrega son 25, 30, 20, 35, la varianza se calcularía en base a estas diferencias al cuadrado. Desviación Estándar: Raíz cuadrada de la varianza, que indica la dispersión promedio de los datos respecto a la media. Para profundizar en la aplicación de medidas estadísticas en datos cuantitativos de FastDelivery, se presentan más detalles y ejemplos: En conjunto, estas medidas permiten comprender la distribución y variabilidad de los datos cuantitativos como cualitativos, brindando información clave para la toma de decisiones estratégicas y la optimización de procesos. Ejercicio de aplicación: Para poner en práctica los conceptos de media, moda, mediana y desviación estándar en el contexto de FastDelivery, se propone el siguiente ejercicio: Datos de Distancias Recorridas por 10 Asociados de FastDelivery en la Jornada Prevía (en kilómetros): 16, 20, 18, 25, 22, 21, 19, 23, 24, 17 Preguntas: 1 Calcula la media, la moda, la mediana y la desviación estándar de las distancias recorridas por los 10 asociados de FastDelivery en la jornada previa. Instrucciones: 1 Para calcular la media, suma todas las distancias recorridas y luego divide entre el número total de datos. 2 La moda será el valor que más se repite en las distancias recorridas. 3 Para encontrar la mediana, ordena los datos de menor a mayor y encuentra el valor central. 4 La desviación estándar mide la dispersión de los datos respecto a la media. Es la raíz cuadrada de la varianza. C O NT I NU A R Lección 3 de 6 Unidad 3. Gráficos estadísticos. Herramientas de visualización de datos Unidad 3. Gráficos estadísticos. Herramientas de visualización de datos En conjunto con la descripción de un dataset de acuerdo con las medidas presentadas para cada una de las variables, se realizan gráficos adecuados a cada variable y orientado por los objetivos de representación de datos que surjan de un problema de datos. Los gráficos estadísticos colaboran en el análisis de datos por varias razones: Visualización Clara y Concisa: Los gráficos permiten representar datos de manera visual y clara, lo que facilita la interpretación de patrones, tendencias y relaciones que de otra forma podrían resultar difíciles de identificar en una tabla de números. Comunicación Efectiva: La visualización a través de gráficos facilita la comunicación de resultados y hallazgos a un público diverso, incluyendo a gestores, tomadores de decisiones, y otros interesados. La representación visual ayuda a transmitir información compleja de forma más comprensible y accesible. Identificación de Tendencias y Patrones: Los gráficos permiten identificar rápidamente tendencias, variaciones, y anomalías en los datos. Al visualizar la información, es más sencillo detectar patrones ocultos o relaciones significativas que pueden guiar la toma de decisiones. Facilita la Comparación: Los gráficos permiten comparar diferentes conjuntos de datos de manera efectiva, ya sea entre categorías, a lo largo del tiempo o entre diferentes variables. Esta comparación visual facilita la identificación de diferencias significativas y tendencias relevantes. Identificación de Outliers: Los gráficos pueden ayudar a identificar valores atípicos o outliers en los datos que pueden ser de importancia para comprender fenómenos excepcionales o errores en la recolección de datos. Tipos de Gráficos para Comparar o Mostrar Magnitudes: 1 Gráfico de Barras: Variables Representadas: Categorías o grupos con valores numéricos asociados. Ejemplo: Comparar la cantidad de entregas realizadas por cada día de la semana. Este gráfico de barras permitiría visualizar de manera clara y directa cuántas entregas se realizan en cada día, identificando posibles picos de demanda. 2 Gráfico de Conjuntos Múltiples: Variables Representadas: Múltiples conjuntos de datos comparativos, generalmente en forma de barras. Ejemplo: Comparar la satisfacción de los clientes por diferentes tipos de productos entregados. Este gráfico ayuda a visualizar la satisfacción en cada categoría de productos de manera simultánea, identificando cuáles tienen un desempeño superior en términos de satisfacción. 3 Gráfico Radial: Variables Representadas: Variables radiales en un eje circular, generalmente para mostrar proporciones. Ejemplo: Mostrar la distribución porcentual de tiempos de entrega según zonas geográficas principales atendidas. Este gráfico radial permitiría visualizar de forma efectiva qué porcentaje de entregas se realizan en cada zona y su importancia relativa en el servicio de FastDelivery. 4 Gráfico de Barras Apiladas: Variables Representadas: Categorías con múltiples subcategorías, mostrando la contribución de cada subcategoría al total. Ejemplo: Visualizar la composición del tipo de productos entregados por cada día de la semana. El gráfico de barras apiladas permitiría ver cómo se distribuyen los diferentes tipos de productos en las entregas diarias, destacando la proporción de cada uno. Figura 1: Tipos de gráficos estadísticos Fuente: https://datos.gob.es/es/blog/como-elegir-el-grafico-correcto-para-visualizar-datos- abiertos Tipos de Gráficos para Mostrar Distribuciones de Datos: 1 Histogramas: Variables Representadas: Variables numéricas continuas divididas en intervalos. Ejemplo: Usar un histograma para visualizar la distribución de los tiempos de entrega de los pedidos. Esto permitiría identificar la frecuencia con la que se producen diferentes tiempos de entrega y analizar posibles patrones en la distribución. 2 Gráficos de Densidad: Variables Representadas: Distribuciones de datos continuos basadas en la densidad de probabilidad. Ejemplo: Utilizar un gráfico de densidad para comparar la distribución de tiempos de entrega en días laborables versus fines de semana. Esto ayudaría a visualizar si existen diferencias significativas en los tiempos de entrega según el día de la semana. 3 Gráfico de Caja (Boxplot): Variables Representadas: Datos numéricos resumidos en cinco estadísticos: mínimo, primer cuartil, mediana, tercer cuartil y máximo. Ejemplo: Emplear un boxplot para analizar la variabilidad en los tiempos de espera de los clientes por zonas geográficas atendidas. Este gráfico permitiría identificar outliers, medir la dispersión y comparar la distribución de los tiempos de espera entre diferentes áreas de servicio. Tipos de Gráficos para Mostrar Proporciones o Partes de un Total: 1 Gráficos de Sectores o de Torta: Variables Representadas: Proporciones de un total divididas en categorías. Ejemplo: Utilizar un gráfico de sectores para mostrar la proporción de diferentes tipos de productos entregados en un mes determinado. Esto permitiría visualizar de manera clara la distribución porcentual de cada tipo de producto en el total de entregas realizadas. 2 Gráficos de Anillos o Donuts: Variables Representadas: Proporciones de subgrupos que componen un total, permitiendo comparar niveles jerárquicos. Ejemplo: Emplear un gráfico de anillos para mostrar la composición de los costos operativos en las diferentes áreas de la cadena logística de FastDelivery. Esto ayudaría a visualizar cómo se distribuyen los costos en cada etapa del proceso de entrega. Tipos de Gráficos para Mostrar Evolución en el Tiempo: 1 Gráficos de Líneas: Variables Representadas: Datos numéricos en función del tiempo. Ejemplo: Emplear un gráfico de líneas para seguir la evolución del número de entregas diarias durante un mes específico. Este gráfico permitiría visualizar la tendencia temporal de las entregas y identificar posibles patrones de demanda a lo largo del tiempo. 2 Gráficos de Cintas (Area Charts): Variables Representadas: Datos que muestran la evolución de una magnitud a lo largo del tiempo, representados en forma de área. Ejemplo: Utilizar un gráfico de cintas para visualizar la evolución de la satisfacción del cliente a lo largo de varios trimestres. Este gráfico permitiría observar la tendencia de mejora o empeoramiento en la satisfacción del cliente de manera más visual y comparativa. C O NT I NU A R Lección 4 de 6 Unidad 4. Análisis exploratorio de datos Unidad 4. Análisis exploratorio de datos El análisis exploratorio (AED) de datos es una etapa fundamental en el proceso de análisis de información, que se encarga de investigar, discriminar y descubrir patrones, tendencias, relaciones y posibles inconsistencias dentro de un conjunto de datos. Su objetivo principal es maximizar el conocimiento y comprensión de los datos antes de aplicar técnicas más avanzadas de modelado. Las actividades involucradas en el Enfoque de AED para tratar un Conjunto de Datos son: 1 Maximizar el conocimiento: Explorar exhaustivamente los datos para obtener una comprensión profunda. 2 Descubrir estructuras subyacentes: Identificar patrones ocultos o tendencias que puedan ser relevantes. 3 Extraer variables importantes: Destacar las variables clave que influyen en los resultados. 4 Detectar outliers y anomalías: Identificar valores inusuales que puedan afectar el análisis. 5 Chequear los supuestos subyacentes: Verificar que los datos cumplan con los requisitos para el análisis. 6 Desarrollar modelos parsimoniosos: Construir modelos simples pero efectivos para comprender los datos. 7 Determinar factores óptimos de configuración: Identificar los factores decisivos para la optimización de procesos. En la mayoría de los casos, cuando se desarrolla el AED, se pueden detectar problemas en los datos y a partir de esta identificación, se resuelven situaciones como: Asimetría: Necesidad de considerar distribuciones asimétricas al analizar datos. Puntuaciones o valores atípicos: Identificación de outliers o valores extremos. Datos ausentes: Manejo de información faltante en el conjunto de datos. Distribuciones con múltiples modas: Identificación de distribuciones con varios picos. Algunos ejemplos relacionados con el caso de FastDelivery Análisis de Rutas de Entrega: A través del análisis exploratorio de datos, FastDelivery puede identificar las rutas más utilizadas, los tiempos de entrega promedio, y posibles cuellos de botella en la distribución de los pedidos. Esto permitirá optimizar las rutas, reducir costos operativos y mejorar la eficiencia en las entregas. Segmentación de Clientes: Mediante técnicas de análisis multivariante, la empresa puede segmentar a sus clientes en grupos con características y preferencias similares. Esto facilitará la personalización de los servicios, la oferta de promociones específicas y la mejora de la experiencia del cliente, lo que influirá positivamente en la fidelización y satisfacción. Control de Inventarios: El análisis exploratorio de datos en relación con el inventario de productos de FastDelivery puede revelar patrones de demanda, estacionalidades y movimientos de stock. Identificar las fluctuaciones en la demanda de ciertos productos permitirá una gestión más eficiente del inventario, evitando excesos o faltantes, y maximizando la rentabilidad. Detección de Outliers en Tiempos de Entrega: Al analizar los tiempos de entrega de los pedidos, FastDelivery puede identificar outliers que representen demoras significativas en comparación con el promedio. Estos datos atípicos pueden corresponder a entregas problemáticas que requieren una revisión en las rutas, coordinación de horarios o mejora en la gestión de recursos para garantizar un servicio óptimo. El trabajo “Estadística descriptiva” (Rendón Macías et al., 2016) nos permite observar en la práctica algunos elementos surgidos de los temas teóricos abordados en relación con las medidas de posición y dispersión (Estadística descriptiva) y con los gráficos estadísticos. La estadística descriptiva, como rama de la estadística, se encarga de resumir de forma clara y sencilla los datos de una investigación, presentándolos en cuadros, tablas, figuras o gráficos. Es fundamental para cualquier investigación proporcionar evidencia objetiva que respalde o refute las hipótesis planteadas. Los investigadores deben tener la habilidad de resumir y presentar datos de manera ordenada y comprensible, facilitando su interpretación por parte de otros investigadores, revisores y lectores. Estas herramientas permiten resumir la información recopilada, identificar tendencias y patrones, y visualizar los resultados a través de gráficos, tablas y figuras. Al integrar estos conceptos, es posible aplicar medidas de tendencia central, como la media, la mediana y la moda, así como medidas de dispersión, como la desviación estándar, para comprender la distribución de los datos y su relación con la toma de decisiones empresariales. La conexión entre la estadística descriptiva y el análisis exploratorio de datos en el módulo proporciona a los estudiantes las herramientas necesarias para interpretar de manera eficaz la información empresarial y fundamentar decisiones basadas en datos. Además, les permite desarrollar habilidades prácticas para representar de manera clara y efectiva los resultados de investigaciones, facilitando la comunicación de hallazgos relevantes en el entorno profesional. De acuerdo a Rendón-Macías et al. (2016) utilizar medidas de tendencia central, como la media aritmética y la mediana, ayuda no solo a resumir la información, sino principalmente a entender la distribución de los datos. Análogamente las medidas de dispersión, como la desviación estándar y el rango intercuartílico, permiten conocer la variabilidad de los datos y evaluar su consistencia. Respecto a los gráficos, Rendón-Macías et al. (2016) resaltan la utilidad de representar visualmente los datos a través de histogramas, diagramas de caja y bigotes, y gráficos de dispersión. Estas representaciones visuales permiten identificar patrones, outliers y distribuciones en los datos, facilitando su interpretación y análisis. La correcta selección y construcción de gráficos es fundamental para comunicar de manera efectiva los resultados de un estudio y crear visualizaciones claras y comprensibles. A través del análisis exploratorio de datos, se orientan las herramientas de estadística descriptiva para explorar la información, identificar tendencias y tomar decisiones fundamentadas en evidencia. La práctica en la interpretación de gráficos y medidas estadísticas fortalece la habilidad para comunicar resultados de manera efectiva en entornos empresariales. La combinación de medidas estadísticas precisas y gráficos adecuados potencia la capacidad de los estudiantes para comprender, analizar y comunicar información relevante en el ámbito empresarial, contribuyendo así a su formación integral como profesionales analíticos y críticos. Para profundizar en este tema, se puede explorar cómo la selección adecuada de gráficos y tablas impacta en la claridad y la interpretación de los resultados, brindando una visión más completa del análisis de datos en contextos empresariales. C O NT I NU A R Lección 5 de 6 Desafío C O NT I NU A R Lección 6 de 6 Referencias Hernández Martín, Z. (2012). Métodos de análisis de datos: apuntes. Logroño, ES: Universidad de La Rioja, Servicio de Publicaciones. Recuperado de https://dialnet.unirioja.es/servlet/libro?codigo=489791 - Cap. 1 Lind, D., Marshal, W. y Wathen, S. (2007). Estadística aplicada a los negocios y a la economía (12.a edición). México: McGraw- Hill. Ontiveros, E. (Dir.) y López Sabater, V. (Coord.). (2017). Economía de los datos. Barcelona, ES: Editorial Ariel. Recuperado de https://www.fundaciontelefonica.com/cultura- digital/publicaciones/624/? _ga=2.63373167.1594837499.1532596170- 1584259485.1530289729 - Cap. 2 Anderson, D. R., Sweeney, D. J., y Williams, T. A. (2017). Estadística para administración y economía. Ciudad de México, MX: Cengage Learning. https://elibro.net/es/lc/biblioues21/titulos/39949 - Cap. 1 Paper: Rendón-Macías, M.; Villasís-Keeve, M.; Miranda-Novales, M. (2016) Estadística descriptiva. Revista Alergia México, vol. 63, núm. 4, octubre-diciembre, pp. 397-407. Colegio Mexicano de Inmunología Clínica y Alergia, A.C. Ciudad de México, México. Recuperado de: http://www.redalyc.org/articulo.oa? id=486755026009 PAPER MODULO 1 Estadística descriptiva.pdf 642.5 KB C O NT I NU A R

MÓDULO 1 Gestión de datos para la toma de decisiones PDF

Document Details

Tags

Related

Summary

Full Transcript