Clase 1-VD PDF
Document Details
Uploaded by BoundlessAluminium
INACAP
Tags
Summary
This document is a presentation on data visualization concepts, focusing on different types of graphs and their applications.
Full Transcript
TECNOLOGÍAS DE INFORMACIÓN Y CIBERSEGURIDAD UNIDAD I: Conceptos fundamentales de visualización de datos Semana 1 Asignatura: Visualización de Datos Unidad I: Conceptos fundamentales de...
TECNOLOGÍAS DE INFORMACIÓN Y CIBERSEGURIDAD UNIDAD I: Conceptos fundamentales de visualización de datos Semana 1 Asignatura: Visualización de Datos Unidad I: Conceptos fundamentales de visualización de datos Objetivo ▪ Un poco de Historia Unidad I: Conceptos fundamentales de visualización de datos Unidad I: Conceptos fundamentales de visualización de datos Unidad I: Conceptos fundamentales de visualización de datos Unidad I: Conceptos fundamentales de visualización de datos Unidad I: Conceptos fundamentales de visualización de datos Unidad I: Conceptos fundamentales de visualización de datos Unidad I: Conceptos fundamentales de visualización de datos Unidad I: Conceptos fundamentales de visualización de datos Unidad I: Conceptos fundamentales de visualización de datos Unidad I: Conceptos fundamentales de visualización de datos Qué es la Visualización La visualización de datos es la representación gráfica de información y datos. Utiliza elementos visuales como gráficos, mapas e infografías para transmitir relaciones complejas y tendencias de datos de manera más fácil de entender. Unidad I: Conceptos fundamentales de visualización de datos Objetivos de la Visualización Generación de ideas: Se utiliza para estimular la creatividad al inicio de un proyecto, alineando al equipo con el problema a abordar. Ilustración de ideas: Ayuda a transmitir tácticas, procesos o estructuras, como diagramas Gantt o flujos de trabajo. Descubrimiento visual: Permite a analistas y científicos de datos identificar patrones y tendencias en conjuntos de datos. Unidad I: Conceptos fundamentales de visualización de datos Beneficios de la Visualización Facilita la comprensión de los datos Identifica patrones y tendencias Ayuda en la toma de decisiones informadas Comunica información de manera efectiva Unidad I: Conceptos fundamentales de visualización de datos ¿Si cuento con un conjunto de datos? ¿Qué hago? Lamentablemente en la mayoría de los casos no podemos llegar y realizar una visualización, por lo general debido a: Datos incompletos o limitados Datos obsoletos y sin actualizar Formatos no reutilizables o no estandarizados Unidad I: Conceptos fundamentales de visualización de datos Preparación de datos Definición La preparación de datos implica desde la importación, la corrección de problemas de calidad, y de ser necesario, el enriquecimiento con otros conjuntos de datos. Unidad I: Conceptos fundamentales de visualización de datos Preparación de datos Unidad I: Conceptos fundamentales de Unidad I: Conceptos fundamentales de visualización de datos visualización de datos Unidad I: Conceptos fundamentales de Unidad I: Conceptos fundamentales de visualización de datos visualización de datos Variable Categórica: Es un tipo de dato cualitativo que pueden agruparse en categorías en lugar de medirse numéricamente. Estas variables categóricas muestran características como el género de una persona, su ciudad de origen, etc. Las medidas categóricas no se dan en números, sino en descripciones en lenguaje natural Unidad I: Conceptos fundamentales de Unidad I: Conceptos fundamentales de visualización de datos visualización de datos Unidad I: Conceptos fundamentales de Unidad I: Conceptos fundamentales de visualización de datos visualización de datos Variable Categórica Ordinal: sus valores pueden ser ordenados jerárquicamente, como, por ejemplo, el nivel de educación de una persona (sin estudios, primaria, secundaria o superiores) Variable Categórica Nominal: Sus valores sólo se pueden clasificar en clases (o categorías), no se pueden ordenar de pequeño a grande o de menos a más. Por ejemplo: género, estado civil, profesión, ocupación, nacionalidad, naranja, pera, uva, manzana, etc. Unidad I: Conceptos fundamentales de visualización de datos Conjunto de datos # ID Name Birthday Gender IsTeacher Students Country City 1 111 Jhon 31/12/1990 M 0 0 Ireland Dublin Características/ Variables/Columnas 2 222 Mery 15/10/1978 F 1 15 Ireland ID 3 333 Alice 19/04/2000 F 0 0 Spain Madrid Name 4 333 Alice 19/04/2000 F 0 0 Spain Paris Birthday Gender 5 444 Mark 15/03/2000 A 1 23 germany Berlin IsTeacher 6 555 Alex 1983-12-01 M 1 10 Italy Rome Students 7 666 Peter 05/05/1995 M 0 0 Italy Italy Country City 8 777 Calvin 03/08/1948 M 0 0 Portugal Lisbon Observaciones/Filas 9 888 Roxane 05/09/1992 F 0 5 Switzerland Geneva 10 10 999 Anne 14/11/1992 F 1 26 ytaly Rome Unidad I: Conceptos fundamentales de visualización de datos Ejemplo # ID Name Birthday Gender IsTeacher Students Country City 1 111 Jhon 31/12/1990 M 0 0 Ireland Dublin 1 Item Duplicado 2 Formato Incorrecto 2 222 Mery 15/10/1978 F 1 15 Ireland 7 3 Valor inválido 3 333 Alice 19/04/2000 F 0 0 Spain Madrid 4 Dependencia 5 Minúsculas 4 333 Alice 1 19/04/2000 F 0 0 Spain Paris 6 Ortografía 5 444 Mark 15/03/2000 A 3 1 23 germany 5 Berlin 7 Valor Faltante 8 Columna incorrecta 6 555 Alex 1983-12-01 M 1 10 Italy Rome 2 7 666 Peter 05/05/1995 M 0 0 Italy 8Italy 8 777 Calvin 03/08/1948 M 0 0 Portugal Lisbon 9 888 Roxane 05/09/1992 F 0 5 4 Switzerland Geneva 10 999 Anne 14/11/1992 F 1 26 ytaly 6 Rome Unidad I: Conceptos fundamentales de Unidad I: Conceptos fundamentales de visualización de datos visualización de datos Recomendaciones Generales Comprende el objetivo y la audiencia Antes de visualizar los datos, asegúrate de entender claramente el propósito de la visualización y conoce a quien va dirigida. Adapta tu enfoque según el nivel de conocimiento y las necesidades de tu audiencia. Simplifica y destaca lo esencial Elimina elementos innecesarios y utiliza colores y tamaños estratégicamente. Mantén la visualización clara y concisa para que se pueda entender de un vistazo. Narrativa Visual Organiza tus visualizaciones de manera lógica y secuencial. Agrega títulos, etiquetas y anotaciones para contextualizar los datos y proporcionar insights adicionales. Selecciona el tipo de gráfico adecuado Elige el tipo de grafico que resalte mejor la relación o patrón que deseas comunicar. Unidad I: Conceptos fundamentales de visualización de datos Gráfico de Barra ¿Cuándo utilizar? Cuando tengas que comparar magnitudes de variables numéricas de diferentes grupos. ¿Cuándo no utilizar? Cuando tengas muchas categorías a comparar (muchos puntos en el eje X) Si quieres analizar los registros individuales en el datasets y tienes muchos registros Si necesitas analizar proporciones Unidad I: Conceptos fundamentales de visualización de datos Gráfico de Torta ¿Cuándo utilizar? Cuando tengas que comparar proporciones. ¿Cuándo no utilizar? Si quieres comparar magnitudes Cuando tengas muchas categorías a comparar Si las proporciones son muy similares Unidad I: Conceptos fundamentales de visualización de datos Gráfico de Cajas ¿Cómo interpretar? La caja indica donde está el % de mis datos La línea en la caja representa la mediana Cualquier punto fuera del “Bigote” es un Outliers ¿Cuándo utilizar? Cuando necesites visualizar estadísticos de una variable de uno o más grupos Quieres detectar datos aberrantes dentro de la variable o la categoría ¿Cuándo no utilizar? Si se requiere análisis de valores individuales de la variable Si es de interés observar la forma exacta de la distribución Mediana: Determina la posición central de los datos Outliers: Punto que difiere significativamente de otra observación. Unidad I: Conceptos fundamentales de visualización de datos Gráfico de Violines ¿Cómo interpretar? Igual que un gráfico de cajas ¿Cuándo utilizar? Cuando necesitas conocer la distribución ¿Cuándo no utilizar? Si no es de interés observar la forma exacta de la distribución Unidad I: Conceptos fundamentales de visualización de datos Histograma ¿Qué es? Gráfico de barras que representa la distribución de una variable numérica ¿Cuándo utilizar? Si necesitas observar la forma de la distribución de una variable numérica Unidad I: Conceptos fundamentales de visualización de datos Histograma KDE ¿Qué es? Histograma que establece una línea que indica la probabilidad que un nuevo dato sea catalogado en un cierto valor Unidad I: Conceptos fundamentales de visualización de datos Gráfico de Líneas ¿Cuándo utilizar? Si necesitas observar tendencias ¿Cuándo no utilizar? Si la variable en X no tiene progresión Cuando hay pocos puntos Si son proporciones Unidad I: Conceptos fundamentales de visualización de datos Gráfico de Área ¿Cuándo utilizar? Si quieres comparar magnitudes y observar tendencias a lo largo de mi Eje X. ¿Cuándo no utilizar? Cuando quieres analizar magnitudes de más de un grupo Unidad I: Conceptos fundamentales de visualización de datos Gráfico de Áreas Apiladas ¿Cuándo utilizar? Si quieres comparar proporciones ¿Cuándo no utilizar? Quiero saber con exactitud los cambios de magnitud Unidad I: Conceptos fundamentales de visualización de datos Gráfico de Dispersión/Scatter ¿Cuándo utilizar? Cuando quiero revisar la relación de variables numéricas ¿Cuándo no utilizar? Si tengo muchos o muy pocos puntos Unidad I: Conceptos fundamentales de visualización de datos Gráfico de Dispersión - Catplot ¿Cuándo utilizar? Cuando quiero revisar la relación de variables numéricas con alguna categórica ¿Cuándo no utilizar? Si tengo muchos o muy pocos puntos Unidad I: Conceptos fundamentales de visualización de datos Gráfico de Regresión ¿Cuándo utilizar? Igual que Scatter ¿Cuándo no utilizar? Si tengo muchos o muy pocos puntos Unidad I: Conceptos fundamentales de visualización de datos Gráfico Compuesto ¿Cuándo utilizar? Quiero observar relación entre variables y la distribución de ellas ¿Cuándo no utilizar? Si tengo muchos o muy pocos puntos Unidad I: Conceptos fundamentales de visualización de datos PairPlot ¿Cuándo utilizar? Quiero comprobar si alguna de las variables numéricas tiene correlación ¿Cuándo no utilizar? Si tengo muchos o muy pocos puntos Unidad I: Conceptos fundamentales de visualización de datos Burbujas ¿Cuándo utilizar? Quiero incorporar una variable numérica adicional a mi Scatter Plot para hallar una posible interacción entre las 3 variables (x,y,Tamaño) Unidad I: Conceptos fundamentales de visualización de datos TwinPlot ¿Cuándo utilizar? Quiero comparar si existe interacción entre los cambios de magnitudes o tendencias entre las 3 variables Unidad I: Conceptos fundamentales de visualización de datos Compuesto – Barras y Líneas ¿Cuándo utilizar? Quiero visualizar como cambian las magnitudes de una variable (Barras) y visualizar como cambia una 2da variable. Al mismo tiempo visualizar si existe una interacción entre las variables a lo largo del eje X. Unidad I: Conceptos fundamentales de visualización de datos HeatMap Correlación ¿Cuándo utilizar? Quiero detectar rápidamente en una sola vista todos los coeficientes de correlación entre las variables de mi Dataset. ¿Cuándo no utilizar? Si tienes pocas categorías Unidad I: Conceptos fundamentales de visualización de datos Coordenadas Paralelas ¿Cuándo utilizar? Quiero encontrar si existe algún tipo de posible relación entre mis variables ¿Cuándo no utilizar? Muchas Variables, Variables sin normalizar Datos Categóricos