GLOSARIO ANALITICA DE DATOS rep 1.docx
Document Details
Uploaded by LaudableGorgon8088
Tags
Full Transcript
**Analítica de datos:** Proceso de examinar, limpiar, transformar y modelar datos con el objetivo de descubrir información útil, llegar a conclusiones y respaldar la toma de decisiones. **Minería de datos:** Extracción de patrones y conocimientos valiosos a partir de conjuntos de datos. **Algorith...
**Analítica de datos:** Proceso de examinar, limpiar, transformar y modelar datos con el objetivo de descubrir información útil, llegar a conclusiones y respaldar la toma de decisiones. **Minería de datos:** Extracción de patrones y conocimientos valiosos a partir de conjuntos de datos. **Algorithm (Algoritmo):** Un conjunto de reglas o procedimientos para resolver un problema. En la analítica de datos, los algoritmos se utilizan para analizar y procesar datos y extraer información valiosa. **Analytics (Analítica):** La ciencia de examinar datos para sacar conclusiones y respaldar la toma de decisiones. Implica recolectar, procesar y analizar grandes conjuntos de datos para descubrir patrones y tendencias. **Augmented Analytics (Análisis aumentado):** El uso de tecnologías avanzadas como el aprendizaje automático y la inteligencia artificial para automatizar la preparación de datos, el descubrimiento de información y el intercambio. Aumenta la inteligencia humana, haciendo que el proceso analítico sea más rápido y accesible para los no expertos. **BI (Business Intelligence) (Inteligencia de Negocios):** Un proceso impulsado por la tecnología que analiza datos y presenta información accionable para ayudar a ejecutivos, gerentes y otros usuarios finales corporativos a tomar decisiones comerciales informadas. **Business Intelligence (BI):** Tecnologías, aplicaciones y procesos para recopilar, analizar y presentar información empresarial. **Business Analytics (Análisis aumentado):** Un proceso impulsado por la tecnología que analiza datos y presenta información accionable para ayudar a ejecutivos, gerentes y otros usuarios finales corporativos a tomar decisiones comerciales informadas. **Big Data (Gran cantidad de datos):** Conjuntos de datos extremadamente grandes que pueden ser analizados para revelar patrones, tendencias y asociaciones. También se refiere a conjuntos de datos extremadamente grandes que son demasiado grandes o complejos para ser manejados por software de procesamiento de datos tradicional. Los datos grandes se caracterizan por su volumen, variedad y velocidad. **Big Data:** Conjunto de datos extremadamente grande que requiere procesamiento especializado. **Dashboards:** Interfaces visuales que muestran de manera resumida métricas e indicadores clave. **Segmentación de mercado:** División de clientes en grupos homogéneos con características similares. **Cardinality (Cardinalidad):** Describe los atributos numéricos de la relación entre dos entidades o tablas. **Column (Columna):** En una tabla, una columna contiene datos para un solo atributo de una entidad. **Visualización de datos:** Representación gráfica de datos para facilitar su comprensión. **Machine Learning:** Uso de algoritmos que permiten a las computadoras aprender patrones y mejorar su rendimiento sin intervención humana. **Predictive Analytics:** Utilización de datos, algoritmos y técnicas estadísticas para prever eventos futuros. **Data Warehouse:** Almacén de datos centralizado que facilita el análisis y la generación de informes. **ETL (Extracción, Transformación y Carga):** Proceso para mover datos desde su origen hasta una base de datos. **Cohort Analysis:** Evaluación del comportamiento de grupos específicos de usuarios a lo largo del tiempo. **Conceptual Model (Modelo Conceptual):** Una representación abstracta de las relaciones y entidades dentro de un sistema. Se centra en la comprensión de alto nivel del sistema y proporciona una base para crear modelos más detallados. El modelo conceptual ayuda a definir la estructura y alcance del modelo de datos, sirviendo como un plan para diseñar el esquema de la base de datos y las relaciones entre entidades. **Correlation (Correlación):** Una medida estadística que describe la asociación entre dos variables. **Database (Base de datos):** Una colección estructurada de datos que se puede acceder, gestionar y actualizar fácilmente. **Correlación:** Relación estadística entre dos variables que indica cómo cambia una variable en relación con la otra. **Customer Segmentation:** División de clientes en grupos basados en características similares o comportamientos. **Data-driven marketing:** Toma de decisiones basada en análisis de datos en lugar de intuición. **Heatmap:** Representación visual de datos en forma de colores para mostrar la densidad de ciertas variables. **Retorno de inversión (ROI):** Medida del rendimiento financiero de una inversión. **Database Management System (DBMS) (Sistema de Gestión de Bases de Datos):** Software que maneja el almacenamiento, recuperación y actualización de datos en un sistema informático. **Data Cleansing (or Data Cleaning) (Limpieza de Datos):** El proceso de identificar y corregir (o eliminar) errores e inconsistencias en los datos para mejorar su calidad. **Data Exploration (Exploración de Datos):** El proceso inicial de analizar un conjunto de datos para descubrir sus principales características y comprender su estructura, variables y valores. La exploración de datos es crucial para familiarizarse con un conjunto de datos, identificar anomalías y detectar patrones o tendencias. Este proceso a menudo implica resumir las principales características de un conjunto de datos utilizando métodos visuales (gráficos, diagramas, etc.) y estadísticas descriptivas. **Data Mart (Mercado de Datos):** Un subconjunto de un almacén de datos que soporta los requisitos de un departamento o función específica. **Data Governance:** Gestión y control de la calidad, seguridad y disponibilidad de los datos en una organización. **Customer Lifetime Value (CLV):** Valor neto que un cliente aporta a una empresa durante toda su relación comercial. **Descriptivo, Predictivo, Prescriptivo:** Niveles de analítica que van desde describir lo que ha sucedido hasta prescribir acciones futuras. **Data Scientist:** Profesional especializado en analizar y interpretar datos complejos. **Tendencias:** Patrones o direcciones generales identificadas a partir del análisis de datos. **Funnel Analysis:** Evaluación de la eficiencia de un proceso examinando las etapas por las que pasan los usuarios. **Data Cleaning:** Proceso de identificación y corrección de errores o inconsistencias en los conjuntos de datos. **Causality:** Relación causa-efecto entre variables. **Data Privacy:** Protección de la información personal y restricción de su acceso. **Data Migration ( Migración de datos):** Este es el proceso de seleccionar, preparar, extraer y transformar datos, y transferirlos permanentemente de un sistema de almacenamiento informático a otro. Este proceso es frecuentemente necesario cuando una organización decide utilizar un nuevo sistema informático o aplicación. La migración de datos es crucial para garantizar que los datos se transfieren de manera precisa y segura, y que sean accesibles y funcionales dentro del nuevo sistema. Este proceso a menudo implica la limpieza de datos y la adición de nuevas estructuras de datos. **Data Mining (Minería de datos):** La práctica de examinar grandes bases de datos para generar nueva información. Las técnicas de minería de datos descubren patrones y relaciones en los datos que pueden no ser evidentes a través de análisis tradicionales. **Data Modeling (Modelado de Datos):** El proceso de crear un modelo de datos para los datos que se almacenarán en una base de datos. Este proceso implica definir cómo se conectan, acceden y almacenan los datos. **Data Science (Ciencia de los datos):** Un campo interdisciplinario que utiliza métodos científicos, procesos, algoritmos y sistemas para extraer conocimiento y perspectivas de datos estructurados y no estructurados. **Data Source (Fuente de datos):** El lugar desde donde proviene los datos. Esto puede ser una base de datos, un almacén de datos, un lago de datos o fuentes de datos externas accedidas a través de APIs u otros medios. **Data Transformation (Transformación de datos):** El proceso de convertir datos de un formato o estructura a otro. A menudo implica limpiar, agregar, enriquecer y reformatear los datos. **Data Warehouse (Almacén de Datos):** Un repositorio central de datos integrados recopilados de una o más fuentes dispares. Almacena datos históricos y actuales en un solo lugar y se utiliza para crear informes y análisis de datos. Los almacenes de datos son componentes esenciales en el campo de la inteligencia empresarial, permitiendo la recuperación y análisis de datos para respaldar los procesos de toma de decisiones. **Decision Trees (Árboles de Decisión):** Un enfoque de modelado predictivo. Los árboles de decisión se utilizan para tareas de clasificación y regresión, proporcionando una representación gráfica que ilustra el proceso de toma de decisiones. El árbol se construye de tal manera que divide los conjuntos de datos en subconjuntos basados en el valor de las variables de entrada, lo que finalmente conduce a una salida o decisión predicha. **Descriptive Analytics (Análisis descriptivo):** Esta es la etapa inicial del procesamiento de datos, resumiendo y visualizando datos históricos para identificar patrones, tendencias e ideas. La analítica descriptiva ayuda a las empresas a entender lo que ha sucedido en el pasado y analizar las métricas de rendimiento, proporcionando una base sólida para análisis y toma de decisiones adicionales. **Dimension (DIM or DIMS) (Dimensión):** Una estructura que categoriza los datos. Las dimensiones se utilizan para segmentar y dividir los datos en un almacén de datos, proporcionando un medio para organizar y agrupar los datos. Por ejemplo, una dimensión de \"Tiempo\" podría incluir niveles jerárquicos como año, trimestre, mes y día. Las dimensiones ayudan en el análisis de datos de diversas formas y son fundamentales para crear informes significativos. **Dashboard (Panel de control):** Una interfaz visual que presenta datos de manera fácil de leer, a menudo utilizando gráficos y diagramas. Los paneles de control se utilizan comúnmente en la inteligencia empresarial para mostrar indicadores clave de rendimiento (KPIs). **Exploratory Data Analysis (EDA) (Análisis Exploratorio de Datos):** Un enfoque para analizar conjuntos de datos con el fin de resumir sus principales características, a menudo utilizando gráficos estadísticos y otros métodos de visualización de datos. **Fact Table (Tabla de hechos):** En un esquema de estrella o copo de nieve, la tabla de hechos es la tabla central que contiene datos cuantitativos (medidas) y claves que se vinculan a las tablas de dimensiones. **Código QR:** Código de barras bidimensional que almacena información y se escanea con dispositivos móviles. **Data Silo:** Almacenamiento de datos aislado que dificulta el acceso y la compartición. **Regresión:** Técnica estadística que examina la relación entre variables. **Data-driven Decision Making:** Proceso de tomar decisiones basadas en el análisis de datos. **Cobertura del mercado:** Porcentaje de mercado potencial que una campaña de marketing puede alcanzar. **Cross-selling:** Estrategia de vender productos adicionales a clientes que ya han realizado una compra. **Data Breach:** Acceso no autorizado o divulgación de datos sensibles. **Cluster Analysis:** Agrupación de elementos similares en conjuntos o \"clusters.\" **Data Ecosystem:** Conjunto de datos y tecnologías interrelacionadas en una organización. **Forecasting (Previsión):** El proceso de hacer predicciones sobre valores futuros basados en datos históricos. Esta técnica se utiliza en varios campos, incluyendo finanzas y predicción del tiempo. **Grain (Granularity) ( Grano (Granularidad)):** El nivel de detalle o profundidad de los datos almacenados en una base de datos o un conjunto de datos. Específicamente, en el almacenamiento de datos y en la inteligencia empresarial, el nivel de detalle de los datos representa el nivel más fino en el que los datos se almacenan. Comprender el nivel de detalle es crucial para el modelado y análisis efectivos de datos, ya que influye en cómo se pueden interpretar y utilizar los datos. **Histogram (Histograma):** Una representación gráfica de la distribución de un conjunto de datos, generalmente representada como barras. Proporciona una interpretación visual de los datos numéricos mostrando el número de puntos de datos que caen dentro de un rango de valores. **Insights (Información clave):** Valiosas piezas de información derivadas del análisis de datos. Los insights a menudo revelan tendencias, patrones o anomalías que pueden ser significativas para las estrategias comerciales y la toma de decisiones. **IoT (Internet of Things) (Internet de las cosas):** Se refiere a la red de dispositivos físicos que están equipados con sensores y software para recopilar e intercambiar datos. El IoT genera grandes cantidades de datos que pueden ser analizados para obtener ideas. **In-memory Computing (En la Computación en Memoria):** Una tecnología que almacena datos en la memoria principal del sistema (en lugar de en unidades de disco tradicionales) para mejorar el rendimiento, ofreciendo una recuperación y análisis de datos más rápidos.