Podcast
Questions and Answers
¿Kimball e Inmon propusieron metodologías para el desarrollo del data warehouse?
¿Kimball e Inmon propusieron metodologías para el desarrollo del data warehouse?
- No
- Sí (correct)
¿Es lo mismo data mart y data warehouse?
¿Es lo mismo data mart y data warehouse?
- No (correct)
- Sí
Menciona dos principios básicos para el desarrollo del data warehouse:
Menciona dos principios básicos para el desarrollo del data warehouse:
- A y B son correctas (correct)
- Infraestructura de información
- Centrarse en el cliente
- Centrarse en el negocio
¿Cuáles son las rutas para el desarrollo del data warehouse según la metodología Kimball?
¿Cuáles son las rutas para el desarrollo del data warehouse según la metodología Kimball?
¿Cómo se pueden obtener los requerimientos del data warehouse?
¿Cómo se pueden obtener los requerimientos del data warehouse?
Para la creación del modelo dimensional según Kimball, ¿cuántos pasos hay que seguir?
Para la creación del modelo dimensional según Kimball, ¿cuántos pasos hay que seguir?
El proceso ETL no forma parte de la metodología propuesta por Kimball:
El proceso ETL no forma parte de la metodología propuesta por Kimball:
Según el estudio publicado por la empresa Tableau, son tendencias del business intelligence:
Según el estudio publicado por la empresa Tableau, son tendencias del business intelligence:
¿Las nuevas tendencias incorporan la realidad aumentada?
¿Las nuevas tendencias incorporan la realidad aumentada?
Menciona dos etapas de la metodología PMI:
Menciona dos etapas de la metodología PMI:
Flashcards
Metodología Kimball
Metodología Kimball
Metodología de diseño y construcción de data warehouses. Se centra en el diseño de la base de datos para la toma de decisiones.
Data Mart
Data Mart
Almacén de información más pequeño que un DW, orientado a un área específica de la organización.
Tablas de Hechos
Tablas de Hechos
Tablas que contienen la información numérica de los indicadores a analizar.
Ciclo de vida Kimball
Ciclo de vida Kimball
Signup and view all the flashcards
Centrarse en el negocio (Kimball)
Centrarse en el negocio (Kimball)
Signup and view all the flashcards
Infraestructura de información (Kimball)
Infraestructura de información (Kimball)
Signup and view all the flashcards
Entregas significativas (Kimball)
Entregas significativas (Kimball)
Signup and view all the flashcards
Solución completa (Kimball)
Solución completa (Kimball)
Signup and view all the flashcards
Tecnología (ruta superior)
Tecnología (ruta superior)
Signup and view all the flashcards
Datos (ruta interior)
Datos (ruta interior)
Signup and view all the flashcards
Aplicaciones BI (ruta inferior)
Aplicaciones BI (ruta inferior)
Signup and view all the flashcards
Planificación del proyecto (Kimball)
Planificación del proyecto (Kimball)
Signup and view all the flashcards
Análisis de requerimientos
Análisis de requerimientos
Signup and view all the flashcards
Dimensión
Dimensión
Signup and view all the flashcards
Proceso de negocio
Proceso de negocio
Signup and view all the flashcards
Nivel de granularidad
Nivel de granularidad
Signup and view all the flashcards
Identificar tablas de hechos
Identificar tablas de hechos
Signup and view all the flashcards
Diseño Físico
Diseño Físico
Signup and view all the flashcards
Diseño ETL
Diseño ETL
Signup and view all the flashcards
Metodología PMI
Metodología PMI
Signup and view all the flashcards
Proceso (PMI)
Proceso (PMI)
Signup and view all the flashcards
Áreas de Conocimiento (PMI)
Áreas de Conocimiento (PMI)
Signup and view all the flashcards
Orientado a temas (Inmon)
Orientado a temas (Inmon)
Signup and view all the flashcards
Integrados (Inmon)
Integrados (Inmon)
Signup and view all the flashcards
No volátil (Inmon)
No volátil (Inmon)
Signup and view all the flashcards
Variante en el tiempo (Inmon)
Variante en el tiempo (Inmon)
Signup and view all the flashcards
Ciclo de vida Inmon
Ciclo de vida Inmon
Signup and view all the flashcards
Granularidad
Granularidad
Signup and view all the flashcards
Data-driven decision
Data-driven decision
Signup and view all the flashcards
Alfabetización de los datos
Alfabetización de los datos
Signup and view all the flashcards
Study Notes
Metodologías y tendencias
Metodología Kimball
- Varias metodologías ayudan a diseñar y construir un data warehouse (DW).
- Los productores intentan aplicar una metodología a su programa.
- Kimball e Inmon son las metodologías más utilizadas.
- El data mart es un repositorio de información más pequeño orientado a un departamento de la organización.
- El DW cubre la totalidad de la organización.
- Kimball se enfoca en el diseño de la base de datos que contendrá la información.
- Las necesidades de cada organización y el compromiso institucional influyen en el tipo de metodología a aplicar.
- Se basa en el ciclo de vida dimensional de la empresa.
- Se fundamenta en cuatro principios básicos: enfoque en el negocio, creación de una infraestructura, cumplimiento en incrementos, ofrecer una solución completa.
- La planeación de proyectos establece el propósito, alcance, objetivos y riesgos del proyecto.
- Para obtener los requerimientos del negocio, realizar entrevistas y sesiones con expertos.
- La "matriz bus" es una herramienta que construye análisis.
- La dimensión resume datos numéricos que serán analizados.
- En las filas tendrá los procesos detallados de negocio y en las columnas las dimensiones reconocidas.
- El proceso iterativo comienza con un modelo de alto nivel basado en los procesos de la matriz.
- El proceso de pruebas tiene cuatro pasos: elegir el proceso, establecer el nivel de granularidad, elegir las dimensiones, identificar las medidas y las tablas de hechos.
- Una vez definidos los atributos, las pruebas se realizan hasta validar el diseño.
- El "modelado dimensional" se convierte en un modelo físico considerando aspectos técnicos.
- El sistema ETL permite extraer datos, aplicar reglas de consistencia y calidad, consolidar información y cargarla en un formato adecuado para su análisis.
- Al finalizar, el proceso ETL permite implementar el data warehouse.
- Es necesario documentar este proceso creando informes cortos, completos, y que sirvan como estándar.
Metodologías PMI
- Tanto el modelo Scrum como el Project Management Institute (PMI) son aplicables a proyectos de inteligencia empresarial, adaptándose a las necesidades de la empresa.
- El PMI es una asociación mundial con individuos certificados en 180 países.
- La metodología de gestión de proyectos PMI incluye ejecución de procesos y áreas de conocimiento.
- Un proyecto se concibe como un proceso con actividades coordinadas hacia un fin específico.
- Las etapas básicas según PMBOK® son:
- Inicialización
- Planificación
- Ejecución
- Control
- Cierre
- El proceso se divide en:
- Procesos de gestión de proyectos (organizar y completar).
- Procesos orientados al producto (especificar y crear el producto).
Áreas de conocimiento
- Integración
- Recursos Humanos
- Costes
- Alcance
- Tiempo
- Calidad
- Comunicación
- Riesgos
- Adquisiciones
Arquitectura Inmon
- El data warehouse forma parte del sistema de inteligencia empresarial.
- Bill Inmon propone que el data warehouse debe:
- Estar orientado a temas (procesos de la empresa).
- Ser integrado (los datos proceden de distintas fuentes con atributos diferentes).
- Ser no volátil (la información no se modifica).
- Ser variante en el tiempo (guardar un registro de los cambios a lo largo del tiempo).
- La metodología de Inmon es iterativa y sigue un esquema inverso al desarrollo de sistemas.
- Los data warehouse por departamento son subconjuntos del data warehouse global.
- La orientación global dificulta el desarrollo e implementación.
- Su ciclo de vida comienza con datos de fuentes integradas, continúa con herramientas de lectura y concluye con la definición de requisitos para sistemas de decisiones.
- Consta de cuatro niveles:
- Nivel de mayor detalle (datos históricos).
- Nivel de detalle actual (datos activos).
- Nivel de datos sutilmente resumidos (datos con primera transformación).
- Nivel de datos muy resumidos (datos agregados específicos para un área)
- El proceso para construir data warehouse:
- Reconocer los sistemas transaccionales de la empresa.
- Llenar las primeras tablas del DW para el negocio.
- Cargar más tablas al DW.
- Cargar el DW con los datos correctos.
- Crear data marts por unidad de negocio.
- Desarrollar nuevos data marts si es necesario.
- La granularidad es el nivel de detalle o resumen de las unidades de datos en el DW; a más detalle, menor granularidad.
- La granularidad influye en el volumen de datos y tipos de consulta.
- Los data warehouse proporcionan flexibilidad y capacidad de conciliar y transformar datos, además de integrar nuevos requisitos.
Data-driven decision modelling
- El concepto de data-driven ('impulsado por datos') mejora el proceso de toma decisiones estratégicas basado en el análisis de datos y su interpretación.
- El DDM permite examinar y organizar los datos de la empresa para mejorar la atención al cliente.
- Para promover acciones, se contextualizan y personalizan mensajes centrados en el cliente.
- El método incluye contribuciones de:
- Inteligencia Artificial (AI), cómo incorporar la inteligencia humana a las computadoras.
- Inteligencia Computacional (CI), redes neuronales, sistemas difusos, informática evolutiva y aprendizaje automático.
- Computación suave (SC), sistemas difusos basados en reglas inducidas a partir de datos.
- Aprendizaje automático o ML, fundamentos teóricos utilizados por CI y SC.
- Minería de datos o DM (data mining) y descubrimiento de conocimiento en bases de datos o KDD (knowledge discovery in databases), se asocian con servicios bancarios, financieros y gestión de recursos.
- Análisis inteligente de datos o IDA (intelligent data analysis), análisis de datos en medicina e investigación.
- DDM utiliza métodos CI, para construir modelos que complementan o reemplazan modelos basados en el conocimiento.
- El proceso de construcción de un modelo DDM sigue principios de recolección y selección de datos, construcción y prueba del modelo.
Tendencias
- La inteligencia empresarial (BI) sigue asombrando por su transformación y fácil manejo.
- Antes de 2008, el mercado de BI había madurado con soluciones de ETL, data warehouse, reporting, cuadro de mandos y OLAP.
- Esto originó una consolidación de mercado (2005-2009):
- Grandes agentes: amplían su catálogo de soluciones (Oracle, SAP, IBM).
- Empresas tradicionales: se mantienen con un producto especializado (Information Builders o Microstrategy).
- Áreas especializadas: son expertas en inteligencia de negocio (data warehouse, integración de datos, análisis visual y dinámico).
- Empresas open source: cubren todo el proceso ofreciendo soluciones con TCO (Hitachi Vantara y Jaspersoft).
- En 2018, los consultores de Qlick Sense elaboraron un informe con las principales tendencias del año:
- La alfabetización de los datos adquiere prioridad empresarial y social pues la capacidad de leer, manejar, analizar y replicar con datos es clave.
- El modelo multinube híbrida: Algunos datos cambian de plataformas por seguridad, costos y rendimiento.
- El big data, el descubrimiento de datos y la ciencia de datos convergen.
- Necesidad de interoperabilidad y modelos de negocio centran atención a las API.
- En la elaboración de informes redefinidos, se tienen en cuenta las necesidades de usuarios con diversos niveles de capacidades.
- El sistema de inteligencia aumentada convierte a los usuarios en participantes y facilitadores.
- El AI se está convirtiendo en una herramienta para cualquier analista. Habrá una creación de empleo (2.3M) y eliminación de otros (1.8M).
- Existe una tendencia a contratar líderes especialistas en el área de humanidades (Paypal, Pinterest). Un tercio de directores ejecutivos de empresas de Fortune 500 se graduaron en esta área.
- Hacia el 2020, el 50 % de las consultas analíticas será por búsqueda de voz. En 2021, más del 50 % de empresas gastarán en chatbots.
- El 70% de las empresas para el 2019 implementará una estrategia de varias nubes (Gartner).
- Se piensa que en 2020 las empresas migrarán a departamentos de dirección de datos (38 empleados de promedio).
- La sabiduría colectiva proporcionará datos correctos y evitará accesos indebidos.
- Los datos se tratarán con el valor que aumentará incrementalmente (materia prima).
- Se incorporarán personas capaces de ajustar los datos y explorar datos para la toma de decisiones.
- Gartner predice que para el 2020 IoT existirán más de 20 400 millones de dispositivos en línea.
- Las universidades apuestan por programas de análisis y ciencia de los datos. Para el 2021, el 69 % exigirá conocimientos de ciencia de los dato.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.