5 Metodologías y Tendencias PDF
Document Details
Uploaded by Itan
Universidad Internacional de La Rioja
Tags
Related
- Data Warehousing PDF
- UNSW Business School INFS2608 Data Warehouse II and Business Intelligence PDF
- Data Warehousing Module 2 PDF
- Lec1_IE165_Overview of Data Warehousing PDF
- Data Warehousing, Business Intelligence, and Dimensional Modeling Primer PDF
- Technologies Business Intelligence - Big Data Analytics Master 2_S3 - PDF
Summary
This document contains information about methodologies and trends in the area of business intelligence. It covers topics like Kimball methodologies, PMI methodologies, Inmon architecture, and data-driven decision-making, along with overall trends in the field.
Full Transcript
Metodologías y tendencias [5.1] ¿Cómo estudiar este tema? [5.2] Metodología Kimball [5.3] Metodologías PMI [5.4] Arquitectura Inmon [5.5] Data-driven decision [5.6] Tendencias [5.7] Referencias bibliográficas 5...
Metodologías y tendencias [5.1] ¿Cómo estudiar este tema? [5.2] Metodología Kimball [5.3] Metodologías PMI [5.4] Arquitectura Inmon [5.5] Data-driven decision [5.6] Tendencias [5.7] Referencias bibliográficas 5 TEMA Desde 2015 – Grandes agentes – Madurez big data – Más allá del Hadoop Tendencias Introducción al Metodologías y – Empresas tradicionales – Revolución – Concordancia del business intelligence, de Josep Curto – Empresas especializadas hardware BI/BA tendencias – Empresa Open source – Aplicaciones – Visualización de Esquema analíticas datos TEMA 5 – Esquema Principios básicos del ciclo Centrarse en el negocio Entregas significativas. Metodología Kimball Realizar infraestructura de información Ofrecer solución completa Rutas de la metodología Tecnología (ruta superior) Aplicaciones del BI (ruta inferior) Datos (ruta interior) Ejecución de procesos Guía PMBOK Metodología PMI Integración Calidad de las tareas Recursos Humanos Comunicación Áreas de conocimiento Costes Riesgos Alcance Adquisiciones del proyecto Tiempo o plazos Metodología Características del DW - Orientado a temas -No volátil -Integrado -Variante en el tiempo Inmon - Ciclo de vida Inmon DW Se debe tener presente - Estructura de un DW - Granularidad - Proceso de construcción de un Entrada de datos Variable de salida El entrenamiento Data-driven Data-driven (‘impulsado por datos’), para Proceso para ser observada Y (calibración) del mejorar el proceso de toma de decisiones modelado modelo tiene como decission modelling estratégicas basadas en análisis de datos y objetivo minimizar su interpretación Modelo el error del modelo Variable de salida II Y (Obs). pronosticada Y Business Intelligence para la Toma de Decisiones © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones Ideas clave 5.1. ¿Cómo estudiar este tema? Para estudiar este tema es suficiente con que leas las siguientes ideas clave. 5.2. Metodología Kimball Existen varias metodologías de diseño y construcción del data warehouse (DW). Cada productor de software de business intelligence intenta aplicar una metodología con sus productos. Las metodologías Kimball y la de Inmon son las más utilizadas actualmente. Para entender la diferencia entre estas dos metodologías, volvamos a los conceptos de data warehouse y de data mart. El segundo es un repositorio de información, similar a un DW, pero más pequeño y orientado a un área o departamento específico de la organización (por ejemplo, Compras, Ventas o RR.HH.), a diferencia del DW, que cubre toda la organización y su alcance (Kimball et al., pp. 98). La metodología de Kimball se centra principalmente en el diseño de la base de datos que guardará la información para la toma de decisiones. El diseño se basa en la creación de tablas de hechos, que contienen la información numérica de los indicadores a analizar, es decir la parte cuantitativa de la información. La aplicación de cualquier metodología para el desarrollo del DW en las empresas, siempre va a depender de las necesidades de las organizaciones y el compromiso institucional de quienes conforman dichas organizaciones. La metodología se basa en lo que Kimball nombra como ciclo de vida dimensional del negocio —business dimensional lifecycle— (Kimball et al., 98 y Mundy y Thornthwaite, 2006). TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones El ciclo de vida del proyecto de DW está fundamentado en cuatro principios básicos: Figura 1. Principios básicos para el desarrollo del DW, según la metodología Kimball Fuente: Kimball et al., 1998. Centrarse en el negocio: es necesario enfocarse hacia la tipificación de los requerimientos del negocio y el valor que le aportará, emplear estos esfuerzos en desarrollar relaciones sólidas con el negocio y con los encargados de implementar las herramientas. Realizar una infraestructura de información: se trata de diseñar una base de información única, integrada, fácil de usar y de alto rendimiento, en la cual deben verse reflejados todos los requerimientos de negocio identificados en la organización. Cumplir las entregas en incrementos significativos: define los tiempos de creación del almacén de datos en incrementos progresivos entregables. Los plazos están determinados por los desarrolladores del proyecto y estos pueden ser cuatro o seis meses cada entrega (tenga en cuenta que estos son tan solo ejemplos, los tiempo de entrega se deben ajustar a las necesidades de la empresa). Ofrecer la solución completa: facilitar todos los elementos necesarios para entregar valor a todos los usuarios del negocio. Para empezar, se debe contar con un almacén de datos sólido, bien diseñado, con calidad probada y accesible. También se deberá entregar herramientas de consulta ad hoc, aplicaciones para informes y análisis avanzado, capacitación, soporte, sitio web y documentación (Rivadera, 2010). La construcción de una solución de data warehouse/business intelligence no es una tarea fácil; sin embargo, Kimball propone una metodología que ayuda a facilitar esa complejidad. Las tareas de esta metodología (ciclo de vida) se muestran en la figura 2. TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones Figura 2. Tareas de la metodología de Kimball, denominada business dimensional lifecycle. Fuente: Kimball et al., 1998 y Mundy y Thornthwaite, 2006. En la figura 2, se observa que hay que destacar el papel central de la tarea de definición de requerimientos. Los requerimientos del negocio son la base inicial de las tareas siguientes. En segundo lugar se observan tres rutas que se enfocan en tres diferentes áreas: Tecnología (ruta superior): envuelve tareas relacionadas con herramientas software específico (para cada empresa), por ejemplo, data integration –Kettle – Pentaho Open Source. Datos (ruta interior): se diseñará e implementará el modelo dimensional, y desarrollo del subsistema de ETL (extracción, transformación y carga) para cargar el data warehouse. Aplicaciones del business intelligence (ruta inferior): en esta ruta se centran las tareas para el diseño, desarrollo e implementación de las aplicaciones de negocio para los usuarios finales. Estas rutas se van mezclando a medida que se va realizando el proyecto hasta llegar a la instalación del sistema. En la base de la figura 2, se observa la actividad general de administración del proyecto. A continuación, se amplía la información de cada una de las tareas. TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones Planificación del proyecto En esta parte se establece el propósito del proyecto de data warehouse/business intelligence, los objetivos específicos, el alcance del mismo, los riesgos y un acercamiento a las necesidades de información. Para Kimball (Kimball et al., 1998) el proyecto hace referencia a una iteración simple del KLC (Kimball Life Cycle), desde el principio hasta el despliegue. Esta tarea incluye las siguientes fases que son comunes para un plan de proyecto: » Definir los más certero posible el alcance (requerimientos del negocio). » Identificar las tareas. » Programar las tareas. » Planear el uso de los recursos. » Establecer la carga de trabajo a los diferentes recursos. » Preparar una prueba piloto » Preparar y elaborar el documento final (informes, tener presente los elementos vistos en el módulo anterior). En el apartado de la planeación de los recursos (humanos) Kimball propone la conformación de un equipo de trabajo al que pertenece tanto personal del área de informática como personal directivo (expertos en el negocio). En la tabla 1. Se muestran algunos ejemplos. Recursos Humanos Negocios Tecnologías de la información Cliente final Arquitecto técnico Gerente Modelador de datos Coordinador de data marts y Líder metadatos Usuarios Administrado de bases de datos Expertos de áreas Soporte del DW Tabla 1. Ejemplo de recursos humanos según metodología Kimbal. Fuente: Kimbal et al., 1998. Análisis de requerimientos Para poder conseguir los requerimientos del negocio se debe planear el cómo obtendremos dichos requerimientos, y para ello existen dos técnicas principales: TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones » Las entrevistas. » Las sesiones facilitadoras. Las entrevistas deben realizarse a los expertos en el negocio (directivos) y a los técnicos. Para ello es preciso tener una preparación previa con ayuda de un experto. De este proceso es imperativo aprender todo sobre el negocio, la competencia, la industria y los clientes (internos y externos), así como conocer las pautas y la terminología. A partir de este análisis se puede construir una herramienta, denominada matriz de procesos/dimensiones, bus matrix en inglés (Rivadera, 2010). La dimensión es una forma o criterio por medio del cual se pueden resumir, cruzar o cortar datos numéricos para ser analizados. La matriz generada contiene en las filas los procesos de negocios detallados y, en las columnas, las dimensiones reconocidas. Un ejemplo de esta matriz de ventas se puede observar en la tabla 2: Dimensiones Fechas Artículo Almacenes Empleados Clientes Proveedores Ventas X X X X X Hechos Inventarios X X X Compras X X X X Facturación X X X Tabla 2. Ejemplo de matriz hecho/dimensiones (bus matrix). Fuente: Zorrilla, 2011. Modelo dimensional La creación de un modelo dimensional es un proceso eficiente y muy iterativo. En la figura 3 se aprecia un esquema general. TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones Figura 3. Diagrama de flujo del proceso dimensional de la metodología de Kimball, denominada business dimensional lifecycle (Kimball et al., 1998; Mundy y Thornthwaite, 2006). El proceso de diseño empieza con un modelo dimensional de alto nivel que se realiza a partir de los procesos anticipados de la matriz descrita en el punto anterior. El proceso de pruebas consiste en cuatro pasos (Rivadera, 2010): 1. Elegir el proceso de negocio: acción tarea a ser modelada. 2. Establecer el nivel de granularidad: especificar al máximo nivel de detalle. 3. Elegir las dimensiones: estas nacen de las reuniones de los equipos de trabajo. 4. Identificar medidas y las tablas de hechos: son los datos cuantificables del negocio que se desean analizar. En la siguiente parte de la sesión inicial de diseño se completa las tablas con una lista de atributos bien definida. Esta se forma colocando en las filas los atributos de la tabla, y en las columnas, la siguiente información: características relacionadas con la futura tabla dimensional del DW, origen de los datos y definición de los procesos ETL. Una vez definidos los atributos y variables que van conformar la matriz, se procede a la implantación del modelo dimensional. Se realizan pruebas de este y si se presentan problemas, se hace una revisión y ajuste del modelo en caso que sea necesario. En caso contrario se procede a la validación del diseño. TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones Diseño físico El modelado dimensional es convertido en un modelo físico y se deben tener en cuenta aspectos técnicos de hardware (memorias, procesadores), software y redes (tarjetas de red, tipos de redes, etc.). Además, hay que considerar aspectos como el tamaño del sistema data warehouse que se va a implementar, la configuración del sistema, y las definiciones de la complejidad del modelo y del tipo de usuario que va a acceder al data warehouse. Diseño del sistema de extracción, transformación y carga (ETL) El sistema de ETL es la base sobre la cual se construye el data warehouse. Crear un sistema ETL que permita extraer los datos de los sistemas originales (bases de datos, tablas simples, etc.), aplicar las diferentes reglas para mejorar su calidad y consistencia, consolidar la información proveniente de distintos sistemas y, finalmente, cargar la información en el data warehouse en un formato adecuado (definido previamente) para la utilización por parte de las diferentes herramientas de análisis, adecuadas a las empresa (Rivadera, 2010). Una vez finalizado el proceso ETL, se procede a la implantación del data warehouse en la organización. Se debe destacar que este puede ir sufriendo modificaciones después de ser implantado; esto se debe a que, una vez interactúa con los usuarios, van surgiendo mejoras o ajustes. Para tener una base sólida sobre cómo se ha llevado acabo cada etapa del proceso del DW, es necesario ir documentando todo el proyecto en avances cortos para construir un informe final completo que sirva como medio de consulta y además como estándar para futuros data warehouse. 5.3. Metodologías PMI Actualmente existen varias metodologías para la dirección de los proyectos que también son aplicables a proyectos business intelligence y se adaptan a las necesidades de la empresa. Las más importantes son Scrum y PMI (siglas de Project Management Institute). TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones El PMI es una asociación profesional de las más grandes del mundo y que cuenta con medio millón de miembros e individuos titulares de sus certificaciones en 180 países (Vahos Hernández, Pastor Ramírez y Jiménez Builes, 2013). La metodología del PMI de gestión de proyectos se compone de dos elementos esenciales: la ejecución de procesos y las áreas de conocimiento. Proceso Para la PMBOK® Guide (A Guide to the Project Management Body of Knowledge), no puede hablarse de proyecto si este no se concibe como un proceso, es decir, una serie de actividades coordinadas e interrelacionadas entre sí que deben ejecutarse con un fin específico. No importa si son muchas o pocas etapas las que componen un proceso. Lo más importante es que este tenga tal entidad. Por supuesto, el número de etapas varía en función de las exigencias de cada caso: participantes, complejidad de las tareas, plazos de entrega, entre otros. Lo realmente decisivo en la ejecución de un proyecto es tener despejadas las etapas básicas que lo conforman, que para el PMI son, según la PMBOK®: » Inicialización. » Planificación. » Ejecución. » Control. » Cierre. En la figura 4 se observa la interacción entre las diferentes etapas de la mitología PMI: Figura 4. Etapas de la metodología PMI. Fuente: PMBOK® Guide. TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones En el enfoque del PMI, el proceso del proyecto es realizado por personas y generalmente está en una de dos categorías: Procesos de gestión de proyectos: describe, organiza y completa el trabajo del proyecto. Procesos orientados al producto: específica y crea el producto del proyecto que generalmente está definido por el ciclo de vida del mismo (PMBOK®). Áreas de conocimiento Además de los conocimientos específicos de los diferentes sectores, los líderes de proyectos deben aplicar otro tipo de conocimientos adicionales, los cuales están relacionados con competencias específicas de la gestión. Ya no es suficiente con ser un especialista en el área en la que nos desenvolvemos; hace falta adquirir competencias transversales para realizar un mejor desempeño del trabajo. Para el PMI, las áreas de conocimiento adicionales que no pueden faltar a la hora de gestionar un proyecto son: » Integración. » Recursos Humanos. » Costes. » Alcance. » Tiempo o plazos. » Calidad de las tareas. » Comunicación. » Riesgos. » Adquisiciones del proyecto. 5.4. Arquitectura Inmon El almacén de datos o data warehouse es una parte del sistema general de inteligencia de negocios. TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones Bill Inmon es considerado el padre del concepto y menciona que este debe cumplir con las siguientes características (Inmon, 1992): Figura 5. Característica del DE según Inmon. Orientado a temas: son los datos relacionados que se producen a partir de procesos de las operaciones que realiza la empresa y que son aptos para ser analizados. Por ejemplo, la presentación de la declaración de renta, en la cual se identifica al contribuyente (empresa o persona), el periodo fiscal y lo que se declara, entre otros. Integrados: los datos que almacena en el data warehouse proceden de fuentes diversas, cuyas estructuras tienen también atributos diferentes, tipos de datos o campos numéricos, pero tienen el mismo significado y deben ser consistentes. Al integrar estos datos se resuelven los problemas de uniformidad al convertirlos para que sean inteligibles para data warehouse. No volátil: los datos y la información no se modifican ni se eliminan en el data warehouse, de modo que aquí se mantienen históricos sobre los cambios que sufren las fuentes de datos de transacción. Variante en el tiempo: los cambios que se realicen a los datos a lo largo del tiempo deben quedar registrados, para la generación de informes y para controlarlos. La metodología que Inmon propuso es iterativa, la cual sigue un esquema inverso al típico de desarrollo de sistemas. Esto se debe a que lo primero con lo que se va trabajar son los datos, estos se integran para ser probados y analizar los resultados, de esta manera entender mejor los requerimientos del negocio. TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones La información debe estar al máximo nivel de detalle. Los data warehouse por departamento o data mart (necesidades individuales) son tratados como subconjuntos del data warehouse global. La metodología consiste en: Figura 6. Metodología Inmon. La metodología Inmon también es conocida como top down. Los datos son extraídos de las fuentes usando los procesos ETL y posteriormente son cargados en las áreas stage. Aquí son validados y agrupados en el data warehouse global, en el cual se encuentran los metadatos que contiene toda la información del data warehouse, es decir, los nombres de los atributos, los valores máximos y mínimos y los datos eliminados, entre otros. Una vez hecho este proceso, se realiza la actualización de los data mart con las respectivas transformaciones. El tener una orientación global suele ser más difícil de desarrollar e implementar. Ciclo de vida Inmon El ciclo de vida para el desarrollo del data warehouse comienza con los datos de las diferentes fuentes, los cuales están integrados y probados, posteriormente se desarrollan herramientas para leer dichos datos y finalmente se definen los requisitos para los sistemas de decisiones. TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones Data Pruebas Programación sobre Integración de datos warehouse orientadas los datos Diseño de sistemas Entender los Análisis de resultados de ayuda a la toma requerimientos de decisiones Figura 7. Ciclo de vida del data warehouse. Fuente: Inmon, 2002. Estructura de un data warehouse La estructura propuesta por Inmon para este sistema esta dividía en cuatro niveles que se muestran en la figura 8: Figura 8. Estructura del data warehouse. Fuente: Inmon, 2002. TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones En la siguiente figura se muestran los cuatro niveles: Figura 9. Estructura de los niveles del DW. Fuente: Inmon, 2002. Proceso para la construcción del DW Inmon propone los siguientes pasos para la construcción del DW. 1. Reconocer los sistemas transaccionales de la empresa que van a servir como fuentes de datos del DW. 2. Se empiezan a llenar las primeras tablas en el DW de las respectivas unidades del negocio. Los usuarios empiezan a acceder a los datos integrados. 3. Se cargan más tablas al DW aumentando también los usuarios que acceden al mismo. 4. El DW es cargado con los datos correctamente, esto trae como resultado la aparición de sistemas de apoyo a la toma de decisiones. 5. Los data mart para cada unidad de negocio son creados. 6. Si surgen nuevas necesidades, nuevos data mart deben ser creados. 7. Después de todos estos pasos, finalmente la arquitectura está desarrollada. En algunas ocasiones los usuarios prefieren acceder a los data mart, ya que su acceso es más rápido. TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones Granularidad El aspecto más importante del diseño de un almacén de datos es la granularidad. De hecho, el problema de la granularidad afecta a la arquitectura que rodea el entorno del almacén de datos. La granularidad se refiere al nivel de detalle o resumen de las unidades de datos en el DW. Cuantos más detalles hay, menor es el nivel de granularidad. Cuantos menos, el nivel es mayor (Inmon, 2002). La granularidad de los datos siempre ha sido un problema importante del diseño. Hace algunos años, la granularidad se daba por sentada. Cuando los datos detallados están siendo actualizados, es casi un hecho que los datos se almacenan en el nivel más bajo de granularidad. La granularidad es el principal problema de diseño en el entorno del almacén de datos porque afecta profundamente el volumen de datos que reside en el DW y el tipo de consulta que puede ser respondida. El volumen de datos en un almacén se intercambia con el nivel de detalle de una consulta. En casi todos los casos, los datos llegan al almacén de datos a un nivel de granularidad demasiado alto. Esto significa que el desarrollador debe gastar muchos recursos separando los datos. En ocasiones, los datos ingresan al almacén a un nivel de granularidad demasiado bajo. Un ejemplo de este nivel son los datos de registro web generados por el entorno de comercio electrónico. Los datos de la secuencia de clics del registro web se deben editar, filtrar y resumir antes de que su granularidad sea adecuada para el entorno del DW (Inmon, 2002). Beneficios de la granularidad: » Después de que el almacén de datos se haya construido correctamente, proporciona a la organización una base que es extremadamente flexible y reutilizable para diferentes procesos de sistemas de apoyo a la toma de decisiones. » Los datos granulares que se encuentran en el almacén de datos son la clave para la reutilización, ya que pueden ser usados por muchas personas de diferentes maneras. Por ejemplo, dentro de una empresa, los mismos datos podrían ser utilizados para satisfacer las necesidades de marketing, ventas y contabilidad. TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones » Todos estos tipos de información están estrechamente relacionados, aunque ligeramente diferentes. Con un almacén de datos, las diferentes organizaciones pueden ver los datos como lo desean. » Mirar los datos de diferentes maneras es solo una ventaja de tener una base sólida. Un beneficio relacionado es la capacidad de conciliar datos, si es necesario. » Otro beneficio relacionado es la flexibilidad. Tener una base de datos sólida permite que esto se realice fácilmente. » Los datos granulares contienen un historial de actividades y eventos en toda la empresa. Y el nivel de granularidad debe ser lo suficientemente detallado como para que los datos puedan ser transformados. » Pero tal vez el mayor beneficio de un almacenamiento de datos es que los futuros requisitos desconocidos pueden ser integrados. Cuando surge un nuevo requerimiento y existe la necesidad de información, el almacén ya está disponible para el análisis y la organización está preparada para manejar los nuevos requisitos. En la figura 10 se muestra un ejemplo de granularidad: Figura 10. Ejemplo de granularidad. Fuente: Inmon, 2002. 5.5. Data-driven decision modelling Las empresas están incluyendo el concepto de data-driven (literalmente ‘impulsado por datos’), para mejorar el proceso de toma decisiones estratégicas basadas en análisis de datos y su interpretación. TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones Una perspectiva data-driven (DDM) permite a las empresas examinar y organizar sus datos con el objetivo de mejorar la atención a sus clientes y consumidores. Al usar datos para promover sus acciones, una empresa puede contextualizar y personalizar los mensajes a sus clientes o posibles clientes para un enfoque más centrado en el cliente. Este método representa grandes avances en el modelo empírico convencional usado hasta el momento e incluye contribuciones de los siguientes campos (Solomatine, See y Abrahart, 2009): Inteligencia artificial o AI (artificial intelligence): estudio general de cómo la inteligencia humana puede ser incorporada a las computadoras. Inteligencia computacional o CI (computational intelligence): incluye redes neuronales, sistemas difusos y la informática evolutiva, así como otras áreas dentro de AI y máquina-aprendizaje. Computación suave o SC (soft computing): está cerca del CI, pero con especial énfasis en sistemas difusos basados en reglas inducidas a partir de datos. Máquinas de aprendizaje automático o ML (machine learning): una vez fue una subárea de AI que se concentraba en los fundamentos teóricos utilizados por CI y SC. La minería de datos o DM (data mining) y el descubrimiento de conocimiento en bases de datos o KDD (knowledge discovery in databases): se enfocan a menudo en bases de datos muy grandes y se asocian con aplicaciones bancarias, servicios financieros y gestión de recursos de clientes. DM se ve como parte de un KDD más amplio. Los métodos utilizados provienen principalmente de estadísticas y ML. Análisis inteligente de datos o IDA (intelligent data analysis): tiende a centrarse en el análisis de datos en medicina e investigación e incorpora métodos de estadísticas y ML. TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones El DDM es un método que se centra en el uso de los métodos de CI, particularmente las máquinas de aprendizaje, para la construcción de modelos que complementan o reemplazan los modelos «basados en el conocimiento» que describen el comportamiento físico. El proceso de construcción de un modelo DDM sigue los principios generales de: recolección de datos ―seleccionar la estructura del modelo–, construir el modelo y finalmente probarlo y (posiblemente) iterar. Un enfoque general del modelo se muestra en la figura 11. Figura 11. Enfoque general del modelo DDM. Fuente: Solomatine, See y Abrahart, 2009. 5.6. Tendencias El business intelligence sigue asombrando por su capacidad de transformación, adaptación y fácil manejo, con lo que consigue que todos los usuarios puedan satisfacer sus necesidades. Las tendencias en BI ayudan a entender que este jugará un papel importante en la transformación digital de las empresas. El autor Josep Curto, en su libro Introducción al business intelligence, opina que antes del año 2008 el mercado de BI había logrado una importante madurez con múltiples representantes ofreciendo soluciones que cubrían la mayoría de las funcionalidades del BI (ETL, data warehouse, reporting, cuadro de mandos y OLAP). TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones Esta madurez originó una fuerte consolidación del mercado durante el periodo 2005- 2009 y lo agrupó de la siguiente forma: Figura 12. Consolidación del mercado del BI según. Fuente: Curto Díaz, 2012. Grandes agentes: fabricantes externos que ampliaron su catálogo de soluciones empresariales con plataformas BI. En este entorno, las marcas más destacadas son: Oracle, que adquirió Hyperion; SAP, que adquirió Business Objects; IBM, que se hizo con el control de Cognos, y otras soluciones del mercado. Empresas tradicionales del mercado: aquellas que se mantienen con un producto especializado. Como, por ejemplo, Information Builders o Microstrategy. Empresas de áreas especializadas: aquellas que son expertas en un campo en concreto de la inteligencia de negocio como: » Data warehouse: Teradata, Netezza, Vertica. » Integración de datos: Informatica, Talend. » Análisis visual: Datawatch. » Análisis dinámico y flexible: QlikView, Tableau. Empresas open source: aquellas que cubren todo el proceso de la inteligencia de negocio y ofrecen soluciones con TCO (total cost ownership). Por ejemplo, Hitachi Vantara (quien adquirió Pentaho) y Jaspersoft (Curto Díaz, 2012). Para el 2018, los consultores de Qlick Sense elaboraron un informe con las principales tendencias del año: TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones La alfabetización de los datos adquirirá prioridad empresarial y social: la capacidad de leer, manejar, analizar y replicar con datos resulta cada vez más importante en la economía empresarial. El modelo de multinube híbrida: el incremento de servicios en la nube excederá la cantidad de los servicios que los líderes de tecnologías de la información pueden manejar. En el 2018, algunos datos almacenados en la nube se tendrán que trasladar a otras plataformas debido a nuevas normativas, seguridad, costes y rendimiento. Los datos están llegando al límite: con el aumento de los dispositivos móviles con acceso a internet se incrementa significativamente la carga de datos para ser analizada. El big data, el descubrimiento de los datos y la ciencia de datos convergerán: el prometedor avance en inteligencia artificial, la integración de big data y la combinación entre motores están generando nuevas oportunidades para analizar completamente conjuntos de grandes de datos, complejos y variados. La necesidad de interoperabilidad y nuevos modelos de negocio centra la atención en las API: a medida que los datos, la informática y su uso están más distribuidos, también lo están los entornos tecnológicos de las grandes empresas. Las empresas están en busca de fragmentos que se puedan unir fácilmente; lo más importante es que los distintos programas se comuniquen entre sí. Es decir, que las plataformas analíticas de este nuevo entorno deben ser abiertas e interoperativas, ampliables, integrables y disponer de API modernas. Tendencia en la elaboración de informes redefinidos: una realidad de los negocios es que no todo el mundo puede explorar sus datos de forma detallada; esto quiere decir que se tienen en cuenta las necesidades de usuarios con diversos niveles de capacidades. En el año 2018 la elaboración de informes empezará a redefinirse ofreciendo información altamente compleja tanto a los analistas como a los usuarios menos capacitados. El sistema de inteligencia aumentada convierte a los usuarios en participantes y facilitadores: la incorporación de la realidad aumentada será un componente fundamental en las nuevas tendencias del BI. Actualmente no se tiene en cuenta esta interacción. TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones Accede al informe completo a través del aula virtual o la siguiente dirección web: http://www.advantic.es/wp-content/uploads/2018/01/tendencias-business- intelligence-qlik-sense-advantic-consultores.pdf Se entrevistó a clientes y miembros del equipo de Tableau para poder decidir cuáles eran las diez tendencias del BI y este fue el resultado: No le teme a la inteligencia artificial La AI se convierte poco a poco en una herramienta poderosa para cualquier analista. Se pueden ejecutar regresiones lineales para tener una aproximación de una modificación actual (por ejemplo, modificar el precio de un producto). En el 2020, la inteligencia artificial se convertirá en uno de los motores de creación de empleo, (aproximadamente 2,3 millones de puestos de trabajo) y eliminará otros 1,8 millones (Gartner). El impacto de las humanidades Es destacable la simplicidad en las plataformas tecnológicas para que pueda ser utilizada por cualquier persona con un conocimiento mínimo en tecnología. Existe una tendencia a que las empresas contraten líderes especialistas en el área de humanidades: Paypal, Pinterest, etc. Un tercio de los directores ejecutivos de las empresas de Fortune 500 se graduaron en el área de humanidades. La promesa del procesamiento del lenguaje natural Será más prevalente, sofisticado y ubicuo. Microsoft Cortana alimenta la expectativas de las personas con respecto a hablarle al software y que su lenguaje sea comprendido. Hacia el 2020, el 50 % de las consultas analíticas se generará mediante búsqueda de voz. Será mucho más rápido pedirle información al móvil. Para el 2021, más del 50 % de las empresas gastarán más al año en la creación de aplicaciones chatbots que en desarrollo de aplicaciones tradicionales. El debate sobre la multiplicidad de nubes Las empresas están migrando a tener varias aplicaciones en la nube que satisfaga sus necesidades y no centrarse en una sola. El 70 % de las empresas para el 2019 implementará una estrategia de varias nubes (Gartner). TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones El auge del director de datos Se piensa que las empresas migrarán en el 2020 hacia tener departamentos u oficinas de dirección de datos completamente operativas. En las grandes empresas el equipo estará conformado por 38 empleados en promedio. Participación colectiva en la gobernanza Consiste en aplicar sabiduría colectiva para proporcionar datos correctos a las personas adecuadas y evitar accesos indebidos. El aseguramiento de los datos Supone el trato de los datos como productos y con valor que aumentará incrementalmente. Se hablará de materia prima para generar datos como cualquier otro producto. La función del ingeniero de datos Las empresas deben incorporar personas capaces de realizar ajustes a los datos, con el fin de explorar datos que sirvan para la toma de decisiones. Hoy en día se pierden más de 9,7 millones de dólares anuales por la calidad deficiente de datos. La ubicación de la IoT IoT son las siglas de «Internet de las cosas», con el cual Gartner predice que para el 2020 IoT existirán más de 20 400 millones de dispositivos en línea. La inversión del sector académico Las universidades apuestan por programas de análisis y ciencia de los datos. La Universidad de California ya cuenta con una especialidad y cursos complementarios de grado sobre ciencia de los datos y busca crear un instituto de ello. Las habilidades técnicas para el análisis de datos ya no son optativas, sino fundamentales. Para el 2021, el 69 % de las empresas exigirá a sus candidatos poseer conocimientos sobre ciencia de los datos. TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones Accede al artículo a través del aula virtual o de la siguiente dirección web: https://www.tableau.com/es-es/reports/business-intelligence-trends 5.7. Referencias bibliográficas Curto-Díaz, J. (2012). Introducción al business intelligence. Barcelona: UOC Editorial. Inmon, W. H, (1992). Building the Data Warehouse (1ª edición). Nueva York: Wiley and Sons. Inmon, W. H. (2002). Building the Data Warehouse (3º Edition). Nueva York: Wiley and Sons. Kimball, R., Reeves, L., Ross, M., y Thornthwaite, W. (1998). The Data Warehouse Lifecycle Toolkit: Expert Methods for Designing, Developing, and Deploying Data Warehouses. John Wiley & Sons. Kimball, R. (2009). Data Warehouse Toolkit Classics: The Data Warehouse Toolkit (2ª ed.); The Data Warehouse Lifecycle Toolkit (2ª ed.); The Data Warehouse ETL Toolkit. Hoboken: Wiley and Sons. Mundy, J., Thornthwaite, W. y Kimball, R. (2006). The Microsoft Data Warehouse Toolkit — With SQL Server 2005 and the Microsoft Business Intelligence Toolset. Indianápolis: Wiley. Rivadera, G. (2010). La metodología de Kimball para el diseño de almacenes de datos (data warehouses). Cuadernos de la facultad (5), 56-71. Recuperado de: http://www1.ucasal.edu.ar/htm/ingenieria/cuadernos/archivos/5-p56-rivadera- formateado.pdf Solomatine, D., See, L. M., y Abrahart, R. J. (2009). Data-driven modelling: concepts, approaches and experiences. En Practical Hydroinformatics (pp. 17-30). Berlín: Springer. Recuperado de: TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones https://www.springer.com/cda/content/document/cda_downloaddocument/9783540 798804-c1.pdf?SGWID=0-0-45-620522-p173819207 Vahos-Hernández, L. E., Pastor-Ramírez, D. M., y Jiménez-Builes, J. A. (2013). Método para la formación de Stakeholder en proyectos de ingeniería usando la metodología PMI y técnicas de inteligencia artificial. Revista Ingenierías 12(23). Vera-García. A. C. (2015). Análisis de herramientas BI en el mercado actual (Trabajo de fin de grado). Universidad Oberta de Cataluña, España. TEMA 5 – Ideas clave © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones Lo + recomendado No dejes de leer… Business intelligence (BI) y analytics: el arte de convertir los datos en conocimiento Ramos, S. (2016). Business intelligence (BI) y analytics: el arte de convertir los datos en conocimiento. Alicante: SolidQ Global S. A. Salvador, con más de quince años de experiencia en el sector, nos habla desde su punto de vista sobre las tendencias de hoy. Business analytics. Predicciones BI 2010 -2012 Arenas, D. (2010). Business analytics. Predicciones BI 2010-2012. En Business Analytics [en línea]. Diego Arenas se dedica a realizar predicciones de negocio en las que puedes encontrar un modelo para tu propio análisis. Accede al artículo a través del aula virtual o desde la siguiente dirección web: http://www.businessanalytics.cl/principal/predicciones-bi-2010-2012 TEMA 5 – Lo + recomendado © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones 11 tendencias para 2018 Qlik Q (s.f). 11 tendencias para 2018. Data de-silofication: el secreto para tener éxito en la economía analítica [en línea]. «¿Cómo podemos avanzar hacia una economía de analítica de datos al tiempo que mantenemos la privacidad? Se trata de extraer los datos fragmentados, las personas y las ideas de sus respectivos silos y conectarlos de una forma ágil, innovadora y controlada, lo que se conoce como data de-silofication o “eliminación de los silos de datos”». Tal y como se puede ver en esta introducción, este es un artículo orientado a la estrategia empresarial mediante aplicaciones originales del business intelligence. Accede al documento a través del aula virtual o desde la siguiente dirección web: http://www.advantic.es/wp-content/uploads/2018/01/tendencias-business- intelligence-qlik-sense-advantic-consultores.pdf No dejes de ver… Metodología de Ralph Kimball para la implementación de DW/BI Pedro Chávez nos da las claves del método Kimball la aplicación de la inteligencia de negocio en diferentes sectores. Accede al vídeo a través del aula virtual o desde la siguiente dirección web: https://www.youtube.com/watch?v=f0SXEIfOx6k TEMA 5 – Lo + recomendado © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones + Información A fondo Las diez tendencias principales de inteligencia de negocios para 2018 «No hay viento favorable para quien no sabe a dónde va» (Séneca). Interesantes resultados de una encuesta a clientes y personal técnico de Tableau, una herramienta líder en BI según el último informe de Gartner. Accede al artículo a través del aula virtual o desde la siguiente dirección web: https://www.tableau.com/sites/default/files/pages/838266_2018_bi_trends_whitepa per_es-es.pdf Webgrafía SQL Server. ¡Sí! En su libro recomendado arriba, Salvador Ramos realiza una introducción sobre este tema, pero en su blog encontramos artículos más actualizados sobre el futuro de los datos. Accede a la página web a través del aula virtual o desde la siguiente dirección: http://www.sqlserversi.com/2016/12/libros-power-bi-espanol.html TEMA 5 – + Información © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones Bibliografía Grabova, O., Darmont, J., Chauchat, J. H., y Zolotaryova, I. (2010). Business Intelligence for small and middle-sized entreprises. ACM SIGMOD Record, 39(2), 39- 50. Recuperado de: https://hal.archives-ouvertes.fr/hal-01429247/document Gutierrez, M. P. (2012). Metodología de uso de herramientas de inteligencia de negocios como estrategia para aumentar la productividad y competitividad de una Pyme (Tesis de maestría). Instituto Politécnico Nacional, México. Mersinger, D. L. (2016). The Role of Data Governance in Data Quality. Minnesota: United States Code Microform Edition: ProQuest LLC. TEMA 5 – + Información © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones Test 1. ¿Kimball e Inmon propusieron metodologías para el desarrollo del data warehouse? A. Sí. B. No. 2. ¿Es lo mismo data mart y data warehouse? A. Sí. B. No. 3. Menciona dos principios básicos para el desarrollo del data warehouse: A. Centrarse en el negocio. B. Infraestructura de información. C. Centrarse en el cliente. D. A y B son correctas. 4. ¿Cuáles son las rutas para el desarrollo del data warehouse según la metodología Kimball? A. Tecnologías. B. Procesos. C. Datos. D. A y C on correctas. 5. ¿Cómo se pueden obtener los requerimientos del data warehouse? A. Entrevistas. B. Sesiones facilitadores. C. Por los clientes externos. D. A y B son correctas. 6. Para la creación del modelo dimensional según Kimball, ¿cuántos pasos hay que seguir? A. 1. B. 8. C. 4. D. 6. TEMA 5 – Test © Universidad Internacional de La Rioja (UNIR) Business Intelligence para la Toma de Decisiones 7. El proceso ETL no forma parte de la metodología propuesta por Kimball: A. Verdadero. B. Falso. 8. Según el estudio publicado por la empresa Tableau, son tendencias del business intelligence: A. El auge del director de datos. B. La inversión del sector académico. C. Empresas especializadas, empresas open source. D. A y B son correctas. 9. Las nuevas tendencias incorporan la realidad aumentada: A. Verdadero. B. Falso. 10. Menciona dos etapas de la metodología PMI: A. Planificación y desarrollo. B. Inicialización y cierre. C. Control y ejecución del proyecto. D. Control y supervisión. TEMA 5 – Test © Universidad Internacional de La Rioja (UNIR)