Analítica de Datos - Parcial 1 (PDF)
Document Details
Uploaded by HonorableMolybdenum
Universidad de Guayaquil
Econ. Michel Mogollón Claudnett, MBA
Tags
Summary
This document provides an overview of data analytics, its different types and their relevance in business. It includes an introduction to the concept of business intelligence and its related topics. The structure of a business intelligence system, along with the components and processes involved in establishing such a system, is also discussed.
Full Transcript
UNIVERSIDAD ANALÍTICA DE DATOS DE GUAYAQUIL FACULTAD DE CIENCIAS ECO. MICHEL MOGOLLÓN CLAUDETT, MBA. ADMINISTRATIVAS UNIDAD # 1 VISIÓN MODERNA DE INTELIGENCIA DE NEGOCIOS Y ANALÍTICA DE DATOS DATA VS INFORMATION INTELIGENCIA DE NEGOCIOS El concepto tiene su origen en...
UNIVERSIDAD ANALÍTICA DE DATOS DE GUAYAQUIL FACULTAD DE CIENCIAS ECO. MICHEL MOGOLLÓN CLAUDETT, MBA. ADMINISTRATIVAS UNIDAD # 1 VISIÓN MODERNA DE INTELIGENCIA DE NEGOCIOS Y ANALÍTICA DE DATOS DATA VS INFORMATION INTELIGENCIA DE NEGOCIOS El concepto tiene su origen en el comienzo de los sistemas de información gerenciales (MIS, Management Information System) de los años 70, cuando comenzaba la automatización de las tareas en las empresas. Inteligencia de Negocios (IN) - Business Intelligence (Bl) un término que Turban et al (2011) definen “como la combinación de arquitecturas, herramientas, bases de datos, herramientas analíticas, aplicaciones y metodologías” La consultora Gartner — referencia mundial en tecnologías de la información y en consultoría estratégica— En su prestigioso IT Glossary, se define Inteligencia de Negocios: (Business Intelligence) como “un término paraguas que incluye las aplicaciones, infraestructuras y herramientas, y las mejores prácticas que facilitan el acceso y análisis de información para mejorar y optimizar decisiones y rendimiento o desempeño (performance)” INTELIGENCIA DE NEGOCIOS VS ANALÍTICA DE NEGOCIOS Inteligencia de negocios. Conjunto de estrategias, tecnologías y sistemas para el almacenamiento, procesamiento, análisis y visualización de conjuntos de datos complejos, que frecuentemente, pero no siempre, viene definida por volumen, velocidad y variedad. (Josep Curto). Inteligencia de negocios. Infraestructura de generación, almacenamiento, integración, generación de informes (reporting), análisis y visualización de datos que proceden de los entornos de negocio, incluyendo en la actualidad Big Data. Analítica de negocios. Herramientas y técnicas para el análisis y comprensión de los datos. Las herramientas van desde el procesamiento analítico en línea (OLAP), estadísticas, modelos de datos, minería de datos y cada vez más herramientas de inteligencia artificial. LOS TRES PILARES DE LA INTELIGENCIA EMPRESARIAL SAMPLE OF MIS REPORT ARQUITECTURA DE UN SISTEMA DE INTELIGENCIA DE NEGOCIOS La arquitectura de Bl es un marco de trabajo (framework) que detalla los diferentes componentes del sistema de Inteligencia de Negocios. Existen varias arquitecturas de inteligencia de negocios de varios autores, sin embargo, se considerarán dos principales: Tradicional de cinco capas (propuesta por Ong et al) Con soporte de Big data ARQUITECTURA DE INTELIGENCIA DE NEGOCIOS DE CINCO CAPAS La arquitectura de inteligencia de negocios tradicional propuesta por Ong et al (2011) expresa que la metodología se compone de cinco capas: Capa de fuentes de datos. Capa de proceso ETL (Extract, Transform, Load) Capa de almacenes de datos (Data Warehouse, Data Mart) Capa de metadatos Capa de usuario final (análisis y visualización de resultados) CAPA FUENTE DE DATOS Las fuentes de datos internas: Se refieren a los datos que son capturados y mantenidos por los sistemas operacionales dentro de las organizaciones, tales como sistemas CRM, ERP, SCM o GIS. Incluyen datos relacionados con la operación del negocio (clientes, productos) Las fuentes de datos externas: Este tipo de datos se pueden recolectar de fuentes externas tales como socios de negocio (partners), proveedores de datos, Internet, gobiernos y corporaciones nacionales y locales, organizaciones de investigación de mercados o científicas, datos demográficos. Es importante identificar las fuentes para evitar datos innecesarios o no fiables o irrelevantes. CAPA DE PROCESO ETL La capa ETL (Extract, Transform, Load) se centra en tres procesos principales: Etapa de extracción: consiste en capturar datos de fuentes heterogéneas y homogéneas. Etapa de transformación: aplica un conjunto de reglas de unificación de datos básicos para transformar los datos desde el origen al destino, garantizando una calidad. Etapa de carga: es necesario garantizar que esta operación se realiza correctamente y empleando el menor número de recursos posible. La figura muestra el proceso de flujo de los datos mediante herramientas ETL, desde las fuentes de datos al almacén destino, Data Warehouse, y de allí a los Data Marts departamentales (extraer, transformar, cargar). CAPA DE ALMACENES DE DATOS (DATA WAREHOUSES Y DATA MARTS) La capa de almacenamiento de datos consta de tres componentes: el almacén de datos operacional (ODS del inglés Operational Data Store), el Data Warehouse (almacén de datos) y los Data Marts (almacenes de datos corporativos). Un almacén de datos (Data Warehouse) es un repositorio de datos que proporciona una visión global, común e integrada de los datos de la organización. Almacena datos históricos y actuales de interés potencial, se originan en los sistemas de ventas, clientes, etc) Los Data Marts son un subconjunto de los almacenes de datos enfocados y de valor para un departamento determinado de la empresa. CAPA DE METADATOS La capa describe donde se utilizan y almacenan los datos, las fuentes de datos, cuales cambios se realizan a los datos y cómo una pieza de datos se refiere a otra información. CAPA DE USUARIO FINAL Se compone de una serie de herramientas que visualizan la información en diferentes formatos y para diferentes usuarios. Las herramientas de la capa de usuario más usuales son: aplicaciones de analítica de datos, procesamiento analítico en línea (OLAP), herramientas de informes (reporting) y consultas (query), herramientas de analítica (minería de datos) y herramientas de visualización. ANALÍTICA DE NEGOCIOS (BUSINESS ANALYTICS ) Es un conjunto de técnicas y herramientas de software utilizadas para analizar los datos debidamente preparados y producir informes para responder a las cuestiones y consultas de los gerentes y directivos, y seguir el proceso del negocio mediante indicadores clave de rendimiento o desempeño, KPI. PLATAFORMAS ANALÍTICAS Las plataformas analíticas incluyen herramientas para gestión de las diferentes bases de datos y almacenes de datos UNIVERSIDAD ANALÍTICA DE DATOS DE SLIDE 2 GUAYAQUIL FACULTAD DE CIENCIAS ECON. MICHEL MOGOLLON CLAUDETT, MBA. ADMINISTRATIVAS UNIDAD # 1 VISIÓN MODERNA DE INTELIGENCIA DE NEGOCIOS Y ANALÍTICA DE DATOS ANALÍTICA DE NEGOCIOS Es un componente fundamental de la Inteligencia de Negocios y es el conjunto de técnicas y herramientas que ayudan a los usuarios a aprovechar los datos empresariales, con el objetivo de tomar decisiones de empresa mejores, acertadas y en consonancia con sus líneas de negocio. INTELIGENCIA DE NEGOCIOS VS ANALÍTICA DE NEGOCIOS ▪ Business Analytics (BA). Es un conjunto de habilidades, tecnologías y practicas que permiten identificar tendencias y comportamientos a partir de datos empíricos, producir escenarios adecuados al trabajo y tomar decisiones óptimas para alcanzar objetivos del negocio. ▪ Analítica de datos (Analytics) Es un término definido por los proveedores de soluciones de software, que se centra más en herramientas y técnicas para análisis y comprensión de datos, tales como OLAP, modelos estadísticos y Minería de Datos. HERRAMIENTAS DE ANALÍTICA DE NEGOCIOS Son un conjunto de herramientas de software que se utilizan para analizar datos y producir informes. Utiliza indicadores clave de rendimiento o desempeño (KPI). Entre estas herramientas se contemplan: Modelos de datos. Minería de Datos. OLAP. Herramientas de reporting y quering (reportes o informes y consultas). Analítica de Big Data. Además de otras que van tomando fuerza y a día de hoy empiezan a tomar terreno tales como las técnicas de Inteligencia Artificial, redes neuronales artificiales, aprendizaje automático y aprendizaje profundo. ANALITICA AVANZADA (AA) Microsoft plantea que la Analítica avanzada es utilizar los datos de manera correcta para obtener información de valor que permita tomar mejores decisiones de negocio. Beneficios de la AA según Microsoft: Búsqueda proactiva de patrones e información de valor a partir de los datos y la habilidad de actuar en consecuencia. La Inteligencia de Negocios (Bl) realiza el análisis del pasado (histórico) para describir y diagnosticar. En esta capa incluye: análisis descriptivo (¿Qué pasó? análisis de la información histórica) análisis de diagnóstico (¿Por qué sucedió? análisis de retrospección). Los análisis avanzados son métodos cuantitativos sofisticados para la predicción y prescripción del futuro. Hay de dos tipos: análisis predictivo (¿Qué pasará?) análisis prescriptivo (¿Cómo hacemos que suceda?). Buscan la optimización mediante la comprensión y la prospección TIPOS DE DATOS Los tipos de datos manejados hoy en día por los sistemas de Inteligencia de Negocios se dividen en tres grandes grupos, en función de su estructura: Estructurados No estructurados. Semiestructurados. La mayoría de las bases de datos relaciónales existentes en la actualidad contienen datos estructurados en formato tabla y las bases de datos modernas que implementan Big Data contienen datos no estructurados y semiestructurados, aunque pueden contener también datos estructurados. DATOS ESTRUCTURADOS Los datos estructurados son aquellos que tienen una estructura predefinida y fija. Se localizan en un campo fijo de un registro o archivo determinado. Los datos estructurados nombran a cada campo de la base de datos y determinan las relaciones entre los campos. Son fáciles de introducir, almacenar, procesar y analizar (se almacenan en filas y columnas, en tablas): se almacenan en bases de datos y hojas de cálculo. Las bases de datos relaciónales sólo tienen capacidad para almacenar y analizar datos estructurados. Son datos estructurados: Datos de estudiantes, empleados, clientes. Datos financieros. Datos logísticos DATOS NO ESTRUCTURADOS Son aquellos que no contienen una estructura definida y no se pueden incluir fácilmente en columnas, filas y campos; es decir, su formato no se puede indexar con facilidad en tablas relacionadas para su análisis. Son datos no estructurados: Imágenes, fotografías, dibujos. Audio. Video. Publicaciones en redes sociales. Archivos de texto, documentos, presentaciones visuales. Correos electrónicos. Archivos PDF Entradas de redes sociales. Hojas de calculo. Publicaciones en redes sociales. DATOS SEMIESTRUCTURADOS Los datos semiestructurados contienen propiedades de los datos estructurados y los datos sin estructurar. Pueden tener alguna estructura, pero no la estructura estricta de un modelo de datos. En los datos semiestructurados se utilizan etiquetas y otros marcadores para identificar algunos de sus elementos, pero no tienen una estructura rígida. Por ejemplo, datos etiqueta/valor: = Lucas, = Antonia, y = Victoria Ejemplos de datos semiestructurados son: 1. Una publicación de Facebook puede clasificarse por autor, información, longitud, opiniones personales, etcétera, pero el contenido no está estructurado. 2. Un software de tratamiento de textos que incluya metadatos como en las bases de datos documentales; puede incluir fichas de autor, de socio, con nombre, fecha de creación, fecha de modificación, etcétera, pero estos datos no son estructurados. 3. Los datos de correo electrónico son datos sin estructurar, pero se pueden considerar híbridos, ya que tienen una parte estructurada (destinatarios, receptores, asunto) y una no estructurada (texto del mensaje). ANALÍTICA DE DATOS UNIVERSIDAD SLIDE 3 DE GUAYAQUIL FACULTAD DE CIENCIAS ADMINISTRATIVAS ECON. MICHEL MOGOLLÓN CLAUDETT, MBA. UNIDAD # 1 VISIÓN MODERNA DE INTELIGENCIA DE NEGOCIOS Y ANALÍTICA DE DATOS CICLO DE VIDA DE LOS DATOS El ciclo de vida de los datos en un sistema de Inteligencia de Negocios Las etapas de un sistema de gestión de datos son: Recolección de datos. Almacenamiento. Procesamiento y análisis de datos. Visualización de datos. 1. RECOLECCION DE DATOS Se agrupan en dos categorías: Batch (por lotes). Este tipo de recolección de datos se conecta cada cierto tiempo a las fuentes de información. Streaming (en tiempo real). Este tipo de recolección de datos trabaja en modo directo, “continuamente”. Fuentes de datos internas Son todas aquellas que las organizaciones y las empresas tienen a su disposición o podrían tener acceso en la actualidad. Ejemplos de datos típicos son: Datos de registros de clientes. Datos de empleados. Datos de ventas. Fuentes de datos externas Pueden ser públicas o privadas y su procedencia es muy variada: Datos meteorológicos. Datos de Twitter, de Facebook o de Linkedln. Datos de Google Maps. Datos de la nube Almacenamiento de datos personales y corporativos 2. ALMACENAMIENTO Estos datos son estructurados y pueden ser analizados eficientemente. Los componentes y conceptos implicados en el almacenamiento de datos estructurados internos son: Bases de Sistemas de Sistemas de Modelos de datos Almacenes bases de gestión de datos. (repositorios de datos. datos no datos. de datos) relacionales 3. Procesamiento y Análisis de los datos El análisis se puede realizar en la propia empresa o en la nube. Los datos deberán cumplir con unas normas específicas legales y operacionales. La tecnología disponible puede exigir que el análisis se realice fuera de la empresa por razones de potencia de computación Se pueden comprar datos externos de un proveedor de la nube. La empresa deberá tener presente los riesgos financieros en el despliegue de datos y aplicaciones en un proveedor de la nube. Herramientas de Analítica que ayudan al análisis de los datos para su soporte en la toma de decisiones: o Informes y reportes descriptivos o Procesamiento analítico en línea (OLAP) o Minería de Datos o Análisis de datos no estructurados o Minería de texto 4. Visualización de datos Las nuevas herramientas de visualización de datos aportan grandes beneficios frente a los típicos informes de filas, columnas y tablas de información. La visualización de datos es la presentación de datos y de los análisis realizados con el objeto de que los responsables de la toma de decisiones puedan entender todos los conceptos y conocimientos. Ayuda a las personas a descubrir patrones, tendencias, relaciones y eventos que se puedan producir analizando datos ordinarios y complejos, mediante la transformación de datos en un contexto visual. ANALÍTICA DE DATOS ( DATA ANALYTICS) La Analítica de Datos es una técnica consistente en capturar, procesar y analizar los datos, con el objetivo de predecir y anticiparse al futuro en la toma de decisiones. Existen tres técnicas utilizadas en Analítica de Datos: Analítica descriptiva Analítica predictiva Analítica prescriptiva ANALITICA DESCRIPTIVA Consiste en almacenar y realizar agregaciones de datos históricos, visualizándolos de forma que puedan ayudar a la comprensión del estado actual y pasado de la empresa. En esencia, es un análisis de la información histórica. Se consultan y visualizan datos de manera agregada provenientes de los diferentes indicadores de negocio, con el objeto de obtener una visión de lo que ha pasado y lo que está pasando. ANALÍTICA PREDICTIVA Se denomina así a la aplicación de técnicas matemáticas y estadísticas avanzadas, así como el aprendizaje automático (machine learning), para predecir datos necesarios pero que no se visualizan directamente y están ausentes. El análisis predictivo se suele realizar tras el análisis descriptivo y permite predecir los posibles escenarios futuros. Estas predicciones se realizan basándose en informaciones pasadas (datos históricos) y presentes, y permite predecir acontecimientos con un alto grado de probabilidad. ANALITICA PRESCRIPTIVA Capitaliza los conocimientos adquiridos mediante la analítica descriptiva y Predictiva, mediante la optimización del proceso de toma de decisiones. La analítica prescriptiva recopila información del negocio y realiza una integración completa en el mismo, teniendo en cuenta no solo los datos del negocio sino como han impactado las decisiones tomadas en las cuentas de resultados y en los beneficios, y aconseja cuales son los aspectos que se han de contemplar en las acciones futuras por realizar. ANALÍTICA DE DATOS (MODELO DE GARTNER) La consultora Gartner considera cuatro etapas en la analítica de datos: descriptiva, diagnóstico, predictiva y prescriptiva. BIG DATA ANALYITCS SAS, uno de los grandes fabricantes de software, líder mundial en soluciones de programas de Minería de Datos y Analítica de Datos, define Analítica de Big Data como “El proceso de examinar grandes volúmenes de información para descubrir patrones ocultos, correlaciones desconocidas y otra información útil, como tendencias de mercado o preferencias de clientes, que se puede utilizar para tomar mejores decisiones en el ámbito de la empresa”. IMPORTANCIA La Analítica de Big Data ayuda a las organizaciones a aprovechar sus datos y utilizarlos para identificar nuevas oportunidades. Esta característica conduce a negocios más inteligentes, operaciones más eficientes, beneficios más altos y clientes más felices. Podemos resumir los grandes beneficios de utilizar Analítica de Big Data: Reducción de costos. Tecnologías de Big Data tales como Hadoop y Analítica basada en la nube reducen considerablemente los costos cuando se almacenan grandes cantidades de datos en la nube y pueden identificar medios más eficientes para hacer negocios Toma de decisiones mejores y más rápidas. Con la velocidad de Hadoop y la Analítica “en memoria", combinadas con la capacidad para analizar nuevas fuentes de datos, las organizaciones pueden identificar medios más eficientes de hacer negocios. Nuevos productos y servicios. La Analítica de Big Data proporciona a las compañías una gran capacidad para crear nuevos productos y cumplir con las necesidades de los clientes TECNOLOGIAS DE BDA Este modelo de Analítica utiliza numerosas tecnologías que funcionan combinadas entre sí. Las tecnologías más relevantes, según SAS, son: GESTIÓN (ADMINISTRACIÓN) DE DATOS Los datos necesitan ser de alta calidad y bien gobernados antes de ser analizados con fiabilidad MINERÍA DE DATOS Las técnicas de Minería de Datos ayudan a examinar grandes cantidades de datos para descubrir patrones de datos que se utilicen en una mejor toma de decisiones. HADOOP El marco de trabajo, por excelencia, de Big Data es Hadoop, que puede almacenar grandes cantidades de datos y ejecutar aplicaciones de clústeres de servidores para funcionar eficientemente con grandes volúmenes de datos. Un beneficio adicional es que es una plataforma basada en código abierto. ANALÍTICA “EN MEMORIA” El análisis de datos en la memoria del sistema (en lugar de en la unidad de disco duro) se realiza con gran rapidez y eficacia. ANALÍTICA PREDICTIVA La tecnología de analítica predictiva, que ya hemos mencionado, utiliza datos, algoritmos estadísticos y técnicas de aprendizaje automático para identificar y predecir comportamientos basados en los datos históricos. MINERÍA DE TEXTOS Con tecnologías de minería de textos, se pueden analizar datos de la Web, campos comentarios, libros y otras fuentes basadas en texto para descubrir conocimiento (insights) no observado anteriormente. utiliza aprendizaje automático o tecnologías de lenguajes de procesamiento natural para combinar documentos, tales como e-mails, blogs, entradas de Twitter, informes, etcétera, que ayudarán a analizar grandes cantidades de información y descubrir nuevos tópicos y relaciones entre ellos. ANALÍTICA DE DATOS UNIVERSIDAD SLIDE 4 DE GUAYAQUIL FACULTAD DE CIENCIAS ADMINISTRATIVAS ECON. MICHEL MOGOLLÓN CLAUDETT, MBA. UNIDAD # 1 VISIÓN MODERNA DE INTELIGENCIA DE NEGOCIOS Y ANALÍTICA DE DATOS TRANSFORMACION DIGITAL Margaret Rouse define la Transformación Digital como: “la reinvención de una organización a través de la utilización de la tecnología digital para mejorar la forma en que la organización se desempeña y sirve a quienes la constituyen. Digital se refiere al uso de las tecnologías que generan, almacenan y procesan datos”. “La Transformación Digital es la oportunidad estratégica de incorporar nuevas tecnologías, pero sobre todo nuevas lógicas, para que el negocio sea más eficiente y permita nuevas oportunidades” (Rocasalvatella, 2016) La Transformación Digital requerirá nuevas destrezas y un desplazamiento en inversiones TIC. La TD facilita a las empresas combinar la perfección digital, el negocio físico y la experiencia de cliente mientras mejora la eficiencia operativa y el desempeño organizacional. TECNOLOGÍAS FACILITADORAS DE LA TRANSFORMACIÓN DIGITAL Las tecnologías facilitadoras de la Transformación Digital que impactan en los sistemas de Inteligencia de Negocios están ayudando a transformar digitalmente a las empresas. Los pilares fundamentales son: Computación en la nube Big Data Internet de las cosas Ciudades Inteligentes Ciberseguridad Inteligencia Artificial Robótica PREDICCIONES SOBRE EL FUTURO DE LA TRANSFORMACIÓN DIGITAL: TENDENCIAS 2016 (FORBES) La prestigiosa revista Forbes publicó el 6 de diciembre de 2016 un artículo de Gil Press donde proponía tres tendencias estratégicas y tres tecnologías que tendrían, según él, gran impacto en la Transformación Digital a lo largo de 2016. Estrategias Tecnologías La Transformación Digital se convertirá en el principal impulso estratégico para la mayoría de Big Data Analytics será el soporte los CEO. fundamental de la Transformación Digital. Las iniciativas de Transformación Digital se consolidarán y se crearán estrategias de Internet de las cosas será un catalizador negocios con una visión muy amplia durante en la expansión de la Transformación 2016. Digital a todos los campos de la economía. La Transformación Digital requerirá nuevas La Inteligencia Artificial (Al) impulsará habilidades y competencias con un nuevos flujos de ingresos de Transformación desplazamiento hacia inversiones en Digital. TI(Tecnología de la Información). LAS 10 TENDENCIAS MÁS IMPORTANTES PARA LA TRANSFORMACIÓN DIGITAL EN 2017 (FORBES) Daniel Newman , publicó en Forbes las siguientes tendencias para 2017: La adaptabilidad es más vital para el éxito que nunca. La importancia del crecimiento de la experiencia de usuario. La experiencia del cliente. La innovación debe suceder rápidamente. Abrazar a la fuerza de trabajo remota. El advenimiento de la Realidad Aumentada (RA) y la Realidad Virtual (RV). Las interfaces de programas de aplicaciones (API). Big Data and Analytics. La Transformación Digital está conducida por la Internet de las cosas. Las máquinas inteligentes y la Inteligencia Artificial (IA) están despegando en gran medida. Destrucción de silos. CASO DE ESTUDIO: LA TRANSFORMACIÓN DIGITAL EN LA VISIÓN DE TELEFÓNICA Para impulsar en forma global la Transformación Digital de las grandes empresas y ayudarlas a adaptarse al nuevo contexto de mercado, Telefónica ha desarrollado Living Cloud (noviembre 2016) , una propuesta basada en su propia experiencia de transformación como compañía, y que se apoya en los siguientes pilares: La conectividad (es la clave de la Transformación Digital). Una estrategia de servicios cloud vertebrada sobre un modelo híbrido junto con la nube pública y un modelo de gestión y facturación único. El digital workplace. La omnicanalidad y el marketing digital. Big Data e loT son elementos diferenciales para hacer más competitivas a las empresas. La seguridad, clave para garantizar la confianza en el nuevo entorno digital. LA EMPRESA DIGITAL La Transformación Digital de la sociedad está conduciendo a la digitalización de las empresas. Delgado (2016) señala que una empresa digital es “la que usa intensamente las TIC para competir” , y continúa: “Una empresa digital es aquella que ha realizado un esfuerzo consciente y sistemático para, gracias a las tecnologías de la información, ser más ágil, conocer y tener una mejor relación con sus clientes, reducir sus costes mediante la automatización extrema de sus procesos, incorporar tecnología a sus productos o servicios o facilitar la colaboración digital de sus empleados”. LOS DOCE DOMINIOS DE DIGITALIZACIÓN DE LA EMPRESA Delgado (2016; 26-30) define en su obra un modelo para realizar la digitalización de una empresa. Se compone de doce ámbitos o dominios en los que la digitalización impacta a las empresas: ▪ Marketing digital. ▪ Comercio digital. ▪ Redes sociales. ▪ Analíticas. ▪ Procesos digitales. ▪ Colaboración digital. ▪ Innovación digital. ▪ Habilidades digitales. ▪ Conocimiento digital. ▪ Roles digitales. ▪ Plataforma digital. ▪ Puesto de trabajo digital CASO DE ESTUDIO: “ LAS TECNOLOGÍAS MÁS RELEVANTES Y DISRUPTIVAS DE LA ECONOMÍA DIGITAL” (ICEMD DE ESIC) El ICEMD de la ESIC Business & Marketing School Instituto de la Economía Digital | ESIC, publicó en el segundo trimestre de 2017 el estudio Digital Technology for Business, un informe exhaustivo sobre las tecnologías que ICEMD considera más relevantes y disruptivas en 2017, de impacto en la economía digital. Las conclusiones más significativas son: Tecnologías más relevantes en la actualidad son Big Data, Cloud Computing y Virtualización, Ciberseguridad. Tecnologías más disruptivas y con mayor impacto en la sociedad. La inteligencia Artificial y cognitiva; Deep Learning, Chatbots y asistentes virtuales. Tecnologías asociadas a tendencias que aparecerán o desarrollarán más su importancia en los próximos años, tales como Robótica de servicios, vehículo autónomo, Inteligencia Artificia. LA TRANSFORMACIÓN DIGITAL EN LA INDUSTRIA Y EN LA EMPRESA La digitalización de las organizaciones requiere de la puesta en marcha de un proceso de Transformación Digital con las estrategias adecuadas. Existen numerosas propuestas para llevar a cabo el proceso de Transformación Digital: el tamaño, el estado real de digitalización, líneas de negocio, etcétera. Existen dos modelos: España 4.0: La Transformación Digital de la empresa, realizado por la consultora Ronald Berger. Estudio de Transformación Digital de la Empresa, realizado por la empresa especializada Territorio Creativo en colaboración con The London School of Economic Enteprise (LSEE) ESPAÑA 4.0: LA TRANSFORMACIÓN DIGITAL DE LAS EMPRESAS (UNA VISIÓN DESDE INDUSTRIA 4.0) La Transformación Digital, según Roland Berger/ Siemens 12, es la adaptación de las cadenas de valor de los distintos sectores de la economía a ese efecto disruptivo que comienza con el consumidor digital. La Transformación Digital es también la conexión integral de las distintas áreas de la economía y la manera en la que los players (actores) de cada sector se adaptarán a las nuevas condiciones que imperan en la economía digital. Industria 4.0 ✓ Sensores. ✓ Procesos de control avanzado. ✓ Impresión 3D/ Fabricación flexible. ✓ Nanotecnología/ Materiales avanzados. ✓ Sistemas ciberfísicos. Logística 4.0 ✓ Logística. ✓ Vehículos autónomos. ✓ El ecosistema se sustenta en las ciudades y edificios inteligentes con la conectividad de las redes eléctricas inteligentes. ANALÍTICA DE DATOS UNIVERSIDAD SLIDE 5 DE GUAYAQUIL FACULTAD DE CIENCIAS ECON. MICHEL MOGOLLÓN ADMINISTRATIVAS CLAUDETT, MBA. UNIDAD # 2 INFRAESTRUCTURAS Y ARQUITECTURA DE INTELIGENCIA DE NEGOCIOS ALMACENES DE DATOS: DATA WAREHOUSE, OLAP Y DATA LAKE IMPORTANCIA DE LOS DATOS La información y el conocimiento son recursos organizacionales valiosos que pueden proporcionar una ventaja competitiva. El proceso de conversión de los datos en información y, a continuación, de la información en conocimiento para su conversión en toma de decisiones, conducirá a la sabiduría. Este proceso se conoce como pirámide del conocimiento: datos— información — conocimiento — sabiduría GESTIÓN DE LOS DATOS Las aplicaciones de TI requieren datos de alta calidad para su uso eficaz. ¿Qué se entiende por datos de calidad? Son los datos precisos, completos, consistentes, accesibles, relevantes, concisos y oportunos. Los datos de pobre calidad pueden producir tomas de decisiones pobres (ineficientes), servicios de baja calidad al cliente y diseño de productos inadecuados. OBJETIVOS El objetivo de la gestión de datos es proporcionar la infraestructura y herramientas para transformar los datos en bruto (raw data) en información corporativa usable (utilizable) de la más alta calidad. Al igual que se gestionan los activos financieros, se deben gestionar los datos, ya que son activos informacionales de la organización La gestión de los datos requiere: Comprensión de los datos ( perfiles). Calidad de los datos y su mejora continua. Integración de los datos, combinando datos similares procedentes de fuentes diferentes. Aumento de los datos con la mejora continua de su valor La gestión de los datos es un enfoque estructurado para la captura, almacenamiento, procesamiento, integración, distribución, aseguramiento y archivado de los datos de un modo eficiente a lo largo de su ciclo de vida. El ciclo de vida de los datos está muy relacionado con la gestión del conocimiento, ya que la transformación de los datos en conocimiento se realiza en varias etapas como se ve en la gráfica. Comienza con la captura de colecciones de datos que proceden de distintas fuentes (datos internos, externos y personales o de usuarios finales), y su almacenamiento en bases de datos. A continuación, serán preprocesados para adaptarse al formato de un Data Waterhouse o un Data Mart, donde se alojaran definitivamente. Luego, Los usuarios acceden allí y recogen los datos, una muestra, que necesitan para su análisis. El análisis de datos se realiza con técnicas de análisis y herramientas de Minería de Datos, que obtienen patrones para corregir la interpretación mediante resultados (visualización de datos, apoyo a la decisión y herramientas de gestión del conocimiento) y el uso de herramientas o soluciones (sistemas de información) como CRM, ERP, SCM o comercio electrónico. GOBIERNO DE LOS DATOS El gobierno de los datos es un enfoque para gestionar la información a través de una organización completa; implica un conjunto formal de procesos de negocios y prácticas para asegurar que los datos puedan ser manejados de un modo bien definido. Los datos deben tener los siguientes atributos para garantizar un uso competente: El dato debe ser único El dato debe ser correcto y exacto. El dato debe ser oportuno CALIDAD DE INTEGRIDAD DE LOS DATOS La calidad de los datos (DQ, Data Quality) es una propiedad muy importante, dado que determina la utilidad de los datos, así como la calidad de las decisiones que se basan en ellos Los datos deben ser precisos, correctos y válidos. Conseguir la mayor calidad de datos posibles. Fiabilidad de los datos de la empresa. BASES DE DATOS CENTRALIZADAS Almacena todos los archivos relacionados en una única posición lógica. Las bases de datos centralizadas ofrecen muchos beneficios a la organización y empresa, pero también son más vulnerables, ya que cuando la computadora central falla, todos los usuarios se ven afectados. BASES DE DATOS DISTRIBUIDAS Una base de datos distribuida tiene copias completas de una base de datos, o parte de una base de datos, en más de una posición, que, normalmente, está próxima al usuario. Los datos de una base de datos distribuida pertenecen lógicamente a un solo sistema, pero se encuentran físicamente esparcidos en diferentes sitios de la red. Las bases de datos distribuidas se dividen, a su vez, en otras dos categorías: replicadas y particionadas. ALMACENES DE DATOS Las empresas, además de los sistemas de gestión de archivos y de bases de datos, utilizan una variedad de herramientas denominadas: Data Warehouses (almacenes de datos) Data Marts (almacenes de datos departamentales) que pretenden proporcionar a los usuarios, del modo más fácil y rápido posible, el acceso, el análisis y la consulta de datos. DATA WAREHOUSE Es una gran base de datos orientada al análisis de la información histórica; es decir, un depósito o repositorio de datos históricos que se organizan por temas para el apoyo en la toma de decisiones. CARACTERISTICAS Orientado a temas. Los datos contenidos en un Data Warehouse se organizan por temas (entidades): cliente, vendedor, producto, precios, región, que contienen sólo información relevante para la toma de decisiones. La orientación a temas proporciona una visión más completa y comprensiva de la organización, permite que el desempeño de una compañía se pueda evaluar más fácilmente y también se pueda detectar cualquier fuente de ineficiencia Integrado. Los datos que se producen en las diferentes fuentes se integran y homogenizan a medida que se cargan en un Data Warehouse. Por ejemplo, los datos de los clientes se pueden extraer de los sistemas internos y externos, y son integrados alrededor de un identificador de cliente para crear una visión completa y exhaustiva del mismo Variable con el tiempo. Un Data Warehouse mantiene datos históricos. A diferencia de los sistemas transaccionales, que solo mantienen datos recientes (día, mes, año actual), un Data Warehouse puede almacenar años de datos, es decir, datos históricos de varios años. Cada Data Warehouse tiene una calidad temporal. El tiempo es una dimensión importante que deben soportar todos los Data Warehouses No volátil. Después de que los datos se han introducido en un Data Warehouse, los usuarios no pueden cambiar o actualizar los datos. Los datos obsoletos se eliminan y los cambios se registran como nuevos datos. Los datos en los Data Warehouses solo pueden ser cambiados o actualizados por profesionales de TI — responsables de los sistemas de información— , es decir que los Data Warehouses se actualizan, pero solo a través de procesos de carga (entrada) en lugar de los usuarios Multidimensional. Un Data Warehouse puede utilizar una estructura relacional o multidimensional. Las bases de datos relaciónales almacenan datos en tablas bidimensionales. En contraste, los Data Warehouse almacenan datos en una estructura multidimensional que consta de más de dos dimensiones. Una representación típica de esta estructura son los cubos de datos. Los datos en los almacenes de datos se organizan por dimensiones del negocio, temas o entidades (productos, ciudades, empleos o períodos de tiempo). Basados en la Web. Los Data Warehouse se diseñan, normalmente, para proporcionar un entorno de computación eficaz para aplicaciones basadas en la Web. Cliente/servidor. Un Data Warehouse utiliza la arquitectura cliente/servidor para proporcionar acceso fácil a los usuarios finales. Tiempo real. Los nuevos Data Warehouse permiten gestión de datos en tiempo real. Metadatos. Un Data Warehouse contiene metadatos (datos que generan datos), que facilitan la gestión de datos complejos Consolidados. Los datos almacenados en un Data Warehouse se obtienen, normalmente, como resúmenes parciales de datos principales que pertenecen a los sistemas operacionales de los cuales se originaron. Por ejemplo, un operador de telefonía celular puede almacenar en un Data Warehouse el costo total de las llamadas realizadas por cada cliente en una semana, subdividida por rutas de tráfico y por el tipo de servicio seleccionado (llamada, mensaje SMS, datos, etcétera.), en lugar de almacenar las llamadas individuales registradas por el sistema operacional. DATA MART Un Data Mart un sistema que reúne todos los datos requeridos por un departamento específico de una empresa, tales como marketing, recursos humanos, logística o administración, con el objeto de realizar análisis de Inteligencia de Negocios y ejecución de aplicaciones de apoyo a las decisiones de funciones específicas concretas. Existen dos categorías de Data Mart: Dependiente Es un subconjunto de datos que se crea directamente del Data Warehouse. Un Data Mart dependiente tiene las ventajas de utilizar un modelo de datos consistente y proporcionar calidad de datos Independiente Es un pequeño warehouse diseñado para un departamento o unidad de negocio estratégica..