quiz image

Historia de la minería de datos y business intelligence

ITKnow avatar
ITKnow
·
·
Download

Start Quiz

Study Flashcards

68 Questions

¿A qué se refieren las fuentes de información en un data warehouse?

A los lugares de donde se extraerán los datos

¿Cuáles son las principales fuentes de datos según el texto?

Bases de datos de sistemas operacionales y sistemas departamentales

¿Qué tipo de sistemas pueden ser incluidos como fuentes de información para un data warehouse?

Sistemas corporativos como CRM y ERP

¿Qué tipo de sistemas departamentales son mencionados en el texto?

Sistemas basados en hojas de cálculo

¿Por qué son importantes las fuentes de información externas para un data warehouse?

Para enriquecer la información existente

¿Cuál es la función principal de las bases de datos en un data warehouse?

Extraer datos para su análisis

¿Por qué se mencionan las siglas CRM, ERP, SCM y HCM en el texto?

Como ejemplos de sistemas corporativos mencionados como fuentes de información

¿Cuál de las siguientes afirmaciones es correcta sobre los sistemas BI?

Están optimizados para consultas de alto rendimiento que involucran la agregación de grandes cantidades de datos.

Según Josep Lluís Cano, ¿quiénes se benefician de la información generada por Business Intelligence?

Todos los departamentos y personas que toman decisiones en la organización.

¿Cuál de los siguientes NO es un problema típico mencionado por Ralph Kimball?

Los sistemas BI no pueden manejar grandes volúmenes de datos transaccionales.

Según el texto, ¿cuál de los siguientes departamentos se menciona como un posible beneficiario de Business Intelligence?

Departamento de recursos humanos.

¿Cuál de las siguientes afirmaciones NO es un problema típico mencionado por Ralph Kimball?

La falta de capacitación en el uso de herramientas BI dificulta el acceso a los datos.

Según el texto, ¿cuál de los siguientes departamentos se menciona como un posible beneficiario de Business Intelligence?

Departamento de ventas/comercial.

¿Cuál de las siguientes afirmaciones es correcta sobre los sistemas BI según el texto?

Están optimizados para consultas de alto rendimiento que involucran la agregación de grandes cantidades de datos.

Según el texto, ¿cuál de los siguientes departamentos NO se menciona como un posible beneficiario de Business Intelligence?

Departamento de servicio al cliente.

¿Según William Inmon (2005), por qué considera que el modelo relacional es mejor para el diseño de un data warehouse?

Porque permite soportar el acceso de muchos usuarios distintos con diferentes requerimientos.

¿Cuál es la clave según William Inmon para el buen funcionamiento del data warehouse?

Reshaping del modelo relacional.

¿Por qué se considera fácil crear tablas sumarizadas en el modelo relacional de William Inmon?

Porque los datos están almacenados al nivel más granular y normalizado.

¿Qué ventaja menciona William Inmon sobre el acceso a tablas sumarizadas en términos de performance?

Es altamente eficiente en términos de performance.

¿Qué se debe hacer para que las tablas sumarizadas sean accesibles directamente y eficientes en performance?

Crearlas a partir de necesidades específicas de un conjunto único de usuarios.

¿Cuál es una característica clave del modelo multidimensional según William Inmon?

Está optimizado para un grupo único de usuarios.

¿Qué sucede si un usuario accede al data warehouse con un modelo multidimensional que no está optimizado para él?

Debe pagar el precio de una performance que no es la óptima.

Según Inmon, ¿cuál es la ventaja principal del modelo relacional?

Proporciona flexibilidad al cambio y a nuevos requerimientos

¿Qué afirma Inmon sobre las tablas sumarizadas en el modelo relacional?

Proveen agregaciones de datos a nivel granular

¿Cuál es la desventaja del modelo multidimensional según Inmon?

Todas las anteriores

Según Inmon, ¿para qué tipo de diseño es ideal el modelo relacional?

Diseño de un data warehouse

¿Para qué tipo de diseño recomienda Inmon el modelo multidimensional?

Diseño de un data mart

Según Inmon, ¿cómo se diseñan los data warehouses?

A partir de los requerimientos de información corporativos

¿Cuál sería un error según Inmon al diseñar un data warehouse?

Utilizar un modelo multidimensional

¿Qué afirma Inmon sobre el impacto al cambio en el modelo relacional?

El impacto al cambio es reducido y aislado

Qu herramientas surgieron en los 90 para la bsqueda de patrones y relaciones ocultas en los datos?

Herramientas de minera de datos

Qu afirma William Inmon sobre los conceptos ligados a BI a partir de 1994?

Que surgieron las bases de datos multidimensionales y OLAP

En qu ao se propuso el concepto actual de BI?

1989

Qu posibilit la aparicin de Internet en relacin al software BI?

Que el software BI estuviera disponible a travs de la visualizacin de informacin en un navegador

Qu conceptos surgieron y permitieron disminuir los costos de implementacin de grandes sistemas de BI?

Software como servicio (SaaS) y computacin en la nube (cloud computing)

Cundo logr el software BI una importante insercin en las organizaciones?

A finales de la dcada de 1990

Qu tipo de datos se podan obtener gracias a la implementacin de enormes almacenes de datos?

Conocimiento de grandes volmenes de datos

Cul de los siguientes conceptos NO se menciona como surgido a partir de 1994 en relacin a BI?

Sistemas de gestin de contenidos

¿Cuál es uno de los principales desafíos en los procesos ETL mencionados en el texto?

Cambio de tecnología para la extracción de datos desde los sistemas transaccionales hasta el data warehouse

¿Qué se debe hacer con los campos no clave antes de escribirlos en el data warehouse?

Reformatearlos

¿Qué se debe hacer con los datos a medida que se introducen en el data warehouse?

Limpiarlos

¿Cuál es uno de los temas clave de auditoría/metadatos cuando se cargan grandes volúmenes de datos en el data warehouse?

Registro de cantidad de datos extraídos, transformados y cargados

¿Cuál es uno de los desafíos mencionados en el texto relacionados con la consolidación de datos de distintas fuentes en el data warehouse?

Limpieza de datos

¿Qué se debe hacer con los campos clave en las bases de datos operacionales antes de escribirlos en el data warehouse?

Reestructurarlos y convertirlos

¿Cuál es la principal diferencia entre el ODS y el data warehouse según el texto?

El ODS está diseñado para procesamiento en tiempo real, mientras que el data warehouse almacena valores históricos.

¿Cuál es una de las principales características del diseño del ODS según el texto?

Sigue un modelo híbrido, pudiendo ser relacional en una parte y multidimensional en otra.

¿Cuál es una de las principales diferencias entre el ODS y el data warehouse mencionadas en el texto?

Las actualizaciones de datos en el ODS son ocasionales, a diferencia del data warehouse.

¿Cuál es una de las características del ODS mencionadas en el texto?

Generalmente contiene no más de un mes de histórico.

¿Cuál es una de las relaciones mencionadas en el texto entre el ODS y el data warehouse?

Los flujos de datos entre ambos son bidireccionales.

Según el texto, ¿qué tipo de aplicaciones BI corren sobre el ODS y no sobre el data warehouse?

Aplicaciones que necesitan visualizar datos actuales.

¿Cuál es el propósito principal del repositorio de metadatos según el texto?

Definir el significado de cada tabla y atributo en el Data Warehouse

¿Cuál de los siguientes departamentos se menciona en el texto como posible beneficiario de la información generada por Business Intelligence?

Finanzas

¿Cuál es el principal reto en la construcción del repositorio de metadatos según el texto?

Homogeneizar la terminología utilizada en la organización

¿Cuál es la función principal del ODS (Operational Data Store) según el texto?

Dar soporte a la toma de decisiones operativas y diarias

¿Cuál de los siguientes beneficios del repositorio de metadatos se menciona en el texto?

Proporcionar definiciones de negocio y descripciones de datos

¿Qué tipo de información se menciona que puede contener el repositorio de metadatos?

Definiciones de negocio y descripciones de datos

¿Qué considera William Inmon que es mejor para el diseño de un data warehouse?

El modelo relacional

¿Por qué es relativamente fácil crear tablas sumarizadas en el modelo relacional de Inmon?

Porque los datos están almacenados al nivel más granular y más normalizado

Según Inmon, ¿cuál es la clave para el buen funcionamiento del data warehouse?

El reshaping del modelo relacional

¿Por qué es importante el nivel de granularidad en el modelo relacional según Inmon?

Para optimizar el acceso a las tablas sumarizadas

¿Cuál es la principal ventaja de las tablas sumarizadas en términos de performance, según Inmon?

Son accesibles directamente y altamente eficientes

¿Cómo se facilita la creación de nuevas tablas sumarizadas en el modelo relacional según Inmon?

Al tener los datos almacenados al nivel más granular

¿Cuál es la principal ventaja del modelo relacional según el texto?

Es flexible y versátil para combinar datos

¿Cuál es la principal característica del modelo multidimensional?

Es eficiente en el acceso a los datos

¿Cómo se describe la estructura del modelo multidimensional?

Tiene una tabla central con registros denormalizados y tablas de dimensiones alrededor

¿Qué afirma el texto sobre las tablas de dimensiones en el modelo multidimensional?

Tienen pocos registros en comparación con la tabla fact

¿Qué disciplina destaca el texto en el diseño de la base de datos del modelo relacional?

La claridad del significado y uso de los datos normalizados

¿En qué se basa la estructura del modelo multidimensional según el texto?

En los requerimientos del usuario

Study Notes

  • William Inmon sentó las bases de la primera definición arquitectónica de Business Intelligence (BI) sobre el "corporate information factory", destacando la importancia del modelo relacional para el diseño de un data warehouse.
  • Inmon defiende que el modelo relacional es más flexible al cambio y permite la creación eficiente de tablas sumarizadas a partir de datos almacenados a nivel granular y normalizado.
  • El modelo relacional facilita la creación de nuevas tablas sumarizadas con diferentes agregaciones y criterios de selección, sin necesidad de modificar la estructura base.
  • En contraste, el modelo multidimensional, optimizado para un grupo único de usuarios, puede afectar la performance al agregar nuevos requerimientos o grupos de usuarios.
  • Inmon sostiene que los data warehouses se diseñan a partir de los requerimientos corporativos globales, mientras que los data marts se enfocan en departamentos específicos.
  • Las fuentes de información para alimentar el data warehouse incluyen bases de datos operacionales, sistemas departamentales, y fuentes externas como bases de datos de terceros para enriquecer la información de clientes.
  • Los usuarios de BI, incluyendo departamentos como compras, ventas, finanzas, marketing, recursos humanos y operaciones, requieren acceso a información útil para la toma de decisiones.
  • Ralph Kimball señala que los problemas típicos de los usuarios de BI incluyen dificultades para acceder a grandes volúmenes de datos, la necesidad de obtener datos importantes fácilmente, y desperdiciar tiempo en discusiones sobre la veracidad de los datos en lugar de enfocarse en decisiones.

Explore la historia y evolución de la minería de datos y la inteligencia empresarial en los años 90. Descubra cómo surgieron las herramientas de data mining y los conceptos asociados al BI, como bases de datos multidimensionales y OLAP.

Make Your Own Quizzes and Flashcards

Convert your notes into interactive study material.

Get started for free

More Quizzes Like This

Data Mining Chapter 5
29 questions

Data Mining Chapter 5

RationalEmpowerment avatar
RationalEmpowerment
Business Intelligence: Data Mining Techniques
18 questions
Use Quizgecko on...
Browser
Browser