Bases de Datos, Big Data, Data Mart y Data Lake

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson
Download our mobile app to listen on the go
Get App

Questions and Answers

¿Cuál de las siguientes opciones describe mejor la función principal de un Data Warehouse?

  • Almacenamiento de datos estructurados y no estructurados en su formato original.
  • Gestión de operaciones diarias de la base de datos.
  • Habilitar actividades de inteligencia empresarial a través de consultas y análisis. (correct)
  • Procesamiento de transacciones en tiempo real.

¿Qué diferencia fundamental existe entre un Data Lake y un Data Warehouse en términos de procesamiento de datos?

  • El Data Lake ingiere datos rápidamente y los prepara sobre la marcha, mientras que el Data Warehouse prepara los datos cuidadosamente antes de la ingesta. (correct)
  • El Data Warehouse procesa datos no estructurados, mientras que el Data Lake solo maneja datos estructurados.
  • Ambos procesan los datos de la misma manera, pero difieren en la cantidad de datos que pueden manejar.
  • El Data Lake requiere que los datos se preparen antes de ser ingeridos, mientras que el Data Warehouse permite la ingesta directa.

¿Cuál de las siguientes NO es una función típica de las sentencias DML (Data Manipulation Language) en SQL?

  • Insertar datos.
  • Actualizar datos.
  • Recuperar datos.
  • Crear nuevas tablas. (correct)

En el contexto de bases de datos, ¿cuál es el propósito principal de una 'Staging Area'?

<p>Simplificar la limpieza y consolidación de datos provenientes de múltiples sistemas de origen. (A)</p> Signup and view all the answers

¿Qué característica distingue principalmente a las tablas de dimensiones en un esquema de estrella?

<p>Proporcionan datos de contexto y categorías para los datos de hechos. (B)</p> Signup and view all the answers

¿En qué se diferencia principalmente un esquema Snowflake de un esquema Star en el modelado de datos?

<p>El esquema Snowflake normaliza las dimensiones para eliminar la redundancia. (B)</p> Signup and view all the answers

¿Cuál de las siguientes describe mejor la función de ETL (Extract, Transform, Load)?

<p>Un proceso para extraer datos de una base de datos, transformarlos y cargarlos en otra. (B)</p> Signup and view all the answers

Si una empresa necesita consolidar datos de varias fuentes en un formato detallado y mantener una vista completa del negocio ¿cuál de los siguientes sería más apropiado?

<p>Enterprise Data Warehouse (EDW). (C)</p> Signup and view all the answers

¿Cuál es la función principal de SQL (Structured Query Language) en el contexto de bases de datos?

<p>Consultar y administrar bases de datos. (B)</p> Signup and view all the answers

¿Cuál de los siguientes describe un sistema OLTP (Online Transaction Processing)?

<p>Sistema enfocado en ejecutar tareas centradas en transacciones, como ventas y entradas de pedidos. (D)</p> Signup and view all the answers

¿Cuál es la principal ventaja de usar un Data Mart en lugar de un Data Warehouse?

<p>Desarrollo e implementación más rápidos. (B)</p> Signup and view all the answers

¿Qué diferencia existe entre DML (Data Manipulation Language) y DDL (Data Definition Language) en SQL?

<p>DML se utiliza para manipular los datos, mientras que DDL se utiliza para definir la estructura de la base de datos. (D)</p> Signup and view all the answers

¿Cuál de las siguientes opciones describe mejor el propósito de un esquema en una base de datos?

<p>Organizar los objetos de la base de datos, como tablas e índices. (A)</p> Signup and view all the answers

¿Cuál de las siguientes afirmaciones describe mejor una tabla de hechos en un esquema de estrella?

<p>Contiene datos de medición y claves foráneas que enlazan a las tablas de dimensiones. (D)</p> Signup and view all the answers

En el contexto de OLAP (Online Analytical Processing), ¿cuál es el enfoque principal?

<p>Análisis de datos multidimensionales para apoyar la toma de decisiones. (C)</p> Signup and view all the answers

¿Qué significa el término 'Big Data' en el contexto de la gestión de datos?

<p>Conjuntos de datos grandes y complejos, difíciles de procesar con herramientas tradicionales. (B)</p> Signup and view all the answers

¿Qué caracteriza principalmente a una base de datos de tipo MOLAP (Multidimensional OLAP)?

<p>La información se almacena en estructuras especiales multidimensionales. (B)</p> Signup and view all the answers

¿Cuál de las siguientes opciones describe mejor el término 'ROLAP' (Relational OLAP)?

<p>Un modo de almacenamiento OLAP en el cual los datos son almacenados en bases de datos relacionales. (C)</p> Signup and view all the answers

¿Qué función principal cumplen las tablas de dimensiones en un esquema de estrella?

<p>Proporciona contexto descriptivo a los datos de hechos. (C)</p> Signup and view all the answers

¿Cuál es la principal diferencia entre un Data Mart y un Data Warehouse en términos de alcance?

<p>Un Data Warehouse cubre toda la empresa, mientras que un Data Mart es para un departamento o línea de negocio específica. (A)</p> Signup and view all the answers

Flashcards

¿Qué es una base de datos?

Colección organizada de información tratada como una unidad.

¿Qué son Big Data?

Conjuntos de datos grandes y complejos, a menudo de nuevas fuentes.

¿Qué es un Data Mart?

Un almacén de datos limitado a un departamento o línea de negocio.

¿Qué es un Data Lake?

Un lugar para almacenar datos estructurados y no estructurados en bruto.

Signup and view all the flashcards

¿Qué es un Data Warehouse?

Base de datos diseñada para inteligencia empresarial, enfocada en consultas y análisis.

Signup and view all the flashcards

¿Qué es una Dimension Table?

Tablas que proporcionan datos de categorías para dar contexto a los datos de hechos.

Signup and view all the flashcards

¿Qué son DML/DDL?

Lenguaje de manipulación de datos (DML) y lenguaje de definición de datos (DDL).

Signup and view all the flashcards

¿Qué es Enterprise Data Warehouse?

Almacenamiento consolidado de datos brutos para una vista completa del negocio.

Signup and view all the flashcards

¿Qué es ETL?

Extraer, transformar, cargar datos de una base de datos a otra.

Signup and view all the flashcards

¿Qué es Fact Table?

Tablas con datos de medición y muchas filas.

Signup and view all the flashcards

¿Qué es Molap?

Base de datos OLAP multidimensional almacenada en estructuras especiales.

Signup and view all the flashcards

¿Qué es Olap?

Procesamiento analítico en línea; responde rápidamente a consultas complejas.

Signup and view all the flashcards

¿Qué es OLTP?

Procesamiento de transacciones; enfocado en tareas centradas en transacciones.

Signup and view all the flashcards

¿Qué es Rolap?

Almacenamiento OLAP en bases de datos relacionales.

Signup and view all the flashcards

¿Qué es Schema?

Colección de objetos de base de datos (tablas, vistas, etc.).

Signup and view all the flashcards

¿Qué es Snowflake schema?

Modelo de almacén complejo que normaliza las dimensiones.

Signup and view all the flashcards

¿Qué es Sql?

Formato estándar para consultar y administrar bases de datos.

Signup and view all the flashcards

¿Qué es Staging Area?

Área para limpiar y consolidar datos operativos de múltiples sistemas.

Signup and view all the flashcards

¿Qué es Star schema?

Esquema en sistemas de almacenamiento de datos.

Signup and view all the flashcards

Study Notes

Base de Datos

  • Una base de datos es una colección organizada de información tratada como una unidad.
  • El propósito de una base de datos es recopilar, almacenar y recuperar información para su uso en aplicaciones.

Big Data

  • Los macrodatos son conjuntos de datos extensos y complejos, originados principalmente de fuentes de datos recientes.
  • Debido a su gran volumen, estos conjuntos dificultan el procesamiento con software tradicional.

Data Mart

  • Un data mart tiene una función similar a la de un data warehouse, pero con un alcance limitado.
  • Puede servir a un departamento o unidad de negocio específica.
  • Los data marts ofrecen una creación más rápida debido a su cobertura limitada, pero pueden generar problemas de inconsistencia.

Data Lake

  • Un lago de datos sirve para almacenar datos estructurados y no estructurados.
  • También es útil para organizar grandes volúmenes de datos diversos provenientes de diferentes fuentes.
  • Los lagos de datos ingieren y preparan los datos rápidamente, mientras que los almacenes los preparan cuidadosamente antes de ingresar.

Data Warehouse

  • Un almacén de datos es una base de datos diseñada para facilitar la inteligencia empresarial.
  • Está diseñado para consultas y análisis en vez de procesamiento de transacciones.
  • Contiene datos históricos derivados de transacciones y de otras fuentes.
  • Permite separar la carga de trabajo de análisis de la de transacciones y consolida datos de múltiples fuentes.
  • Sirve para mantener registros históricos y analizar datos para comprender y mejorar el negocio.

Dimension Table

  • Las tablas de dimensiones proveen información de categorías para dar contexto a los datos de hechos.
  • En un esquema en estrella para datos de ventas, se incluyen dimensiones para producto, fecha, ubicación, promoción, etc.
  • Actúan como tablas de consulta o referencia.

DML / DDL

  • Dentro de SQL, las operaciones comunes se agrupan en DML (Lenguaje de Manipulación de Datos) y DDL (Lenguaje de Definición de Datos).
  • Las declaraciones DML (SELECT, UPDATE e INSERT) permiten recuperar, almacenar, modificar, eliminar, insertar y actualizar datos.
  • Las sentencias DDL (CREATE, ALTER y DROP) permiten crear, modificar y eliminar objetos de la base de datos, como tablas, índices y usuarios.

Enterprise Data Warehouse (EDW)

  • Un EDW consolida los datos brutos como centro de la arquitectura de almacenamiento de datos.
  • Proporciona una vista de 360 grados del negocio al mantener la información comercial relevante en el formato más detallado.

ETL (Extraer, Transformar, Cargar)

  • Se refiere a tres procesos combinados que se usan para extraer datos de una base de datos y moverlos a otra base de datos.
  • Es una función común en el almacenamiento de datos.

Fact Table

  • Las tablas de hechos contienen datos de medición con muchas filas, pero pocas columnas.
  • Pueden contener miles de millones de filas en grandes empresas.
  • En esquemas en estrella, la tabla de hechos representa más del 90% del espacio de almacenamiento.
  • Una tabla de hechos tiene una clave compuesta formada por las claves primarias de las tablas de dimensiones.

Molap

  • Se trata de una base de datos OLAP multidimensional.
  • La información se almacena en estructuras especiales para luego transferirla a un servidor central.

Olap (Procesamiento Analítico en Línea)

  • Es la base tecnológica de muchas herramientas de inteligencia empresarial.
  • Responde rápidamente a consultas de bases de datos analíticas multidimensionales (MDA).
  • Permite vistas de informes ilimitadas, análisis predictivo y cálculos analíticos complejos.

OLTP (Procesamiento Transaccional en Línea)

  • Es un tipo de procesamiento de datos que ejecuta tareas centradas en transacciones.
  • Implica insertar, eliminar o actualizar pequeñas cantidades de datos en la base de datos.
  • Se usa en transacciones financieras, entrada de pedidos, ventas minoristas y gestión de clientes.
  • Recopila transacciones de datos voluminosas, sin necesariamente analizarlas en conjunto.

Rolap

  • La base de datos rolap es un modo de almacenamiento OLAP en el cual los datos están almacenados en bases de datos relacionales.

Schema

  • Un esquema es una colección de objetos de base de datos (tablas, vistas, índices y sinónimos).
  • Se pueden organizar los objetos de esquema en modelos diseñados para el almacenamiento de datos.
  • El modelo de datos original y los requisitos de los usuarios ayudan a diseñar el esquema del almacén de datos.

Snowflake Schema

  • El esquema de copo de nieve es un modelo de almacén de datos más complejo que el esquema en estrella, pero es un tipo de esquema en estrella.
  • Se llama así porque el diagrama del esquema se parece a un copo de nieve.
  • Los esquemas de copo de nieve normalizan las dimensiones para eliminar la redundancia.
  • Los datos de dimensión se agrupan en varias tablas en lugar de una sola grande.

SQL (Structured Query Language)

  • Es un formato estandarizado para consultar y administrar bases de datos.
  • Es el lenguaje más común para la comunicación de datos.
  • La mayoría de las bases de datos tienen al menos algo de SQL propietario.
  • Algunas bases de datos no lo admiten o utilizan una versión truncada y simplificada.

Staging Area

  • Un área de preparación simplifica la limpieza y consolidación de datos.
  • Se usa para datos operativos que provienen de múltiples sistemas de origen.
  • Es relevante en almacenes de datos empresariales donde se consolida toda la información de una empresa.

Star Schema

  • Los esquemas en estrella se encuentran con frecuencia en sistemas de almacenamiento de datos con almacenes físicos o lógicos integrados.
  • El modelado dimensional crea esquemas en estrella basados en un proceso comercial, como el seguimiento de ventas o envíos.
  • Cada esquema en estrella puede considerarse un data mart y unos 20 data marts pueden cubrir las necesidades de inteligencia empresarial de una empresa.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

More Like This

Amazon S3: Construção de Data Lake
77 questions
Database vs Data Warehouse vs Data Lake
8 questions
Data Warehousing Concepts Overview
23 questions
Use Quizgecko on...
Browser
Browser