Data warehouse

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Quelle est la principale fonction d'un entrepôt de données selon la définition de Georges GARDARIN-99 ?

  • Gérer la sécurité du réseau de l'entreprise.
  • Stocker des données non structurées telles que des e-mails et des documents.
  • Aider à la prise de décision dans l'entreprise. (correct)
  • Fournir une base de données transactionnelle pour les opérations quotidiennes.

Quelle caractéristique distingue les données d'un entrepôt de données (DWH) des données des organisations traditionnelles ?

  • Les données du DWH sont utilisées pour des applications de production en temps réel.
  • Les données du DWH sont volatiles et fréquemment mises à jour.
  • Les données du DWH sont orientées processus fonctionnel.
  • Les données du DWH sont structurées par thème (sujet). (correct)

Parmi les suivantes, quelle est une caractéristique essentielle des données intégrées dans un entrepôt de données ?

  • Elles résultent de l'intégration de données hétérogènes provenant de différentes sources. (correct)
  • Elles peuvent être dupliquées pour améliorer la redondance.
  • Elles proviennent d'une seule source pour garantir la cohérence.
  • Elles sont stockées dans un format non normalisé pour accélérer l'accès.

Quelle est la principale implication du fait que les données d'un entrepôt de données (ED) soient non volatiles ?

<p>Les données sont principalement utilisées pour l'interrogation et ne sont pas modifiées. (A)</p> Signup and view all the answers

Quelle est l'importance des données historisées dans un entrepôt de données (ED)?

<p>Elles représentent l'activité de l'entreprise sur une période donnée, permettant l'analyse des variations dans le temps. (B)</p> Signup and view all the answers

Quelles sont les trois phases principales du processus général de construction et d'exploitation d'un entrepôt de données (ED)?

<p>Construction de la base de données décisionnelle, sélection des données à analyser, analyse des données. (C)</p> Signup and view all the answers

Dans l'architecture fonctionnelle d'un entrepôt de données, quel est le rôle du dictionnaire de métadonnées?

<p>Centraliser les informations sur les données, telles que leur définition, leur origine et leur structure. (B)</p> Signup and view all the answers

Quel est le défi principal posé par les sources d'informations hétérogènes lors de la construction d'un entrepôt de données?

<p>L'hétérogénéité des données, nécessitant des processus d'homogénéisation et d'intégration. (C)</p> Signup and view all the answers

Quelle est la fonction principale d'un entrepôt de données (DWH) par rapport à une base de données opérationnelle?

<p>Stocker toutes les informations extraites des sources et optimiser l'accès aux informations pour des requêtes non prévues. (C)</p> Signup and view all the answers

Comment les données sont-elles structurées dans un entrepôt de données (DWH) selon les axes synthétique et historique?

<p>Les données sont structurées selon deux axes : synthétique (agrégation) et historique (évolution dans le temps). (D)</p> Signup and view all the answers

Concernant l'axe synthétique d'un entrepôt de données (DWH), quelles données représentent les événements les plus récents?

<p>Les données détaillées. (B)</p> Signup and view all the answers

Quelle est la différence principale entre un entrepôt de données (ED) et un magasin de données (MD)?

<p>L'ED collecte l'ensemble de l'information utile à l'entreprise, tandis que le MD extrait une partie des données pour un besoin spécifique. (D)</p> Signup and view all the answers

Quelle est la caractéristique principale d'un magasin de données (Data Mart)?

<p>Il est un petit entrepôt de données ciblé sur un sujet spécifique. (A)</p> Signup and view all the answers

Dans un contexte d'entrepôt de données, qu'est-ce que l'ODS (Operational Data Store) représente ?

<p>Un regroupement des données intégrées récupérées des sources. (B)</p> Signup and view all the answers

Dans l'architecture fonctionnelle d'un entrepôt de données (ED) à 3 niveaux, quel est le rôle du niveau d'extraction ?

<p>Détecter et extraire les mises à jour des données des bases de données opérationnelles. (C)</p> Signup and view all the answers

Quelle est la fonction du moniteur de source (source monitor) dans le niveau d'extraction d'un entrepôt de données ?

<p>Détecter les mises à jour effectuées sur la source d'information et repérer les données à envoyer à l'ED. (B)</p> Signup and view all the answers

Quel est le rôle de l'adaptateur de source (source wrapper) dans le processus d'extraction des données ?

<p>Traduire les requêtes et les données entre le modèle de la source locale et le modèle de l'entrepôt de données. (B)</p> Signup and view all the answers

Dans l'architecture d'un entrepôt de données, quelle est la fonction principale du médiateur (mediator) au niveau de fusion ?

<p>Fournir une vision intégrée des données provenant de différentes sources et extraire des vues intégrées. (B)</p> Signup and view all the answers

Quel est le rôle principal du moteur OLAP dans un entrepôt de données ou un magasin de données ?

<p>Exécuter des requêtes interactives complexes et analyser les données selon différents axes. (A)</p> Signup and view all the answers

Quelle est la fonction principale des outils de fouille de données (Data Mining) dans un entrepôt de données ?

<p>Extraire automatiquement des propriétés cachées et des connaissances valides et compréhensibles. (A)</p> Signup and view all the answers

Quel type d'informations peut-on trouver dans le dictionnaire de données d'un entrepôt de données (ED)?

<p>Les informations sur les données de l'ED, y compris leur définition, origine et structure. (A)</p> Signup and view all the answers

Le dictionnaire de données d'un entrepôt de données contient des informations sur ? (Sélectionnez toutes les affirmations qui s'appliquent)

<p>Toutes les données de l'ED (A), Chaque étape lors de la construction de l'ED (C), Le passage d'un niveau de données à un autre lors de l'exploitation de l'ED (D)</p> Signup and view all the answers

Quels sont les trois fonctions essentielles d’un entrepôt de données ?

<p>La collecte de données de bases existantes et chargement, la gestion des données dans l’entrepôt et l’analyse de données pour la prise de décision. (E)</p> Signup and view all the answers

Quelles sont les étapes dans le processus général de construction d’un entrepôt de données ?

<p>Construction de la base de données décisionnelle, la sélection des données à analyser et l’analyse des données. (C)</p> Signup and view all the answers

Qu’est-ce qu’un magasin de données (Data Marts - DM) extraire pour faciliter les traitements décisionnels?

<p>Des données d’un ENTREPÔT ou de BD existantes. (A)</p> Signup and view all the answers

Qu’est qu’un moniteur (source monitor) dans Niveau extraction?

<p>C’est un composant logiciel détectant les mises à jour effectuées sur la source d'information et repérerant les données à envoyer à l'ED pour sa mise à jour ultérieure. (E)</p> Signup and view all the answers

Considérant l’architecture fonctionnelle ED à 3 niveaux. C’est quoi une importance du médiateur (mediator)?

<p>de fournir une vision intégrée des différentes sources d'information et d'extraire par des requêtes des parties de ces vues intégrées (D)</p> Signup and view all the answers

Dans un Niveau exploitation. Quel d'assertions est une fonction des Outils de fouille de données (Data Mining)

<p>Extraction automatique de propriétés cachées et l'extraction automatique de connaissances (D)</p> Signup and view all the answers

D'après le texte, dans la modélisation relationnelle, comment chaque sujet est-il géré au niveau de l'entrepôt ?

<p>Chaque sujet correspond à une Table gérée par l'entrepôt. (A)</p> Signup and view all the answers

Dans le contexte d'un ED, quelle est la conséquence directe du fait que les données soient non volatiles ?

<p>L'utilisation prédominante des données pour l'interrogation (consultation). (A)</p> Signup and view all the answers

Dans le cadre d'un entrepôt de données (ED), pourquoi est-il nécessaire d'intégrer des données issues de sources hétérogènes ?

<p>Pour obtenir une vue complète et cohérente des informations nécessaires à la prise de décision. (D)</p> Signup and view all the answers

Suite à l'extraction, quelles sont les étapes suivantes effectuées sur les données avant leur utilisation dans un ED ?

<p>Transformation et validation. (D)</p> Signup and view all the answers

Quels sont les avantages d'un DataMart pour des besoins d'analyse ?

<p>Il simplifie et accélère les analyses ciblées. (A)</p> Signup and view all the answers

Quels sont les principaux objectifs de l'extraction, de la transformation et du chargement (ETL) des données dans un contexte de Data Warehouse ?

<p>Garantir l'intégrité, la qualité et la cohérence des données. (C)</p> Signup and view all the answers

Selon le texte, quel type de triggers est utilisé si les SGBD en disposent?

<p>détectant les mises à jour (C)</p> Signup and view all the answers

Selon le texte, quelle type de base de données est utilisé, si les bases locales préexistent?

<p>relationnelles (A)</p> Signup and view all the answers

Selon le texte, pourquoi le rôle de metadata est important à permettre dans les Data Warehouses?

<p>l'accés aux données (C)</p> Signup and view all the answers

Flashcards

Data Warehouse

A data warehouse is a set of historical data varying over time, organized by subjects, consolidated in a unique database, managed in a specific storage environment, helping in decision making in the enterprise.

Data Warehouse Functions

Collecting data from existing bases and uploading, managing the data in the warehouse, and data analysis for decision making.

Subject-Oriented Data

Data organized by subject, not by application or function.

Integrated Data

Data from different sources are integrated into a unified structure.

Signup and view all the flashcards

Non Volatile Data

Data is essentially used in querying (consultation) and cannot be modified..

Signup and view all the flashcards

Historical Data

Data represents the company's activity over a certain period (several years) allowing to analyze variations of a data over time

Signup and view all the flashcards

Data Mart

A component of a data warehouse where targeted data are located for analysis.

Signup and view all the flashcards

What does an ED consist of?

Collect all the useful information to decision-makers from data sources

Signup and view all the flashcards

OLAP

An approach to answer multi-dimensional analytic queries swiftly.

Signup and view all the flashcards

What is level extraction?

Extraction of data from operational DB's. Detecting updates and data integration.

Signup and view all the flashcards

Level Transformation/Fusion

Integrating, loading and storing extracted data in a data warehouse organized by subject.

Signup and view all the flashcards

Level Exploitation

Reports, dashboards, and graphics. Exploration of stored data.

Signup and view all the flashcards

Source Monitor

A software component that detects updates on a data source and routes the data to the ED for updating.

Signup and view all the flashcards

Source Wrapper

A software component translating requirements and info from a local source to your ED.

Signup and view all the flashcards

Mediator

Software component that provides a consolidated view from sources and provides access to integrated views.

Signup and view all the flashcards

Moteur OLAP

d'exécuter des requêtes interactives complexes,d'analyser interactivement les données selon des axes, de visualiser des résultats de ces analyses, d'effectuer les opérations OLTP classiques

Signup and view all the flashcards

Data Mining

l'extraction automatique de propriétés cachées, l'extraction automatique de connaissances

Signup and view all the flashcards

Data Dictionary

A repository of information about data which guides data warehouses.

Signup and view all the flashcards

Study Notes

  • Data warehouses are a collection of historical data that changes over time.
  • They are organized by topic and consolidated into a single database.
  • They are managed in a specific storage environment to assist in business decision-making.

Course Objectives

  • Introduction and definition of a data warehouse.
  • Modeling and architecture of a data warehouse.
  • OLAP and implementation of data warehouses.

Data Warehouse Definition by Georges GARDARIN-99

  • A set of historical data varying over time.
  • The data is organized by subject and consolidated into a single database.
  • It is managed in a specific storage environment to aid in business decision-making.
  • Data warehouses involve three essential functions: data collection, data management, and data analysis.

Definition by Stanford (1995)

  • Data warehouse is a storage device for integrated information from distributed, autonomous, and heterogeneous sources.

Definition by Immon (1992)

  • A data warehouse is a collection of data that is subject-oriented, integrated, non-volatile, and historical.

Subject-Oriented Data

  • Data warehouses, unlike traditional organizational data, are oriented towards functional processes or applications.
  • Data warehouses structure data by theme or subject, such as client or vendor.
  • An ED (Entrepôt de Données) gathers and organizes data associated with different functional structures of the company.
  • The ED is pertinent to a subject or theme, and responds to analysis needs.
  • Data warehouses offer easy access to data that has been categorized by functional subject.
  • Relational modeling involves each subject corresponding to a table managed by the data warehouse.
  • Defining tables requires isolating strategic data, determining necessary details, and using summaries to preserve data.
  • Data summaries are generally calculated using queries with aggregates.
  • This data arrangement allows for analysis of subjects across functional and organizational structures and iterative subject analysis.

Integrated Data

  • Data in a warehouse results from integrating data from different sources, which may be heterogeneous.
  • Integration aims to avoid data duplication across several subjects and requires normalization, management of reference data, data coherence, and semantic rule application.

Non-Volatile Data

  • Data in the data warehouse is used for querying and cannot be modified, except for updates.
  • There is no data deletion.
  • Repeat queries yield the same results and maintaining traceability of information ensures consistent decision-making.

Historical Data

  • Data represents a company's activity over a certain period, enabling analysis of data variations over time.
  • It tracks the evolution of different values of the indicators to be analyzed and uses a defined temporal reference.

Data Warehouse Construction in 3 Phases

  • Construction of the decision-making database, involving conceptual modeling of multi-form and multi-source data, designing the data warehouse, feeding the warehouse (extracting, cleaning, transforming, loading), and physical storage of the data.
  • Selection of data which includes, data marts, cubes, tables etc to be analyzed based on user needs.
  • Data analysis, which includes, statistics, reporting, and data mining.

Functional architecture of Data Warehouse

  • Data warehouses use metadata dictionaries, OLAP servers, ETL processes, data marts, and front-end tools.

Heterogeneous Information Sources

  • They include internal and external data that are highly heterogeneous with issues of different sources
  • Relational databases, object databases, network databases, flat files, HTML documents, etc. are used.
  • The data is generally modified on a daily basis.
  • The components are used for feeding, homogenization, and data integration.

DWH (Data Warehouse)

  • Data warehouses store all information extracted from sources.
  • Data warehouses can be relational, multidimensional, or object-oriented.
  • Multidimensional databases are optimized for data access based on unforeseen queries at the time of database creation.

Data Structure

  • Data have a 2 axes: synthetic and historical
  • Data have 2 types: detailed and aggregated

Synthetic Axis

  • A synthetic axis establishes a hierarchy of aggregation and includes detailed data representing recent events, aggregated data synthesizing detailed data, and strongly aggregated data summarizing at a higher level.

Historical Axis

  • The historical axis includes detailed historical data representing past events.
  • Storing metadata is necessary that concerns origin, structure, used method for aggregation.

Data Marts

  • Data marts have targeted data for analysis and provide a small data warehouse focused on a specific subject, sourced from a data warehouse or directly from different sources.
  • Data marts require less infrastructure than warehouses and can be implemented more quickly.

Data Warehouse vs Data Marts

  • Data warehouses collect information useful for decision-makers from various sources.
  • Data warehouses centralize decision-making information and integrates extracted data, guaranteeing its longevity.
  • Data Marts are subject-oriented, aid in OLAP analysis processes, and extract a portion of useful data for a specific user group or analysis need.
  • Data warehouses are for managing large historical detail databases, are centralized storage, and are organized to facilitate data management and history.
  • Data marts are small warehouses with a lighter infrastructure for rapid implementation
  • Data marts extract data from a data warehouse or existing databases to aid decision-making with a specific model facilitating decision-making processes.

Data Warehouse vs. Data Marts - Size Comparison

  • Data warehouses use large machines for historical detail databases and centralized storage, whereas data marts have lighter infrastructure and quicker setup.
  • Data warehouses extract data for overall decision support, while data marts extract data with models that support specific decision-making processes.
  • Data warehouses support the entire enterprise with SQL-type servers and have multi-subject enterprise scope, while data marts support departments with MD or OLAP and have a department-focused scope.
  • Data warehouses range in size from >100 GB with implementation times between 9-18 months, data marts range from 10-20 GB with 6-12 month implementation times.

Logical View of the Data Warehouse Structure

  • Customization is performed on Data Marts, forming Customization.
  • CDW (Corporate Data Warehouse) allows Aggregation.
  • ODS (Operational Data Store) historical data allows Integration.
  • Data cleaning and archiving are involved in the Preparation.
  • The data extracted from multiple data sources are considered data sources.

Functional Architecture of an ED: 3 Levels:

  • Data at the source gets extracted, filtered to a BD source, for operational data and is a legatory form.
  • There is transformation and fusion when extracting data.
  • At the presentation, there is the client.

Extraction Level

  • The two strategies for extraction is, "push" for immediate incorporation to ED and "pull," a scheduled BD update to ED.

Level Transformations/Fusions

  • Data extracted is added, stored, and loaded to an ED BD.
  • Refresh the data when mise-à-jour gets updated.

Exploitation

  • Use analyses, dashboards, tables, and other tools to explore data in the ED.

Data Source Monitor

  • The monitor component detects and finds the updated data to send to the ED.
  • Data uses the source wrapper (extraction) to translate local files and requests for a vice versa method.

Mediator

  • Mediators are used in the ED, they remove redundancies in various multiple data.

OLAP Engines

  • This engine looks for an OLAP in the data.

Metadata Dictionaries

  • Contains info or metadata for data source in an ED, is the data dictionary for each component.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

More Like This

Use Quizgecko on...
Browser
Browser