Datawarehousing

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Wat is het doel van een OLTP-database?

  • Snel antwoorden geven op queries (correct)
  • Opslaan van historische data
  • Ondersteunen van tactische beslissingen
  • Analyse van grote hoeveelheden data

Welke eigenschap beschrijft het beste een datawarehouse?

  • Beperkt tot een specifiek type data
  • Tijdelijk en enkel actueel
  • Geïntegreerd met focus op thema's (correct)
  • Enkel geopend voor operationele processen

Welke van de volgende beweringen over OLAP is juist?

  • Het vergt minimale opslag van historische data.
  • Het is voornamelijk gericht op operationele processen.
  • Het ondersteunt complexe en onvoorspelbare bevragingen. (correct)
  • Real-time respons is van cruciaal belang.

Wat doet een datawarehousemanagementsysteem (DWMS)?

<p>Beheert de opslag van datawarehouses. (C)</p> Signup and view all the answers

Waarom zijn historische data belangrijk in een OLAP-database?

<p>Ze maken analyses over tijd mogelijk. (C)</p> Signup and view all the answers

Hoe zijn datawarehouses over het algemeen opgebouwd?

<p>Rond onderwerpen of thema's (C)</p> Signup and view all the answers

Wat is een kenmerk van een OLTP-systeem?

<p>Snelle respons is van groot belang. (C)</p> Signup and view all the answers

Wat is een belangrijk aspect van datamining in relatie tot datawarehouses?

<p>Ondersteunen van gegevensanalyse en patronen ontdekken. (A)</p> Signup and view all the answers

Wat zijn de drie stappen van het ETL-proces?

<p>Extract, Transform, Load (B)</p> Signup and view all the answers

Wat gebeurt er met gegevens wanneer ze in een datawarehouse worden ingeladen?

<p>Ze blijven permanent en de oude waarden worden bewaard. (D)</p> Signup and view all the answers

Welke van de volgende kenmerken is niet typisch voor data in een datawarehouse?

<p>Data kan gemakkelijk worden overschreven. (A)</p> Signup and view all the answers

Wat is het belangrijkste verschil tussen een database en een datawarehouse?

<p>Een datawarehouse slaat ook tijdsvastleggingen op en is optimaal voor analyses. (A)</p> Signup and view all the answers

Welke van de onderstaande databronnen is typisch voor een datawarehouse?

<p>Een heterogene set van databestanden, zoals XML en adresboeken. (D)</p> Signup and view all the answers

Waarom is tijdsordening belangrijk in een datawarehouse?

<p>Het stelt gebruikers in staat om historische ontwikkelingen te bestuderen. (D)</p> Signup and view all the answers

Wat is de rol van de gebruiker met betrekking tot tijdsdata in een database?

<p>De gebruiker moet zelf tijdsdata interpreteren en verwerken. (D)</p> Signup and view all the answers

Welke uitspraak over data in een datawarehouse is onjuist?

<p>Data wordt periodiek ingeladen en blijft actueel. (A)</p> Signup and view all the answers

Wat is een kenmerk van het inlaadproces in moderne datawarehouse systemen?

<p>Het inlaadproces is semi-continu. (B)</p> Signup and view all the answers

Wat wordt bedoeld met incrementeel inladen?

<p>Alleen nieuwe of gewijzigde data sinds de laatste laadoperatie worden geladen. (B)</p> Signup and view all the answers

Waarom is het belangrijk om metadata te hebben in een datawarehouse?

<p>Het biedt informatie over de structuur, processen en businessregels. (A)</p> Signup and view all the answers

Wie zijn de primaire gebruikers van een datawarehouse?

<p>Beleidsmakers en analisten. (A)</p> Signup and view all the answers

Wat is een belangrijke functie van toegangssoftware in een datawarehouse?

<p>Het centraliseert en maakt data toegankelijk voor analisten. (A)</p> Signup and view all the answers

Wat type analyses kan een datawarehouse ondersteunen?

<p>Zowel ad-hoc als routinematige analyses. (B)</p> Signup and view all the answers

Wat beschrijft een feit binnen een datawarehouse?

<p>Een geregistreerde waarde waarvan men een bepaalde studie wil maken. (A)</p> Signup and view all the answers

Waarom zijn aggregaties belangrijk in een datawarehouse?

<p>Ze versnellen de uitvoeringstijden van analyses. (C)</p> Signup and view all the answers

Wat is een voorbeeld van een trager veranderend kenmerk?

<p>Verkoper die van regio verandert (D)</p> Signup and view all the answers

Wat gebeurt er bij het overschrijven van de oude waarde van een kenmerk?

<p>Er is een kans op dataverlies. (A)</p> Signup and view all the answers

Welke techniek wordt gebruikt om te integreren geaggregeerde feiten in bestaande matrices?

<p>Niveaucodering (C)</p> Signup and view all the answers

Wat houdt de 'drill-down' operator in?

<p>Het verhogen van het detailniveau van gegevens. (D)</p> Signup and view all the answers

Wat is het belangrijkste karakteristiek van de 'roll-up' operator?

<p>Het uitzoomen voor minder detailniveau. (C)</p> Signup and view all the answers

Welke aanpassingsstrategie houdt in dat nieuwe feiten met een timestamp worden geregistreerd?

<p>Volledige historiek bijhouden. (B)</p> Signup and view all the answers

Welke techniek kan gebruikt worden om alleen feiten die voldoen aan specifieke condities te tonen?

<p>Selecteren (B)</p> Signup and view all the answers

Wat gebeurt er bij de techniek 'slice en dice'?

<p>De gegevens worden geprojecteerd op basis van geselecteerde kenmerken. (D)</p> Signup and view all the answers

Wat houdt het ETL-proces in?

<p>Extractie, transformatie, inladen. (A)</p> Signup and view all the answers

Welke factor maakt volledige automatisering van foutcontrole moeilijk?

<p>Onjuiste definities van concepten. (B)</p> Signup and view all the answers

Wat is een voorbeeld van gegevenstransformatie?

<p>Aggregatie van detailgegevens voor compactere rapportage. (D)</p> Signup and view all the answers

Wat wordt bedoeld met 'impedance mismatch' in gegevensintegratie?

<p>Ongewenst informatieverlies bij het omzetten van datatypes. (D)</p> Signup and view all the answers

Waarom is gegevensintegratie noodzakelijk?

<p>Bij het samenvoegen van data uit verschillende bronnen. (C)</p> Signup and view all the answers

Wat is een veelvoorkomende uitdaging bij gegevensverzameling?

<p>Inconsistentie in de gegevensformaat. (A)</p> Signup and view all the answers

Wat houdt een gegevensevaluatie in?

<p>Correcties van foutieve of onjuiste gegevens. (C)</p> Signup and view all the answers

Wat wordt bedoeld met gegevensvervuiling?

<p>Gegevens die niet op de juiste plaatsen zijn opgeslagen. (B)</p> Signup and view all the answers

Wat is een belangrijke eigenschap van de primaire sleutel in een feitenrelatie?

<p>Deze bestaat uit een samenstelling van vreemde sleutels. (A)</p> Signup and view all the answers

Wat is het doel van een surrogaatsleutel in een dimensierelatie?

<p>Om de datawarehouse onafhankelijk te maken van de structuur van de databronnen. (B)</p> Signup and view all the answers

Welke stelling over sterschema's is correct?

<p>Een sterschema kan meerdere onderwerpen omvatten. (D)</p> Signup and view all the answers

Wat wordt er bedoeld met 'niet-normaliseren' van dimensierelaties?

<p>Het leidt tot prestatiewinst door het vermijden van join-operaties. (B)</p> Signup and view all the answers

Welke van de volgende beschrijvingen over een dimensierelatie is juist?

<p>Het kan een eenvoudig kenmerk van de feiten bevatten. (B)</p> Signup and view all the answers

Wat beschrijft het verschil tussen n-dimensionale matrices en 2-dimensionale basisrelaties?

<p>N-dimensionale matrices hebben een hogere complexiteit. (B)</p> Signup and view all the answers

Welke uitspraak over feitenrelaties is waar?

<p>Feitenrelaties houden alle feiten van een onderwerp bij. (A)</p> Signup and view all the answers

Wat zijn de basisrelaties in relationele datawarehouse-schema's?

<p>Feitenrelaties en dimensierelaties. (D)</p> Signup and view all the answers

Flashcards

OLTP (On-line Transaction Processing)

Een database die ontworpen is voor operationele processen. Deze databases worden gebruikt om transacties te verwerken en moeten snel antwoorden geven op queries. Historische data wordt zelden opgeslagen.

OLAP (On-line Analytical Processing)

Een database die ontworpen is voor data-analyse. OLAP-databases ondersteunen beleidsbeslissingen door het analyseren van grote hoeveelheden data en het vinden van patronen. De nadruk ligt op historische data.

Datawarehouse

Een opslagplaats van data die gericht is op het ondersteunen van beleidsbeslissingen. Data in een datawarehouse is onderwerpgericht, geïntegreerd, permanent en tijdvariërend.

Datawarehousesysteem

Een computersysteem dat datawarehouses beheert, zoals een database management system (DBMS) een database beheert.

Signup and view all the flashcards

Datawarehouse Management System (DWMS)

De softwarecomponent van een datawarehousesysteem die verantwoordelijk is voor het managen van de datawarehouse.

Signup and view all the flashcards

Datawarehouse: Onderwerpgeoriënteerd

Datawarehouses zijn georganiseerd rond onderwerpen of thema's, in tegenstelling tot databases die rond entiteiten zijn opgebouwd.

Signup and view all the flashcards

Data-integratie in datawarehouses

Het verzamelen van data uit verschillende bronnen om het in één consistent formaat in een datawarehouse te integreren.

Signup and view all the flashcards

Datawarehouse: Persistent en tijdvariërend

Data in een datawarehouse is persistent, wat betekent dat het niet verwijderd wordt, en tijdvariërend, wat betekent dat het data over verschillende tijdsperiodes bevat.

Signup and view all the flashcards

ETL

Het proces van het verzamelen en voorbereiden van data uit verschillende bronnen om ze te gebruiken in een datawarehouse.

Signup and view all the flashcards

Gegevensextractie

De stap in ETL die data uit verschillende bronnen haalt.

Signup and view all the flashcards

Gegevensaudit

Het controleren van de kwaliteit en juistheid van de geëxtraheerde data.

Signup and view all the flashcards

Impedance mismatch

Een probleem dat kan optreden tijdens het transformeren van data, waarbij informatie verloren gaat.

Signup and view all the flashcards

Gegevenstransformatie

Het proces van het omzetten van data naar een uniform formaat en datatype, zodat het kan worden gebruikt in het datawarehouse.

Signup and view all the flashcards

Aggregatie

Een vorm van transformatie waarbij data wordt samengevoegd om de hoeveelheid te reduceren.

Signup and view all the flashcards

Gegevensladen

Het proces van het opslaan van de getransformeerde data in het datawarehouse.

Signup and view all the flashcards

Foutieve data

Data die niet volledig of correct is, wat kan leiden tot fouten in analyses.

Signup and view all the flashcards

Datawarehouseschema

Een datawarehouseschema is een logische structuur die de combinaties van benodigde data weergeeft. Het is analoog aan een databaseschema, maar specifiek voor datawarehouses. Het doel is om data op een gestructureerde manier te organiseren voor eenvoudige analyse.

Signup and view all the flashcards

ETL-proces

Het proces van data uit meerdere bronnen te extraheren, te transformeren en te laden in een datawarehouse.

Signup and view all the flashcards

Permanentheid in datawarehousing

Data in een datawarehouse is permanent, wat betekent dat data niet overschreven wordt, maar bewaard blijft om historische trends te analyseren.

Signup and view all the flashcards

Tijdsordening in datawarehousing

Data in een datawarehouse is gesorteerd op tijdstempel, zodat een historische analyse mogelijk is en trends in de tijd bestudeerd kunnen worden.

Signup and view all the flashcards

Datawarehousing-proces

Het ‘datawarehousing’-proces omvat alle activiteiten die betrokken zijn bij het opzetten, beheren en gebruiken van een datawarehouse.

Signup and view all the flashcards

Databronnen in datawarehousing

Datawarehouses halen data uit verschillende bronnen, zoals databases, bestanden, XML-bestanden, etc.

Signup and view all the flashcards

Efficiëntie van datawarehouse

Het ontsluiten van geïntegreerde data in een datawarehouse is efficiënter dan het ontsluiten van data uit individuele bronnen.

Signup and view all the flashcards

Stabiliteit van datawarehouse

Datawarehouses blijven stabiel over tijd, wat belangrijk is voor repliceerbare analyses en consistente resultaten.

Signup and view all the flashcards

Inladen

Het proces waarbij data vanuit de bronnen naar het datawarehouse wordt overgebracht. Dit kan real-time gebeuren of uitgesteld.

Signup and view all the flashcards

Incrementeel inladen

Het proces waarbij wijzigingen in de bronnen worden bijgewerkt in het datawarehouse.

Signup and view all the flashcards

Backflushing

Het terugsturen van fouten en correcties naar de bronnen.

Signup and view all the flashcards

Data en metadata

Data in het datawarehouse wordt op verschillende detailniveaus opgeslagen, van zeer gedetailleerd tot samenvattingen.

Signup and view all the flashcards

Metadata

Meta-informatie over het datawarehouse zelf, zoals technische details, het ETL proces en businessregels.

Signup and view all the flashcards

Meerdimensionaal datamodel

Een datawarehouse slaat data op in de vorm van meerdimensionale matrices, waarbij elke matrix een bepaald onderwerp voorstelt.

Signup and view all the flashcards

Feiten

De werkelijke waarden die worden geanalyseerd in het datawarehouse.

Signup and view all the flashcards

Kenmerken van feiten

De contextuele informatie die bij een feit hoort.

Signup and view all the flashcards

Meerdere detailniveaus

Verschillende detailniveaus worden gebruikt om aggregaties te creëren. Aggregaten van een algemener niveau zijn samenvattingen van details op een lager niveau.

Signup and view all the flashcards

Aggregatietechnieken

De meest gebruikelijke technieken voor het samenbrengen van data op meerdere niveaus:

Signup and view all the flashcards

Afzonderlijke matrix

Een kleine, aparte matrix wordt gebruikt om gedetailleerde data te aggregeren. Dit zorgt voor een efficiënte opslag van samenvattingen.

Signup and view all the flashcards

Niveaucodering

Gedetailleerde data in één grote matrix, waarbij geaggregeerde data worden gemarkeerd met een "niveaucode". Dit vereenvoudigt de opslag.

Signup and view all the flashcards

Traag veranderende kenmerken

Kenmerken (bv. regio van een verkoper) die zelden veranderen. De waarde kan wel wijzigen, maar niet vaak.

Signup and view all the flashcards

Aanpassingsstrategieën

Manieren om om te gaan met veranderingen in traag veranderende kenmerken bij analyse.

Signup and view all the flashcards

Oude waarde overschrijven

De oude waarde van het kenmerk wordt overschreven door de nieuwe waarde. Efficiënt, maar er gaat data verloren! Wordt gebruikt om fouten te corrigeren.

Signup and view all the flashcards

Volledige historiek

Alle eerdere waarden van een kenmerk worden bewaard met tijdstempels. Dit levert een complete historische record.

Signup and view all the flashcards

Meerdimensionaal datawarehouse-schema

Een datawarehouse-schema dat n-dimensionale matrices behoudt en implementeert. Dit schema wordt gebruikt om multidimensionale data te modelleren.

Signup and view all the flashcards

Feitenrelatie

Een type basisrelatie in een relationeel datawarehouse-schema dat alle feiten van een bepaald onderwerp bijhoudt. Elke rij in de feitenrelatie correspondeert met één cel in de multidimensionale matrix.

Signup and view all the flashcards

Dimensierelatie

Een type basisrelatie in een relationeel datawarehouse-schema dat informatie geeft over de waarde van één kenmerk van de feiten uit een cel.

Signup and view all the flashcards

Twee-dimensionaal schema voor n-dimensionale matrices

Een schema dat datawarehouse-matrices voorstelt als tweedimensionale relaties, vergelijkbaar met relationele databaseschema's. De semantische betekenis verschilt echter aanzienlijk.

Signup and view all the flashcards

Sterschema

Een relationeel datawarehouse-schema dat data in de vorm van sterren voorstelt. Elk onderwerp wordt weergegeven door één feitenrelatie en meerdere dimensierelaties.

Signup and view all the flashcards

Surrogaatsleutels creëren

Het proces van het creëren van surrogaatsleutels voor dimensierelaties in een datawarehouse. Dit zorgt ervoor dat het datawarehouse onafhankelijk is van de structuur van de data in de bronnen.

Signup and view all the flashcards

Samengestelde primaire sleutel in een feitenrelatie

De primaire sleutel van een feitenrelatie wordt gevormd door het combineren van alle vreemde sleutels van alle dimensierelaties die betrekking hebben op de feiten.

Signup and view all the flashcards

Denormalisatie in datawarehouses

Een vorm van datawarehousemodellering die gebruikmaakt van denormalisatie, waardoor join-bewerkingen sneller kunnen worden uitgevoerd, maar mogelijk redundantie creëert.

Signup and view all the flashcards

Study Notes

Datawarehousing

  • Datawarehousing is anders dan transactionele dataverwerking. Het heeft andere doelstellingen en vereist andere functionaliteiten.
  • Werk met transacties: gericht op operationele processen, vereist actuele operationele data, die constant veranderen, voorspelbare instructies. Analysen zijn minder complex. De totale hoeveelheid data is groot.
  • Gegevensanalyse: gericht op tactische en strategische beslissingen, gebruik van historische data die niet aangepast worden maar wel toegevoegd, vragen onvoorspelbaar en eenmalig, zeer complexe analyses, grote hoeveelheid data.
  • OLTP (Online Transaction Processing): databases die operationele databases ondersteunen, sneller antwoord op vragen, maar niet geschikt voor complexe analyses, alleen actuele data.
  • OLAP (Online Analytical Processing): databases gericht op analyses van veel data en opzoeken van patronen in historische gegevens, niet gericht op operationele processen, historische data zeer belangrijk.

Basisconcepten

  • Datawarehouse: onderwerpgericht, geïntegreerd, permanent, tijd-variërend verzameling van data, ondersteuning van besluitvorming. Het is een opslagplaats om patronen te ontdekken in data.

Datawarehouse-systeem

  • Het is een computersysteem voor het beheer van datawarehouses, net zoals een database een DBMS heeft.
  • Het ontwerp is onderwerpgeoriënteerd, in tegenstelling tot databaseontwerpen die rond entiteiten gebaseerd zijn. Het ontwerp is gebaseerd rond thema's zoals inkomsten van personen, studieresultaten en verkoopcijfers.
  • Gegevens van verschillende bronnen worden gecombineerd. Het systeem is geïntegreerd.
  • Data zijn niet opgeschreven maar worden ingeladen.
  • Het is permanent, gegevens worden niet gewijzigd maar er wordt meer data toegevoegd. Oude data blijft bestaan.
  • Gegevens variëren in de tijd, dus historische data is cruciaal.
  • Het ETL-proces is essentieel. (Extract, Transform, Load): data uit verschillende bronnen extracten, transformeren voor uniformiteit en inladen.
  • Data die uit verschillende bronnen komen zijn heterogene bronnen. Dat betekent ze elk hun eigen dataformats, structuur en conventies hebben.

Datawarehousing-proces

  • Het proces omvat verschillende stappen, waaronder het extraheren van gegevens, controleren en aanpassen.
  • Het ontwerp van het datawarehouse-systeem is belangrijk voor efficiënte data-analyses.

Data in een Datawarehouse

  • Data en metadata in databases worden opgeslagen in verschillende niveaus van details.
  • Actuele en historische data worden opgeslagen.
  • Aggregaties worden gemaakt om analysetijd te verkorten.
  • Metadata (data over data) is uitgebreider dan in gewone databases.

Logisch Datawarehouse-ontwerp

  • Relatie tussen Feiten en Dimensies: Feiten zijn de numerieke data die geanalyseerd worden. Dimensies zijn de verschillende aspecten van de feiten (bijv. datum, product, locatie). Beide worden opgeslagen in verschillende tabellen.
  • Sterschema's: Simpel schema dat één feitentabel en meerdere dimensietabellen gebruikt.
  • Snowflake-schema's: Variatie op sterschema's, met meer dimensies of geaggregeerde data. Ze zijn complexe tabellen.
  • Feitenconstellatie: Een relationeel ontwerp voor datawarehouses met twee of meer feitenrelaties die dezelfde dimensies delen.

Meerdimensionale Datawarehouse-modellen

  • Feiten en kenmerken worden georganiseerd in matrices.
  • Feiten zijn numeriek, kenmerken zijn dimensies.
  • Matrices zijn geschikt voor complexe analyses.
  • Granulariteit (detailniveau) kan veranderen, matrices zijn hiëarchisch.
  • Operaties zoals 'slice en dice', 'drill down', 'roll up', en 'selecteren' worden beschreven voor matrices.

Virtuele Datawarehouses en Datamarts

  • Virtuele datawarehouses zijn uitbreidingen van databases, gebaseerd op materiaaliseerde views.
  • Datamarts zijn kleinere datawarehouses, vaak gekoppeld aan een grotere enterprise-wide datawarehouse.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

More Like This

Use Quizgecko on...
Browser
Browser