Data Engineering Concepts Quiz

Podcast

Listen to an AI-generated conversation about this lesson

Download our mobile app to listen on the go

Get App

Questions and Answers

Ktoré z nasledujúcich možností patria medzi podstatné otázky spojené s výberom systému ukladania dát?

Architektúra dátového skladu (correct)
Verzia operačného systému
Typ zdrojového systému (correct)
Teplota dát (correct)

Generovanie dát sa vyskytuje iba na začiatku životného cyklu dátového inžinierstva.

False (B)

Čo je to "hot data"?

Najčastejšie prístupné dáta.

___ dáta sa zriedkavo vyťahujú a sú vhodné na ukladanie do archívnych systémov.

Studené

Signup and view all the answers

Spojte typy zdrojových systémov s ich príkladom:

Relácie databázových systémov = MySQL NoSQL = MongoDB IoT = SenZory v priemyselných zariadeniach Dátové prúdy = Real-time events log

Signup and view all the answers

Data engineers sa nemusí vedieť komunikovať s technickými tímami.

False (B)

Signup and view all the answers

V ktorých fázach životného cyklu dátového inžinierstva sa nachádza bezpečnostná vrstva?

Bezpečnosť je prítomná vo všetkých fázach životného cyklu dátového inžinierstva.

Signup and view all the answers

Multiverzná časová pečiatka v riadení súbežnosti umožňuje viacerým transakciám súčasne pristupovať k rovnakému dátovému elementu, ale len na čítanie.

False (B)

Signup and view all the answers

Optimizmustické techniky v riadení súbežnosti predpokladajú, že konflikty sú ______ a že je efektívnejšie nechať transakcie prebiehať bez oneskorení.

zriedkavé

Signup and view all the answers

Ktorá z nasledujúcich fáz sa nenachádza v optimizmustických technikách?

Spracovanie (A)

Signup and view all the answers

Vysvetlite hlavný princíp multiverzného riadenia súbežnosti pomocou časovej pečiatky.

Multiverzné riadenie súbežnosti pomocou časovej pečiatky umožňuje viacerým transakciám súčasne pristupovať k rovnakému dátovému elementu tým, že pre každú zmenu vytvorí novú verziu dátového elementu. Pri čítaní sa vyberie verzia, ktorá zaisťuje serializovateľnosť. Staršie verzie sa zmazú, keď už nie sú potrebné.

Signup and view all the answers

Spojte každý pojem s jeho definíciou:

Multiverzné riadenie súbežnosti = Umožňuje transakciám pristupovať k rôznym verziám dátového elementu a zaisťuje serializovateľnosť. Optimizmustické techniky = Predpokladajú, že konflikty sú zriedkavé a nechajú transakcie prebiehať bez oneskorení. Základné riadenie súbežnosti pomocou časovej pečiatky = Predpokladá, že existuje len jedna verzia dátového elementu a umožňuje prístup k nemu len jednej transakcii súčasne.

Signup and view all the answers

Aký je konečný zostatok na účte po transakciách T1 a T2?

£190 (D)

Signup and view all the answers

Nezaviazaná závislosť je, keď jedna transakcia môže vidieť medzičasové výsledky inej transakcie pred jej potvrdením.

True (A)

Signup and view all the answers

Čo je to serializovateľnosť?

Identifikácia vykonaní transakcií, ktoré zaručujú konzistenciu.

Signup and view all the answers

Problém _nastáva, keď transakcia číta niekoľko hodnôt a druhá transakcia aktualizuje niektoré z nich počas vykonávania prvej.

neúplnej analýzy

Signup and view all the answers

Zarovnajte nasledujúce problémy s ich popisom:

Stratený aktualizačný problém = Strata aktualizácie druhej transakcie Nezviazaná závislosť = Prístup k medzičasovým výsledkom Problém neúplnej analýzy = Čítanie hodnôt počas aktualizácie

Signup and view all the answers

Aký je spôsob, ako sa vyhnúť stratenému aktualizačnému problému?

Zabrániť T1 čítať balx pred aktualizovaním. (C)

Signup and view all the answers

Serializovateľnosť zvyšuje paralelitu transakcií.

False (B)

Signup and view all the answers

Aký zostatok by mal mať balx po transakcii T4, ak T4 zruší svoju aktualizáciu?

£100

Signup and view all the answers

Súbor čítaní/písaní sú o transakciách sa nazýva _ .

časový plán

Signup and view all the answers

Aký je hlavný problém nesprávneho rozvrhu zamknutia?

Transakcie uvoľňujú zámky príliš skoro. (A)

Signup and view all the answers

Protokol Two-Phase Locking (2PL) povoľuje akvizíciu nových zámkov počas zmenšovacej fázy.

False (B)

Signup and view all the answers

Aké sú dve fázy protokolu 2PL?

Rastúca fáza a zmenšovacia fáza.

Signup and view all the answers

Protokol 2PL zabraňuje problému ______ aktualizácie.

stratenej

Signup and view all the answers

Usporiadajte problémy a ich riešenia pomocou protokolu 2PL:

Stratená aktualizácia = Preventing Lost Update Problem Nezavedená závislosť = Preventing Uncommitted Dependency Problem Nejednotná analýza = Preventing Inconsistent Analysis Problem Kaskádový rollback = Preventing Cascading Rollback Problem

Signup and view all the answers

Čo sa stane, ak transakcia T14 zlyhá?

Všetky transakcie, ktoré jej závisia, musia byť tiež zrušené. (D)

Signup and view all the answers

Pri dodržiavaní protokolu 2PL môže nastať problém so uvoľnením zámkov.

True (A)

Signup and view all the answers

Čo znamená celková serializovateľnosť transakcií?

Transakcie musia byť vykonané v takom poradí, aby sa správali ako keby sa vykonávali sekvenčne.

Signup and view all the answers

V protokole 2PL sa uvoľnenie všetkých zámkov odkladá až na koniec transakcie, aby sa zabránilo ______.

kaskádovému rollbacku

Signup and view all the answers

Čo sa stane, ak transakcia má časovú pečiatku menšiu ako časová pečiatka poslednej transakcie, ktorá zapísala daný prvok?

Transakcia je zrušená a reštartovaná (D)

Signup and view all the answers

Každá transakcia dostáva časovú pečiatku na základe predchádzajúcej transakcie.

False (B)

Signup and view all the answers

Aké sú problémy spojené s detekciou a zotavením z mŕtvej zóny?

výber obete mŕtvej zóny, ako ďaleko vrátiť transakciu, zabránenie hladu.

Signup and view all the answers

Jedným z hlavných cieľov ____ je zabrániť zablokovaniu transakcií.

časového pečiatkovania

Signup and view all the answers

Zlúčte nasledujúce komponenty časového pečiatkovania s ich definíciami:

read-timestamp = časová pečiatka poslednej transakcie, ktorá prečítala prvok write-timestamp = časová pečiatka poslednej transakcie, ktorá zapísala prvok ts(T) = časová pečiatka aktuálnej transakcie T konflikt = situácia, keď sa transakcie snažia naraz meniť rovnaké dáta

Signup and view all the answers

Aká je výhoda časového pečiatkovania v porovnaní s inými metodami správy transakcií?

Zefektívňuje čítanie a zápis bez zamykania (B)

Signup and view all the answers

Pri časovom pečiatkovaní nie je potrebné vrátiť transakcie späť, ak neexistuje konflikt.

True (A)

Signup and view all the answers

Aký identifikátor je vytvorený systémom DBMS pre určenie relatívneho času začatia transakcie?

časová pečiatka

Signup and view all the answers

Pri konflikte je možné vyriešiť situáciu tak, že _____ a transakcia sa znovu spustí.

vrátite transakciu späť

Signup and view all the answers

Čo sa deje s transakciou, ak je jej časová pečiatka väčšia ako časová pečiatka píšúcej transakcie?

Transakcia je zrušená a reštartovaná (D)

Signup and view all the answers

Flashcards

Model zrelosti dát

Rámec na hodnotenie úrovne správy dát v organizácii.

Cykly inžinierstva dát

Stupne transformácie surových dát na užitočný produkt.

Generácia dát

Etapa, kde dáta vznikajú z pôvodných systémov.

Ukladanie dát

Miesto na uloženie údajov po ich ingestii.

Signup and view all the flashcards

Ingestia dát

Proces získavania dát zo zdrojových systémov.

Signup and view all the flashcards

Tepelné triedy dát

Kategorizácia dát podľa frekvencie prístupu: horúce, teplé, studené.

Signup and view all the flashcards

Technické zodpovednosti dátového inžiniera

Zručnosti potrebné na stavbu architektúr optimalizujúcich výkon a náklady.

Signup and view all the flashcards

Problém strateného aktualizovania

Strata aktualizácie T2 je zabránená, ak T1 nečítajú balx pred aktualizáciou.

Signup and view all the flashcards

Problém nekontrolovanej závislosti

Ked je transakcia schopná vidieť medzičlánkové výsledky inej transakcie pred jej potvrdením.

Signup and view all the flashcards

Problém nekontrolovanej závislosti - príklad

T4 aktualizuje balx na £200, ale ak abortuje, T3 už čítalo £200, čo vedie k nesprávnemu zostatku.

Signup and view all the flashcards

Problém nekonzistentnej analýzy

Nastáva, keď transakcia číta niekoľko hodnôt, ale iná transakcia niektoré z nich aktualizuje počas vykonávania.

Signup and view all the flashcards

Nešpinavé čítanie

Prečítanie hodnoty, ktorá môže byť nielen správna, ale aj neskôr zrušená.

Signup and view all the flashcards

Serializovateľnosť

Cieľ regulácie súťaže je naplánovať transakcie, aby sa predišlo zásahom.

Signup and view all the flashcards

Triedenie transakcií

Sekvencia čítaní/písaní zo sadzby súbežných transakcií.

Signup and view all the flashcards

Konzistentnosť

Zabezpečiť, že všetky transakcie udržujú údajovú integritu počas súbežného spracovania.

Signup and view all the flashcards

Aby sa zabránilo konfliktom

Preventívne opatrenia, aby sa zabezpečilo, že transakcie neprekážajú navzájom.

Signup and view all the flashcards

Základné pravidlo časového označovania

Pravidlo, ktoré obmedzuje operácie na základe časového označovania transakcií.

Signup and view all the flashcards

Multiverzné časové označovanie

Povolenie viacerých verzií dát na zvýšenie konkurencie medzi transakciami.

Signup and view all the flashcards

Optimistické techniky

Metóda, ktorá predpokladá, že konflikty sú zriedkavé a transakcie sa môžu vykonávať bez prerušenia.

Signup and view all the flashcards

Fázy optimistických techník

Sú tri: Čítanie, Validácia a Písanie.

Signup and view all the flashcards

Fáza čítania

Prvá fáza optimistických techník, ktorá trvá od začiatku až po predkomit.

Signup and view all the flashcards

Chybné uvoľňovanie zámkov

Transakcie uvoľňujú zámky príliš skoro, čo narušuje izoláciu a atomickosť.

Signup and view all the flashcards

Dvojfázové zamykanie (2PL)

Protokol, kde všetky zámky sú získané pred prvým uvoľnením v transakcii.

Signup and view all the flashcards

Rastová fáza

Fáza transakcie, kedy sa získavajú všetky zámky, ale nemôžu sa uvoľniť.

Signup and view all the flashcards

Skracovacia fáza

Fáza transakcie, kedy sa uvoľňujú zámky, ale nepridávajú sa nové.

Signup and view all the flashcards

Problém stratených aktualizácií

Situácia, keď zámky zabraňujú prepisovaniu starších údajov.

Signup and view all the flashcards

Nezáväzná závislosť

Problém vznikajúci, ak transakcie závisia na nezávislých údajoch pred potvrdením.

Signup and view all the flashcards

Kaskádová rollback

Situácia, kedy sa zrušenie jednej transakcie prenáša na ďalšie závislé transakcie.

Signup and view all the flashcards

Serialization schedule

Zoznam transakcií, ktorý zaručuje ich správne usporiadanie bez konfliktu.

Signup and view all the flashcards

Zabránění kaskádovej rollback

Preventívne opatrenia na zabránenie kaskádovým rollbackom pri 2PL.

Signup and view all the flashcards

Detekcia mŕtvej slučky

Proces identifikácie, či sú transakcie v stave mŕtvej slučky.

Signup and view all the flashcards

Obnova z mŕtvej slučky

Riešenie zahŕňajúce výber obete a spätné spustenie transakcie.

Signup and view all the flashcards

Časť vrátenia transakcie

Rozhodovanie o tom, ako ďaleko vrátiť transakciu pri obnove.

Signup and view all the flashcards

Timestamping

Globalne usporiadanie transakcií podľa ich časových značiek na prednosť.

Signup and view all the flashcards

Časová značka (Timestamp)

Jedinečný identifikátor pre transakciu, zobrazujúci jej začiatok.

Signup and view all the flashcards

Prispôsobenie zápisu

Zápis sa povolí, ak posledná aktualizácia bola vykonaná staršou transakciou.

Signup and view all the flashcards

Read-timestamp

Časová značka poslednej transakcie, ktorá prečítala položku.

Signup and view all the flashcards

Write-timestamp

Časová značka poslednej transakcie, ktorá zapísala položku.

Signup and view all the flashcards

Čítanie dátuma (Read(x))

Podmienka vyžaduje, aby bola položka aktualizovaná staršou transakciou.

Signup and view all the flashcards

Zápis dátumu (Write(x))

Zápis je zamietnutý, ak posledný zápis je od mladšej transakcie.

Signup and view all the flashcards

Study Notes