Datenmanagement 1 VO - Block 1 - WS 2024/25

Summary

This document covers the topic of data management and database systems. It discusses concepts such as the role of data in information systems, storage methods, and characteristics of database systems. The content is suitable for undergraduate-level courses on data management and related topics.

Full Transcript

Datenmanagement 1 VO Block 1 – Datenmanagement und Datenbanksysteme Christina Feilmayr, WS 2024/25 §. Teil 1 – Einführung in Datenmanagement § Was sind Daten? § Fachliche Sicht vs. technische Sicht auf Date...

Datenmanagement 1 VO Block 1 – Datenmanagement und Datenbanksysteme Christina Feilmayr, WS 2024/25 §. Teil 1 – Einführung in Datenmanagement § Was sind Daten? § Fachliche Sicht vs. technische Sicht auf Daten § Datenmanagement – Motivation, Methoden, Herausforderungen § Informationssysteme Teil 2 – Einführung in Datenbanksysteme § Datenbanksysteme § Charakteristika von Datenbanksystemen § Datenbankentwurfsprozess Agenda § 3-Schichten-Konzept von Datenbanksystemen 2 LERNZIELE BLOCK 1 §. DATENMANAGEMENT UND DATENBANKSYSTEME § Generelle Bedeutung von Daten und Maßnahmen, um den Wert seiner Daten nachhaltig zu maximieren § Bedeutung von Daten und welche Rolle Daten für Informationssysteme einnehmen § Bedeutung von Datenmanagement – Motivation, Methoden, Herausforderungen § Wissen über Ansätze, wie Daten gespeichert werden können § Speicherung der Daten in Datenbanksysteme und Abgrenzung zu einer dateibasierten Speicherung § Definition der Begriffe Datenbanksystem, Datenbankmanagementsystem, Datenbank, Informationssystem § Gestaltung des Datenbankentwurfsprozesses § Wissen über das 3-Schichten-Konzept eines Datenbanksystems MEB | DMT1VO © CHRISTINA FEILMAYR 3 INHALT §. 1 - EINFÜHRUNG IN DATENMANAGEMENT § Was sind Daten? - Fachliche Sicht vs. technische Sicht auf Daten - Daten Lebenszyklus - Entstehung von Information § Datenmanagement - Motivation - Methoden, Herausforderungen, Tools, Trends § Informationssysteme - Definition und Komponenten - Abgrenzung zu Anwendungssysteme MEB | DMT1VO © CHRISTINA FEILMAYR 4 §. Einführung in 1 Datenmanagement §. WAS SIND DATEN? DISKUSSIONSRUNDE #1 Was sind Daten? § Geben Sie drei Beispiele von Anwendungssystemen, welches Daten in irgendeiner Form nutzt? MEB | DMT1VO © CHRISTINA FEILMAYR 6 FACHLICHE SICHT AUF DATEN §. VERSUS TECHNISCHE SICHT Die häufigsten Fragestellungen der einzelnen Geschäftsfunktionen/des Managements zum Thema Daten beziehen sich auf das Wissen über die Daten und nicht auf technische Fragestellungen bzw. die Daten an sich § In welchen Systemen werden meine Daten gespeichert? § Woher stammen die Zahlen aus meinem Bericht? § Wo kann ich zusätzlich Informationen zu meinen Daten finden? § Sind die Daten korrekt? § Wie vollständig sind meine Daten? Zusammengefasst Welche Daten die Organisation hat, woher sie kommen, was sie bedeuten, wer verantwortlich ist, wo sie gespeichert werden, wer sie verändern darf, wo sie überall verwendet werden, welche besonders schützenswert sind, in welcher Qualität sie vorliegen und wie sie strukturiert sind. DATEN ÜBER DATEN = METADATEN MEB | DMT1VO © CHRISTINA FEILMAYR 7 WAS SIND DATEN? §. DATEN ALS GRUNDLAGE Daten sind die Grundlage für Informationen Daten sind Zeichen oder Symbole, die Informationen darstellen und dem Zweck der Verarbeitung dienen Wissenstreppe nach North | http://north-online.de/ MEB | DMT1VO © CHRISTINA FEILMAYR 8 ENTSTEHUNG VON INFORMATION §. TRANSFORMATION VON DATEN ZU INFORMATIONEN Hinzufügen von Bedeutung, durch Selektierung, Strukturierung und Transformation/Aufbereitung der Daten DATA TRANSFORMING PROCESS INFORMATION Nützliche Information setzt akkurate Daten voraus DATENMANAGEMENT MEB | DMT1VO © CHRISTINA FEILMAYR 9 DATENMANAGEMENT §. BEDEUTUNG § Menge an Daten, die zur Auswertung zur Verfügung stehen, wird immer größer § Wichtige Ressource im Unternehmen, durch die Nutzung können fundierte Entscheidungen getroffen werden - Beschleunigung und Verbesserung von Entscheidungsprozessen - Optimierung von internen Geschäftsprozessen - Steigerung der betrieblichen Effizienz - Steigerung der Umsätze und Gewinne - Sicherung der Wettbewerbsvorteile gegenüber Mitbewerbern, Erkennung von Markttrends - Geschäftsprobleme erkennen § Effektives Datenmanagement unverzichtbar (hinsichtlich Risiken) Grundlage für datengetriebene Entscheidungen, datengetriebenes Arbeiten, aber auch datengetriebene Wissensvermittlung MEB | DMT1VO © CHRISTINA FEILMAYR 16 NOTWENDIGKEIT DATENMANAGEMENT §. SPEICHERUNG UND AUFBEREITUNG § Daten müssen strukturiert aufbereitet werden, um sie sinnvoll nutzen zu können § Fokus auf strukturierte Daten, gespeichert in Datenbanken § Sinnvolle Aufbereitung und vor allem gewinnbringende Nutzung der Daten bedeutet - Standardisierung von Datenformaten - Anreicherung von Metadaten - Entfernung von Dubletten, Löschung von nutzlosen Daten - Aggregation von Daten - Analyse von Daten - Visualisierung von Daten MEB | DMT1VO © CHRISTINA FEILMAYR 17 DATENMANAGEMENT §. DEFINITION § Durch effektives Datenmanagement werden Benutzer mit korrekten, zeitnahen und relevanten Informationen versorgt - Relevante Informationen: wenn sie für die Aufgaben und Entscheidungen, für die sie benötigt werden, hilfreich und geeignet sind - Um die entsprechende Informationsversorgung für Führungskräfte und Mitarbeiter innerhalb des Unternehmens sicherzustellen, müssen die gesamten Daten sorgfältig verwaltet werden § Datenmanagement bezeichnet den gezielten Umgang mit Daten innerhalb eines Unternehmens - Es umfasst die Planung, Organisation, Steuerung und Überwachung aller Prozesse, die für die Erfassung, Speicherung, Aufbereitung, Analyse und Nutzung von Daten erforderlich sind - Dabei geht es vor allem darum, die Qualität und Verfügbarkeit von Daten zu gewährleisten und somit eine effiziente und effektive Nutzung zu ermöglichen MEB | DMT1VO © CHRISTINA FEILMAYR 18 METHODEN DES DATENMANAGEMENTS §. § Datenbankmanagement DATENMANAGEMENT 1 - Daten werden in Datenbanksystemen organisiert - Daten können mittels Abfrage-Werkzeuge effektiv und effizient genutzt werden - Wesentliche Komponente eines jeden Informationssystems § Data Warehousing DATENMANAGEMENT 2 - Daten aus unterschiedlichen Quellen zusammengeführt - Historisierung der Datenbestände - Fokus auf komplexere Datenanalysen § Big Data Analytics - Analyse/Abfrage von sehr großen Datenbeständen - U.a. auch Analyse von unstrukturierten Texten, Bildern, Videos etc. MEB | DMT1VO © CHRISTINA FEILMAYR 22 TOOLS IM DATENMANAGEMENT §. § Relationale Datenbankmanagementsysteme - Organisierte Daten in Tabellen dadurch effiziente Speicherung, Verwaltung und Verarbeitung - Beispiele: MySQL, MS SQL Server, Oracle, PostgreSQL § Data Warehouse - Spezielle Art von Datenbank (verwendet oft als Basis eine relationale DB), Historisierung der Daten - Beispiele: Amazon Redshift, Snowflake, Oracle Exadata § NoSQL Datenbank - Flexiblere Strukturierung, besser geeignet für unstrukturierte Daten - Beispiele: Couchbase, Cassandra, MongoDB § Data Lake - Sammlung von Rohdaten aus unterschiedlichen Quellen, Struktur muss nicht vorab definiert werden - Beispiele: Amazon S3, Microsoft Azure Data Lake, Google Cloud Storage MEB | DMT1VO © CHRISTINA FEILMAYR 23 INFORMATIONSSYSTEME §. BEDEUTUNG Informationssysteme werden als Systeme verstanden, die Informationen verarbeiten, d.h. erfassen, übertragen, transformieren, speichern und bereitstellen. § Dienen dazu, die in einem Unternehmen anfallenden Aufgaben zur Erfüllung von Unternehmenszwecken zu unterstützen (Erreichung von Unternehmenszielen) § Hohe strategische Bedeutung § Unterstützung in der Entscheidungsfindung § Das technische Rückgrat von Informationssystemen ist das Datenmanagement bzw. Datenbanksysteme MEB | DMT1VO © CHRISTINA FEILMAYR 26 INFORMATIONSSYSTEME §. KOMPONENTEN INFORMATIONSSYSTEM ANWENDER ORGANISATION ANWENDER MANAGEMENT BETRIEBLICHE AUFGABEN/PROZESSE ANWENDUNGS- DATEN SOFTWARE IT-INFRASTRUKTUR ANWENDUNGSSYSTEM MEB | DMT1VO © CHRISTINA FEILMAYR 28 §. Einführung in 2 Datenbanksysteme, Datenbank Entwurfsprozess INHALT §. 2 – EINFÜHRUNG IN DATENBANKSYSTEME, DB-ENTWURFSPROZESS § Datenbanksysteme - Komponenten - Kernstück Datenbankmanagementsystem - Limitierungen von dateibasierten Ansätzen § Datenbankentwurfsprozess - 3-Schichten-Konzept eines Datenbanksystems - Datenbank Schema - Phasenmodell des Prozesses § Beispiele - Grober Entwurfsprozess - Zusammenhang 3-Schichten-Konzept MEB | DMT1VO © CHRISTINA FEILMAYR 33 DATENBANKEN §. Sammlung von Daten | Eingabe, Suche, Gewinnen und Ändern/Manipulieren von Daten DB oft als Synonym verwendet für DBMS oder DBS MEB | DMT1VO © CHRISTINA FEILMAYR 34 DATENBANKSYSTEME §. KOMPONENTEN UND DEREN ZUSAMMENHANG ANWENDUNGEN DATENBANKMANAGEMENTSYSTEM (DBMS) DATENBANK (DB) DATENBANKSYSTEM MEB | DMT1VO © CHRISTINA FEILMAYR 35 DATENBANKSYSTEME §. DEFINITIONEN § Datenbanksystem (DBS) - Zusammenfassung der Komponenten Datenbank (DB) und Datenbankmanagementsystem (DBMS) - System zur Beschreibung, Speicherung und Wiedergewinnung umfangreicher Datenmengen, die von verschiedenen Anwendungsprogrammen benutzt werden § Datenbanken (DB) - Menge von logisch zusammengehörenden Daten, Sammlung aller gespeicherten Daten - Deckung des Informationsbedarfs verschiedener Benutzer durch ein automatisiertes Datenverarbeitungs- systems (üblicherweise ein DBMS) - Berücksichtigung logischen Beziehungen § Datenbankmanagementsystems (DBMS) - Softwaresystem zur Unterstützung einer Datenbank - Realisiert Grundfunktionen der Verwaltung von Daten und Datenspezifikationen einer Datenbank MEB | DMT1VO © CHRISTINA FEILMAYR 36 DATENBANKMANAGEMENTSYSTEM §. KERNKOMPONENTE DES DBS § Definition einer Datenbank erfolgt über DBMS (mittels einer Datendatendefinitionssprache, DDL) - Definition von Datentypen und -strukturen sowie die - Festlegung von Einschränkungen für die in der Datenbank zu speichernden Daten § DBMS ermöglicht Benutzern das Einfügen, Aktualisieren, Löschen und Abrufen von Daten aus der Datenbank (über eine Datenmanipulationssprache, DML) § Abfragesprache für DBMS ist in der Regel die Structured Query Language (SQL) § SQL = De-facto-Standardsprache für relationale DBMS MEB | DMT1VO © CHRISTINA FEILMAYR 37 SCHICHTENMODELL DBS §. ANSI-SPARC-ARCHITEKTUR … WAS BENUTZER EXTERNE SICHT SICHT 1 SICHT 2 SICHT 3 SICHT N ANFRAGEBEARBEITUNG SEHEN DATENDARSTELLUNG Logische KONZEPTIONELLES SCHEMA TABELLEN & VERKNÜPFUNGEN, WELCHE DATEN? Physische INTERNES SCHEMA WIE WERDEN DIE DATEN GESICHERT? Datenun- abhängigkeit Jede Schicht ist unabhängig von deren unteren Schichten MEB | DMT1VO © CHRISTINA FEILMAYR 38 SCHICHTENMODELL DBS §. BESCHREIBUNG DER EBENEN § Internes Schema (physische Ebene) - Beschreibt, wie die Daten gespeichert werden (Hardware und Datenbank) - Verwaltung durch Betriebssystem unter der Verwendung vom jeweiligen DBMS - Informationen über die Art und den Aufbau verwendeter Datenstrukturen (insbesondere deren Definition) und die Zugriffsmechanismen § Externes Schema - Die Sicht des Benutzers auf die Datenbank - Umfasst alle individuellen Sichten („Subschemata“) der einzelnen Benutzer(gruppen) - Eine Sicht enthält genau den Ausschnitt der konzeptuellen Gesamtsicht, den der Benutzer sehen bzw. bearbeiten darf MEB | DMT1VO 39 SCHICHTENMODELL DBS §. BESCHREIBUNG DER SCHEMATA § Konzeptionelles Schema wichtigste Schicht - Beschreibung aller Daten in der Datenbank und wie diese miteinander verknüpft sind - Vollständiger Überblick über die Datenanforderungen der Organisation, unabhängig von etwaigen Speicheraspekten (unabhängig von der eingesetzten Hard- und Software) - Legt nicht fest, wie die Daten physisch gespeichert werden - Diese Ebene enthält die logische Struktur der gesamten Datenbank aus Sicht des Datenbank Administrators - Unterstützt alle definierten externen Sichten, da alle für einen Benutzer verfügbaren Daten in der konzeptionellen Ebene enthalten oder daraus ableitbar sein müssen MEB | DMT1VO © CHRISTINA FEILMAYR 40 POSITIVE ASPEKTE DES SCHICHTENMODELLS §. § Ermöglicht unabhängige, benutzer-angepasste Ansichten - Jeder Benutzer sollte auf die gleichen Daten zugreifen können haben, hat aber eine andere benutzerdefinierte Ansicht - Ansichten sind unabhängig voneinander, d.h. eine Änderung in einer Sicht ändert keine andere Ansicht § Verbirgt die physischen Speicherdetails vor Benutzern - Benutzer arbeiten mit den Daten, ohne sich Gedanken darüber zu machen, wie diese physisch gespeichert werden § Datenbankadministratoren sollen in der Lage sein, die Datenbankspeicherstrukturen zu ändern bzw. Änderungen in der konzeptionellen Struktur der DB vorzunehmen, ohne die Ansichten der Benutzer zu beeinflussen § Internes Schema wird nicht beeinflusst durch Änderungen in der Speicherung (bspw. Wechsel auf eine neue Festplatte) LOGISCHE & PHYSISCHE DATENUNABHÄNGIGKEIT MEB | DMT1VO © CHRISTINA FEILMAYR 41 §. SPEICHERUNG DER DATEN IN DATENBANKEN DISKUSSIONSRUNDE #2 Gibt es Alternativen? § Welche Alternativen gibt es zur Speicherung von Daten in Datenbanken? § Welche Probleme und Herausforderungen sehen Sie in diesen Alternativen? MEB | DMT1VO © CHRISTINA FEILMAYR 42 LIMITIERUNGEN DATEIBASIERTER ANSATZ §. § Trennung bzw. Isolation der Daten: jedes Programm verwaltet seinen eigenen Datensatz Duplizierung von Daten: dieselben Daten werden von verschiedenen Programmen gespeichert Inkonsistenzen durch Redundanzen § Datenabhängigkeit: die Dateistruktur ist im Programmcode definiert § Inkompatible Dateiformate: - Eingeschränkte Verknüpfung von Daten - Eingeschränkter Zugriff auf die Daten eines anderen Anwendungsprogrammes MEB | DMT1VO © CHRISTINA FEILMAYR 43 WARUM DATENBANKMANAGEMENTSYSTEM? §. § Anwendungsentwicklungs- und Wartungskosten - Effiziente, korrekte und unabhängige Datenorganisation, -größe und -zugriff § Konsistenz und Datenintegrität - Eliminiert Redundanz und sorgt so für Konsistenz - Erzwingt Integritätsbeschränkungen (z.B. semantische Regeln) - ausgehend von einem inhaltlich und formal korrekten Datenbank, wird als Ergebnis wieder eine korrekte Datenbank erzeugt © 2022 MEB | DMT1VO © CHRISTINA FEILMAYR 44 WARUM DATENBANKBANKMANAGEMENTSYSTEM? §. § Mehrbenutzerbetrieb und Zugriffskontrolle - Synchronisierung gleichzeitiger Benutzerabfragen und -aktualisierungen - Durchsetzung der Zugriffskontrolle (z.B. Berechtigungen für Tabellen, Ansichten) § Protokollierung und Wiederherstellung - Wiederherstellung eines konsistenten Zustands nach einem Hardware- oder Software-Fehler § Leistung und Skalierbarkeit - Hohe Leistung für große Datensätze oder hohen Transaktionsdurchsatz (Performance) - Skalieren Sie auf große Datensätze mit geringem Speicherbedarf MEB | DMT1VO © CHRISTINA FEILMAYR 45 DATENBANKENTWURFSPROZESS §. ZIELE § Hauptziel des Entwurfsprozesses - Abstrakte Sicht auf die Daten - Verbergen bestimmter Details, wie die Daten gespeichert und bearbeitet werden § Forderungen - Befriedigung der inhaltlichen Informationsanforderungen zukünftiger Benutzer und Anwendungen - Bereitstellung adäquater Informationsstrukturierung Die Aufgabe des Datenbankentwurfes ist der Entwurf der logischen und physischen Struktur einer Datenbank so, dass die Informationsbedürfnisse der Benutzer in einer Organisation für bestimmte Anwendungen adäquat befriedigt werden können. MEB | DMT1VO © CHRISTINA FEILMAYR 47 DATENBANK SCHEMA §. DEFINITION UND MAPPING DER SCHEMATA § Die Gesamtbeschreibung der Datenbank wird als Datenbankschema bezeichnet § Schema = maschinenlesbares Format und beschreibt die Daten innerhalb einer relationalen DB § Es drei verschiedene Schematypen in einer Datenbank, diese werden entsprechend der Abstraktionsebenen der 3-Schichten Architektur beschrieben - DBMS validiert, dass jedes externe Schema aus dem konzeptuellen Schema ableitbar ist - DBMS ist zuständig für das Mapping zwischen konzeptionellen und externen bzw. konzeptionellen und physischen Schema - Pro DBS kann es nur ein konzeptionelles und logisches Schema geben Ziel vom Datenbankentwurfsprozess ist die Erzeugung der drei Schemata MEB | DMT1VO © CHRISTINA FEILMAYR 49 DATENBANKENTWURFSPROZESS §. ZUSAMMENFASSUNG SEMANTISCHE LOGISCHE INFORMATIONS- DATENBANK DATEN- DATEN- SAMMLUNG INSTALLATION MODELLIERUNG MODELLIERUNG systemunabhängig systemabhängig GROBE GENAUE ANFORDERUNGSANALYSE MODELLIERUNG MODELLIERUNG KONZEPTIONELLES SCHEMA ANFORDERUNGS- KONZEPT. LOGISCHES PHYSISCHES PROTOTYPING/ ANALYSE ENTWURF ENTWURF ENTWURF WARTUNG - Geschäftszweck Konzeptionelles Logisches Schema Physisches Schema - Dokumentation - Aktualität Schema - Transformation - Mapping - Erweiterungen - Aggregation - Entitäten - Konsistenz - Datenbankstruktur - Modifikationen - Historie - Beziehungen - Dimensionierung - Extraktion - Verfügbarkeit - Attribute - Anforderungen an - Beladung - Kardinalitäten operative Systeme - Datentransfer PMBI | DBG3ILV 50 BEISPIEL ENTWURF §. VON DER ANFORDERUNG ZUR DATENBANK Anforderunganalyse ER Modell Relationales Modell Implementierung KdNr mittels SQL Name Adresse § Kunde: [{KdNr, Name, Adresse, CREATE TABLE Produkt ( Stadt, BL, PLZ Stadt, BL, PLZ, Email}] Email PrNr NUMBER(8) NOT NULL, Kunden § Produkt: [{PrNr, Name, Stkz}] Name CHAR(40), § KdNr § Name Kunde Stkz. NUMBER(4) § Bestellt: [{KdNr, PrNr, Preis, ); § Adresse m Menge, Datum]} § Stadt, Bundesland, PLZ § E-Mail-Adresse Preis bestellt Menge Produkte Datum § PrNr …. § Name n …. § Stückzahl auf Lager Produkt Bestellungen erfolgen zu einem bestimmten Datum, pro Bestellung PrNr kann pro Produkt die Menge Name und der Preis definiert werden. Stkz MEB | DMT1VO © CHRISTINA FEILMAYR 51 DATENBANKENTWURFSPROZESS §. ANFORDERUNGSANALYSE UND -SPEZIFIKATION § In der Anforderungsanalyse und -spezifikation werden die Anforderungen aller potentiellen Benutzer an das zu entwickelnde Datenbank erhoben - Worüber sind Daten zu speichern (Informationsanforderungen) – WAS, nicht das WIE - Wie sind diese Daten zu speichern (Bearbeitungsanforderungen) § Vorgehensweise: Sammlung des Informationsbedarfs in den Fachabteilungen § Ergebnis: - informale Beschreibung (Texte, tabellarische Aufstellungen, Formblätter, usw.) des Fachproblems - Trennen der Information über Daten (Datenanalyse) von der Information über Funktionen (Funktionsanalyse) - Klassischer DB-Entwurf: nur Datenanalyse und Folgeschritte - Funktionsentwurf: Anwendung von Methoden des Software Engineering MEB | DMT1VO © CHRISTINA FEILMAYR 54 WICHTIGKEIT DER ANFORDERUNGSANALYSE §. § Bestimmung des Zwecks der Datenbank § Die gesammelten Daten und deren Beschreibung werden später Teil des Datenbankkatalogs (Data Dictionary) § Erhebung der Daten aus jeder Perspektive § Befragen aller Personen, die das System nutzen werden § Analyse von Geschäftsformulare, wie z. B. Rechnungen, Stundenzettel, Umfragen § Durchkämmen sämtlicher bestehenden Datensysteme (einschließlich physischer und digitaler Akten/Dateien) VERSTEHEN WAS DIE NUTZER WOLLEN! MEB | DMT1VO © CHRISTINA FEILMAYR 55 DATENBANKENTWURFSPROZESS §. KONZEPTIONELLER ENTWURF Der konzeptionelle Entwurf ist die erste formale Beschreibung des Fachproblems § Sprachmittel: semantisches Datenmodell, z.B. erweitertes ER-Modell § Vorgehensweise: - Modellierung von Sichten z.B. für verschiedene Fachabteilungen - Analyse der vorliegenden Sichten in Bezug auf Konflikte - Integration der Sichten in ein Gesamtschema § Ergebnis: konzeptionelles Gesamtschema z.B. (E)ER-Diagramm MEB | DMT1VO © CHRISTINA FEILMAYR 56 DATENBANKENTWURFSPROZESS §. SICHTEN IM KONZEPTIONELLEN ENTWURF § Bei größeren Anwendungen ist es nicht praktikabel, den konzeptionellen Entwurf in einem Stück durchzuführen. § Der konzeptionelle Entwurf (und die Anforderungsanalyse) sollte in verschiedenen Anwendersichten aufgeteilt werden: - Sicht für die Führungsebene - Sicht für die Buchhaltung - Sicht für Marketing und Verkauf - Sicht für die Produktion - Sicht für den Einkauf MEB | DMT1VO © CHRISTINA FEILMAYR 57 DATENBANKENTWURFSPROZESS §. KONFLIKTE IM KONZEPTIONELLEN ENTWURF § Namenskonflikte: Homonyme / Synonyme - Homonyme: Schloss, Kunde - Synonyme: Auto, KFZ, Fahrzeug § Typkonflikte: verschiedene Strukturen für das gleiche Element § Wertebereichskonflikte: verschiedene Wertebereiche für ein Element § Bedingungskonflikte: z.B. verschiedene Schlüssel für ein Element § Strukturkonflikte: gleicher Sachverhalt durch unterschiedliche Konstrukte ausgedrückt MEB | DMT1VO © CHRISTINA FEILMAYR 58 DATENBANKENTWURFSPROZESS §. WAHL DES DBS-SYSTEMS § Mögliche Entscheidungskriterien bei der Wahl des Datenbanksystems (DBS): - Vorhandene Hard- und Software, insbesondere vorhandenes Betriebssystem - Benötigte Programmiersprachen-Schnittstellen - Herstellerbindung des betreffenden Unternehmens - Benötigte Performance des Systems - Komplexität des zu implementierenden Datenmodells MEB | DMT1VO © CHRISTINA FEILMAYR 59 DATENBANKENTWURFSPROZESS §. LOGISCHER ENTWURF / IMPLEMENTIERUNGSENTWURF § Sprachmittel: Datenmodell des ausgewählten „Realisierungs“-DBMS z.B. relationales Modell § Vorgehensweise: 1. (automatische) Transformation des konzeptionellen Schemas z.B. ER → relationales Modell 2. Verbesserung des relationalen Schemas anhand von Gütekriterien (Normalisierung) § Entwurfsziele: Redundanzvermeidung, Erstellung eines konsistenten Schemas § Ergebnis: logisches Schema, z.B. Sammlung von Relationenschemata MEB | DMT1VO © CHRISTINA FEILMAYR 60 DATENBANKENTWURFSPROZESS §. DATENDEFINITION IM IMPLEMENTIERUNGSENTWURF § Umsetzung des logischen Schemas in ein konkretes Schema § Sprachmittel: DDL und DML eines DBMS (Oracle, MySQL, Postgres, MS SQL Server) - Datenbankdeklaration in der DDL des DBMS - Realisierung der Integritätssicherung - Definition der Benutzersichten § DDL … Datendefinitionssprache (Data Definition Language) § DML… Datenmanipulationssprache (Data Manipulation Language) MEB | DMT1VO © CHRISTINA FEILMAYR 61 DATENBANKENTWURFSPROZESS §. PHYSISCHER ENTWURF § Ergänzen des physischen Entwurfs um Zugriffsunterstützung bzgl. Effizienzverbesserung § Der physische Entwurf beinhaltet die Definition des internen Schemas - Festlegen geeigneter Speicherstrukturen - Festlegen von Zugriffsmechanismen - Bestimmung von Indexstrukturen -... § Mit Hilfe der DDL des gewählten DBMS erfolgt die Implementierung der verschiedenen Schemata - z.B. im relationalen System: Einrichten von Relationen, Views, Indexstrukturen, Zugriffsrechten,... § Sprachmittel: Speicherstruktursprache SSL MEB | DMT1VO © CHRISTINA FEILMAYR 62 DATENBANKENTWURFSPROZESS §. WARTUNG, PROTOTYPING § In der Prototyping Phase wird eine Beispieldatenbank geladen. - Verifikation des Entwurfes - Erzeugung eines Test-Datenbestandes zur Messung der Performance - Ziel: Aussagen darüber, ob die Effizienzanforderungen an die Datenbank erfüllt werden können § Die Dokumentation soll sinnvollerweise nicht am Ende des gesamten Entwurfsprozesses stehen, sondern soll als begleitende Aktivität von Beginn an durchgeführt werden. § Weiterentwicklung / Wartung (Phasen) - weitere Optimierung der physischen Ebene - Anpassung an neue Anforderungen und Systemplattformen - Portierung auf neue Datenbankmanagementsysteme MEB | DMT1VO © CHRISTINA FEILMAYR 63 DATENBANKENTWURFSPROZESS §. ANFORDERUNGEN AN DEN ENTWURFSPROZESS Die wichtigsten Merkmale und Anforderungen an den Datenbank Entwurfsprozess: § Informationserhalt § Redundanzfreiheit § Vollständigkeit bezüglich Anforderungsanalyse § Konsistenz des Beschreibungsdokuments § Ausdrucksstärke, Verständlichkeit des benutzten Formalismus § Formale Semantik der Beschreibungskonstrukte § Lesbarkeit der Dokumente § Weitere Qualitätseigenschaften: Erweiterbarkeit, Modularisierung, Wiederverwendbarkeit, Werkzeugunterstützung, Performance etc. MEB | DMT1VO © CHRISTINA FEILMAYR 64 BEISPIEL SCHICHTENMODELL DBS §. EXTERNE SICHT #1 EXTERNE SICHT #2 KdNr Name Anschrift Email Name Mail KdNr Name Adresse Stadt BL PLZ Email KONZEPTIONELLE SCHICHT struct Kunde { int KdNr; char Name ; char Adresse ; char Stadt ; PHYSISCHE SCHICHT … struct Produkt *next } Index KdNr; index PLZ; MEB | DMT1VO © CHRISTINA FEILMAYR 65 …. ….

Use Quizgecko on...
Browser
Browser