Datenbank PDF
Document Details
Uploaded by RecordSettingPine
Multi Media Berufsbildende Schulen
Marina Hildmann
Tags
Related
- PCSII Depression/Anxiety/Strong Emotions 2024 Document
- A Concise History of the World: A New World of Connections (1500-1800)
- Human Bio Test PDF
- Vertebrate Pest Management PDF
- Lg 5 International Environmental Laws, Treaties, Protocols, and Conventions
- Educación para la Salud: la Importancia del Concepto PDF
Summary
This document provides an overview of database theory including database systems, their components, and various models. It also includes a comparison of file server and client-server systems, along with specific database design concepts.
Full Transcript
Mediengestalter/-in Digital und Print │ 2. Ausbildungsjahr Lernfeld 7: Medien aus Datenquellen zu einem Medienprodukt zusammenführen Lehrkraft: Marina Hildmann Grundlagen der Datenbanktheorie Datenbanksysteme Software, die die Erstellung, Verwaltung und den Zugriff auf Datenbankenermög- licht, wi...
Mediengestalter/-in Digital und Print │ 2. Ausbildungsjahr Lernfeld 7: Medien aus Datenquellen zu einem Medienprodukt zusammenführen Lehrkraft: Marina Hildmann Grundlagen der Datenbanktheorie Datenbanksysteme Software, die die Erstellung, Verwaltung und den Zugriff auf Datenbankenermög- licht, wird als Datenbanksystem (DBS) be- zeichnet wird. Wie Sie in der Grafik rechts sehen, besteht ein Datenbanksystem aus Datenbanken (DB) und aus einem Daten- bankmanagementsystem (DBMS) zur Ver- waltung der Datenbanken. Die Aufgaben eines DBMS sind: Physikalische Verwaltung der Daten,so dass sich der Nutzer nicht darum kümmern muss (und auch nicht weiß), wo die Daten liegen. Bearbeitung von Datenbankabfragen (engl.: Query), die mit Hilfe der standardisierten Abfragesprache SQL 1erfolgen. Gewährleistung der Datensicherheit– auch nach einem Systemabsturz Gewährleistung des Datenschutzes über die Vergabe von Zugriffsrechten Zugriffsregelung bei gleichzeitigem Zugriff auf eine Datenbank durch mehrere Nutzer Bereitstellung von Werkzeugen für den Datenbankentwurf Bereitstellung von „Assistenten“ z. B. für Berichte (Reports), Formulare und Abfragen Konvertieren der Daten in andere Formate (Datenexport) Bei Datenbanksystemen werden grundsätzlich zwei Arten unterschieden: Fileserver-System Bei einem Fileserver-System liegen die Datenbanken an zentraler Stelle, entweder auf dem eigenen Computer (Einbenutzerbetrieb) oder auf einem Server (Mehrbenutzerbetrieb). Die Verwaltung mittels DBMS erfolgt clientseitig, also auf den Computern der Anwender. Nachteil dieses Verfahrens ist die hohe Netzbelastung, da bei Abfragen unter Umständen eine große Menge an Datensätzen (zur loka- len Auswertung durch das DBMS) übertragen werden müssen. Fileserver-Systeme kommen deshalb nur bei kleineren Anwendungen in Frage. Client-Server-System Bei einem Client-Server-System befinden sich nicht nur die Datenbanken auf einem Server, sondern auch das Datenbankmanagementsystem. Hieraus ergibt sich der Vorteil, dass Abfragen durch die Nutzer an zentraler Stelle auf dem Server ausgewertet werden und nur die Ergebnisse über das Netz- werk übertragen werden müssen. Dies erhöht die Datensicherheit und verringert die Belastung des Netzwerks. 1/ SQL ist eine Datenbanksprache zur Definition von Datenstrukturen in relationalen Datenbanken sowie zum Bearbeiten und Abfragen von darauf basierenden Datenbeständen. Mediengestalter/-in Digital und Print │ 2. Ausbildungsjahr Lernfeld 7: Medien aus Datenquellen zu einem Medienprodukt zusammenführen Lehrkraft: Marina Hildmann Datenbankmodelle Bei einer Datenbank (DB) handelt ess ich um eine strukturierte Sammlung von Daten, die in einem sachlogischen Zusammenhang stehen. Es gibt mehrere Möglichkeiten, wie sich Daten strukturieren und anordnen lassen. Die wichtigsten Datenbankmodelle sind: Hierarchische Datenbanken besitzen die Struktur eines umgedrehten Baumes, der sich immer weiter verzweigt. Eine derartige Struktur finden Sie beispielsweise bei Dateisystemen (siehe Seite 37). Objektorientierte Datenbanken orientieren sich an der Struktur objektorientierter Programmiersprachen. Sie haben allerdings bislang eine geringe Verbreitung. Bei relationalen Datenbanken bilden Tabellen (Relationen) die Grundbausteine der Datenbank. Zur Abfrage der Datensätze kommt die Abfragesprache SQL zum Einsatz. Aufgrund ihrer bis heute großen Bedeutung gehen wir im Folgenden auf relationale Datenbanken ein. Ein neuerer Ansatz wird mit dokumentorientierten Datenbanken verfolgt, bei denen Dokumente die Grundbausteine der Datenbank bilden. Der Zugriff auf diese Dokumente erfolgt ohne SQL, weshalb auch von einem NoSQL-Modell gesprochen wird. Mediengestalter/-in Digital und Print │ 2. Ausbildungsjahr Lernfeld 7: Medien aus Datenquellen zu einem Medienprodukt zusammenführen Lehrkraft: Marina Hildmann Grundlagen der Datenbanktheorie Arbeitsauftrag: 1. Vergleich von Fileserver- und Client-Server-Systemen: Erstellen Sie eine Tabelle, in der die Vor- und Nachteile von Fileserver-Systemen und Client- Server-Systemen gegenübergestellt werden. Berücksichtigen Sie dabei Aspekte wie Netzwerklast, Datensicherheit und Einsatzbereiche. Diskutieren Sie, welches System für welche Art von Anwendung am besten geeignet ist und begründen Sie Ihre Einschätzung. Fileserver-Systemen Client-Server-Systemen - Einfach einzurichten für kleine - Bessere Netzwerksicherheit und Netzwerke Verwaltungsmöglichkeiten - Kostengünstig für kleine Anwendungen - Reduzierte Netzwerklast durch zentrale Vorteile Verarbeitung - Hohe Netzwerklast bei großen - Abhängig von einem zentralen Server, Datenmengen - Komplexer einzurichten was einen Single Point of Failure und teurer in der Anschaffung darstellt Nachteile - Geringere Datensicherheit, da Daten - Komplexer einzurichten und teurer in lokal verarbeitet werden der Anschaffung - Nur vor Ort nutzbar Hoch, da alle Daten über das Netzwerk Geringer, da nur die Abfrageergebnisse übertragen werden müssen übertragen werden Netzwerklast Niedriger, da Daten auf lokalen Höher, da die Daten zentral auf dem Maschinen verarbeitet werden Server gespeichert und verarbeitet werden Datensicherheit Kleine Unternehmen oder einfache Große Unternehmen oder Anwendungen Anwendungen mit geringem mit hohem Datenvolumen und Bedarf an Datenvolumen hoher Datensicherheit Einsatzbereich Mediengestalter/-in Digital und Print │ 2. Ausbildungsjahr Lernfeld 7: Medien aus Datenquellen zu einem Medienprodukt zusammenführen Lehrkraft: Marina Hildmann 2. Verschriftlichen Sie, welches System (Fileserver- und Client-Server-Systemen) für welche Art von Anwendung am besten geeignet ist und begründen Sie Ihre Einschätzung. Für Anwendungen, die in einem kleinen Netzwerk mit begrenztem Datenvolumen und geringem Sicherheitsbedarf laufen, ist das Fileserver-System die bessere Wahl. Es ist kostengünstig und einfach einzurichten, jedoch sollte die hohe Netzwerklast und die geringere Sicherheit berücksichtigt werden. Für größere Unternehmen oder Anwendungen, die hohe Sicherheitsanforderungen und eine effiziente Verarbeitung großer Datenmengen erfordern, ist das Client-Server-System vorzuziehen. Obwohl es komplexer und teurer in der Implementierung ist, bietet es durch die zentrale Datenverarbeitung eine bessere Leistung und Sicherheit. 3. Tauschen Sie sich in Partnerarbeit über Ihre Ergebnisse aus. Im Anschluss werden wir diese im Klassenverband besprechen. Mediengestalter/-in Digital und Print │ 2. Ausbildungsjahr Lernfeld 7: Medien aus Datenquellen zu einem Medienprodukt zusammenführen Lehrkraft: Marina Hildmann Relationale Datenbanken Wie bereits erwähnt bestehen relationale Datenbanken aus Tabellen und sind aktuell die mit Abstand wichtigste Untergruppe der Datenbanken. A C D B E Tabelle (Relation) A Tabellen bilden die „Bausteine“ relationaler Datenbanken. Eine relationale Datenbank besteht aus min- destens einer, meistens aus mehreren Tabellen, die über Schlüssel miteinander in Beziehung stehen. Jede Tabelle besteht ihrerseits aus Datensätzen. Datensatz (Tupel) B Die Zeilen einer Tabelle werden als Datensätze oder Tupel bezeichnet. Ein Datensatz besteht aus mehreren Datenfeldern C, z. B. Kundennummer, Nachname, Vorname, Anschrift, Telefonnummer und E-Mail-Adresse. Jeder Datensatz muss über einen sogenannten Schlüssel, z. B. die Kundennummer, eindeutig identifizierbar sein. Mit Hilfe einer Karteikarte bzw. mittels Formular wird jeweils ein Daten- satz beschrieben. Attribute D Die einzelnen Zellen einer Tabelle werden als Datenfelder bezeichnet. Gleichartige Datenfelder, z. B. Nachnamen oder E-Mail-Adressen, sind spaltenweise angeordnet und werden in der Theorie Attribute genannt. Jedes Attribut wird durch einen Feldnamen, z. B. „Name“ oder „Mail“,bezeichnet und besitzt einen bestimmten Datentyp. Die wichtigsten Datentypen sind: Ganze Zahlen (INTEGER) Dezimalzahlen (FLOAT, DECIMAL) Zeichen (CHAR) Text (VARCHAR) Ja/Nein (BOOLEAN) Datum (DATE) Uhrzeit (TIME) Binäre Daten (BINARY) Warum ist diese Unterscheidung wichtig? Erstens entscheidet der Datentyp über den benötigten Spei- cherplatz und damit letztlich auch über die Leistungsfähigkeit der Datenbank. Zweitens ist die Fest- legung des Datentyps zur weiteren Verarbeitung der Daten erforderlich. So kann mit Zahlen gerechnet Mediengestalter/-in Digital und Print │ 2. Ausbildungsjahr Lernfeld 7: Medien aus Datenquellen zu einem Medienprodukt zusammenführen Lehrkraft: Marina Hildmann werden,z. B. Menge x Einzelpreis = Endpreis, aus Texten lassen sich beispielsweise E-Mails generie- ren, während binäre Datentypen z. B. Bilder speichern können. Schlüssel E Ein wesentliches Merkmal einer Datenbank ist, dass jeder Datensatz eindeutig identifizierbar sein muss. Für diesen Zweck wird in jeder Tabelle (mindestens) ein Schlüssel benötigt. In der Kundendatenbank oben wurde die Kundennummer als Schlüssel definiert. Über einen Schlüs- sel wird der Zugriff auf Datensätze beschleunigt. Sein Wert wird vom DBMS automatisch vergeben (Autowert), so dass doppelte Werte nicht vorkommen können. Mit Hilfe der Schlüssel lassen sich Tabellen miteinander verknüpfen, z. B. wenn ein Kunde Artikel be- stellt, die in einer Artikeltabelle hinterlegt sind. Ein Schlüssel, der zur Identifikation der Datensätze der eigenen Tabelle dient, heißt Primärschlüssel. Wird dieser Schlüssel in einer Tabelle verwendet, die einen eigenen Primärschlüssel hat, spricht man von einem Fremdschlüssel. Arbeitsauftrag: 1. Lesen Sie den Informationstext zu relationale Datenbanken. 2. Tragen Sie die jeweiligen Fachbegriffe aus dem Informationstext in das Schaubild ein. 3. Geben Sie an, welche Datentypen im Schaubild vorhanden sind. Ganze Zahlen (INTEGER) Zeichen (CHAR) Text (VARCHAR) Datum (DATE) Mediengestalter/-in Digital und Print │ 2. Ausbildungsjahr Lernfeld 7: Medien aus Datenquellen zu einem Medienprodukt zusammenführen Lehrkraft: Marina Hildmann Anforderungen an eine Datenbank Atomisierung Durch die Erfassung der gesamten Anschrift in einem Datenfeld ist ein Sortieren der Datensätze, z. B. nach Postleitzahlen, nicht möglich. Auch ein Filtern der Daten, z.B. nach Kunden aus Seelbach, wäre nicht möglich. Die Forderung lautet deshalb, dass die Daten eines Datensatzes so zerlegt werden müssen, dass sich in einem Datenfeld immer nur eine Information befindet. Man bezeichnet dies als atomisieren. Datenkonsistenz In der Tabelle wurde korrekterweise ein Primärschlüssel „ANr“ festgelegt. Der Auftragsnummer kann das bestellte Produkt aber nicht eindeutig zugeordnet werden, da es Kunden gibt, die mehrere Pro- dukte bestellt haben. Ein weiterer Widerspruch besteht darin, dass die Firmen unterschiedlich be- zeichnet wurden, z. B. als „Fa. Schulz“ und als „Firma Schulz“. Eine Abfrage würde ergeben, dass es sich um zwei unterschiedliche Firmen handelt. Die zweite zentrale Forderung an eine Datenbank lautet, dass sie widerspruchsfrei oder konsistent sein muss. Redundanzfreiheit Bei jedem Auftrag wurde jedes Mal die gesamte Firmenanschrift eingetragen. Dies macht nicht nur Mühe und braucht Speicherplatz, sondern birgt auch Gefahren: Ändert sich eine Kundenanschrift, muss diese Änderung in mehreren Datensätzen vorgenommen werden, da die Datenbank sonst in- konsistent würde. Die dritte Forderung an eine Datenbank ist deshalb, dass sie keine mehrfachen Informationen enthalten darf. Man sagt, dass sie redundanzfrei sein muss. Weitere Forderungen Der Nutzer braucht sich nicht um die Organisation und Verwaltung der Daten zu kümmern. Die Daten einer Datenbank müssen vor Verlust sicher sein (Datensicherheit). Um diese Forderung zu erfüllen, müssen geeignete Backup-Strategien zum Einsatz kommen. Ein heikles Thema ist der Datenschutz vor unerlaubtem Zugriff und vor Manipulation, insbesondere wenn es sich um personenbezogene Daten handelt. Mehrere Nutzer müssen gleichzeitig auf eine Datenbank zugreifen können (Multiuser-DB). Mediengestalter/-in Digital und Print │ 2. Ausbildungsjahr Lernfeld 7: Medien aus Datenquellen zu einem Medienprodukt zusammenführen Lehrkraft: Marina Hildmann Normalisierung Datenbanken Die Hauptforderungen an Datenbanken sind: Datenkonsistenz Redundanzfreiheit Um diese Ziele zu erreichen, müssen die Datensätze auf mehrere Tabellen verteilt werden. Der Vor- gang wird als Normalisierung bezeichnet, wobei mehrere sogenannte Normalformen unterschieden werden. Im Folgenden wird anhand eines Beispiels auf die erste von fünf Normalformen eingegangen. Sie benötigen zum erstellen eines Medienproduktes aus Datenquellen meistens nur die erste Form der Normalisierung. Arbeitsauftrag Teil I: 1. Schauen Sie sich die obere Tabelle in Einzelarbeit an. 2. Notieren Sie die Mängel der Tabelle, die sich aus der Betrachtung der Aspekte Automatisierung, Redundanzfreiheit und Konsistenz ergeben. Automatisierung: Dieselbe Firma taucht in der Tabelle oft mit leicht unterschiedlichen Informationen mehrmals auf (z.B. Firma Winkler in verschiedenen Zeilen). Das macht es schwer für Maschinen, diese Daten automatisch zu verarbeiten, da jedes Vorkommen einzeln behandelt werden muss, was zu Fehlern führen kann. Redundanzfreiheit: Mehrere Firmen stehen mehrfach mit denselben Adressen in der Tabelle (z.B. Firma Schulz oder Schmitt), aber mit unterschiedlichen Aufträgen. Dadurch werden Daten unnötig doppelt gespeichert, was Platz verschwendet und Fehler verursachen kann, wenn nicht alle Einträge gleichzeitig geändert werden. Konsistenz: Die gleiche Firma wird in verschiedenen Datensätzen unterschiedlich dargestellt (z.B. verschiedene Aufträge für Firma Winkler). Wenn etwas an den Daten geändert wird, muss das an mehreren Stellen gemacht werden, was zu Unstimmigkeiten führen kann, wenn etwas vergessen wird. 3. Tauschen Sie sich in Partnerarbeit über Ihre Ergebnisse aus und ergänzen Sie ggf. Ihre Notizen. Mediengestalter/-in Digital und Print │ 2. Ausbildungsjahr Lernfeld 7: Medien aus Datenquellen zu einem Medienprodukt zusammenführen Lehrkraft: Marina Hildmann Arbeitsauftrag Teil II: 1. Normalform 1. Erstellen Sie in Einzelarbeit eine Tabelle in Excel mit den zu Verfügung gestellten Daten im Word-Dokument. 2. Versuchen Sie bei dieser Tabelle die Problematik der Automatisierung zu beheben. 3. Notieren Sie sich, was in Ihrer Tabelle mit der Konsistenz und Redundanz passiert. 4 Vergleichen Sie Ihre Tabelle und Notizen jeweils in Partnerarbeit. Mediengestalter/-in Digital und Print │ 2. Ausbildungsjahr Lernfeld 7: Medien aus Datenquellen zu einem Medienprodukt zusammenführen Lehrkraft: Marina Hildmann Datenaustauschformate - Datenzusammenführung Ausgangsdaten für den variablen Datendruck Am Beispiel des Programms Adobe InDesign soll der Datendruck mit variablen Text- und Bilddaten be- schrieben werden. Datentabellen in der ersten Normalform sind die Ausgangsdaten für das Erstellen personalisierter Drucksachen mit Adobe InDesign. Die Datentabelle muss zwingend mit einer Steuer- zeile und Attributen versehen sein, um später das Einlesen der Daten im Layoutprogramm zu ermög- lichen. InDesign ist nicht in der Lage, Daten aus einer Datentabelle direkt einzulesen. Die Daten müssen immer in einem Textformat z. B. aus der Excel-Datentabelle exportiert und eventu- ell bearbeitet werden. Ist ein variabler Bildaustausch vorgesehen, müssen die Textdateien aufbereitet werden. Erst danach können sie durch InDesign verarbeitet werden. Export der Daten als Textdatei aus dem Programm MS Excel Tabstopgetrennter Text (.txt) D Exportiert die Daten auf dem aktiven Blatt in eine Textdatei, in der die Werte in den Zellen durch Tabstopps getrennt sind. Zell- eigenschaften, Formeln, Grafiken und andere Formatierungen gehen dabei verloren. Alle Zeilen und alle Zeichen in sämtlichen Zellen werden gespeichert. Datenspalten werden durch Tab- stopps getrennt; alle Datenzeilen werden durch eine Zeilen- schaltung abgeschlossen. Wenn eine Zelle ein Komma enthält, werden die Zellinhalte in Anführungszeichen eingeschlossen. Wenn Zellen Formeln an- stelle von Formelwerten anzeigen, werden die Formeln als Text gespeichert. Um die Formeln beim erneuten Öffnen der Datei in Microsoft Excel zu erhalten, wählen Sie im Text-Assistenten die Option Getrennt aus, und wählen Sie Tabstopps als Trenn- zeichen aus. Windows formatierter Text (.txt) E Exportiert die Daten auf dem aktiven Blatt in eine Windows- kompatible Textdatei, in der Werte in Zellen durch Tabstopps getrennt sind. Zelleigenschaften, Formeln, Grafiken und andere Formatierungen gehen dabei verloren. Mac formatierter Text (.txt) E Exportiert die Daten auf dem aktiven Blatt in eine Macintosh-kompatible Textdatei, in der Werte in Zel- len durch Tabstopps getrennt sind. Zelleigenschaften, Formeln, Grafiken und andere Formatierungen gehen dabei verloren. Kommagetrennter Text (.csv) F Exportiert die Daten auf dem aktiven Blatt in eine Textdatei, in der Werte in Zellen durch Trennzeichen (Semikolon oder Komma) getrennt sind. Zelleigenschaften, Formeln, Grafiken und andere Formatie- rungen gehen dabei verloren. Mediengestalter/-in Digital und Print │ 2. Ausbildungsjahr Lernfeld 7: Medien aus Datenquellen zu einem Medienprodukt zusammenführen Lehrkraft: Marina Hildmann Arbeitsauftrag: 1. Öffnen Sie die Ihnen zur Verfügung gestellte Excel-Tabelle 2. Speichern Sie diese Excel-Tabelle als Tabstoppgetrennten Text und Kommagetrennten Text. 3. Vergleichen Sie die gespeicherten Tabellen. 4. Beschreiben Sie, was Ihnen an den Tabellen auffällt. 5. Welches Dateiformat bzw. Textformat ist aus Ihrer Sicht für den variablen Datendruck zu empfehlen? Begründen Sie Ihre Entscheidung.