Data Science Foliensatz 4
34 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Welche der folgenden Aussagen beschreibt am besten den Hauptvorteil eines Data Warehouse?

  • Es ermöglicht die Speicherung großer Datenmengen aus verschiedenen Quellen an einem zentralen Ort. (correct)
  • Es beschränkt den Zugriff auf Daten auf bestimmte Abteilungen.
  • Es minimiert die Notwendigkeit von IT-Kompetenzen in den Fachbereichen.
  • Es reduziert die Notwendigkeit der Datenaufbereitung.

Was versteht man unter dem Begriff 'ETL' im Kontext eines Data Warehouse?

  • Ein Werkzeug zur direkten Datenanalyse für Endnutzer.
  • Ein Prozess zum Extrahieren, Transformieren und Laden von Daten in das Data Warehouse. (correct)
  • Eine Methode zur Verschlüsselung sensibler Daten im Data Warehouse.
  • Eine Software zur Ãœberwachung der Systemleistung des Data Warehouse.

Welche der folgenden Datenquellen wäre am wahrscheinlichsten, um Kundendaten für eine Churn Prediction (Kundenabwanderungsprognose) zu verwenden?

  • Finanzdaten (z.B. Rechnungen, Zahlungsausfälle).
  • Sensordaten.
  • Kundendaten aus Hotlines und E-Mails. (correct)
  • Produktionsdaten (z.B. Anzahl produzierter Einheiten).

Was sind typische Nachteile der traditionellen Datenaufbewahrung in verschiedenen Funktionsbereichen eines Unternehmens vor der Einführung eines Data Warehouse?

<p>Dateninseln und mangelnde Integration. (D)</p> Signup and view all the answers

Welche Aussage beschreibt am besten die Rolle von Meta-Daten in einem Data Warehouse?

<p>Sie beschreiben die Struktur und Bedeutung der Daten im Data Warehouse. (D)</p> Signup and view all the answers

Was ist der Hauptunterschied zwischen einem Data Warehouse und einem Operational Data Store (ODS)?

<p>Ein ODS speichert aktuelle Daten für operative Zwecke, während ein Data Warehouse historische Daten für analytische Zwecke speichert. (C)</p> Signup and view all the answers

Welche der folgenden Aussagen beschreibt am besten den Zweck der Datenbereinigung (Data Cleaning) im ETL-Prozess?

<p>Fehlerhafte, inkonsistente oder unvollständige Daten zu identifizieren und zu korrigieren. (C)</p> Signup and view all the answers

Was versteht man unter 'Data Wrangling' im Rahmen der Datenaufbereitung?

<p>Die Umwandlung und Strukturierung von Daten in ein geeignetes Format für die Analyse. (C)</p> Signup and view all the answers

Was ist ein wesentlicher Unterschied zwischen 'On-Premise' und 'Cloud-basierten' Lösungen zur Datenspeicherung?

<p>On-Premise-Lösungen erfordern eine eigene physische Infrastruktur, während Cloud-basierte Lösungen die Infrastruktur eines Dienstanbieters nutzen. (D)</p> Signup and view all the answers

Welchen Vorteil bietet eine Cloud-native Architektur wie Snowflake im Vergleich zu traditionellen Data Warehouses?

<p>Unabhängige Skalierung von Speicher- und Rechenressourcen. (B)</p> Signup and view all the answers

Welchen Aspekt sollte man besonders beachten, wenn man kritische oder sensible Daten in der Cloud speichert?

<p>Die Einhaltung von Datenschutzrichtlinien und Sicherheitsstandards. (D)</p> Signup and view all the answers

Was ist der Hauptzweck eines Datenbank-Management-Systems (DMS)?

<p>Die Verwaltung und Pflege einer Datenbank. (B)</p> Signup and view all the answers

Was kennzeichnet eine relationale Datenbank?

<p>Sie integriert verschiedene Teilmengen von Daten, wobei die Beziehungen zwischen den Daten durch ID-Nummern verknüpft sind. (D)</p> Signup and view all the answers

Welche der folgenden Optionen sind keine typischen Elemente, die in Dashboards zur Datenvisualisierung verwendet werden?

<p>Tabellen mit Rohdaten. (D)</p> Signup and view all the answers

Welche der folgenden Aussagen beschreibt am besten den Zweck von Score Cards?

<p>Sie zeigen den Fortschritt und die Leistung eines Bereichs oder Projekts anhand von Leistungskennzahlen (KPIs). (D)</p> Signup and view all the answers

Welche Herausforderung besteht typischerweise bei der Verwendung von Dashboards?

<p>Ãœberforderung durch zu viele Informationen. (B)</p> Signup and view all the answers

Wie können Führungskräfte die Informationen, des in der Präsentation dargestellten Dashboards (Folie 26) nutzen, um ihre Entscheidungsprozesse zu verbessern?

<p>Durch die Verwendung des Dashboards zur Ãœberwachung von Verkaufszahlen nach Region und Produktkategorie, um Marketingstrategien anzupassen. (B)</p> Signup and view all the answers

Welche der folgenden Aussagen beschreibt am besten die Rolle der Unternehmenskultur bei der Implementierung von Data Science?

<p>Eine innovationsfreundliche und datengetriebene Kultur kann die Akzeptanz und den Erfolg von Data Science Projekten fördern. (A)</p> Signup and view all the answers

Welche Art von Widerstand ist bei der Data Science-Implementierung von Beschäftigten zu erwarten?

<p>Sorgen/Ängste vor Überforderung oder Arbeitsplatzverlust. (B)</p> Signup and view all the answers

Welche Art von Widerstand ist bei der Data Science-Implementierung von Managern zu erwarten?

<p>Angst vor Kontrollverlust und die Delegation der Entscheidungsmacht an Daten. (C)</p> Signup and view all the answers

Wie kann man laut der Präsentation Widerstände bei der Implementierung von Data Science überwinden?

<p>Indem man die Mitarbeiter einbezieht, den Nutzen verdeutlicht und Schulungen anbietet. (C)</p> Signup and view all the answers

Was ist ein wichtiger Aspekt, um Hindernisse bei der Implementierung von Data Science zu überwinden?

<p>Die Konzentration auf kleine, erfolgreiche Projekte am Anfang. (D)</p> Signup and view all the answers

Was versteht man unter einer 'kognitiven Dissonanz' im Kontext der Data Science-Implementierung bei Managern?

<p>Das Unvereinbarkeit von Evidenz aus Datenanalyse und eigenen Berufserfahrungen. (B)</p> Signup and view all the answers

Was ist gemäß Kurt Lewins Phasen der Veränderung der erste Schritt bei der Implementierung von Data Science in einem Unternehmen?

<p>Das Auftauen (Unfreeze), d.h. die Vorbereitung der Mitarbeiter auf die Veränderung. (B)</p> Signup and view all the answers

Welchen Fokus haben Unternehmen im ersten Reifegradmodell für ein Informationssystem typischerweise?

<p>Keinen Fokus auf Data Science. (C)</p> Signup and view all the answers

Was kennzeichnet Unternehmen mit dem höchsten Reifegradmodell für ein Informationssystem?

<p>Die Nutzung von Data Science für strategische und operative Entscheidungen. (A)</p> Signup and view all the answers

Welche Art von Kompetenzen sind gemäß des Reifegradmodells für ein Informationssystem in Unternehmen der Stufe 2 vorrangig?

<p>Ausgeprägte Data-Warehouse Kompetenzen mit grundlegendem analytischem Wissen. (D)</p> Signup and view all the answers

Welche der folgenden Aussagen ist ein Argument für die Speicherung großer Datenmengen in einem Data Warehouse?

<p>Es verbessert die Leistung von operativen Systemen durch Auslagerung von Daten. (A)</p> Signup and view all the answers

Welche Rolle spielt die Automatisierung im Kontext von Data-Science-Projekten?

<p>Sie ermöglicht eine schnellere und effizientere Verarbeitung großer Datenmengen. (B)</p> Signup and view all the answers

In welchen Schritten sollte die Data Science Implementierung erfolgen?

<p>Die Data Science Implementierung sollte durch die sukzessive Förderung von Projekten erfolgen. (C)</p> Signup and view all the answers

Welchen Vorteil bietet die Möglichkeit Dashboards zu erstellen?

<p>Dashboards ermöglichen einen vollständigen Echtzeit-Überblick wesentlicher Daten. (B)</p> Signup and view all the answers

Auf welche Art und Weise können Lead- und Lag-Informationen die Entscheidungsfindung in Unternehmen verbessern?

<p>Sie ermöglichen eine exaktere Vorhersage zukünftiger Ereignisse. (C)</p> Signup and view all the answers

Welche Eigenschaft beschreibt die Datenaufbereitung am besten?

<p>Die Transformation von Daten in ein analysierbares Format. (D)</p> Signup and view all the answers

Welche Vorteile erzielt ein Unternehmen durch das Überwinden von Widerständen bei der Data Science Implementierung?

<p>Verbesserte strategische Datennutzung. (D)</p> Signup and view all the answers

Flashcards

Advanced Analytics

Systematischer Einsatz von Advanced Analytics für Wettbewerbsvorteile.

Data Warehouse Relevanz

Die Relevanz eines Data Warehouse darzustellen und erklären.

Dashboard-Nutzung

Die Nutzung von Dashboards zur Datenvisualisierung zu erklären.

Unternehmenskultur Rolle

Die Rolle der Unternehmenskultur darzustellen und beschreiben.

Signup and view all the flashcards

Datenspeicherung

Daten werden in Funktionsbereichen eines Unternehmens gespeichert.

Signup and view all the flashcards

Vorteile Data Warehouse

Speicherung großer Datenmengen und Entlastung der Funktionsbereiche.

Signup and view all the flashcards

Datenintegration

Integration von Daten aus verschiedenen Quellen

Signup and view all the flashcards

Data Marts

Relational Data Foundation und Cubes für Business User.

Signup and view all the flashcards

Meta-Daten

Informationen über Daten (Zeit, Person, Variablen).

Signup and view all the flashcards

ETL Prozess

Extraktion, Transformation, Laden von Daten.

Signup and view all the flashcards

Operational Data Store (ODS)

Datenbank, i.d.R. nur aktuelle Daten ohne Vergangenheitsdaten.

Signup and view all the flashcards

Transaktionsdaten

Analysiere Verkaufszahlen über die Zeit.

Signup and view all the flashcards

Kundendaten

Segmentiere und erstelle eine Churn Prediction.

Signup and view all the flashcards

Beschäftigte Daten

Trainingsbedarf, Verhaltensvorhersage

Signup and view all the flashcards

Betriebsstunden Traktor

Sensoren erfassen Betriebsstunden des Traktors

Signup and view all the flashcards

Motordaten

Motordrehzahl, Temperatur, Kraftstoffverbrauch.

Signup and view all the flashcards

Boden- und Umweltdaten

Bodenfeuchtigkeit, Temperatur, Nährstoffgehalt.

Signup and view all the flashcards

Data Cleaning

Outlier entdecken und behandeln.

Signup and view all the flashcards

Duplikatsbereinigung

Duplikate entdecken und eliminieren.

Signup and view all the flashcards

Mapping Daten

Verschiedene Versionen von Einträgen in ein unified Value bringen.

Signup and view all the flashcards

Cloud-basiert

Software und Daten werden auf den Servern des Dienstanbieters gehostet.

Signup and view all the flashcards

SaaS

Methode der Softwarebereitstellung, die den Zugriff auf Daten von jedem Gerät mit Internetverbindung ermöglicht.

Signup and view all the flashcards

Internal Process Culture

Klare Hierarchien, Formalisierung, Transparenz und Effizienz.

Signup and view all the flashcards

Rational Goal Culture

Ambitioniert, Wachstum, Langzeit orientiert, Effizienz.

Signup and view all the flashcards

Group Culture

Harmonie, Kohäsion, Mitarbeiterzufriedenheit ist wichtig.

Signup and view all the flashcards

Developmental Culture

Dynamisch, Innovativ, gute Fehlerkultur.

Signup and view all the flashcards

Sorgen/Ängste

Sorgen/Ängste z.B. vor Überforderung oder Arbeitsplatzverlust.

Signup and view all the flashcards

Data Science Erfolg

Verstehen, wo sie Unterstützung brauchen.

Signup and view all the flashcards

Study Notes

  • Die Präsentation behandelt das Thema Data Science im Unternehmenskontext, Teil 2 von Prof. Dr. Marius Wehner von der Heinrich-Heine-Universität Düsseldorf.

Kurze Wiederholung zu den Gastvorträgen

  • Beispiel ERGO: Wettbewerbsvorteile durch systematischen Einsatz von Advanced Analytics entlang der gesamten Wertschöpfungskette.
  • Diskussionsfragen:
    • Warum ist Informationsmanagement bei ERGO wichtig?
    • Wie wird die Integration der Data Science Abteilung in die Unternehmensstrategie beurteilt?

Lernziele

  • Die Relevanz eines Data Warehouses darstellen und erklären können.
  • Mögliche Datenquellen benennen können.
  • Die Nutzung von Dashboards zur Datenvisualisierung erklären können.
  • Die Rolle der Unternehmenskultur darstellen und beschreiben können.

Rolle des Data Warehouse

  • Datenspeicherung in Funktionsbereichen:
    • Personalabteilung: Personalakte, Bewerbungen, Abwesenheits- und Urlaubsdaten.
    • Einkauf: Auftragsbücher, Lieferzeiten, Qualität.
    • Finanzen: Rechnungen, Transaktionen, Zahlungsausfälle.
    • Produktion: Inventurdaten, Produktionsdaten, Maschinendaten, Ausfallzeiten.
  • Nachteile der Datenspeicherung in Funktionsbereichen:
    • Digitalisierung und großes Datenvolumen (Big Data)
    • Geringe Nützlichkeit (Archivierung und Nachweis als traditionelles Ziel)
    • Dateninseln und fehlende Integration
    • Wenig Dokumentation, "Datenfriedhöfe"
    • Keine oder schlechte Aufbereitung

Vorteile eines Data Warehouse

  • Speicherung großer Datenmengen
  • Entlastung der Funktionsbereiche
  • Bessere Datenaufbereitung
    • Höhere Validität
    • Transparenz durch "Meta-Daten"
    • Hohe Verfügbarkeit
  • Integration von Daten aus verschiedenen Quellen
    • Bessere Informationsausbeutung
    • Vermeidung von isolierten "Dateninseln"

Architektur eines Data Warehouse

  • BI-Portal ermöglicht Zugriff für Business-Anwender.
  • Data Mart Area für relationales Data-Fundament und Cubes.
  • ETL-Prozesse integrieren Daten aus Quellsystemen
  • Data Warehouse enthält Dimensionen und ein Meta-Data-Repository.
  • Data Quality Prozesse sorgen für Datenbereinigung.
  • Staging Area als Dateneingangsbereich und Repository.
  • ETL-Prozesse.
  • Source Systeme sind ERP, CRM usw.
  • Begriffsbedeutungen:
    • BI = Business Intelligence
    • Data Marts enthalten Daten bestimmter Abteilungen
    • Meta-Daten sind Informationen über Daten (Zeit, Person, Variablen).
    • ETL = Extract, Transform, Load
    • ODS = Operational Data Store
    • Staging Area dient der temporären Speicherung.
    • ERP = Enterprise Resource Planning

Beispiele für Datenströme (Sources) und Nutzung

  • Transaktionen: Analyse von Verkaufszahlen, automatische Inkasso-Systeme.
  • Sensordaten: Produktverwendung, Predictive Maintenance.
  • Kundendaten: Segmentierung, Churn Prediction, Alarmsysteme.
  • Beschäftigte: Trainingsbedarf, Verhaltensvorhersage, Job Performance.
  • Geo-Daten: Benachrichtigungen, Fraud Detection, Logistik.
  • Social Media: Stimmung, Präferenzen, Trends, CSR, Bewerbertracking.
  • Informationen über Maßnahmen: Wissen, was funktioniert (für welche Kunden).
  • Weblogs: Kundenverhalten, Interessen, Präferenzen.
  • Produktionsinformationen: Produktverbesserung, Prozessverbesserung, Qualitätskontrolle.

Beispiel: Landwirtschaft goes digital

  • Der Traktor:
    • Betriebsstunden: Erfassung zur Nutzungsdauer, Ort und Wartungsbedarf.
    • Motordaten: Drehzahl, Temperatur, Kraftstoffverbrauch, Öldruck, Gewicht, Bodendruck.
    • Boden- und Umweltdaten: Bodenfeuchtigkeit, Temperatur, Nährstoffgehalt.

Datenbereinigung (ETL) als wichtige Aufgabe

  • ETL-Prozess: Extract [Zugriff auf Datenbank], Transform, Load.
  • Data Cleaning:
    • Outlier entdecken und behandeln (z.B. Winsorizing).
    • Duplicates entdecken und eliminieren.
    • Missing data entdecken, verstehen und imputieren.
  • Data Wrangling (Datenaufbereitung):
    • Umkodieren (Strings in numerische Variablen).
    • Neue Variable berechnen.
    • Tables zusammenfügen.
    • Aggregieren (z.B. Tageswerte auf Monats-Level).
    • Pivoting (Wideformat → Longformat).
    • Mapping: Verschiedene Versionen in einen einheitlichen Wert bringen.

Technologie-Option zur Datenspeicherung

  • Vor-Ort (On-Premise):
    • Physisch in Computern und Servern innerhalb der Organisation.
    • Generell besser anpassbar.
    • Mehr Kontrolle über Daten.
    • Einmalige, unbefristete Gebühr plus Lizenz- und Supportkosten.
  • Cloud-basiert:
    • Software und Daten auf Servern des Dienstanbieters (z. B. Amazon Web Services, Microsoft Azure).
    • Ortsunabhängiger Echtzeit-Zugriff.
    • Keine Vorabkosten.
    • Abonnement-/Lizenzmodelle.
    • Skalierbarkeit.

SaaS, PaaS und IaaS

  • Methode der Softwarebereitstellung für Zugriff auf Daten von jedem Gerät.
  • Bietet komplette Softwarelösung auf Pay-per-use-Basis.
  • Beispiele:
    • Software as a Service (SaaS): On-Demand-ERP, On-Demand-CRM.
    • Plattformbasierter Dienst (PaaS): Azure, Salesforce.com.
    • Infrastructure as a Service (IaaS): Amazon EC2.

Kosten der Implementierung (als Richtwerte)

  • Vor-Ort: ca. 1,4 Mio US-$ (2010), 26% Lizenzierung, 74% Anpassung/Infrastruktur/Wartung/Upgrade/IT-Personal/Ausbildung.
  • Cloud: ca. 700 Tsd. US-$ (2010), 65% Lizenzierung, 35% Anpassung/Ausbildung/IT-Personal/Konnektivität.

Beispiel: Snowflake

  • Gegründet 2012 in den USA.
  • Eine der ersten Cloud-nativen Architekturen
  • Trennt Speicher- und Rechenressourcen.
  • Ermöglicht unabhängige Skalierung.
  • Beseitigt Beschränkungen ortsgebundener Data Warehouses.

Digitale Datenspeicherung

  • Kombination beider Speichertypen = Vorteile beider Ansätze.
  • Kritische/sensible Daten lokal speichern, weniger sensible oder skalierbare Daten in die Cloud auslagern.

Organisation von Daten

  • Datenbank-Management:
    • Datenbank: Sammlung organisierter Daten.
    • Datenbank-Management-System (DBMS): Software zur Pflege einer Datenbank.
  • Relationale Datenbank:
    • Teilmengen von Daten sind integriert und durch IDs verknüpft.
    • Relationales DBMS: Software zur Pflege relationaler Datenbanken.
  • Management einer relationalen Datenbank:
    • Tabelle, Schlüsselvariable, Bericht

Visualisierung von Daten

  • Reports (Berichte): Strukturierte Dokumente oder Präsentationen.
  • Score Cards: Darstellung von Leistungskennzahlen (KPIs).
  • Analytical Applications: Softwareanwendungen zur Datenvisualisierung und Analyse
  • Dashboards: Visuelle Darstellung relevanter Informationen auf einer Oberfläche.

Beispiel: Dashboard

  • Vorteile: Datenvisualisierung, Echtzeitüberwachung, Datenintegration, benutzerdefinierte Ansichten.
  • Nachteile: Datenqualität, Ãœberforderung, Abhängigkeit von Technologie, Fehlinterpretation.

Rolle der Unternehmenskultur für die Data Science Funktion

  • Data Science-Implementierung als Organisationsentwicklungsmaßnahme.
  • Widerstand bei Beschäftigten: Sorgen/Ängste, Verständnisprobleme, mangelnde Beteiligung.
  • Widerstand bei Managern: Angst vor Entscheidungsverlust, kognitive Dissonanz, Mangel an Ressourcen.
  • Kultur-Taxonomie von Quinn & Rohrbaugh (1983)
    • Fokus: Intern oder Extern
    • Struktur: Mechanistisch (formalisiert & zentralisiert) oder organisch (flexibel & dezentralisiert)
  • Kurt Lewin's Phasen der Veränderung: Unfreeze, Change, Refreeze.
  • Aspekte zur Ãœberwindung von Hindernissen:
    • Manager und Beschäftigte einbeziehen und Nutzen verdeutlichen;
    • zentrale Personen überzeugen;
    • Training und Unterstützung anbieten;
    • "Start small and make it happen";
    • Implementierung begleiten und Feedback einholen.
  • Der Beitrag von Data Science zur Zielerreichung wird durch ein Reifegradmodell dargestellt
  • Revolution vs. Evolution: Unternehmenssteigerung durch sukzessive Projekte.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

More Like This

Data Warehouse and Mining Lecture Overview
10 questions
Data Warehouse Integration Quiz
16 questions
Data Warehouse characteristics and design
48 questions
Use Quizgecko on...
Browser
Browser