Podcast
Questions and Answers
Welche der folgenden Aussagen beschreibt am besten den Hauptvorteil eines Data Warehouse?
Welche der folgenden Aussagen beschreibt am besten den Hauptvorteil eines Data Warehouse?
- Es ermöglicht die Speicherung großer Datenmengen aus verschiedenen Quellen an einem zentralen Ort. (correct)
- Es beschränkt den Zugriff auf Daten auf bestimmte Abteilungen.
- Es minimiert die Notwendigkeit von IT-Kompetenzen in den Fachbereichen.
- Es reduziert die Notwendigkeit der Datenaufbereitung.
Was versteht man unter dem Begriff 'ETL' im Kontext eines Data Warehouse?
Was versteht man unter dem Begriff 'ETL' im Kontext eines Data Warehouse?
- Ein Werkzeug zur direkten Datenanalyse für Endnutzer.
- Ein Prozess zum Extrahieren, Transformieren und Laden von Daten in das Data Warehouse. (correct)
- Eine Methode zur Verschlüsselung sensibler Daten im Data Warehouse.
- Eine Software zur Ãœberwachung der Systemleistung des Data Warehouse.
Welche der folgenden Datenquellen wäre am wahrscheinlichsten, um Kundendaten für eine Churn Prediction (Kundenabwanderungsprognose) zu verwenden?
Welche der folgenden Datenquellen wäre am wahrscheinlichsten, um Kundendaten für eine Churn Prediction (Kundenabwanderungsprognose) zu verwenden?
- Finanzdaten (z.B. Rechnungen, Zahlungsausfälle).
- Sensordaten.
- Kundendaten aus Hotlines und E-Mails. (correct)
- Produktionsdaten (z.B. Anzahl produzierter Einheiten).
Was sind typische Nachteile der traditionellen Datenaufbewahrung in verschiedenen Funktionsbereichen eines Unternehmens vor der Einführung eines Data Warehouse?
Was sind typische Nachteile der traditionellen Datenaufbewahrung in verschiedenen Funktionsbereichen eines Unternehmens vor der Einführung eines Data Warehouse?
Welche Aussage beschreibt am besten die Rolle von Meta-Daten in einem Data Warehouse?
Welche Aussage beschreibt am besten die Rolle von Meta-Daten in einem Data Warehouse?
Was ist der Hauptunterschied zwischen einem Data Warehouse und einem Operational Data Store (ODS)?
Was ist der Hauptunterschied zwischen einem Data Warehouse und einem Operational Data Store (ODS)?
Welche der folgenden Aussagen beschreibt am besten den Zweck der Datenbereinigung (Data Cleaning) im ETL-Prozess?
Welche der folgenden Aussagen beschreibt am besten den Zweck der Datenbereinigung (Data Cleaning) im ETL-Prozess?
Was versteht man unter 'Data Wrangling' im Rahmen der Datenaufbereitung?
Was versteht man unter 'Data Wrangling' im Rahmen der Datenaufbereitung?
Was ist ein wesentlicher Unterschied zwischen 'On-Premise' und 'Cloud-basierten' Lösungen zur Datenspeicherung?
Was ist ein wesentlicher Unterschied zwischen 'On-Premise' und 'Cloud-basierten' Lösungen zur Datenspeicherung?
Welchen Vorteil bietet eine Cloud-native Architektur wie Snowflake im Vergleich zu traditionellen Data Warehouses?
Welchen Vorteil bietet eine Cloud-native Architektur wie Snowflake im Vergleich zu traditionellen Data Warehouses?
Welchen Aspekt sollte man besonders beachten, wenn man kritische oder sensible Daten in der Cloud speichert?
Welchen Aspekt sollte man besonders beachten, wenn man kritische oder sensible Daten in der Cloud speichert?
Was ist der Hauptzweck eines Datenbank-Management-Systems (DMS)?
Was ist der Hauptzweck eines Datenbank-Management-Systems (DMS)?
Was kennzeichnet eine relationale Datenbank?
Was kennzeichnet eine relationale Datenbank?
Welche der folgenden Optionen sind keine typischen Elemente, die in Dashboards zur Datenvisualisierung verwendet werden?
Welche der folgenden Optionen sind keine typischen Elemente, die in Dashboards zur Datenvisualisierung verwendet werden?
Welche der folgenden Aussagen beschreibt am besten den Zweck von Score Cards?
Welche der folgenden Aussagen beschreibt am besten den Zweck von Score Cards?
Welche Herausforderung besteht typischerweise bei der Verwendung von Dashboards?
Welche Herausforderung besteht typischerweise bei der Verwendung von Dashboards?
Wie können Führungskräfte die Informationen, des in der Präsentation dargestellten Dashboards (Folie 26) nutzen, um ihre Entscheidungsprozesse zu verbessern?
Wie können Führungskräfte die Informationen, des in der Präsentation dargestellten Dashboards (Folie 26) nutzen, um ihre Entscheidungsprozesse zu verbessern?
Welche der folgenden Aussagen beschreibt am besten die Rolle der Unternehmenskultur bei der Implementierung von Data Science?
Welche der folgenden Aussagen beschreibt am besten die Rolle der Unternehmenskultur bei der Implementierung von Data Science?
Welche Art von Widerstand ist bei der Data Science-Implementierung von Beschäftigten zu erwarten?
Welche Art von Widerstand ist bei der Data Science-Implementierung von Beschäftigten zu erwarten?
Welche Art von Widerstand ist bei der Data Science-Implementierung von Managern zu erwarten?
Welche Art von Widerstand ist bei der Data Science-Implementierung von Managern zu erwarten?
Wie kann man laut der Präsentation Widerstände bei der Implementierung von Data Science überwinden?
Wie kann man laut der Präsentation Widerstände bei der Implementierung von Data Science überwinden?
Was ist ein wichtiger Aspekt, um Hindernisse bei der Implementierung von Data Science zu überwinden?
Was ist ein wichtiger Aspekt, um Hindernisse bei der Implementierung von Data Science zu überwinden?
Was versteht man unter einer 'kognitiven Dissonanz' im Kontext der Data Science-Implementierung bei Managern?
Was versteht man unter einer 'kognitiven Dissonanz' im Kontext der Data Science-Implementierung bei Managern?
Was ist gemäß Kurt Lewins Phasen der Veränderung der erste Schritt bei der Implementierung von Data Science in einem Unternehmen?
Was ist gemäß Kurt Lewins Phasen der Veränderung der erste Schritt bei der Implementierung von Data Science in einem Unternehmen?
Welchen Fokus haben Unternehmen im ersten Reifegradmodell für ein Informationssystem typischerweise?
Welchen Fokus haben Unternehmen im ersten Reifegradmodell für ein Informationssystem typischerweise?
Was kennzeichnet Unternehmen mit dem höchsten Reifegradmodell für ein Informationssystem?
Was kennzeichnet Unternehmen mit dem höchsten Reifegradmodell für ein Informationssystem?
Welche Art von Kompetenzen sind gemäß des Reifegradmodells für ein Informationssystem in Unternehmen der Stufe 2 vorrangig?
Welche Art von Kompetenzen sind gemäß des Reifegradmodells für ein Informationssystem in Unternehmen der Stufe 2 vorrangig?
Welche der folgenden Aussagen ist ein Argument für die Speicherung großer Datenmengen in einem Data Warehouse?
Welche der folgenden Aussagen ist ein Argument für die Speicherung großer Datenmengen in einem Data Warehouse?
Welche Rolle spielt die Automatisierung im Kontext von Data-Science-Projekten?
Welche Rolle spielt die Automatisierung im Kontext von Data-Science-Projekten?
In welchen Schritten sollte die Data Science Implementierung erfolgen?
In welchen Schritten sollte die Data Science Implementierung erfolgen?
Welchen Vorteil bietet die Möglichkeit Dashboards zu erstellen?
Welchen Vorteil bietet die Möglichkeit Dashboards zu erstellen?
Auf welche Art und Weise können Lead- und Lag-Informationen die Entscheidungsfindung in Unternehmen verbessern?
Auf welche Art und Weise können Lead- und Lag-Informationen die Entscheidungsfindung in Unternehmen verbessern?
Welche Eigenschaft beschreibt die Datenaufbereitung am besten?
Welche Eigenschaft beschreibt die Datenaufbereitung am besten?
Welche Vorteile erzielt ein Unternehmen durch das Überwinden von Widerständen bei der Data Science Implementierung?
Welche Vorteile erzielt ein Unternehmen durch das Überwinden von Widerständen bei der Data Science Implementierung?
Flashcards
Advanced Analytics
Advanced Analytics
Systematischer Einsatz von Advanced Analytics für Wettbewerbsvorteile.
Data Warehouse Relevanz
Data Warehouse Relevanz
Die Relevanz eines Data Warehouse darzustellen und erklären.
Dashboard-Nutzung
Dashboard-Nutzung
Die Nutzung von Dashboards zur Datenvisualisierung zu erklären.
Unternehmenskultur Rolle
Unternehmenskultur Rolle
Signup and view all the flashcards
Datenspeicherung
Datenspeicherung
Signup and view all the flashcards
Vorteile Data Warehouse
Vorteile Data Warehouse
Signup and view all the flashcards
Datenintegration
Datenintegration
Signup and view all the flashcards
Data Marts
Data Marts
Signup and view all the flashcards
Meta-Daten
Meta-Daten
Signup and view all the flashcards
ETL Prozess
ETL Prozess
Signup and view all the flashcards
Operational Data Store (ODS)
Operational Data Store (ODS)
Signup and view all the flashcards
Transaktionsdaten
Transaktionsdaten
Signup and view all the flashcards
Kundendaten
Kundendaten
Signup and view all the flashcards
Beschäftigte Daten
Beschäftigte Daten
Signup and view all the flashcards
Betriebsstunden Traktor
Betriebsstunden Traktor
Signup and view all the flashcards
Motordaten
Motordaten
Signup and view all the flashcards
Boden- und Umweltdaten
Boden- und Umweltdaten
Signup and view all the flashcards
Data Cleaning
Data Cleaning
Signup and view all the flashcards
Duplikatsbereinigung
Duplikatsbereinigung
Signup and view all the flashcards
Mapping Daten
Mapping Daten
Signup and view all the flashcards
Cloud-basiert
Cloud-basiert
Signup and view all the flashcards
SaaS
SaaS
Signup and view all the flashcards
Internal Process Culture
Internal Process Culture
Signup and view all the flashcards
Rational Goal Culture
Rational Goal Culture
Signup and view all the flashcards
Group Culture
Group Culture
Signup and view all the flashcards
Developmental Culture
Developmental Culture
Signup and view all the flashcards
Sorgen/Ängste
Sorgen/Ängste
Signup and view all the flashcards
Data Science Erfolg
Data Science Erfolg
Signup and view all the flashcards
Study Notes
- Die Präsentation behandelt das Thema Data Science im Unternehmenskontext, Teil 2 von Prof. Dr. Marius Wehner von der Heinrich-Heine-Universität Düsseldorf.
Kurze Wiederholung zu den Gastvorträgen
- Beispiel ERGO: Wettbewerbsvorteile durch systematischen Einsatz von Advanced Analytics entlang der gesamten Wertschöpfungskette.
- Diskussionsfragen:
- Warum ist Informationsmanagement bei ERGO wichtig?
- Wie wird die Integration der Data Science Abteilung in die Unternehmensstrategie beurteilt?
Lernziele
- Die Relevanz eines Data Warehouses darstellen und erklären können.
- Mögliche Datenquellen benennen können.
- Die Nutzung von Dashboards zur Datenvisualisierung erklären können.
- Die Rolle der Unternehmenskultur darstellen und beschreiben können.
Rolle des Data Warehouse
- Datenspeicherung in Funktionsbereichen:
- Personalabteilung: Personalakte, Bewerbungen, Abwesenheits- und Urlaubsdaten.
- Einkauf: Auftragsbücher, Lieferzeiten, Qualität.
- Finanzen: Rechnungen, Transaktionen, Zahlungsausfälle.
- Produktion: Inventurdaten, Produktionsdaten, Maschinendaten, Ausfallzeiten.
- Nachteile der Datenspeicherung in Funktionsbereichen:
- Digitalisierung und großes Datenvolumen (Big Data)
- Geringe Nützlichkeit (Archivierung und Nachweis als traditionelles Ziel)
- Dateninseln und fehlende Integration
- Wenig Dokumentation, "Datenfriedhöfe"
- Keine oder schlechte Aufbereitung
Vorteile eines Data Warehouse
- Speicherung großer Datenmengen
- Entlastung der Funktionsbereiche
- Bessere Datenaufbereitung
- Höhere Validität
- Transparenz durch "Meta-Daten"
- Hohe Verfügbarkeit
- Integration von Daten aus verschiedenen Quellen
- Bessere Informationsausbeutung
- Vermeidung von isolierten "Dateninseln"
Architektur eines Data Warehouse
- BI-Portal ermöglicht Zugriff für Business-Anwender.
- Data Mart Area für relationales Data-Fundament und Cubes.
- ETL-Prozesse integrieren Daten aus Quellsystemen
- Data Warehouse enthält Dimensionen und ein Meta-Data-Repository.
- Data Quality Prozesse sorgen für Datenbereinigung.
- Staging Area als Dateneingangsbereich und Repository.
- ETL-Prozesse.
- Source Systeme sind ERP, CRM usw.
- Begriffsbedeutungen:
- BI = Business Intelligence
- Data Marts enthalten Daten bestimmter Abteilungen
- Meta-Daten sind Informationen über Daten (Zeit, Person, Variablen).
- ETL = Extract, Transform, Load
- ODS = Operational Data Store
- Staging Area dient der temporären Speicherung.
- ERP = Enterprise Resource Planning
Beispiele für Datenströme (Sources) und Nutzung
- Transaktionen: Analyse von Verkaufszahlen, automatische Inkasso-Systeme.
- Sensordaten: Produktverwendung, Predictive Maintenance.
- Kundendaten: Segmentierung, Churn Prediction, Alarmsysteme.
- Beschäftigte: Trainingsbedarf, Verhaltensvorhersage, Job Performance.
- Geo-Daten: Benachrichtigungen, Fraud Detection, Logistik.
- Social Media: Stimmung, Präferenzen, Trends, CSR, Bewerbertracking.
- Informationen über Maßnahmen: Wissen, was funktioniert (für welche Kunden).
- Weblogs: Kundenverhalten, Interessen, Präferenzen.
- Produktionsinformationen: Produktverbesserung, Prozessverbesserung, Qualitätskontrolle.
Beispiel: Landwirtschaft goes digital
- Der Traktor:
- Betriebsstunden: Erfassung zur Nutzungsdauer, Ort und Wartungsbedarf.
- Motordaten: Drehzahl, Temperatur, Kraftstoffverbrauch, Öldruck, Gewicht, Bodendruck.
- Boden- und Umweltdaten: Bodenfeuchtigkeit, Temperatur, Nährstoffgehalt.
Datenbereinigung (ETL) als wichtige Aufgabe
- ETL-Prozess: Extract [Zugriff auf Datenbank], Transform, Load.
- Data Cleaning:
- Outlier entdecken und behandeln (z.B. Winsorizing).
- Duplicates entdecken und eliminieren.
- Missing data entdecken, verstehen und imputieren.
- Data Wrangling (Datenaufbereitung):
- Umkodieren (Strings in numerische Variablen).
- Neue Variable berechnen.
- Tables zusammenfügen.
- Aggregieren (z.B. Tageswerte auf Monats-Level).
- Pivoting (Wideformat → Longformat).
- Mapping: Verschiedene Versionen in einen einheitlichen Wert bringen.
Technologie-Option zur Datenspeicherung
- Vor-Ort (On-Premise):
- Physisch in Computern und Servern innerhalb der Organisation.
- Generell besser anpassbar.
- Mehr Kontrolle über Daten.
- Einmalige, unbefristete Gebühr plus Lizenz- und Supportkosten.
- Cloud-basiert:
- Software und Daten auf Servern des Dienstanbieters (z. B. Amazon Web Services, Microsoft Azure).
- Ortsunabhängiger Echtzeit-Zugriff.
- Keine Vorabkosten.
- Abonnement-/Lizenzmodelle.
- Skalierbarkeit.
SaaS, PaaS und IaaS
- Methode der Softwarebereitstellung für Zugriff auf Daten von jedem Gerät.
- Bietet komplette Softwarelösung auf Pay-per-use-Basis.
- Beispiele:
- Software as a Service (SaaS): On-Demand-ERP, On-Demand-CRM.
- Plattformbasierter Dienst (PaaS): Azure, Salesforce.com.
- Infrastructure as a Service (IaaS): Amazon EC2.
Kosten der Implementierung (als Richtwerte)
- Vor-Ort: ca. 1,4 Mio US-$ (2010), 26% Lizenzierung, 74% Anpassung/Infrastruktur/Wartung/Upgrade/IT-Personal/Ausbildung.
- Cloud: ca. 700 Tsd. US-$ (2010), 65% Lizenzierung, 35% Anpassung/Ausbildung/IT-Personal/Konnektivität.
Beispiel: Snowflake
- Gegründet 2012 in den USA.
- Eine der ersten Cloud-nativen Architekturen
- Trennt Speicher- und Rechenressourcen.
- Ermöglicht unabhängige Skalierung.
- Beseitigt Beschränkungen ortsgebundener Data Warehouses.
Digitale Datenspeicherung
- Kombination beider Speichertypen = Vorteile beider Ansätze.
- Kritische/sensible Daten lokal speichern, weniger sensible oder skalierbare Daten in die Cloud auslagern.
Organisation von Daten
- Datenbank-Management:
- Datenbank: Sammlung organisierter Daten.
- Datenbank-Management-System (DBMS): Software zur Pflege einer Datenbank.
- Relationale Datenbank:
- Teilmengen von Daten sind integriert und durch IDs verknüpft.
- Relationales DBMS: Software zur Pflege relationaler Datenbanken.
- Management einer relationalen Datenbank:
- Tabelle, Schlüsselvariable, Bericht
Visualisierung von Daten
- Reports (Berichte): Strukturierte Dokumente oder Präsentationen.
- Score Cards: Darstellung von Leistungskennzahlen (KPIs).
- Analytical Applications: Softwareanwendungen zur Datenvisualisierung und Analyse
- Dashboards: Visuelle Darstellung relevanter Informationen auf einer Oberfläche.
Beispiel: Dashboard
- Vorteile: Datenvisualisierung, Echtzeitüberwachung, Datenintegration, benutzerdefinierte Ansichten.
- Nachteile: Datenqualität, Überforderung, Abhängigkeit von Technologie, Fehlinterpretation.
Rolle der Unternehmenskultur für die Data Science Funktion
- Data Science-Implementierung als Organisationsentwicklungsmaßnahme.
- Widerstand bei Beschäftigten: Sorgen/Ängste, Verständnisprobleme, mangelnde Beteiligung.
- Widerstand bei Managern: Angst vor Entscheidungsverlust, kognitive Dissonanz, Mangel an Ressourcen.
- Kultur-Taxonomie von Quinn & Rohrbaugh (1983)
- Fokus: Intern oder Extern
- Struktur: Mechanistisch (formalisiert & zentralisiert) oder organisch (flexibel & dezentralisiert)
- Kurt Lewin's Phasen der Veränderung: Unfreeze, Change, Refreeze.
- Aspekte zur Ãœberwindung von Hindernissen:
- Manager und Beschäftigte einbeziehen und Nutzen verdeutlichen;
- zentrale Personen überzeugen;
- Training und Unterstützung anbieten;
- "Start small and make it happen";
- Implementierung begleiten und Feedback einholen.
- Der Beitrag von Data Science zur Zielerreichung wird durch ein Reifegradmodell dargestellt
- Revolution vs. Evolution: Unternehmenssteigerung durch sukzessive Projekte.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.