Questions and Answers
Was beschreibt der Begriff 'Big Data'?
Big Data kann nur für Unternehmen in der Finanzindustrie genutzt werden.
False
Was ist das 3-V-Modell?
Das 3-V-Modell ist ein Modell, nach dem die Daten nach ihrer Bedeutung bewertet werden.
Ein Unternehmen kann sich einen großen _______________________ sichern, wenn es Big Data sinnvoll für sich nutzen kann.
Signup and view all the answers
Match the following terms with their explanations:
Signup and view all the answers
Big Data kann einen Eingriff in die Privatsphäre bedeuten.
Signup and view all the answers
Welche Bedeutung haben die Daten für ein Unternehmen?
Signup and view all the answers
Warum sorgen sich viele Bürger um ihren Datenschutz?
Signup and view all the answers
Was fürchten viele Bürger vor?
Signup and view all the answers
Die EU-Datenschutzgrundverordnung (DSGVO) soll dazu dienen, dass nur relevante und anonymisierte Daten gesammelt werden.
Signup and view all the answers
Was ist der Zweck einer Big Data Strategie?
Signup and view all the answers
Für die Auswertung von Daten wird auch das _______________ eingesetzt.
Signup and view all the answers
Was ist der CRISP-DM?
Signup and view all the answers
Der CRISP-DM besteht aus 5 Schritten.
Signup and view all the answers
Welche Disziplinen werden im Data Mining-Prozess genutzt?
Signup and view all the answers
Was ist das Hauptziel von Data Mining?
Signup and view all the answers
Wie wird das CRISP DM Modell oft dargestellt?
Signup and view all the answers
Die erste Phase des CRISP-DM Modells beschäftigt sich damit, ein Datenverständnis zu entwickeln.
Signup and view all the answers
Was soll in der ersten Phase des CRISP-DM Modells präzise beschrieben werden?
Signup and view all the answers
Die dritte Phase des CRISP-DM Modells geht um die ____________________.
Signup and view all the answers
Ordnen Sie die Phasen des CRISP-DM Modells ihren Beschreibungen zu:
Signup and view all the answers
Wozu dienen die erstellten Datenmodelle in der fünften Phase des CRISP-DM Modells?
Signup and view all the answers
In der vierten Phase des CRISP-DM Modells können verschiedene Modellierungstechniken des Data Minings zum Einsatz kommen.
Signup and view all the answers
Wozu soll ein finaler Datensatz dienen?
Signup and view all the answers
Was ist der Hauptzweck eines Data Lakes?
Signup and view all the answers
Ein Data Warehouse enthält nur strukturierte Daten.
Signup and view all the answers
Wer sind die Hauptbenutzer eines Data Lakes?
Signup and view all the answers
Ein Data Lake speichert Daten in ihrem ____________________ Format.
Signup and view all the answers
Was sind die Vorteile von Data Lakes?
Signup and view all the answers
Ordne die folgenden Begriffe den entsprechenden Konzepten zu:
Signup and view all the answers
Ein Data Lake ist ein Repository, das nur strukturierte Daten aufnimmt.
Signup and view all the answers
Was ist ein Data Lake laut Definition?
Signup and view all the answers
Welche Programmiersprache ist besonders stark in statistischen Analysen?
Signup and view all the answers
BigQuery ist ein Open-Source-Data-Warehouse von Google.
Signup and view all the answers
Welche beiden Bibliotheken machen Python besonders nützlich für Datenanalyse?
Signup and view all the answers
BigQuery ermöglicht superschnelle SQL-Abfragen auf grosse _______________________.
Signup and view all the answers
Match the following industries with their potential applications of Big Data:
Signup and view all the answers
Welche Vorteile bietet BigQuery für Unternehmen?
Signup and view all the answers
Python ist die einzige Programmiersprache, die für Datenanalyse verwendet wird.
Signup and view all the answers
Wie kann Big Data im Gesundheitswesen eingesetzt werden?
Signup and view all the answers
Was ist der Hauptzweck eines Data Lake?
Signup and view all the answers
Welche Eigenschaften haben Data Lakes?
Signup and view all the answers
Was ist ein Data Warehouse?
Signup and view all the answers
Wer sind die Hauptbenutzer von Data Lakes?
Signup and view all the answers
Was sind die Vorteile von Data Lakes?
Signup and view all the answers
Wie werden Daten in einem Data Lake gespeichert?
Signup and view all the answers
Was ist ein Data Lake?
Signup and view all the answers
Warum können Unternehmen mit Big Data evidenzbasierte Entscheidungen treffen?
Signup and view all the answers
Was ist ein Vorteil des Einsatzes von Big Data für ein Unternehmen?
Signup and view all the answers
Wie sind Data Lakes und Data Warehouses unterschiedlich?
Signup and view all the answers
Warum sorgen sich viele Bürger um ihren Datenschutz, wenn es um Big Data geht?
Signup and view all the answers
Welche Art von Daten kann ein Unternehmen mit Big Data sammeln?
Signup and view all the answers
Was kann Big Data auch bedeuten?
Signup and view all the answers
Wie kann ein Unternehmen Big Data nutzen?
Signup and view all the answers
Warum ist Big Data wichtig für Unternehmen?
Signup and view all the answers
Welche Datenquellen können für Big Data genutzt werden?
Signup and view all the answers
Wie viele Phasen hat das CRISP-DM-Modell?
Signup and view all the answers
Welche Phase des CRISP-DM-Modells beschäftigt sich mit der Datenvorbereitung?
Signup and view all the answers
Was passiert mit den Daten, wenn keine regelmäßigen Datenqualitäts- und Data-Governance-Maßnahmen durchgeführt werden?
Signup and view all the answers
Wozu dienen die erstellten Datenmodelle in der fünften Phase des CRISP-DM-Modells?
Signup and view all the answers
Was ist der Zweck des CRISP-DM?
Signup and view all the answers
Wie viele Phasen enthält das CRISP-DM Modell?
Signup and view all the answers
Was ist die Hauptaufgabe der ersten Phase des CRISP-DM-Modells?
Signup and view all the answers
Wer sind die Hauptbenutzer des CRISP-DM Modells?
Signup and view all the answers
Was ist ein wichtiger Aspekt der zweiten Phase des CRISP-DM-Modells?
Signup and view all the answers
Was ist ein wichtiger Aspekt des CRISP-DM Modells?
Signup and view all the answers
Wozu wird der finale Datensatz in der dritten Phase des CRISP-DM-Modells verwendet?
Signup and view all the answers
Wie wird das CRISP-DM-Modell oft dargestellt?
Signup and view all the answers
Was bedeutet CRISP-DM?
Signup and view all the answers
Was geschieht in der vierten Phase des CRISP-DM-Modells?
Signup and view all the answers
Warum ist das CRISP-DM Modell wichtig?
Signup and view all the answers
Wer unterstützt die Entwicklung des CRISP-DM?
Signup and view all the answers
Was passiert, wenn die Modelle in der Datenanalyse nicht ausreichend sind?
Signup and view all the answers
Was ist der Zweck der letzten Phase des CRISP DM Modells?
Signup and view all the answers
Welche zwei Systeme sind wichtige Datenmanagement-Tools?
Signup and view all the answers
Was ist Apache Spark bekannt für?
Signup and view all the answers
Welche analytische Software wird für Big Data genutzt?
Signup and view all the answers
Was ist die Hauptaufgabe von Hadoop?
Signup and view all the answers
Was ist das Hauptziel des CRISP DM Modells?
Signup and view all the answers
In welchem Jahrzehnt begannen Organisationen wie die NASA und große Unternehmen, enorme Datenmengen zu verarbeiten?
Signup and view all the answers
Wer ist einer der Schlüsselfiguren, die den Begriff 'Big Data' popularisierten und die Herausforderungen sowie die Möglichkeiten dieser neuen Datenära diskutierten?
Signup and view all the answers
Was war ein wichtiger Meilenstein in der Geschichte von Big Data?
Signup and view all the answers
Wann wuchs die Menge der generierten Daten exponentiell?
Signup and view all the answers
Was ermöglichte die Entwicklung von Hadoop?
Signup and view all the answers
Welche Plattformen wurden durch Hadoop inspiriert?
Signup and view all the answers
Welche Rolle spielt Big Data heute in vielen Geschäftsstrategien?
Signup and view all the answers
Warum erkannten Firmen den Wert von Big Data?
Signup and view all the answers
Was charakterisiert einen Data Lake?
Signup and view all the answers
Wie kann Big Data genutzt werden?
Signup and view all the answers
Welche Vorteile kann ein Unternehmen durch die Verwendung eines Data Lakes erzielen?
Signup and view all the answers
Was ist der Hauptzweck eines Data Lakes?
Signup and view all the answers
Wie unterscheidet sich ein Data Lake von einem Data Warehouse?
Signup and view all the answers
Was ermöglicht die Verwendung von Big Data in Unternehmen?
Signup and view all the answers
Wie kann ein Unternehmen Big Data nutzen, um neue Erkenntnisse zu gewinnen?
Signup and view all the answers
Was ist die Zukunft von Big Data?
Signup and view all the answers
Was charakterisiert Big Data und wie kann es Unternehmen helfen?
Signup and view all the answers
Was ist das 3-V-Modell in Bezug auf Big Data?
Signup and view all the answers
Was sind die Chancen von Big Data für Unternehmen?
Signup and view all the answers
Warum sorgen sich viele Bürger um ihren Datenschutz?
Signup and view all the answers
Was bedeutet ein Eingriff in die Privatsphäre durch Big Data?
Signup and view all the answers
Welche Bedeutung haben die Daten für ein Unternehmen?
Signup and view all the answers
Wie kann Big Data im Gesundheitswesen eingesetzt werden?
Signup and view all the answers
Was ist der Zweck einer Big Data Strategie?
Signup and view all the answers
Wie können Unternehmen durch die Nutzung von Big Data und analytischen Werkzeugen wie R und Python evidenzbasierte Entscheidungen treffen?
Signup and view all the answers
Welche Vorteile bietet BigQuery für Unternehmen?
Signup and view all the answers
Wie kann Big Data im Gesundheitswesen eingesetzt werden?
Signup and view all the answers
Welche Bibliotheken machen Python besonders nützlich für Datenanalyse?
Signup and view all the answers
Was ist das Hauptziel von Data Mining?
Signup and view all the answers
Wie werden Daten in einem Data Lake gespeichert?
Signup and view all the answers
Welche Eigenschaften haben Data Lakes?
Signup and view all the answers
Welche Vorteile bietet die Verwendung von R und Python für die Datenanalyse?
Signup and view all the answers
Welche Phase des CRISP-DM Modells beschäftigt sich mit der Entwicklung eines tieferen Geschäftsverständnisses?
Signup and view all the answers
Welche Aspekte werden bei der Datenvorbereitung im CRISP-DM Modell berücksichtigt?
Signup and view all the answers
Wozu werden die im CRISP-DM Modell erstellten Datenmodelle verwendet?
Signup and view all the answers
In welcher Phase des CRISP-DM Modells werden verschiedene Modellierungstechniken des Data Minings zum Einsatz kommen?
Signup and view all the answers
Wie wird das CRISP DM Modell oft dargestellt?
Signup and view all the answers
Was ist das Hauptziel der ersten Phase des CRISP-DM Modells?
Signup and view all the answers
Wie viele Phasen enthält das CRISP-DM Modell?
Signup and view all the answers
Was ist der Zweck der Datenaufbereitung im CRISP-DM Modell?
Signup and view all the answers
Study Notes
Einführung in Big Data
- Big Data beschreibt eine große Menge an Daten, die Unternehmen sammeln, analysieren und daraus Schlüsse ziehen können, um evidenzbasierte Entscheidungen treffen zu können.
- Die Daten können aus vielen Bereichen kommen, wie Social Media, der Finanzindustrie oder dem Gesundheitswesen.
3-V-Modell
- Big Data wird nach dem 3-V-Modell bewertet, das aus drei Dimensionen besteht: Volume (Datenmenge), Velocity (Daten Geschwindigkeit) und Variety (Daten-Variabilität).
Big Data Chancen
- Unternehmen können durch die Nutzung von Big Data einen großen Wettbewerbsvorteil sichern, indem sie neue Erkenntnisse über ihre Arbeitsprozesse oder Nutzer gewinnen.
Big Data Kritik
- Die Gesellschaft hat eine Skepsis gegenüber Big Data, da die Datenanalyse sehr detaillierte Erkenntnisse über die Nutzer liefern kann, was zu einer Verletzung der Privatsphäre führen kann.
- Die EU-Datenschutzgrundverordnung (DSGVO) regelt die Datensammlung und -verwendung, um den Datenschutz zu gewährleisten.
Big Data Strategie
- Unternehmen bemühen sich, Big Data Strategien umzusetzen, um mit dem Marktwettbewerb der Industrie 4.0 mitzuhalten.
- Die Umsetzung einer Big Data Strategie ist nicht einfach, da die großen Datenmengen sehr unübersichtlich sind.
CRISP-DM
- Die CRISP-DM (Cross-Industry Standard Process for Data Mining) ist ein einheitlicher Standard für die Entwicklung von Data Mining Prozessen.
- Der CRISP-DM besteht aus 6 Schritten: Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation und Deployment.
Data Lake vs Data Warehouse
- Data Lake und Data Warehouse sind Konzepte für die Datenspeicherung und -verwendung.
- Data Lake speichert rohe, unstrukturierte Daten, während Data Warehouse verarbeitete, strukturierte Daten enthält.
Data Mining
- Data Mining ist interdisziplinär und nutzt Erkenntnisse aus den Bereichen der Informatik, Mathematik und Statistik.
- Data Mining wird verwendet, um neue Trends und Muster ausfindig zu machen und um Erkenntnisse über die Nutzer zu gewinnen.
R und Python
- R und Python sind führende Programmiersprachen für Datenanalyse und maschinelles Lernen.
- R ist besonders stark in statistischen Analysen, während Python durch Bibliotheken wie Pandas für Datenmanipulation und PySpark für die Arbeit mit großen Datensätzen in einem Spark-Umfeld breite Anwendung findet.
Anwendungsfälle
- Big Data hat viele Anwendungsfälle, wie Direktmarketing, Betrug erkennen (Fraud Detection) und Gesundheitswesen.
- Im Gesundheitswesen ermöglicht Big Data die Entwicklung von personalisierter Medizin, indem es umfangreiche Patientendaten analysiert.
Big Data
- Big Data beschreibt eine große Menge an Daten, die von Unternehmen gesammelt, analysiert und für evidenzbasierte Entscheidungen genutzt werden können.
- Daten können aus verschiedenen Bereichen kommen, wie z.B. Social Media, Finanzindustrie oder Gesundheitswesen.
- Datenquellen sind z.B. Kredit- und Kundenkarten, Smartphones oder Smartwatches.
3-V-Modell
- Das 3-V-Modell bewertet Daten nach drei Kriterien: Volume (Menge), Velocity (Geschwindigkeit) und Variety (Vielfalt).
Big Data Chancen
- Unternehmen können durch die Nutzung von Big Data einen Wettbewerbsvorteil erzielen.
- Durch die Auswertung von Daten können Unternehmen neue Erkenntnisse über ihre Arbeitsprozesse oder Nutzer gewinnen.
Big Data Kritik
- Die Gesellschaft hat Bedenken bzgl. der Datenschutz und des Eingriffs in die Privatsphäre.
- Die Verwendung von Daten ohne ausdrückliches Einverständnis der Nutzer ist ein Problem.
Data Lake vs. Data Warehouse
- Data Lake: Ein Repository für unstrukturierte Daten in Rohformat, flexibel und anpassbar.
- Data Warehouse: Ein sistema für strukturierte Daten, vorformatierte und für spezifische Anwendungen geeignet.
Data Lake: Chancen und Herausforderungen
- Chancen: flexibel, anpassbar, Schnittstellen für verschiedene Datenquellen.
- Herausforderungen: Komplexität, Benutzer müssen sich mit den Daten auseinandersetzen.
CRISP DM
- CRISP DM ist ein einheitlicher Standard für die Entwicklung von Data Mining-Prozessen.
- Es besteht aus 6 Phasen: Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation und Deployment.
Die 6 Phasen des CRISP DM Modells
- Phase 1: Business Understanding - Entwicklung eines tieferen Geschäftsverständnisses.
- Phase 2: Data Understanding - Entwicklung eines Datenverständnisses.
- Phase 3: Data Preparation - Datenvorbereitung.
- Phase 4: Modeling - Datenmodellierung.
- Phase 5: Evaluation - Evaluierung der Modelle.
- Phase 6: Deployment - Bereitstellung der Ergebnisse.
CRISP DM: Vor- und Nachteile
- Vorteile: strukturiertes Vorgehen, effiziente Projektplanung.
- Nachteile: Inflexibilität, zu zeitintensiv.
Datenmanagement Tools
- Hadoop: Ein Framework für die Speicherung und Verarbeitung grosser Datenmengen auf Clustern von Standardhardware.
- Apache Spark: Eine alternative zu Hadoop MapReduce, schneller und effizienter.
Analytische Tools
- R und Python mit Pandas und PySpark: spezialisierte analytische Software für die Auswertung von Daten.
- Google BigQuery: ein Cloud-basiertes Datenanalyse-Tool.
Einführung in Big Data
- Big Data bezeichnet eine große Menge an Daten, die Unternehmen sammeln, analysieren und auswerten können, um daraus Schlüsse zu ziehen und evidenzbasierte Entscheidungen zu treffen.
- Die Daten können aus verschiedenen Bereichen stammen, wie Social Media, Finanzindustrie oder Gesundheitswesen, und werden nach dem 3-V-Modell bewertet.
Vorteile von Big Data
- Unternehmen können durch die Auswertung von Big Data einen großen Wettbewerbsvorteil erzielen, indem sie neue Erkenntnisse über ihre Arbeitsprozesse oder Nutzer gewinnen.
- Big Data kann Unternehmen helfen, ihre Arbeitsprozesse zu optimieren, Kosten zu reduzieren und neue Geschäftsmodelle zu entwickeln.
Kritik an Big Data
- Big Data kann einen Eingriff in die Privatsphäre der Nutzer darstellen, wenn Daten ohne ausdrückliches Einverständnis der Nutzer verwendet werden.
- Es gibt Bedenken hinsichtlich der Transparenz über die Datenhandhabung und des Datenschutzes.
Geschichte von Big Data
- Die Ursprünge von Big Data reichen zurück in die 1960er Jahre, als Organisationen wie die NASA und große Unternehmen begannen, enorme Datenmengen zu verarbeiten.
- Der Begriff "Big Data" wurde Anfang der 2000er Jahre eingeführt, um die explosionsartig anwachsenden Datenmengen zu beschreiben.
- Ein wichtiger Meilenstein in der Geschichte von Big Data war die Entwicklung von Hadoop im Jahr 2006.
Data Lake
- Ein Data Lake ist ein sehr großer Speicher, in dem Daten in ihrem Rohformat gespeichert werden.
- Ein Data Lake kann einem Unternehmen einen großen Wettbewerbsvorteil verschaffen, indem es die Analyse großer Datenmengen ermöglicht.
CRISP-DM-Modell
- Das CRISP-DM-Modell ist ein iterativer Prozess, der in sechs Phasen unterteilt ist: Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation und Deployment.
- Jede Phase ist wichtig für die erfolgreiche Implementierung eines Big-Data-Projekts.
Werkzeuge für Big Data
- R und Python sind führende Programmiersprachen für Datenanalyse und maschinelles Lernen.
- Google BigQuery ist ein Enterprise-Data-Warehouse, das speziell für Big Data entwickelt wurde.
Anwendungsfälle von Big Data
- Big Data hat vielfältige Anwendungsfälle, wie Direktmarketing, Betrug erkennen und Gesundheitswesen.
- Im Gesundheitswesen können Big Data helfen, die Entwicklung von personalisierter Medizin zu fördern und Krankheitsverläufe vorherzusagen.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Description
Erfahren Sie, was Big Data ist und wie Unternehmen große Mengen an strukturierten und unstrukturierten Daten sammeln, analysieren und daraus Schlüsse ziehen können.