Podcast
Questions and Answers
Was beschreibt der Begriff 'Big Data'?
Was beschreibt der Begriff 'Big Data'?
Big Data kann nur für Unternehmen in der Finanzindustrie genutzt werden.
Big Data kann nur für Unternehmen in der Finanzindustrie genutzt werden.
False
Was ist das 3-V-Modell?
Was ist das 3-V-Modell?
Das 3-V-Modell ist ein Modell, nach dem die Daten nach ihrer Bedeutung bewertet werden.
Ein Unternehmen kann sich einen großen _______________________ sichern, wenn es Big Data sinnvoll für sich nutzen kann.
Ein Unternehmen kann sich einen großen _______________________ sichern, wenn es Big Data sinnvoll für sich nutzen kann.
Signup and view all the answers
Match the following terms with their explanations:
Match the following terms with their explanations:
Signup and view all the answers
Big Data kann einen Eingriff in die Privatsphäre bedeuten.
Big Data kann einen Eingriff in die Privatsphäre bedeuten.
Signup and view all the answers
Welche Bedeutung haben die Daten für ein Unternehmen?
Welche Bedeutung haben die Daten für ein Unternehmen?
Signup and view all the answers
Warum sorgen sich viele Bürger um ihren Datenschutz?
Warum sorgen sich viele Bürger um ihren Datenschutz?
Signup and view all the answers
Was fürchten viele Bürger vor?
Was fürchten viele Bürger vor?
Signup and view all the answers
Die EU-Datenschutzgrundverordnung (DSGVO) soll dazu dienen, dass nur relevante und anonymisierte Daten gesammelt werden.
Die EU-Datenschutzgrundverordnung (DSGVO) soll dazu dienen, dass nur relevante und anonymisierte Daten gesammelt werden.
Signup and view all the answers
Was ist der Zweck einer Big Data Strategie?
Was ist der Zweck einer Big Data Strategie?
Signup and view all the answers
Für die Auswertung von Daten wird auch das _______________ eingesetzt.
Für die Auswertung von Daten wird auch das _______________ eingesetzt.
Signup and view all the answers
Was ist der CRISP-DM?
Was ist der CRISP-DM?
Signup and view all the answers
Der CRISP-DM besteht aus 5 Schritten.
Der CRISP-DM besteht aus 5 Schritten.
Signup and view all the answers
Welche Disziplinen werden im Data Mining-Prozess genutzt?
Welche Disziplinen werden im Data Mining-Prozess genutzt?
Signup and view all the answers
Was ist das Hauptziel von Data Mining?
Was ist das Hauptziel von Data Mining?
Signup and view all the answers
Wie wird das CRISP DM Modell oft dargestellt?
Wie wird das CRISP DM Modell oft dargestellt?
Signup and view all the answers
Die erste Phase des CRISP-DM Modells beschäftigt sich damit, ein Datenverständnis zu entwickeln.
Die erste Phase des CRISP-DM Modells beschäftigt sich damit, ein Datenverständnis zu entwickeln.
Signup and view all the answers
Was soll in der ersten Phase des CRISP-DM Modells präzise beschrieben werden?
Was soll in der ersten Phase des CRISP-DM Modells präzise beschrieben werden?
Signup and view all the answers
Die dritte Phase des CRISP-DM Modells geht um die ____________________.
Die dritte Phase des CRISP-DM Modells geht um die ____________________.
Signup and view all the answers
Ordnen Sie die Phasen des CRISP-DM Modells ihren Beschreibungen zu:
Ordnen Sie die Phasen des CRISP-DM Modells ihren Beschreibungen zu:
Signup and view all the answers
Wozu dienen die erstellten Datenmodelle in der fünften Phase des CRISP-DM Modells?
Wozu dienen die erstellten Datenmodelle in der fünften Phase des CRISP-DM Modells?
Signup and view all the answers
In der vierten Phase des CRISP-DM Modells können verschiedene Modellierungstechniken des Data Minings zum Einsatz kommen.
In der vierten Phase des CRISP-DM Modells können verschiedene Modellierungstechniken des Data Minings zum Einsatz kommen.
Signup and view all the answers
Wozu soll ein finaler Datensatz dienen?
Wozu soll ein finaler Datensatz dienen?
Signup and view all the answers
Was ist der Hauptzweck eines Data Lakes?
Was ist der Hauptzweck eines Data Lakes?
Signup and view all the answers
Ein Data Warehouse enthält nur strukturierte Daten.
Ein Data Warehouse enthält nur strukturierte Daten.
Signup and view all the answers
Wer sind die Hauptbenutzer eines Data Lakes?
Wer sind die Hauptbenutzer eines Data Lakes?
Signup and view all the answers
Ein Data Lake speichert Daten in ihrem ____________________ Format.
Ein Data Lake speichert Daten in ihrem ____________________ Format.
Signup and view all the answers
Was sind die Vorteile von Data Lakes?
Was sind die Vorteile von Data Lakes?
Signup and view all the answers
Ordne die folgenden Begriffe den entsprechenden Konzepten zu:
Ordne die folgenden Begriffe den entsprechenden Konzepten zu:
Signup and view all the answers
Ein Data Lake ist ein Repository, das nur strukturierte Daten aufnimmt.
Ein Data Lake ist ein Repository, das nur strukturierte Daten aufnimmt.
Signup and view all the answers
Was ist ein Data Lake laut Definition?
Was ist ein Data Lake laut Definition?
Signup and view all the answers
Welche Programmiersprache ist besonders stark in statistischen Analysen?
Welche Programmiersprache ist besonders stark in statistischen Analysen?
Signup and view all the answers
BigQuery ist ein Open-Source-Data-Warehouse von Google.
BigQuery ist ein Open-Source-Data-Warehouse von Google.
Signup and view all the answers
Welche beiden Bibliotheken machen Python besonders nützlich für Datenanalyse?
Welche beiden Bibliotheken machen Python besonders nützlich für Datenanalyse?
Signup and view all the answers
BigQuery ermöglicht superschnelle SQL-Abfragen auf grosse _______________________.
BigQuery ermöglicht superschnelle SQL-Abfragen auf grosse _______________________.
Signup and view all the answers
Match the following industries with their potential applications of Big Data:
Match the following industries with their potential applications of Big Data:
Signup and view all the answers
Welche Vorteile bietet BigQuery für Unternehmen?
Welche Vorteile bietet BigQuery für Unternehmen?
Signup and view all the answers
Python ist die einzige Programmiersprache, die für Datenanalyse verwendet wird.
Python ist die einzige Programmiersprache, die für Datenanalyse verwendet wird.
Signup and view all the answers
Wie kann Big Data im Gesundheitswesen eingesetzt werden?
Wie kann Big Data im Gesundheitswesen eingesetzt werden?
Signup and view all the answers
Was ist der Hauptzweck eines Data Lake?
Was ist der Hauptzweck eines Data Lake?
Signup and view all the answers
Welche Eigenschaften haben Data Lakes?
Welche Eigenschaften haben Data Lakes?
Signup and view all the answers
Was ist ein Data Warehouse?
Was ist ein Data Warehouse?
Signup and view all the answers
Wer sind die Hauptbenutzer von Data Lakes?
Wer sind die Hauptbenutzer von Data Lakes?
Signup and view all the answers
Was sind die Vorteile von Data Lakes?
Was sind die Vorteile von Data Lakes?
Signup and view all the answers
Wie werden Daten in einem Data Lake gespeichert?
Wie werden Daten in einem Data Lake gespeichert?
Signup and view all the answers
Was ist ein Data Lake?
Was ist ein Data Lake?
Signup and view all the answers
Warum können Unternehmen mit Big Data evidenzbasierte Entscheidungen treffen?
Warum können Unternehmen mit Big Data evidenzbasierte Entscheidungen treffen?
Signup and view all the answers
Was ist ein Vorteil des Einsatzes von Big Data für ein Unternehmen?
Was ist ein Vorteil des Einsatzes von Big Data für ein Unternehmen?
Signup and view all the answers
Wie sind Data Lakes und Data Warehouses unterschiedlich?
Wie sind Data Lakes und Data Warehouses unterschiedlich?
Signup and view all the answers
Warum sorgen sich viele Bürger um ihren Datenschutz, wenn es um Big Data geht?
Warum sorgen sich viele Bürger um ihren Datenschutz, wenn es um Big Data geht?
Signup and view all the answers
Welche Art von Daten kann ein Unternehmen mit Big Data sammeln?
Welche Art von Daten kann ein Unternehmen mit Big Data sammeln?
Signup and view all the answers
Was kann Big Data auch bedeuten?
Was kann Big Data auch bedeuten?
Signup and view all the answers
Wie kann ein Unternehmen Big Data nutzen?
Wie kann ein Unternehmen Big Data nutzen?
Signup and view all the answers
Warum ist Big Data wichtig für Unternehmen?
Warum ist Big Data wichtig für Unternehmen?
Signup and view all the answers
Welche Datenquellen können für Big Data genutzt werden?
Welche Datenquellen können für Big Data genutzt werden?
Signup and view all the answers
Wie viele Phasen hat das CRISP-DM-Modell?
Wie viele Phasen hat das CRISP-DM-Modell?
Signup and view all the answers
Welche Phase des CRISP-DM-Modells beschäftigt sich mit der Datenvorbereitung?
Welche Phase des CRISP-DM-Modells beschäftigt sich mit der Datenvorbereitung?
Signup and view all the answers
Was passiert mit den Daten, wenn keine regelmäßigen Datenqualitäts- und Data-Governance-Maßnahmen durchgeführt werden?
Was passiert mit den Daten, wenn keine regelmäßigen Datenqualitäts- und Data-Governance-Maßnahmen durchgeführt werden?
Signup and view all the answers
Wozu dienen die erstellten Datenmodelle in der fünften Phase des CRISP-DM-Modells?
Wozu dienen die erstellten Datenmodelle in der fünften Phase des CRISP-DM-Modells?
Signup and view all the answers
Was ist der Zweck des CRISP-DM?
Was ist der Zweck des CRISP-DM?
Signup and view all the answers
Wie viele Phasen enthält das CRISP-DM Modell?
Wie viele Phasen enthält das CRISP-DM Modell?
Signup and view all the answers
Was ist die Hauptaufgabe der ersten Phase des CRISP-DM-Modells?
Was ist die Hauptaufgabe der ersten Phase des CRISP-DM-Modells?
Signup and view all the answers
Wer sind die Hauptbenutzer des CRISP-DM Modells?
Wer sind die Hauptbenutzer des CRISP-DM Modells?
Signup and view all the answers
Was ist ein wichtiger Aspekt der zweiten Phase des CRISP-DM-Modells?
Was ist ein wichtiger Aspekt der zweiten Phase des CRISP-DM-Modells?
Signup and view all the answers
Was ist ein wichtiger Aspekt des CRISP-DM Modells?
Was ist ein wichtiger Aspekt des CRISP-DM Modells?
Signup and view all the answers
Wozu wird der finale Datensatz in der dritten Phase des CRISP-DM-Modells verwendet?
Wozu wird der finale Datensatz in der dritten Phase des CRISP-DM-Modells verwendet?
Signup and view all the answers
Wie wird das CRISP-DM-Modell oft dargestellt?
Wie wird das CRISP-DM-Modell oft dargestellt?
Signup and view all the answers
Was bedeutet CRISP-DM?
Was bedeutet CRISP-DM?
Signup and view all the answers
Was geschieht in der vierten Phase des CRISP-DM-Modells?
Was geschieht in der vierten Phase des CRISP-DM-Modells?
Signup and view all the answers
Warum ist das CRISP-DM Modell wichtig?
Warum ist das CRISP-DM Modell wichtig?
Signup and view all the answers
Wer unterstützt die Entwicklung des CRISP-DM?
Wer unterstützt die Entwicklung des CRISP-DM?
Signup and view all the answers
Was passiert, wenn die Modelle in der Datenanalyse nicht ausreichend sind?
Was passiert, wenn die Modelle in der Datenanalyse nicht ausreichend sind?
Signup and view all the answers
Was ist der Zweck der letzten Phase des CRISP DM Modells?
Was ist der Zweck der letzten Phase des CRISP DM Modells?
Signup and view all the answers
Welche zwei Systeme sind wichtige Datenmanagement-Tools?
Welche zwei Systeme sind wichtige Datenmanagement-Tools?
Signup and view all the answers
Was ist Apache Spark bekannt für?
Was ist Apache Spark bekannt für?
Signup and view all the answers
Welche analytische Software wird für Big Data genutzt?
Welche analytische Software wird für Big Data genutzt?
Signup and view all the answers
Was ist die Hauptaufgabe von Hadoop?
Was ist die Hauptaufgabe von Hadoop?
Signup and view all the answers
Was ist das Hauptziel des CRISP DM Modells?
Was ist das Hauptziel des CRISP DM Modells?
Signup and view all the answers
In welchem Jahrzehnt begannen Organisationen wie die NASA und große Unternehmen, enorme Datenmengen zu verarbeiten?
In welchem Jahrzehnt begannen Organisationen wie die NASA und große Unternehmen, enorme Datenmengen zu verarbeiten?
Signup and view all the answers
Wer ist einer der Schlüsselfiguren, die den Begriff 'Big Data' popularisierten und die Herausforderungen sowie die Möglichkeiten dieser neuen Datenära diskutierten?
Wer ist einer der Schlüsselfiguren, die den Begriff 'Big Data' popularisierten und die Herausforderungen sowie die Möglichkeiten dieser neuen Datenära diskutierten?
Signup and view all the answers
Was war ein wichtiger Meilenstein in der Geschichte von Big Data?
Was war ein wichtiger Meilenstein in der Geschichte von Big Data?
Signup and view all the answers
Wann wuchs die Menge der generierten Daten exponentiell?
Wann wuchs die Menge der generierten Daten exponentiell?
Signup and view all the answers
Was ermöglichte die Entwicklung von Hadoop?
Was ermöglichte die Entwicklung von Hadoop?
Signup and view all the answers
Welche Plattformen wurden durch Hadoop inspiriert?
Welche Plattformen wurden durch Hadoop inspiriert?
Signup and view all the answers
Welche Rolle spielt Big Data heute in vielen Geschäftsstrategien?
Welche Rolle spielt Big Data heute in vielen Geschäftsstrategien?
Signup and view all the answers
Warum erkannten Firmen den Wert von Big Data?
Warum erkannten Firmen den Wert von Big Data?
Signup and view all the answers
Was charakterisiert einen Data Lake?
Was charakterisiert einen Data Lake?
Signup and view all the answers
Wie kann Big Data genutzt werden?
Wie kann Big Data genutzt werden?
Signup and view all the answers
Welche Vorteile kann ein Unternehmen durch die Verwendung eines Data Lakes erzielen?
Welche Vorteile kann ein Unternehmen durch die Verwendung eines Data Lakes erzielen?
Signup and view all the answers
Was ist der Hauptzweck eines Data Lakes?
Was ist der Hauptzweck eines Data Lakes?
Signup and view all the answers
Wie unterscheidet sich ein Data Lake von einem Data Warehouse?
Wie unterscheidet sich ein Data Lake von einem Data Warehouse?
Signup and view all the answers
Was ermöglicht die Verwendung von Big Data in Unternehmen?
Was ermöglicht die Verwendung von Big Data in Unternehmen?
Signup and view all the answers
Wie kann ein Unternehmen Big Data nutzen, um neue Erkenntnisse zu gewinnen?
Wie kann ein Unternehmen Big Data nutzen, um neue Erkenntnisse zu gewinnen?
Signup and view all the answers
Was ist die Zukunft von Big Data?
Was ist die Zukunft von Big Data?
Signup and view all the answers
Was charakterisiert Big Data und wie kann es Unternehmen helfen?
Was charakterisiert Big Data und wie kann es Unternehmen helfen?
Signup and view all the answers
Was ist das 3-V-Modell in Bezug auf Big Data?
Was ist das 3-V-Modell in Bezug auf Big Data?
Signup and view all the answers
Was sind die Chancen von Big Data für Unternehmen?
Was sind die Chancen von Big Data für Unternehmen?
Signup and view all the answers
Warum sorgen sich viele Bürger um ihren Datenschutz?
Warum sorgen sich viele Bürger um ihren Datenschutz?
Signup and view all the answers
Was bedeutet ein Eingriff in die Privatsphäre durch Big Data?
Was bedeutet ein Eingriff in die Privatsphäre durch Big Data?
Signup and view all the answers
Welche Bedeutung haben die Daten für ein Unternehmen?
Welche Bedeutung haben die Daten für ein Unternehmen?
Signup and view all the answers
Wie kann Big Data im Gesundheitswesen eingesetzt werden?
Wie kann Big Data im Gesundheitswesen eingesetzt werden?
Signup and view all the answers
Was ist der Zweck einer Big Data Strategie?
Was ist der Zweck einer Big Data Strategie?
Signup and view all the answers
Wie können Unternehmen durch die Nutzung von Big Data und analytischen Werkzeugen wie R und Python evidenzbasierte Entscheidungen treffen?
Wie können Unternehmen durch die Nutzung von Big Data und analytischen Werkzeugen wie R und Python evidenzbasierte Entscheidungen treffen?
Signup and view all the answers
Welche Vorteile bietet BigQuery für Unternehmen?
Welche Vorteile bietet BigQuery für Unternehmen?
Signup and view all the answers
Wie kann Big Data im Gesundheitswesen eingesetzt werden?
Wie kann Big Data im Gesundheitswesen eingesetzt werden?
Signup and view all the answers
Welche Bibliotheken machen Python besonders nützlich für Datenanalyse?
Welche Bibliotheken machen Python besonders nützlich für Datenanalyse?
Signup and view all the answers
Was ist das Hauptziel von Data Mining?
Was ist das Hauptziel von Data Mining?
Signup and view all the answers
Wie werden Daten in einem Data Lake gespeichert?
Wie werden Daten in einem Data Lake gespeichert?
Signup and view all the answers
Welche Eigenschaften haben Data Lakes?
Welche Eigenschaften haben Data Lakes?
Signup and view all the answers
Welche Vorteile bietet die Verwendung von R und Python für die Datenanalyse?
Welche Vorteile bietet die Verwendung von R und Python für die Datenanalyse?
Signup and view all the answers
Welche Phase des CRISP-DM Modells beschäftigt sich mit der Entwicklung eines tieferen Geschäftsverständnisses?
Welche Phase des CRISP-DM Modells beschäftigt sich mit der Entwicklung eines tieferen Geschäftsverständnisses?
Signup and view all the answers
Welche Aspekte werden bei der Datenvorbereitung im CRISP-DM Modell berücksichtigt?
Welche Aspekte werden bei der Datenvorbereitung im CRISP-DM Modell berücksichtigt?
Signup and view all the answers
Wozu werden die im CRISP-DM Modell erstellten Datenmodelle verwendet?
Wozu werden die im CRISP-DM Modell erstellten Datenmodelle verwendet?
Signup and view all the answers
In welcher Phase des CRISP-DM Modells werden verschiedene Modellierungstechniken des Data Minings zum Einsatz kommen?
In welcher Phase des CRISP-DM Modells werden verschiedene Modellierungstechniken des Data Minings zum Einsatz kommen?
Signup and view all the answers
Wie wird das CRISP DM Modell oft dargestellt?
Wie wird das CRISP DM Modell oft dargestellt?
Signup and view all the answers
Was ist das Hauptziel der ersten Phase des CRISP-DM Modells?
Was ist das Hauptziel der ersten Phase des CRISP-DM Modells?
Signup and view all the answers
Wie viele Phasen enthält das CRISP-DM Modell?
Wie viele Phasen enthält das CRISP-DM Modell?
Signup and view all the answers
Was ist der Zweck der Datenaufbereitung im CRISP-DM Modell?
Was ist der Zweck der Datenaufbereitung im CRISP-DM Modell?
Signup and view all the answers
Study Notes
Einführung in Big Data
- Big Data beschreibt eine große Menge an Daten, die Unternehmen sammeln, analysieren und daraus Schlüsse ziehen können, um evidenzbasierte Entscheidungen treffen zu können.
- Die Daten können aus vielen Bereichen kommen, wie Social Media, der Finanzindustrie oder dem Gesundheitswesen.
3-V-Modell
- Big Data wird nach dem 3-V-Modell bewertet, das aus drei Dimensionen besteht: Volume (Datenmenge), Velocity (Daten Geschwindigkeit) und Variety (Daten-Variabilität).
Big Data Chancen
- Unternehmen können durch die Nutzung von Big Data einen großen Wettbewerbsvorteil sichern, indem sie neue Erkenntnisse über ihre Arbeitsprozesse oder Nutzer gewinnen.
Big Data Kritik
- Die Gesellschaft hat eine Skepsis gegenüber Big Data, da die Datenanalyse sehr detaillierte Erkenntnisse über die Nutzer liefern kann, was zu einer Verletzung der Privatsphäre führen kann.
- Die EU-Datenschutzgrundverordnung (DSGVO) regelt die Datensammlung und -verwendung, um den Datenschutz zu gewährleisten.
Big Data Strategie
- Unternehmen bemühen sich, Big Data Strategien umzusetzen, um mit dem Marktwettbewerb der Industrie 4.0 mitzuhalten.
- Die Umsetzung einer Big Data Strategie ist nicht einfach, da die großen Datenmengen sehr unübersichtlich sind.
CRISP-DM
- Die CRISP-DM (Cross-Industry Standard Process for Data Mining) ist ein einheitlicher Standard für die Entwicklung von Data Mining Prozessen.
- Der CRISP-DM besteht aus 6 Schritten: Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation und Deployment.
Data Lake vs Data Warehouse
- Data Lake und Data Warehouse sind Konzepte für die Datenspeicherung und -verwendung.
- Data Lake speichert rohe, unstrukturierte Daten, während Data Warehouse verarbeitete, strukturierte Daten enthält.
Data Mining
- Data Mining ist interdisziplinär und nutzt Erkenntnisse aus den Bereichen der Informatik, Mathematik und Statistik.
- Data Mining wird verwendet, um neue Trends und Muster ausfindig zu machen und um Erkenntnisse über die Nutzer zu gewinnen.
R und Python
- R und Python sind führende Programmiersprachen für Datenanalyse und maschinelles Lernen.
- R ist besonders stark in statistischen Analysen, während Python durch Bibliotheken wie Pandas für Datenmanipulation und PySpark für die Arbeit mit großen Datensätzen in einem Spark-Umfeld breite Anwendung findet.
Anwendungsfälle
- Big Data hat viele Anwendungsfälle, wie Direktmarketing, Betrug erkennen (Fraud Detection) und Gesundheitswesen.
- Im Gesundheitswesen ermöglicht Big Data die Entwicklung von personalisierter Medizin, indem es umfangreiche Patientendaten analysiert.
Big Data
- Big Data beschreibt eine große Menge an Daten, die von Unternehmen gesammelt, analysiert und für evidenzbasierte Entscheidungen genutzt werden können.
- Daten können aus verschiedenen Bereichen kommen, wie z.B. Social Media, Finanzindustrie oder Gesundheitswesen.
- Datenquellen sind z.B. Kredit- und Kundenkarten, Smartphones oder Smartwatches.
3-V-Modell
- Das 3-V-Modell bewertet Daten nach drei Kriterien: Volume (Menge), Velocity (Geschwindigkeit) und Variety (Vielfalt).
Big Data Chancen
- Unternehmen können durch die Nutzung von Big Data einen Wettbewerbsvorteil erzielen.
- Durch die Auswertung von Daten können Unternehmen neue Erkenntnisse über ihre Arbeitsprozesse oder Nutzer gewinnen.
Big Data Kritik
- Die Gesellschaft hat Bedenken bzgl. der Datenschutz und des Eingriffs in die Privatsphäre.
- Die Verwendung von Daten ohne ausdrückliches Einverständnis der Nutzer ist ein Problem.
Data Lake vs. Data Warehouse
- Data Lake: Ein Repository für unstrukturierte Daten in Rohformat, flexibel und anpassbar.
- Data Warehouse: Ein sistema für strukturierte Daten, vorformatierte und für spezifische Anwendungen geeignet.
Data Lake: Chancen und Herausforderungen
- Chancen: flexibel, anpassbar, Schnittstellen für verschiedene Datenquellen.
- Herausforderungen: Komplexität, Benutzer müssen sich mit den Daten auseinandersetzen.
CRISP DM
- CRISP DM ist ein einheitlicher Standard für die Entwicklung von Data Mining-Prozessen.
- Es besteht aus 6 Phasen: Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation und Deployment.
Die 6 Phasen des CRISP DM Modells
- Phase 1: Business Understanding - Entwicklung eines tieferen Geschäftsverständnisses.
- Phase 2: Data Understanding - Entwicklung eines Datenverständnisses.
- Phase 3: Data Preparation - Datenvorbereitung.
- Phase 4: Modeling - Datenmodellierung.
- Phase 5: Evaluation - Evaluierung der Modelle.
- Phase 6: Deployment - Bereitstellung der Ergebnisse.
CRISP DM: Vor- und Nachteile
- Vorteile: strukturiertes Vorgehen, effiziente Projektplanung.
- Nachteile: Inflexibilität, zu zeitintensiv.
Datenmanagement Tools
- Hadoop: Ein Framework für die Speicherung und Verarbeitung grosser Datenmengen auf Clustern von Standardhardware.
- Apache Spark: Eine alternative zu Hadoop MapReduce, schneller und effizienter.
Analytische Tools
- R und Python mit Pandas und PySpark: spezialisierte analytische Software für die Auswertung von Daten.
- Google BigQuery: ein Cloud-basiertes Datenanalyse-Tool.
Einführung in Big Data
- Big Data bezeichnet eine große Menge an Daten, die Unternehmen sammeln, analysieren und auswerten können, um daraus Schlüsse zu ziehen und evidenzbasierte Entscheidungen zu treffen.
- Die Daten können aus verschiedenen Bereichen stammen, wie Social Media, Finanzindustrie oder Gesundheitswesen, und werden nach dem 3-V-Modell bewertet.
Vorteile von Big Data
- Unternehmen können durch die Auswertung von Big Data einen großen Wettbewerbsvorteil erzielen, indem sie neue Erkenntnisse über ihre Arbeitsprozesse oder Nutzer gewinnen.
- Big Data kann Unternehmen helfen, ihre Arbeitsprozesse zu optimieren, Kosten zu reduzieren und neue Geschäftsmodelle zu entwickeln.
Kritik an Big Data
- Big Data kann einen Eingriff in die Privatsphäre der Nutzer darstellen, wenn Daten ohne ausdrückliches Einverständnis der Nutzer verwendet werden.
- Es gibt Bedenken hinsichtlich der Transparenz über die Datenhandhabung und des Datenschutzes.
Geschichte von Big Data
- Die Ursprünge von Big Data reichen zurück in die 1960er Jahre, als Organisationen wie die NASA und große Unternehmen begannen, enorme Datenmengen zu verarbeiten.
- Der Begriff "Big Data" wurde Anfang der 2000er Jahre eingeführt, um die explosionsartig anwachsenden Datenmengen zu beschreiben.
- Ein wichtiger Meilenstein in der Geschichte von Big Data war die Entwicklung von Hadoop im Jahr 2006.
Data Lake
- Ein Data Lake ist ein sehr großer Speicher, in dem Daten in ihrem Rohformat gespeichert werden.
- Ein Data Lake kann einem Unternehmen einen großen Wettbewerbsvorteil verschaffen, indem es die Analyse großer Datenmengen ermöglicht.
CRISP-DM-Modell
- Das CRISP-DM-Modell ist ein iterativer Prozess, der in sechs Phasen unterteilt ist: Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation und Deployment.
- Jede Phase ist wichtig für die erfolgreiche Implementierung eines Big-Data-Projekts.
Werkzeuge für Big Data
- R und Python sind führende Programmiersprachen für Datenanalyse und maschinelles Lernen.
- Google BigQuery ist ein Enterprise-Data-Warehouse, das speziell für Big Data entwickelt wurde.
Anwendungsfälle von Big Data
- Big Data hat vielfältige Anwendungsfälle, wie Direktmarketing, Betrug erkennen und Gesundheitswesen.
- Im Gesundheitswesen können Big Data helfen, die Entwicklung von personalisierter Medizin zu fördern und Krankheitsverläufe vorherzusagen.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Related Documents
Description
Erfahren Sie, was Big Data ist und wie Unternehmen große Mengen an strukturierten und unstrukturierten Daten sammeln, analysieren und daraus Schlüsse ziehen können.