Podcast
Questions and Answers
Was beschreibt der Begriff 'Big Data'?
Was beschreibt der Begriff 'Big Data'?
- Eine große Menge an Daten (correct)
- Eine kleine Menge an Daten
- Eine unstrukturierte Datenmenge
- Eine strukturierte Datenmenge
Big Data kann nur für Unternehmen in der Finanzindustrie genutzt werden.
Big Data kann nur für Unternehmen in der Finanzindustrie genutzt werden.
False (B)
Was ist das 3-V-Modell?
Was ist das 3-V-Modell?
Das 3-V-Modell ist ein Modell, nach dem die Daten nach ihrer Bedeutung bewertet werden.
Ein Unternehmen kann sich einen großen _______________________ sichern, wenn es Big Data sinnvoll für sich nutzen kann.
Ein Unternehmen kann sich einen großen _______________________ sichern, wenn es Big Data sinnvoll für sich nutzen kann.
Match the following terms with their explanations:
Match the following terms with their explanations:
Big Data kann einen Eingriff in die Privatsphäre bedeuten.
Big Data kann einen Eingriff in die Privatsphäre bedeuten.
Welche Bedeutung haben die Daten für ein Unternehmen?
Welche Bedeutung haben die Daten für ein Unternehmen?
Warum sorgen sich viele Bürger um ihren Datenschutz?
Warum sorgen sich viele Bürger um ihren Datenschutz?
Was fürchten viele Bürger vor?
Was fürchten viele Bürger vor?
Die EU-Datenschutzgrundverordnung (DSGVO) soll dazu dienen, dass nur relevante und anonymisierte Daten gesammelt werden.
Die EU-Datenschutzgrundverordnung (DSGVO) soll dazu dienen, dass nur relevante und anonymisierte Daten gesammelt werden.
Was ist der Zweck einer Big Data Strategie?
Was ist der Zweck einer Big Data Strategie?
Für die Auswertung von Daten wird auch das _______________ eingesetzt.
Für die Auswertung von Daten wird auch das _______________ eingesetzt.
Was ist der CRISP-DM?
Was ist der CRISP-DM?
Der CRISP-DM besteht aus 5 Schritten.
Der CRISP-DM besteht aus 5 Schritten.
Welche Disziplinen werden im Data Mining-Prozess genutzt?
Welche Disziplinen werden im Data Mining-Prozess genutzt?
Was ist das Hauptziel von Data Mining?
Was ist das Hauptziel von Data Mining?
Wie wird das CRISP DM Modell oft dargestellt?
Wie wird das CRISP DM Modell oft dargestellt?
Die erste Phase des CRISP-DM Modells beschäftigt sich damit, ein Datenverständnis zu entwickeln.
Die erste Phase des CRISP-DM Modells beschäftigt sich damit, ein Datenverständnis zu entwickeln.
Was soll in der ersten Phase des CRISP-DM Modells präzise beschrieben werden?
Was soll in der ersten Phase des CRISP-DM Modells präzise beschrieben werden?
Die dritte Phase des CRISP-DM Modells geht um die ____________________.
Die dritte Phase des CRISP-DM Modells geht um die ____________________.
Ordnen Sie die Phasen des CRISP-DM Modells ihren Beschreibungen zu:
Ordnen Sie die Phasen des CRISP-DM Modells ihren Beschreibungen zu:
Wozu dienen die erstellten Datenmodelle in der fünften Phase des CRISP-DM Modells?
Wozu dienen die erstellten Datenmodelle in der fünften Phase des CRISP-DM Modells?
In der vierten Phase des CRISP-DM Modells können verschiedene Modellierungstechniken des Data Minings zum Einsatz kommen.
In der vierten Phase des CRISP-DM Modells können verschiedene Modellierungstechniken des Data Minings zum Einsatz kommen.
Wozu soll ein finaler Datensatz dienen?
Wozu soll ein finaler Datensatz dienen?
Was ist der Hauptzweck eines Data Lakes?
Was ist der Hauptzweck eines Data Lakes?
Ein Data Warehouse enthält nur strukturierte Daten.
Ein Data Warehouse enthält nur strukturierte Daten.
Wer sind die Hauptbenutzer eines Data Lakes?
Wer sind die Hauptbenutzer eines Data Lakes?
Ein Data Lake speichert Daten in ihrem ____________________ Format.
Ein Data Lake speichert Daten in ihrem ____________________ Format.
Was sind die Vorteile von Data Lakes?
Was sind die Vorteile von Data Lakes?
Ordne die folgenden Begriffe den entsprechenden Konzepten zu:
Ordne die folgenden Begriffe den entsprechenden Konzepten zu:
Ein Data Lake ist ein Repository, das nur strukturierte Daten aufnimmt.
Ein Data Lake ist ein Repository, das nur strukturierte Daten aufnimmt.
Was ist ein Data Lake laut Definition?
Was ist ein Data Lake laut Definition?
Welche Programmiersprache ist besonders stark in statistischen Analysen?
Welche Programmiersprache ist besonders stark in statistischen Analysen?
BigQuery ist ein Open-Source-Data-Warehouse von Google.
BigQuery ist ein Open-Source-Data-Warehouse von Google.
Welche beiden Bibliotheken machen Python besonders nützlich für Datenanalyse?
Welche beiden Bibliotheken machen Python besonders nützlich für Datenanalyse?
BigQuery ermöglicht superschnelle SQL-Abfragen auf grosse _______________________.
BigQuery ermöglicht superschnelle SQL-Abfragen auf grosse _______________________.
Match the following industries with their potential applications of Big Data:
Match the following industries with their potential applications of Big Data:
Welche Vorteile bietet BigQuery für Unternehmen?
Welche Vorteile bietet BigQuery für Unternehmen?
Python ist die einzige Programmiersprache, die für Datenanalyse verwendet wird.
Python ist die einzige Programmiersprache, die für Datenanalyse verwendet wird.
Wie kann Big Data im Gesundheitswesen eingesetzt werden?
Wie kann Big Data im Gesundheitswesen eingesetzt werden?
Was ist der Hauptzweck eines Data Lake?
Was ist der Hauptzweck eines Data Lake?
Welche Eigenschaften haben Data Lakes?
Welche Eigenschaften haben Data Lakes?
Was ist ein Data Warehouse?
Was ist ein Data Warehouse?
Wer sind die Hauptbenutzer von Data Lakes?
Wer sind die Hauptbenutzer von Data Lakes?
Was sind die Vorteile von Data Lakes?
Was sind die Vorteile von Data Lakes?
Wie werden Daten in einem Data Lake gespeichert?
Wie werden Daten in einem Data Lake gespeichert?
Was ist ein Data Lake?
Was ist ein Data Lake?
Warum können Unternehmen mit Big Data evidenzbasierte Entscheidungen treffen?
Warum können Unternehmen mit Big Data evidenzbasierte Entscheidungen treffen?
Was ist ein Vorteil des Einsatzes von Big Data für ein Unternehmen?
Was ist ein Vorteil des Einsatzes von Big Data für ein Unternehmen?
Wie sind Data Lakes und Data Warehouses unterschiedlich?
Wie sind Data Lakes und Data Warehouses unterschiedlich?
Warum sorgen sich viele Bürger um ihren Datenschutz, wenn es um Big Data geht?
Warum sorgen sich viele Bürger um ihren Datenschutz, wenn es um Big Data geht?
Welche Art von Daten kann ein Unternehmen mit Big Data sammeln?
Welche Art von Daten kann ein Unternehmen mit Big Data sammeln?
Was kann Big Data auch bedeuten?
Was kann Big Data auch bedeuten?
Wie kann ein Unternehmen Big Data nutzen?
Wie kann ein Unternehmen Big Data nutzen?
Warum ist Big Data wichtig für Unternehmen?
Warum ist Big Data wichtig für Unternehmen?
Welche Datenquellen können für Big Data genutzt werden?
Welche Datenquellen können für Big Data genutzt werden?
Wie viele Phasen hat das CRISP-DM-Modell?
Wie viele Phasen hat das CRISP-DM-Modell?
Welche Phase des CRISP-DM-Modells beschäftigt sich mit der Datenvorbereitung?
Welche Phase des CRISP-DM-Modells beschäftigt sich mit der Datenvorbereitung?
Was passiert mit den Daten, wenn keine regelmäßigen Datenqualitäts- und Data-Governance-Maßnahmen durchgeführt werden?
Was passiert mit den Daten, wenn keine regelmäßigen Datenqualitäts- und Data-Governance-Maßnahmen durchgeführt werden?
Wozu dienen die erstellten Datenmodelle in der fünften Phase des CRISP-DM-Modells?
Wozu dienen die erstellten Datenmodelle in der fünften Phase des CRISP-DM-Modells?
Was ist der Zweck des CRISP-DM?
Was ist der Zweck des CRISP-DM?
Wie viele Phasen enthält das CRISP-DM Modell?
Wie viele Phasen enthält das CRISP-DM Modell?
Was ist die Hauptaufgabe der ersten Phase des CRISP-DM-Modells?
Was ist die Hauptaufgabe der ersten Phase des CRISP-DM-Modells?
Wer sind die Hauptbenutzer des CRISP-DM Modells?
Wer sind die Hauptbenutzer des CRISP-DM Modells?
Was ist ein wichtiger Aspekt der zweiten Phase des CRISP-DM-Modells?
Was ist ein wichtiger Aspekt der zweiten Phase des CRISP-DM-Modells?
Was ist ein wichtiger Aspekt des CRISP-DM Modells?
Was ist ein wichtiger Aspekt des CRISP-DM Modells?
Wozu wird der finale Datensatz in der dritten Phase des CRISP-DM-Modells verwendet?
Wozu wird der finale Datensatz in der dritten Phase des CRISP-DM-Modells verwendet?
Wie wird das CRISP-DM-Modell oft dargestellt?
Wie wird das CRISP-DM-Modell oft dargestellt?
Was bedeutet CRISP-DM?
Was bedeutet CRISP-DM?
Was geschieht in der vierten Phase des CRISP-DM-Modells?
Was geschieht in der vierten Phase des CRISP-DM-Modells?
Warum ist das CRISP-DM Modell wichtig?
Warum ist das CRISP-DM Modell wichtig?
Wer unterstützt die Entwicklung des CRISP-DM?
Wer unterstützt die Entwicklung des CRISP-DM?
Was passiert, wenn die Modelle in der Datenanalyse nicht ausreichend sind?
Was passiert, wenn die Modelle in der Datenanalyse nicht ausreichend sind?
Was ist der Zweck der letzten Phase des CRISP DM Modells?
Was ist der Zweck der letzten Phase des CRISP DM Modells?
Welche zwei Systeme sind wichtige Datenmanagement-Tools?
Welche zwei Systeme sind wichtige Datenmanagement-Tools?
Was ist Apache Spark bekannt für?
Was ist Apache Spark bekannt für?
Welche analytische Software wird für Big Data genutzt?
Welche analytische Software wird für Big Data genutzt?
Was ist die Hauptaufgabe von Hadoop?
Was ist die Hauptaufgabe von Hadoop?
Was ist das Hauptziel des CRISP DM Modells?
Was ist das Hauptziel des CRISP DM Modells?
In welchem Jahrzehnt begannen Organisationen wie die NASA und große Unternehmen, enorme Datenmengen zu verarbeiten?
In welchem Jahrzehnt begannen Organisationen wie die NASA und große Unternehmen, enorme Datenmengen zu verarbeiten?
Wer ist einer der Schlüsselfiguren, die den Begriff 'Big Data' popularisierten und die Herausforderungen sowie die Möglichkeiten dieser neuen Datenära diskutierten?
Wer ist einer der Schlüsselfiguren, die den Begriff 'Big Data' popularisierten und die Herausforderungen sowie die Möglichkeiten dieser neuen Datenära diskutierten?
Was war ein wichtiger Meilenstein in der Geschichte von Big Data?
Was war ein wichtiger Meilenstein in der Geschichte von Big Data?
Wann wuchs die Menge der generierten Daten exponentiell?
Wann wuchs die Menge der generierten Daten exponentiell?
Was ermöglichte die Entwicklung von Hadoop?
Was ermöglichte die Entwicklung von Hadoop?
Welche Plattformen wurden durch Hadoop inspiriert?
Welche Plattformen wurden durch Hadoop inspiriert?
Welche Rolle spielt Big Data heute in vielen Geschäftsstrategien?
Welche Rolle spielt Big Data heute in vielen Geschäftsstrategien?
Warum erkannten Firmen den Wert von Big Data?
Warum erkannten Firmen den Wert von Big Data?
Was charakterisiert einen Data Lake?
Was charakterisiert einen Data Lake?
Wie kann Big Data genutzt werden?
Wie kann Big Data genutzt werden?
Welche Vorteile kann ein Unternehmen durch die Verwendung eines Data Lakes erzielen?
Welche Vorteile kann ein Unternehmen durch die Verwendung eines Data Lakes erzielen?
Was ist der Hauptzweck eines Data Lakes?
Was ist der Hauptzweck eines Data Lakes?
Wie unterscheidet sich ein Data Lake von einem Data Warehouse?
Wie unterscheidet sich ein Data Lake von einem Data Warehouse?
Was ermöglicht die Verwendung von Big Data in Unternehmen?
Was ermöglicht die Verwendung von Big Data in Unternehmen?
Wie kann ein Unternehmen Big Data nutzen, um neue Erkenntnisse zu gewinnen?
Wie kann ein Unternehmen Big Data nutzen, um neue Erkenntnisse zu gewinnen?
Was ist die Zukunft von Big Data?
Was ist die Zukunft von Big Data?
Was charakterisiert Big Data und wie kann es Unternehmen helfen?
Was charakterisiert Big Data und wie kann es Unternehmen helfen?
Was ist das 3-V-Modell in Bezug auf Big Data?
Was ist das 3-V-Modell in Bezug auf Big Data?
Was sind die Chancen von Big Data für Unternehmen?
Was sind die Chancen von Big Data für Unternehmen?
Warum sorgen sich viele Bürger um ihren Datenschutz?
Warum sorgen sich viele Bürger um ihren Datenschutz?
Was bedeutet ein Eingriff in die Privatsphäre durch Big Data?
Was bedeutet ein Eingriff in die Privatsphäre durch Big Data?
Welche Bedeutung haben die Daten für ein Unternehmen?
Welche Bedeutung haben die Daten für ein Unternehmen?
Wie kann Big Data im Gesundheitswesen eingesetzt werden?
Wie kann Big Data im Gesundheitswesen eingesetzt werden?
Was ist der Zweck einer Big Data Strategie?
Was ist der Zweck einer Big Data Strategie?
Wie können Unternehmen durch die Nutzung von Big Data und analytischen Werkzeugen wie R und Python evidenzbasierte Entscheidungen treffen?
Wie können Unternehmen durch die Nutzung von Big Data und analytischen Werkzeugen wie R und Python evidenzbasierte Entscheidungen treffen?
Welche Vorteile bietet BigQuery für Unternehmen?
Welche Vorteile bietet BigQuery für Unternehmen?
Wie kann Big Data im Gesundheitswesen eingesetzt werden?
Wie kann Big Data im Gesundheitswesen eingesetzt werden?
Welche Bibliotheken machen Python besonders nützlich für Datenanalyse?
Welche Bibliotheken machen Python besonders nützlich für Datenanalyse?
Was ist das Hauptziel von Data Mining?
Was ist das Hauptziel von Data Mining?
Wie werden Daten in einem Data Lake gespeichert?
Wie werden Daten in einem Data Lake gespeichert?
Welche Eigenschaften haben Data Lakes?
Welche Eigenschaften haben Data Lakes?
Welche Vorteile bietet die Verwendung von R und Python für die Datenanalyse?
Welche Vorteile bietet die Verwendung von R und Python für die Datenanalyse?
Welche Phase des CRISP-DM Modells beschäftigt sich mit der Entwicklung eines tieferen Geschäftsverständnisses?
Welche Phase des CRISP-DM Modells beschäftigt sich mit der Entwicklung eines tieferen Geschäftsverständnisses?
Welche Aspekte werden bei der Datenvorbereitung im CRISP-DM Modell berücksichtigt?
Welche Aspekte werden bei der Datenvorbereitung im CRISP-DM Modell berücksichtigt?
Wozu werden die im CRISP-DM Modell erstellten Datenmodelle verwendet?
Wozu werden die im CRISP-DM Modell erstellten Datenmodelle verwendet?
In welcher Phase des CRISP-DM Modells werden verschiedene Modellierungstechniken des Data Minings zum Einsatz kommen?
In welcher Phase des CRISP-DM Modells werden verschiedene Modellierungstechniken des Data Minings zum Einsatz kommen?
Wie wird das CRISP DM Modell oft dargestellt?
Wie wird das CRISP DM Modell oft dargestellt?
Was ist das Hauptziel der ersten Phase des CRISP-DM Modells?
Was ist das Hauptziel der ersten Phase des CRISP-DM Modells?
Wie viele Phasen enthält das CRISP-DM Modell?
Wie viele Phasen enthält das CRISP-DM Modell?
Was ist der Zweck der Datenaufbereitung im CRISP-DM Modell?
Was ist der Zweck der Datenaufbereitung im CRISP-DM Modell?
Study Notes
Einführung in Big Data
- Big Data beschreibt eine große Menge an Daten, die Unternehmen sammeln, analysieren und daraus Schlüsse ziehen können, um evidenzbasierte Entscheidungen treffen zu können.
- Die Daten können aus vielen Bereichen kommen, wie Social Media, der Finanzindustrie oder dem Gesundheitswesen.
3-V-Modell
- Big Data wird nach dem 3-V-Modell bewertet, das aus drei Dimensionen besteht: Volume (Datenmenge), Velocity (Daten Geschwindigkeit) und Variety (Daten-Variabilität).
Big Data Chancen
- Unternehmen können durch die Nutzung von Big Data einen großen Wettbewerbsvorteil sichern, indem sie neue Erkenntnisse über ihre Arbeitsprozesse oder Nutzer gewinnen.
Big Data Kritik
- Die Gesellschaft hat eine Skepsis gegenüber Big Data, da die Datenanalyse sehr detaillierte Erkenntnisse über die Nutzer liefern kann, was zu einer Verletzung der Privatsphäre führen kann.
- Die EU-Datenschutzgrundverordnung (DSGVO) regelt die Datensammlung und -verwendung, um den Datenschutz zu gewährleisten.
Big Data Strategie
- Unternehmen bemühen sich, Big Data Strategien umzusetzen, um mit dem Marktwettbewerb der Industrie 4.0 mitzuhalten.
- Die Umsetzung einer Big Data Strategie ist nicht einfach, da die großen Datenmengen sehr unübersichtlich sind.
CRISP-DM
- Die CRISP-DM (Cross-Industry Standard Process for Data Mining) ist ein einheitlicher Standard für die Entwicklung von Data Mining Prozessen.
- Der CRISP-DM besteht aus 6 Schritten: Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation und Deployment.
Data Lake vs Data Warehouse
- Data Lake und Data Warehouse sind Konzepte für die Datenspeicherung und -verwendung.
- Data Lake speichert rohe, unstrukturierte Daten, während Data Warehouse verarbeitete, strukturierte Daten enthält.
Data Mining
- Data Mining ist interdisziplinär und nutzt Erkenntnisse aus den Bereichen der Informatik, Mathematik und Statistik.
- Data Mining wird verwendet, um neue Trends und Muster ausfindig zu machen und um Erkenntnisse über die Nutzer zu gewinnen.
R und Python
- R und Python sind führende Programmiersprachen für Datenanalyse und maschinelles Lernen.
- R ist besonders stark in statistischen Analysen, während Python durch Bibliotheken wie Pandas für Datenmanipulation und PySpark für die Arbeit mit großen Datensätzen in einem Spark-Umfeld breite Anwendung findet.
Anwendungsfälle
- Big Data hat viele Anwendungsfälle, wie Direktmarketing, Betrug erkennen (Fraud Detection) und Gesundheitswesen.
- Im Gesundheitswesen ermöglicht Big Data die Entwicklung von personalisierter Medizin, indem es umfangreiche Patientendaten analysiert.
Big Data
- Big Data beschreibt eine große Menge an Daten, die von Unternehmen gesammelt, analysiert und für evidenzbasierte Entscheidungen genutzt werden können.
- Daten können aus verschiedenen Bereichen kommen, wie z.B. Social Media, Finanzindustrie oder Gesundheitswesen.
- Datenquellen sind z.B. Kredit- und Kundenkarten, Smartphones oder Smartwatches.
3-V-Modell
- Das 3-V-Modell bewertet Daten nach drei Kriterien: Volume (Menge), Velocity (Geschwindigkeit) und Variety (Vielfalt).
Big Data Chancen
- Unternehmen können durch die Nutzung von Big Data einen Wettbewerbsvorteil erzielen.
- Durch die Auswertung von Daten können Unternehmen neue Erkenntnisse über ihre Arbeitsprozesse oder Nutzer gewinnen.
Big Data Kritik
- Die Gesellschaft hat Bedenken bzgl. der Datenschutz und des Eingriffs in die Privatsphäre.
- Die Verwendung von Daten ohne ausdrückliches Einverständnis der Nutzer ist ein Problem.
Data Lake vs. Data Warehouse
- Data Lake: Ein Repository für unstrukturierte Daten in Rohformat, flexibel und anpassbar.
- Data Warehouse: Ein sistema für strukturierte Daten, vorformatierte und für spezifische Anwendungen geeignet.
Data Lake: Chancen und Herausforderungen
- Chancen: flexibel, anpassbar, Schnittstellen für verschiedene Datenquellen.
- Herausforderungen: Komplexität, Benutzer müssen sich mit den Daten auseinandersetzen.
CRISP DM
- CRISP DM ist ein einheitlicher Standard für die Entwicklung von Data Mining-Prozessen.
- Es besteht aus 6 Phasen: Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation und Deployment.
Die 6 Phasen des CRISP DM Modells
- Phase 1: Business Understanding - Entwicklung eines tieferen Geschäftsverständnisses.
- Phase 2: Data Understanding - Entwicklung eines Datenverständnisses.
- Phase 3: Data Preparation - Datenvorbereitung.
- Phase 4: Modeling - Datenmodellierung.
- Phase 5: Evaluation - Evaluierung der Modelle.
- Phase 6: Deployment - Bereitstellung der Ergebnisse.
CRISP DM: Vor- und Nachteile
- Vorteile: strukturiertes Vorgehen, effiziente Projektplanung.
- Nachteile: Inflexibilität, zu zeitintensiv.
Datenmanagement Tools
- Hadoop: Ein Framework für die Speicherung und Verarbeitung grosser Datenmengen auf Clustern von Standardhardware.
- Apache Spark: Eine alternative zu Hadoop MapReduce, schneller und effizienter.
Analytische Tools
- R und Python mit Pandas und PySpark: spezialisierte analytische Software für die Auswertung von Daten.
- Google BigQuery: ein Cloud-basiertes Datenanalyse-Tool.
Einführung in Big Data
- Big Data bezeichnet eine große Menge an Daten, die Unternehmen sammeln, analysieren und auswerten können, um daraus Schlüsse zu ziehen und evidenzbasierte Entscheidungen zu treffen.
- Die Daten können aus verschiedenen Bereichen stammen, wie Social Media, Finanzindustrie oder Gesundheitswesen, und werden nach dem 3-V-Modell bewertet.
Vorteile von Big Data
- Unternehmen können durch die Auswertung von Big Data einen großen Wettbewerbsvorteil erzielen, indem sie neue Erkenntnisse über ihre Arbeitsprozesse oder Nutzer gewinnen.
- Big Data kann Unternehmen helfen, ihre Arbeitsprozesse zu optimieren, Kosten zu reduzieren und neue Geschäftsmodelle zu entwickeln.
Kritik an Big Data
- Big Data kann einen Eingriff in die Privatsphäre der Nutzer darstellen, wenn Daten ohne ausdrückliches Einverständnis der Nutzer verwendet werden.
- Es gibt Bedenken hinsichtlich der Transparenz über die Datenhandhabung und des Datenschutzes.
Geschichte von Big Data
- Die Ursprünge von Big Data reichen zurück in die 1960er Jahre, als Organisationen wie die NASA und große Unternehmen begannen, enorme Datenmengen zu verarbeiten.
- Der Begriff "Big Data" wurde Anfang der 2000er Jahre eingeführt, um die explosionsartig anwachsenden Datenmengen zu beschreiben.
- Ein wichtiger Meilenstein in der Geschichte von Big Data war die Entwicklung von Hadoop im Jahr 2006.
Data Lake
- Ein Data Lake ist ein sehr großer Speicher, in dem Daten in ihrem Rohformat gespeichert werden.
- Ein Data Lake kann einem Unternehmen einen großen Wettbewerbsvorteil verschaffen, indem es die Analyse großer Datenmengen ermöglicht.
CRISP-DM-Modell
- Das CRISP-DM-Modell ist ein iterativer Prozess, der in sechs Phasen unterteilt ist: Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation und Deployment.
- Jede Phase ist wichtig für die erfolgreiche Implementierung eines Big-Data-Projekts.
Werkzeuge für Big Data
- R und Python sind führende Programmiersprachen für Datenanalyse und maschinelles Lernen.
- Google BigQuery ist ein Enterprise-Data-Warehouse, das speziell für Big Data entwickelt wurde.
Anwendungsfälle von Big Data
- Big Data hat vielfältige Anwendungsfälle, wie Direktmarketing, Betrug erkennen und Gesundheitswesen.
- Im Gesundheitswesen können Big Data helfen, die Entwicklung von personalisierter Medizin zu fördern und Krankheitsverläufe vorherzusagen.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Related Documents
Description
Erfahren Sie, was Big Data ist und wie Unternehmen große Mengen an strukturierten und unstrukturierten Daten sammeln, analysieren und daraus Schlüsse ziehen können.