Einführung in Big Data
119 Questions
0 Views

Einführung in Big Data

Created by
@BrainyConnemara

Questions and Answers

Was beschreibt der Begriff 'Big Data'?

  • Eine große Menge an Daten (correct)
  • Eine kleine Menge an Daten
  • Eine unstrukturierte Datenmenge
  • Eine strukturierte Datenmenge
  • Big Data kann nur für Unternehmen in der Finanzindustrie genutzt werden.

    False

    Was ist das 3-V-Modell?

    Das 3-V-Modell ist ein Modell, nach dem die Daten nach ihrer Bedeutung bewertet werden.

    Ein Unternehmen kann sich einen großen _______________________ sichern, wenn es Big Data sinnvoll für sich nutzen kann.

    <p>Wettbewerbsvorteil</p> Signup and view all the answers

    Match the following terms with their explanations:

    <p>Big Data = Eine große Menge an Daten 3-V-Modell = Ein Modell, nach dem die Daten nach ihrer Bedeutung bewertet werden Datenschutz = Der Schutz von personenbezogenen Daten vor unbefugtem Zugriff oder Missbrauch</p> Signup and view all the answers

    Big Data kann einen Eingriff in die Privatsphäre bedeuten.

    <p>True</p> Signup and view all the answers

    Welche Bedeutung haben die Daten für ein Unternehmen?

    <p>Die Daten helfen einem Unternehmen, neue Erkenntnisse über seine Arbeitsprozesse oder Nutzer zu gewinnen.</p> Signup and view all the answers

    Warum sorgen sich viele Bürger um ihren Datenschutz?

    <p>Alle obigen Optionen</p> Signup and view all the answers

    Was fürchten viele Bürger vor?

    <p>Überwachung</p> Signup and view all the answers

    Die EU-Datenschutzgrundverordnung (DSGVO) soll dazu dienen, dass nur relevante und anonymisierte Daten gesammelt werden.

    <p>True</p> Signup and view all the answers

    Was ist der Zweck einer Big Data Strategie?

    <p>Mit dem Marktwettbewerb der Industrie 4.0 mitzuhalten</p> Signup and view all the answers

    Für die Auswertung von Daten wird auch das _______________ eingesetzt.

    <p>maschinelle Lernen</p> Signup and view all the answers

    Was ist der CRISP-DM?

    <p>Ein einheitlicher Standard für die Entwicklung von Data Mining Prozessen</p> Signup and view all the answers

    Der CRISP-DM besteht aus 5 Schritten.

    <p>False</p> Signup and view all the answers

    Welche Disziplinen werden im Data Mining-Prozess genutzt?

    <p>Informatik = Statistik Biologie = Physik Psychologie = Soziologie Geschichte = Geografie</p> Signup and view all the answers

    Was ist das Hauptziel von Data Mining?

    <p>Zielgerichtete Analyse und Bewertung von Daten</p> Signup and view all the answers

    Wie wird das CRISP DM Modell oft dargestellt?

    <p>als ein iterativer Kreislauf</p> Signup and view all the answers

    Die erste Phase des CRISP-DM Modells beschäftigt sich damit, ein Datenverständnis zu entwickeln.

    <p>False</p> Signup and view all the answers

    Was soll in der ersten Phase des CRISP-DM Modells präzise beschrieben werden?

    <p>Die betriebswirtschaftliche Problemstellung</p> Signup and view all the answers

    Die dritte Phase des CRISP-DM Modells geht um die ____________________.

    <p>Datenvorbereitung</p> Signup and view all the answers

    Ordnen Sie die Phasen des CRISP-DM Modells ihren Beschreibungen zu:

    <p>Phase 1 = Ein tieferes Geschäftsverständnis zu entwickeln Phase 2 = Ein Datenverständnis zu entwickeln Phase 3 = Die Datenvorbereitung Phase 4 = Die Daten zu modellieren</p> Signup and view all the answers

    Wozu dienen die erstellten Datenmodelle in der fünften Phase des CRISP-DM Modells?

    <p>Zur Evaluierung der Modelle</p> Signup and view all the answers

    In der vierten Phase des CRISP-DM Modells können verschiedene Modellierungstechniken des Data Minings zum Einsatz kommen.

    <p>True</p> Signup and view all the answers

    Wozu soll ein finaler Datensatz dienen?

    <p>als Basis für die nächste Phase der Modellierung</p> Signup and view all the answers

    Was ist der Hauptzweck eines Data Lakes?

    <p>Daten zu speichern, um sie später zu verarbeiten</p> Signup and view all the answers

    Ein Data Warehouse enthält nur strukturierte Daten.

    <p>True</p> Signup and view all the answers

    Wer sind die Hauptbenutzer eines Data Lakes?

    <p>Data Scientists</p> Signup and view all the answers

    Ein Data Lake speichert Daten in ihrem ____________________ Format.

    <p>Rohformat</p> Signup and view all the answers

    Was sind die Vorteile von Data Lakes?

    <p>Hohe Flexibilität</p> Signup and view all the answers

    Ordne die folgenden Begriffe den entsprechenden Konzepten zu:

    <p>Data Lake = roh Data Warehouse = verarbeitet</p> Signup and view all the answers

    Ein Data Lake ist ein Repository, das nur strukturierte Daten aufnimmt.

    <p>False</p> Signup and view all the answers

    Was ist ein Data Lake laut Definition?

    <p>Ein Repository, das unstrukturierte Daten in ihrem Rohformat aufnimmt.</p> Signup and view all the answers

    Welche Programmiersprache ist besonders stark in statistischen Analysen?

    <p>R</p> Signup and view all the answers

    BigQuery ist ein Open-Source-Data-Warehouse von Google.

    <p>False</p> Signup and view all the answers

    Welche beiden Bibliotheken machen Python besonders nützlich für Datenanalyse?

    <p>Pandas und PySpark</p> Signup and view all the answers

    BigQuery ermöglicht superschnelle SQL-Abfragen auf grosse _______________________.

    <p>Datenmengen</p> Signup and view all the answers

    Match the following industries with their potential applications of Big Data:

    <p>Gesundheitswesen = Entwicklung von personalisierter Medizin Direktmarketing = Zielgruppenorientiertes Marketing Betrug erkennen (Fraud Detection) = Früherkennung von finanziellen Anomalien</p> Signup and view all the answers

    Welche Vorteile bietet BigQuery für Unternehmen?

    <p>Automatische Skalierung und Verarbeitung von Petabytes an Daten</p> Signup and view all the answers

    Python ist die einzige Programmiersprache, die für Datenanalyse verwendet wird.

    <p>False</p> Signup and view all the answers

    Wie kann Big Data im Gesundheitswesen eingesetzt werden?

    <p>Entwicklung von personalisierter Medizin durch die Auswertung von Genomsequenzen zusammen mit klinischen Daten, um massgeschneiderte Behandlungspläne erstellen zu können.</p> Signup and view all the answers

    Was ist der Hauptzweck eines Data Lake?

    <p>Daten zu speichern, die noch nicht verarbeitet werden müssen</p> Signup and view all the answers

    Welche Eigenschaften haben Data Lakes?

    <p>unstrukturiert, flexibel und für Data Scientists</p> Signup and view all the answers

    Was ist ein Data Warehouse?

    <p>Ein Repository, das strukturierte Daten aufnimmt</p> Signup and view all the answers

    Wer sind die Hauptbenutzer von Data Lakes?

    <p>Data Scientists</p> Signup and view all the answers

    Was sind die Vorteile von Data Lakes?

    <p>Sie sind sehr flexibel</p> Signup and view all the answers

    Wie werden Daten in einem Data Lake gespeichert?

    <p>in Rohformat</p> Signup and view all the answers

    Was ist ein Data Lake?

    <p>Ein Repository, das unstrukturierte Daten aufnimmt</p> Signup and view all the answers

    Warum können Unternehmen mit Big Data evidenzbasierte Entscheidungen treffen?

    <p>Weil sie große Mengen an Daten sammeln können</p> Signup and view all the answers

    Was ist ein Vorteil des Einsatzes von Big Data für ein Unternehmen?

    <p>Ein Unternehmen kann dadurch einen großen Wettbewerbsvorteil sichern</p> Signup and view all the answers

    Wie sind Data Lakes und Data Warehouses unterschiedlich?

    <p>Sie haben fundamental unterschiedliche Konzepte und Art der Datenspeicherung</p> Signup and view all the answers

    Warum sorgen sich viele Bürger um ihren Datenschutz, wenn es um Big Data geht?

    <p>Weil sie nicht wissen, was mit ihren Daten passiert oder welche Unternehmen Zugriff darauf erhalten</p> Signup and view all the answers

    Welche Art von Daten kann ein Unternehmen mit Big Data sammeln?

    <p>(Un-)strukturierte Datenmengen</p> Signup and view all the answers

    Was kann Big Data auch bedeuten?

    <p>Ein Eingriff in die Privatsphäre</p> Signup and view all the answers

    Wie kann ein Unternehmen Big Data nutzen?

    <p>Indem es die Daten sinnvoll für sich nutzt</p> Signup and view all the answers

    Warum ist Big Data wichtig für Unternehmen?

    <p>Weil es ihnen hilft, ihre Daten zu analysieren und daraus Schlüsse zu ziehen</p> Signup and view all the answers

    Welche Datenquellen können für Big Data genutzt werden?

    <p>Kredit- und Kundenkarten, Smartphones, Smartwatches und viele andere</p> Signup and view all the answers

    Wie viele Phasen hat das CRISP-DM-Modell?

    <p>6</p> Signup and view all the answers

    Welche Phase des CRISP-DM-Modells beschäftigt sich mit der Datenvorbereitung?

    <p>Phase 3: Data Preparation</p> Signup and view all the answers

    Was passiert mit den Daten, wenn keine regelmäßigen Datenqualitäts- und Data-Governance-Maßnahmen durchgeführt werden?

    <p>Sie werden zu einem Datensumpf</p> Signup and view all the answers

    Wozu dienen die erstellten Datenmodelle in der fünften Phase des CRISP-DM-Modells?

    <p>Zur Evaluierung der Modelle</p> Signup and view all the answers

    Was ist der Zweck des CRISP-DM?

    <p>Einheitliches Vorgehensmodell für Data Mining Projekte zu schaffen</p> Signup and view all the answers

    Wie viele Phasen enthält das CRISP-DM Modell?

    <p>6</p> Signup and view all the answers

    Was ist die Hauptaufgabe der ersten Phase des CRISP-DM-Modells?

    <p>Ein tieferes Geschäftsverständnis zu entwickeln</p> Signup and view all the answers

    Wer sind die Hauptbenutzer des CRISP-DM Modells?

    <p>Data Scientists und Data Analysts</p> Signup and view all the answers

    Was ist ein wichtiger Aspekt der zweiten Phase des CRISP-DM-Modells?

    <p>Die Analyse und Bewertung der Datenqualität</p> Signup and view all the answers

    Was ist ein wichtiger Aspekt des CRISP-DM Modells?

    <p>Es ist ein einheitliches Vorgehensmodell für Data Mining Projekte</p> Signup and view all the answers

    Wozu wird der finale Datensatz in der dritten Phase des CRISP-DM-Modells verwendet?

    <p>Für die Modellierung der Daten</p> Signup and view all the answers

    Wie wird das CRISP-DM-Modell oft dargestellt?

    <p>Als ein iterativer Kreislauf</p> Signup and view all the answers

    Was bedeutet CRISP-DM?

    <p>Cross Industry Standard Process for Datamining</p> Signup and view all the answers

    Was geschieht in der vierten Phase des CRISP-DM-Modells?

    <p>Die Datenmodellierung</p> Signup and view all the answers

    Warum ist das CRISP-DM Modell wichtig?

    <p>Es ermöglicht die Strukturierung von Data Mining Projekten</p> Signup and view all the answers

    Wer unterstützt die Entwicklung des CRISP-DM?

    <p>Die EU</p> Signup and view all the answers

    Was passiert, wenn die Modelle in der Datenanalyse nicht ausreichend sind?

    <p>Es wird in die vorherigen Phasen zurückgesprungen.</p> Signup and view all the answers

    Was ist der Zweck der letzten Phase des CRISP DM Modells?

    <p>Die Ergebnisse zu präsentieren.</p> Signup and view all the answers

    Welche zwei Systeme sind wichtige Datenmanagement-Tools?

    <p>Hadoop und Apache Spark</p> Signup and view all the answers

    Was ist Apache Spark bekannt für?

    <p>Eine hohe Verarbeitungsgeschwindigkeit und die Fähigkeit, komplexe Datenpipelines zu unterstützen</p> Signup and view all the answers

    Welche analytische Software wird für Big Data genutzt?

    <p>R, Python mit Pandas und PySpark, und Google BigQuery</p> Signup and view all the answers

    Was ist die Hauptaufgabe von Hadoop?

    <p>Die Speicherung und Verarbeitung grosser Datenmengen</p> Signup and view all the answers

    Was ist das Hauptziel des CRISP DM Modells?

    <p>Die Daten zu analysieren und wertvolle Erkenntnisse zu gewinnen</p> Signup and view all the answers

    In welchem Jahrzehnt begannen Organisationen wie die NASA und große Unternehmen, enorme Datenmengen zu verarbeiten?

    <p>1960er</p> Signup and view all the answers

    Wer ist einer der Schlüsselfiguren, die den Begriff 'Big Data' popularisierten und die Herausforderungen sowie die Möglichkeiten dieser neuen Datenära diskutierten?

    <p>John Mashey</p> Signup and view all the answers

    Was war ein wichtiger Meilenstein in der Geschichte von Big Data?

    <p>Die Entwicklung von Hadoop im Jahr 2006</p> Signup and view all the answers

    Wann wuchs die Menge der generierten Daten exponentiell?

    <p>In den 2010er Jahren mit der weiten Verbreitung von Smartphones und sozialen Medien</p> Signup and view all the answers

    Was ermöglichte die Entwicklung von Hadoop?

    <p>Speichern und Verarbeiten enormer Datenmengen auf kostengünstiger Standardhardware</p> Signup and view all the answers

    Welche Plattformen wurden durch Hadoop inspiriert?

    <p>NoSQL-Datenbanken, Apache Spark und spezialisierte Big Data-Analyseplattformen</p> Signup and view all the answers

    Welche Rolle spielt Big Data heute in vielen Geschäftsstrategien?

    <p>Big Data bildet die Grundlage für Entwicklungen im Bereich des maschinellen Lernens und der künstlichen Intelligenz.</p> Signup and view all the answers

    Warum erkannten Firmen den Wert von Big Data?

    <p>Weil die Analyse grosser Datenmengen wertvolle Einsichten in Kundenverhalten, Betriebseffizienz und Markttrends liefern konnte</p> Signup and view all the answers

    Was charakterisiert einen Data Lake?

    <p>Ein sehr großer Speicher, in dem Daten in ihrem Rohformat gespeichert werden.</p> Signup and view all the answers

    Wie kann Big Data genutzt werden?

    <p>Um wertvolle Einsichten in Kundenverhalten, Betriebseffizienz und Markttrends zu liefern</p> Signup and view all the answers

    Welche Vorteile kann ein Unternehmen durch die Verwendung eines Data Lakes erzielen?

    <p>Einen großen Wettbewerbsvorteil, indem es personalisierte Werbung schalten oder Preise festlegen kann.</p> Signup and view all the answers

    Was ist der Hauptzweck eines Data Lakes?

    <p>Daten in ihrem Rohformat zu speichern, um sie später für Analysen und Entscheidungen nutzen zu können.</p> Signup and view all the answers

    Wie unterscheidet sich ein Data Lake von einem Data Warehouse?

    <p>Ein Data Lake speichert Daten in ihrem Rohformat, während ein Data Warehouse nur strukturierte Daten enthält.</p> Signup and view all the answers

    Was ermöglicht die Verwendung von Big Data in Unternehmen?

    <p>Die Möglichkeit, evidenzbasierte Entscheidungen zu treffen.</p> Signup and view all the answers

    Wie kann ein Unternehmen Big Data nutzen, um neue Erkenntnisse zu gewinnen?

    <p>Indem es Daten aus verschiedenen Quellen wie Logdateien, Kundenmeinungen oder sozialen Medien mit einbezieht.</p> Signup and view all the answers

    Was ist die Zukunft von Big Data?

    <p>Technologien wie dem Internet der Dinge (IoT) und noch weiter fortgeschrittenen KI-Systemen, die noch intelligentere, datengesteuerte Lösungen ermöglichen.</p> Signup and view all the answers

    Was charakterisiert Big Data und wie kann es Unternehmen helfen?

    <p>Big Data beschreibt eine große Menge an (un-)strukturierten Daten, die Unternehmen sammeln und analysieren können, um evidenzbasierte Entscheidungen zu treffen.</p> Signup and view all the answers

    Was ist das 3-V-Modell in Bezug auf Big Data?

    <p>Das 3-V-Modell beschreibt die drei wichtigsten Eigenschaften von Big Data: Volumen (Datenmenge), Variation (Datenarten) und Velocity (Datenrate).</p> Signup and view all the answers

    Was sind die Chancen von Big Data für Unternehmen?

    <p>Big Data bietet Unternehmen die Chance, sich einen Wettbewerbsvorteil zu sichern, indem sie neue Erkenntnisse über ihre Arbeitsprozesse oder Nutzer gewinnen.</p> Signup and view all the answers

    Warum sorgen sich viele Bürger um ihren Datenschutz?

    <p>Viele Bürger sorgen sich um ihren Datenschutz, weil sie befürchten, dass ihre Daten ohne ihre Zustimmung erfasst, verwendet oder missbraucht werden.</p> Signup and view all the answers

    Was bedeutet ein Eingriff in die Privatsphäre durch Big Data?

    <p>Ein Eingriff in die Privatsphäre bedeutet, dass Unternehmen die Daten ihrer Kunden ohne ihre Zustimmung erheben, speichern oder verwenden.</p> Signup and view all the answers

    Welche Bedeutung haben die Daten für ein Unternehmen?

    <p>Die Daten haben für ein Unternehmen die Bedeutung, dass sie neue Erkenntnisse über ihre Arbeitsprozesse oder Nutzer liefern.</p> Signup and view all the answers

    Wie kann Big Data im Gesundheitswesen eingesetzt werden?

    <p>Big Data kann im Gesundheitswesen eingesetzt werden, um neue Erkenntnisse über Krankheiten, Behandlungen und Patienten zu gewinnen.</p> Signup and view all the answers

    Was ist der Zweck einer Big Data Strategie?

    <p>Der Zweck einer Big Data Strategie ist es, Daten sinnvoll zu nutzen, um wettbewerbsfähiger zu sein und evidenzbasierte Entscheidungen zu treffen.</p> Signup and view all the answers

    Wie können Unternehmen durch die Nutzung von Big Data und analytischen Werkzeugen wie R und Python evidenzbasierte Entscheidungen treffen?

    <p>Indem sie grosse Mengen an Daten analysieren und darauf basierende Erkenntnisse gewinnen können.</p> Signup and view all the answers

    Welche Vorteile bietet BigQuery für Unternehmen?

    <p>Es ermöglicht superschnelle SQL-Abfragen auf grosse Datenmengen und skaliert automatisch, was es zu einem mächtigen Tool für Unternehmen macht, die riesige Datensätze analysieren müssen.</p> Signup and view all the answers

    Wie kann Big Data im Gesundheitswesen eingesetzt werden?

    <p>Durch die Auswertung von Genomsequenzen zusammen mit klinischen Daten können Ärztinnen und Ärzte massgeschneiderte Behandlungspläne erstellen.</p> Signup and view all the answers

    Welche Bibliotheken machen Python besonders nützlich für Datenanalyse?

    <p>Pandas für Datenmanipulation und PySpark für die Arbeit mit grossen Datensätzen in einem Spark-Umfeld.</p> Signup and view all the answers

    Was ist das Hauptziel von Data Mining?

    <p>Das Hauptziel von Data Mining ist es, aus Daten Erkenntnisse und Muster zu gewinnen, um daraus geschäftliche Vorteile zu ziehen.</p> Signup and view all the answers

    Wie werden Daten in einem Data Lake gespeichert?

    <p>In ihrem ursprünglichen Format.</p> Signup and view all the answers

    Welche Eigenschaften haben Data Lakes?

    <p>Sie speichern Daten in ihrem ursprünglichen Format und bieten große Flexibilität und Skalierbarkeit.</p> Signup and view all the answers

    Welche Vorteile bietet die Verwendung von R und Python für die Datenanalyse?

    <p>Sie bieten Flexibilität, mächtige Bibliotheken und eine aktive Community.</p> Signup and view all the answers

    Welche Phase des CRISP-DM Modells beschäftigt sich mit der Entwicklung eines tieferen Geschäftsverständnisses?

    <p>Phase 1: Business Understanding</p> Signup and view all the answers

    Welche Aspekte werden bei der Datenvorbereitung im CRISP-DM Modell berücksichtigt?

    <p>Bereinigung und Aufbereitung der Daten</p> Signup and view all the answers

    Wozu werden die im CRISP-DM Modell erstellten Datenmodelle verwendet?

    <p>Die Evaluierung der Modelle</p> Signup and view all the answers

    In welcher Phase des CRISP-DM Modells werden verschiedene Modellierungstechniken des Data Minings zum Einsatz kommen?

    <p>Phase 4: Modeling</p> Signup and view all the answers

    Wie wird das CRISP DM Modell oft dargestellt?

    <p>Als ein iterativer Kreislauf</p> Signup and view all the answers

    Was ist das Hauptziel der ersten Phase des CRISP-DM Modells?

    <p>Ein tieferes Geschäftsverständnis zu entwickeln</p> Signup and view all the answers

    Wie viele Phasen enthält das CRISP-DM Modell?

    <p>6 Phasen</p> Signup and view all the answers

    Was ist der Zweck der Datenaufbereitung im CRISP-DM Modell?

    <p>Die Erstellung eines finalen Datensatzes</p> Signup and view all the answers

    Study Notes

    Einführung in Big Data

    • Big Data beschreibt eine große Menge an Daten, die Unternehmen sammeln, analysieren und daraus Schlüsse ziehen können, um evidenzbasierte Entscheidungen treffen zu können.
    • Die Daten können aus vielen Bereichen kommen, wie Social Media, der Finanzindustrie oder dem Gesundheitswesen.

    3-V-Modell

    • Big Data wird nach dem 3-V-Modell bewertet, das aus drei Dimensionen besteht: Volume (Datenmenge), Velocity (Daten Geschwindigkeit) und Variety (Daten-Variabilität).

    Big Data Chancen

    • Unternehmen können durch die Nutzung von Big Data einen großen Wettbewerbsvorteil sichern, indem sie neue Erkenntnisse über ihre Arbeitsprozesse oder Nutzer gewinnen.

    Big Data Kritik

    • Die Gesellschaft hat eine Skepsis gegenüber Big Data, da die Datenanalyse sehr detaillierte Erkenntnisse über die Nutzer liefern kann, was zu einer Verletzung der Privatsphäre führen kann.
    • Die EU-Datenschutzgrundverordnung (DSGVO) regelt die Datensammlung und -verwendung, um den Datenschutz zu gewährleisten.

    Big Data Strategie

    • Unternehmen bemühen sich, Big Data Strategien umzusetzen, um mit dem Marktwettbewerb der Industrie 4.0 mitzuhalten.
    • Die Umsetzung einer Big Data Strategie ist nicht einfach, da die großen Datenmengen sehr unübersichtlich sind.

    CRISP-DM

    • Die CRISP-DM (Cross-Industry Standard Process for Data Mining) ist ein einheitlicher Standard für die Entwicklung von Data Mining Prozessen.
    • Der CRISP-DM besteht aus 6 Schritten: Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation und Deployment.

    Data Lake vs Data Warehouse

    • Data Lake und Data Warehouse sind Konzepte für die Datenspeicherung und -verwendung.
    • Data Lake speichert rohe, unstrukturierte Daten, während Data Warehouse verarbeitete, strukturierte Daten enthält.

    Data Mining

    • Data Mining ist interdisziplinär und nutzt Erkenntnisse aus den Bereichen der Informatik, Mathematik und Statistik.
    • Data Mining wird verwendet, um neue Trends und Muster ausfindig zu machen und um Erkenntnisse über die Nutzer zu gewinnen.

    R und Python

    • R und Python sind führende Programmiersprachen für Datenanalyse und maschinelles Lernen.
    • R ist besonders stark in statistischen Analysen, während Python durch Bibliotheken wie Pandas für Datenmanipulation und PySpark für die Arbeit mit großen Datensätzen in einem Spark-Umfeld breite Anwendung findet.

    Anwendungsfälle

    • Big Data hat viele Anwendungsfälle, wie Direktmarketing, Betrug erkennen (Fraud Detection) und Gesundheitswesen.
    • Im Gesundheitswesen ermöglicht Big Data die Entwicklung von personalisierter Medizin, indem es umfangreiche Patientendaten analysiert.

    Big Data

    • Big Data beschreibt eine große Menge an Daten, die von Unternehmen gesammelt, analysiert und für evidenzbasierte Entscheidungen genutzt werden können.
    • Daten können aus verschiedenen Bereichen kommen, wie z.B. Social Media, Finanzindustrie oder Gesundheitswesen.
    • Datenquellen sind z.B. Kredit- und Kundenkarten, Smartphones oder Smartwatches.

    3-V-Modell

    • Das 3-V-Modell bewertet Daten nach drei Kriterien: Volume (Menge), Velocity (Geschwindigkeit) und Variety (Vielfalt).

    Big Data Chancen

    • Unternehmen können durch die Nutzung von Big Data einen Wettbewerbsvorteil erzielen.
    • Durch die Auswertung von Daten können Unternehmen neue Erkenntnisse über ihre Arbeitsprozesse oder Nutzer gewinnen.

    Big Data Kritik

    • Die Gesellschaft hat Bedenken bzgl. der Datenschutz und des Eingriffs in die Privatsphäre.
    • Die Verwendung von Daten ohne ausdrückliches Einverständnis der Nutzer ist ein Problem.

    Data Lake vs. Data Warehouse

    • Data Lake: Ein Repository für unstrukturierte Daten in Rohformat, flexibel und anpassbar.
    • Data Warehouse: Ein sistema für strukturierte Daten, vorformatierte und für spezifische Anwendungen geeignet.

    Data Lake: Chancen und Herausforderungen

    • Chancen: flexibel, anpassbar, Schnittstellen für verschiedene Datenquellen.
    • Herausforderungen: Komplexität, Benutzer müssen sich mit den Daten auseinandersetzen.

    CRISP DM

    • CRISP DM ist ein einheitlicher Standard für die Entwicklung von Data Mining-Prozessen.
    • Es besteht aus 6 Phasen: Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation und Deployment.

    Die 6 Phasen des CRISP DM Modells

    • Phase 1: Business Understanding - Entwicklung eines tieferen Geschäftsverständnisses.
    • Phase 2: Data Understanding - Entwicklung eines Datenverständnisses.
    • Phase 3: Data Preparation - Datenvorbereitung.
    • Phase 4: Modeling - Datenmodellierung.
    • Phase 5: Evaluation - Evaluierung der Modelle.
    • Phase 6: Deployment - Bereitstellung der Ergebnisse.

    CRISP DM: Vor- und Nachteile

    • Vorteile: strukturiertes Vorgehen, effiziente Projektplanung.
    • Nachteile: Inflexibilität, zu zeitintensiv.

    Datenmanagement Tools

    • Hadoop: Ein Framework für die Speicherung und Verarbeitung grosser Datenmengen auf Clustern von Standardhardware.
    • Apache Spark: Eine alternative zu Hadoop MapReduce, schneller und effizienter.

    Analytische Tools

    • R und Python mit Pandas und PySpark: spezialisierte analytische Software für die Auswertung von Daten.
    • Google BigQuery: ein Cloud-basiertes Datenanalyse-Tool.

    Einführung in Big Data

    • Big Data bezeichnet eine große Menge an Daten, die Unternehmen sammeln, analysieren und auswerten können, um daraus Schlüsse zu ziehen und evidenzbasierte Entscheidungen zu treffen.
    • Die Daten können aus verschiedenen Bereichen stammen, wie Social Media, Finanzindustrie oder Gesundheitswesen, und werden nach dem 3-V-Modell bewertet.

    Vorteile von Big Data

    • Unternehmen können durch die Auswertung von Big Data einen großen Wettbewerbsvorteil erzielen, indem sie neue Erkenntnisse über ihre Arbeitsprozesse oder Nutzer gewinnen.
    • Big Data kann Unternehmen helfen, ihre Arbeitsprozesse zu optimieren, Kosten zu reduzieren und neue Geschäftsmodelle zu entwickeln.

    Kritik an Big Data

    • Big Data kann einen Eingriff in die Privatsphäre der Nutzer darstellen, wenn Daten ohne ausdrückliches Einverständnis der Nutzer verwendet werden.
    • Es gibt Bedenken hinsichtlich der Transparenz über die Datenhandhabung und des Datenschutzes.

    Geschichte von Big Data

    • Die Ursprünge von Big Data reichen zurück in die 1960er Jahre, als Organisationen wie die NASA und große Unternehmen begannen, enorme Datenmengen zu verarbeiten.
    • Der Begriff "Big Data" wurde Anfang der 2000er Jahre eingeführt, um die explosionsartig anwachsenden Datenmengen zu beschreiben.
    • Ein wichtiger Meilenstein in der Geschichte von Big Data war die Entwicklung von Hadoop im Jahr 2006.

    Data Lake

    • Ein Data Lake ist ein sehr großer Speicher, in dem Daten in ihrem Rohformat gespeichert werden.
    • Ein Data Lake kann einem Unternehmen einen großen Wettbewerbsvorteil verschaffen, indem es die Analyse großer Datenmengen ermöglicht.

    CRISP-DM-Modell

    • Das CRISP-DM-Modell ist ein iterativer Prozess, der in sechs Phasen unterteilt ist: Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation und Deployment.
    • Jede Phase ist wichtig für die erfolgreiche Implementierung eines Big-Data-Projekts.

    Werkzeuge für Big Data

    • R und Python sind führende Programmiersprachen für Datenanalyse und maschinelles Lernen.
    • Google BigQuery ist ein Enterprise-Data-Warehouse, das speziell für Big Data entwickelt wurde.

    Anwendungsfälle von Big Data

    • Big Data hat vielfältige Anwendungsfälle, wie Direktmarketing, Betrug erkennen und Gesundheitswesen.
    • Im Gesundheitswesen können Big Data helfen, die Entwicklung von personalisierter Medizin zu fördern und Krankheitsverläufe vorherzusagen.

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Description

    Erfahren Sie, was Big Data ist und wie Unternehmen große Mengen an strukturierten und unstrukturierten Daten sammeln, analysieren und daraus Schlüsse ziehen können.

    Use Quizgecko on...
    Browser
    Browser