M1.1 Statistik: Zufällige Werte
40 Questions
1 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Welcher Datentyp repräsentiert eine Folge von Zeichen?

  • Ganzzahl
  • Boolean
  • Gleitkommazahl
  • Zeichenfolge (correct)
  • Welcher Bereich wird von einem Short (16 Bit) geführt?

  • 0 bis 65.535
  • -128 bis 127
  • -32768 bis 32767 (correct)
  • -2147483648 bis 2147483647
  • Welche der folgenden Optionen ist ein Beispiel für einen Gleitkommazahl-Datentyp?

  • 3,434 (correct)
  • 1000
  • true
  • 2023-03-15
  • Wie viele mögliche Werte kann ein Boolean-Datentyp annehmen?

    <p>2</p> Signup and view all the answers

    Welches Format wird für ein Datum verwendet?

    <p>yyyy-mm-dd</p> Signup and view all the answers

    Was ist der Wertebereich eines Byte (8 Bit) für ganze Zahlen?

    <p>-128 bis 127</p> Signup and view all the answers

    Welcher der folgenden Punkte beschreibt einen Long-Datentyp?

    <p>64 Bit</p> Signup and view all the answers

    Welcher Datentyp hat keinen Bereich von -128 bis 127?

    <p>Float</p> Signup and view all the answers

    Was ist der Hauptzweck beim Zusammenführen von Datensätzen?

    <p>Um die Tabellen sowohl vertikal als auch horizontal zu erweitern</p> Signup and view all the answers

    Welches Verbindungselement wird verwendet, um Tabellen zusammenzuführen?

    <p>ID</p> Signup and view all the answers

    Wann findet eine vertikale Erweiterung von Tabellen statt?

    <p>Wenn die Attributstruktur ähnlich ist</p> Signup and view all the answers

    Was passiert im Modus „Union“ beim Zusammenführen von Tabellen?

    <p>Alle Attribute und mögliche Duplikate werden übernommen</p> Signup and view all the answers

    Wie funktioniert die horizontale Erweiterung von Tabellen?

    <p>Sie erfordert die Verwendung einer ID zur Verknüpfung</p> Signup and view all the answers

    Welche der folgenden Aussagen trifft auf den Modus „Intersection“ zu?

    <p>Es werden nur die gemeinsamen Attribute in allen Tabellen übernommen.</p> Signup and view all the answers

    Wie werden Duplikate behandelt, wenn der Modus „Union“ benutzt wird?

    <p>Sie können ignoriert oder gesondert gekennzeichnet werden.</p> Signup and view all the answers

    Welche Funktion hat die ID bei der vertikalen Erweiterung von Tabellen?

    <p>Sie hat keine zusammenführende Funktion.</p> Signup and view all the answers

    Welche der folgenden Transformationen beziehen sich auf die Bearbeitung von Zeichensätzen?

    <p>Zeichentransformation</p> Signup and view all the answers

    Was ist eine der Hauptfunktionen der Zahlentransformation?

    <p>Mathematische Berechnungen durchführen</p> Signup and view all the answers

    Was ist ein Beispiel für eine regelbasierte Wertetransformation?

    <p>Das Geschlecht in Zahlen umzuwandeln, basierend auf einer Bedingung</p> Signup and view all the answers

    Was beschreibt völlig zufällige fehlende Werte?

    <p>Das Auftreten fehlender Werte ist unabhängig von Eigenschaften der Daten.</p> Signup and view all the answers

    Welche Bedingung ist notwendig, um eine regelbasierte Wertetransformation durchzuführen?

    <p>Eine vorher festgelegte Bedingung muss erfüllt sein</p> Signup and view all the answers

    Welches Szenario beschreibt bedingt zufällige fehlende Werte (MAR)?

    <p>Frauen haben weniger häufig fehlende Werte als Männer in einer Umfrage.</p> Signup and view all the answers

    Was ist charakteristisch für nicht zufällig fehlende Werte (MNAR)?

    <p>Fehlende Werte hängen von der Vertraulichkeit der Fragen ab.</p> Signup and view all the answers

    Was beschreibt die Tabellentransformation am besten?

    <p>Bearbeiten der Struktur und Gestaltung von Datensätzen</p> Signup and view all the answers

    Welche der folgenden Optionen ist keine Methode der Sortierung?

    <p>Filterung</p> Signup and view all the answers

    Welche der folgenden Aussagen über das Management fehlender Werte ist korrekt?

    <p>Es ist wichtig, die Gründe für fehlende Werte zu berücksichtigen.</p> Signup and view all the answers

    Wie könnte ein Datensatz vor der Analyse gefiltert werden?

    <p>Durch Auswahl eines bestimmten Altersbereichs</p> Signup and view all the answers

    Welche Methode ist geeignet, um mit völlig zufälligen fehlenden Werten umzugehen?

    <p>Die fehlenden Werte ignorieren bei der Analyse.</p> Signup and view all the answers

    Welcher Knoten wird normalerweise für die Zahlentransformation verwendet?

    <p>Math Formula</p> Signup and view all the answers

    Welches Beispiel beschreibt einen Zustand von bedingt zufälligen fehlenden Werten?

    <p>Menschen, die aus Scham Fragen zu Einkommen nicht beantworten.</p> Signup and view all the answers

    Was passiert bei nicht zufälligen fehlenden Werten?

    <p>Der Grund für das Fehlen hängt mit der Dateneigenschaft zusammen.</p> Signup and view all the answers

    Wie sollten fehlende Werte idealerweise behandelt werden?

    <p>Mit einer Annahme über die Gründe für ihr Fehlen.</p> Signup and view all the answers

    Was geschieht beim Transponieren von Daten?

    <p>Zeilen und Spalten werden umgewandelt.</p> Signup and view all the answers

    Worin besteht der Hauptzweck des Filterns von Daten?

    <p>Um die Auswahl der relevanten Daten zu ermöglichen.</p> Signup and view all the answers

    Welcher Knoten wird verwendet, um Spalten auf zwei Tabellen zu verteilen?

    <p>Column Splitter</p> Signup and view all the answers

    Welcher Begriff beschreibt das Teilen von Zeilen in zwei Tabellen anhand eines Attributwerts?

    <p>Row Splitter</p> Signup and view all the answers

    Was beschreibt die Partitionierung in Bezug auf Datenverteilung?

    <p>Aufteilung der Daten in Trainings- und Testdaten</p> Signup and view all the answers

    Was ist eine der einfachsten Formen der Datenaggregation?

    <p>Gruppieren von Informationen</p> Signup and view all the answers

    Wie wird beim Zeilenfilter gefiltert?

    <p>Zeilen werden nach einem Attributwert herausgefiltert.</p> Signup and view all the answers

    Welche Methode wird verwendet, um Daten in einer zusammenfassenden Form darzustellen?

    <p>Aggregation</p> Signup and view all the answers

    Study Notes

    Kategorien fehlender Werte

    • Fehlende Werte lassen sich in drei Kategorien unterteilen: völlig zufällig (MCAR), bedingt zufällig (MAR) und nicht zufällig (MNAR).
    • Völlig zufällig (MCAR): Das Fehlen von Werten ist unabhängig von den Eigenschaften der Objekte oder Quellen.
    • Bedingt zufällig (MAR): Fehlende Werte hängen von den Eigenschaften der Werte ab, jedoch nicht von den Objekten oder Quellen. Beispiel: Unterschiede bei Umfragen zwischen Männern und Frauen.
    • Nicht zufällig (MNAR): Fehlende Werte sind abhängig von den Eigenschaften der Werte sowie den Objekten und Quellen. Beispiel: Männer geben weniger persönliche Informationen über Depressionen an als Frauen.

    Umgang mit fehlenden Werten

    • Analyse der gesamten Datensatzentstehung ist entscheidend für das Verständnis von fehlenden Werten.
    • Einzelne fehlende Werte sollten nicht leichtfertig gelöscht, sondern gründlich analysiert werden.

    Verbinden von Datensätzen

    • Tabellen können sowohl vertikal als auch horizontal verknüpft werden.
    • Eine Haupttabelle dient als zentrale Tabelle, mit Nebentabellen verbunden.
    • Verknüpfungen erfolgen über Verbindungselemente (Schlüssel) wie IDs oder Kundennummern.

    Vertikale und horizontale Erweiterung von Tabellen

    • Vertikale Erweiterung: Wenn Tabellen ähnliche Attributstrukturen besitzen, können sie durch Anhängen von Zeilen zusammengeführt werden.
    • Union: Übernahme aller Attribute, kann zu vielen fehlenden Werten und Duplikaten führen.
    • Intersection: Nur gemeinsame Attribute werden zusammengeführt.
    • Horizontale Erweiterung: Verbindet Tabellen mit einer erforderlichen ID über Join.

    Datentypen und Transformationen

    • Zeichen: (Strings, Byte, Short, Long)
    • Numerische Daten: Ganze Zahlen (Integer) und Gleitkommazahlen (Float, Double).
    • Boolesche Daten: Zwei mögliche Werte (Wahr oder Falsch).
    • Datum/Uhrzeit-Daten: Im „yyyy-mm-dd“-Format.
    • Transformationen umfassen Zeichentransformation (Manipulation von Strings), Zahlentransformation (arithmetische Operationen) und regelbasierte Wertetransformation (Bedingungen zur Anwendung).

    Tabellentransformation und Analyse

    • Filterung und Auswahl von Datensätzen nach spezifischen Kriterien (z.B. Geschlecht oder Alter).
    • Gestaltungsmöglichkeiten: Sortieren, Filtern, Aufteilen und Aggregation.

    Sortieren von Tabellen

    • Sorter: ermöglicht das Sortieren von Zeilen nach bestimmten Attributen.
    • Transpose: Umwandlung von Zeilen in Spalten und umgekehrt.

    Filtern von Tabellen

    • Row Filter: Filterung der Zeilen nach Attributwerten.
    • Column Filter: Auswahl relevanter Spalten, um nicht benötigte zu entfernen.

    Aufteilen von Tabellen

    • Verwendung von „Splitter“:
      • Column Splitter: Aufteilung in zwei Tabellen basierend auf Spaltenauswahl.
      • Row Splitter: Verteilung von Zeilen entsprechend Attributwerten.
    • Partitionierung: Verteilung von Zeilen nach einem Schlüssel (z.B. Trainings- und Testdaten im maschinellen Lernen).

    Aggregation

    • Informationen werden gesammelt und in summarischer Form dargestellt, um Kennzahlen zu generieren und Zielgruppen besser zu verstehen.
    • Gruppierung ist die einfachste Form der Aggregation, um Daten zusammenzufassen.

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Related Documents

    Description

    In diesem Quiz untersuchen wir die drei Kategorien des Auftretens von Werten: völlig zufällig, bedingt zufällig und nicht zufällig. Teste dein Wissen über die unterschiedlichen Arten von Zufälligkeit und deren Auswirkungen auf Datenanalysen. Ideal für Studierende, die sich mit Statistik beschäftigen.

    More Like This

    Use Quizgecko on...
    Browser
    Browser