Einheit 01 Einführung, Merkmale, Skalen, Datenerhebung_WII PDF
Document Details
Uploaded by DeliciousNobelium9664
Hochschule Bochum
2024
Prof. Dr. Thomas Skill
Tags
Summary
This document provides an introduction to statistics, covering topics like data collection, processing, analysis and interpretation. It also includes information on different statistical methods and techniques.
Full Transcript
Was verstehen wir unter Statistik? In Statistik werden Methoden zur Erhebung, Aufbereitung, Analyse und Interpretation von Daten über die Wirklichkeit (Empirie) entwickelt und angewendet. Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 15...
Was verstehen wir unter Statistik? In Statistik werden Methoden zur Erhebung, Aufbereitung, Analyse und Interpretation von Daten über die Wirklichkeit (Empirie) entwickelt und angewendet. Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 15 Stand: 10.10.2024 Ablauf statistischer Untersuchungen Phases of the CRISP-DM Model Source: Riepl, Statistik Dresden, 2012 Teaching Statistics, Volume: 43, Issue: S1, Pages: S201-S215, First published: 25 June 2021, DOI: 10.1111/test.12264 Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 16 Stand: 10.10.2024 Ablauf statistischer Untersuchungen Zyklusmodell des Prozesses der Daten-Wertschöpfung (angelehnt an Association Data Science Pipeline of Independent Schools New South Wales u. a.) Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 17 Stand: 10.10.2024 Ablauf statistischer Untersuchungen Auftrag: Untersuchen Sie, welche Gemeinsamkeiten die vier Modelle der Untersuchungsabläufe haben. Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 18 Stand: 10.10.2024 Was verstehen wir unter Statistik? Statistik Statistische Methodenlehre Angewandte Statistik Deskriptive Statistik Wirtschaftsstatistik Induktive Statistik Bevölkerungsstatistik Zeitreihenanalyse Sozialstatistik Multivariate Statistik …statistik Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 19 Stand: 10.10.2024 Drei Teilgebiete lassen sich unterscheiden. (1/2) I. Deskriptive (beschreibende) Statistik: Beschreibung des Untersuchungsobjektes 1. Erhebung relevanter Daten 2. Aufbereitung der Daten 3. Analyse der Daten: Eigenschaften des Untersuchungsobjektes Gesetzmäßigkeiten zeitlicher Entwicklung Abhängigkeiten zwischen zwei Größen 4. Interpretation der Analyseergebnisse Beispiel: 7-Tage-Inzidenz Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 20 Stand: 10.10.2024 Drei Teilgebiete lassen sich unterscheiden. (2/2) II. A) Wahrscheinlichkeitsrechnung: Berechnung des Ausmaßes an Sicherheit, mit der ein möglicher Ausgang eines ungewissen Vorgangs eintritt Beispiel: Wahrscheinlichkeit für einen Sechser im Lotto II. B) Induktive Statistik1: Ermittlung erkennbarer Trends aus einer Stichprobe für die Grundgesamtheit Beispiel: Hochrechnungen bei Bundestagswahlen 1 auch Inferenzstatistik, beurteilende Statistik, schließende Statistik Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 21 Stand: 10.10.2024 Grundbegriffe (1/3) Bei statistischen Untersuchungen ist genau zu definieren, welche Informationen von Objekten, die diese Informationen tragen, betrachtet werden sollen. Diese Informationen nennen wir Untersuchungsmerkmale, kurz: Merkmale. Die einzelnen informationstragenden Objekte werden als Merkmalsträger, auch Auwahleinheiten oder statistische Einheiten bezeichnet. Zur Identifikation der gleichartigen Merkmalsträger, die zu einer „Gesamtheit“ gehören sollen, werden in der Regel objektive und genaue Identifikationskriterien 1. zeitlicher 2. räumlicher und 3. sachlicher Art angegeben. Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 22 Stand: 10.10.2024 Grundbegriffe (2/3) Die Menge aller statistischen Einheiten mit denselben wohl- definierten Identifikationskriterien wird Grundgesamtheit genannt. In der Literatur kommen auch die Bezeichnungen statistische Masse, Population oder Kollektiv vor. Die möglichen Werte (Kategorien), die ein Merkmal annehmen kann, heißen Merkmalsausprägungen. Die n möglichen Ausprägungen des Merkmals X werden mit Kleinbuchstaben x1 , , xi , , xn bezeichnet. Daher sagt man auch, dass ein Merkmal eine Abbildung X :M → A αi X ( αi ) =mit endlicher Menge M und Menge A von xi Ausprägungen ( i = 1, ,n ). Die m beobachteten Ausprägungen des Merkmals X werden mit b1 , , bi , , bm bezeichnet (Beobachtungswerte). Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 23 Stand: 10.10.2024 Beispiel (1/2) Grundbegriff Beschreibung Beispiel Statistische Einheit Gegenstand der Ein einzelner (Merkmalsträger) Untersuchung Studierender an der HS BO Merkmal Eigenschaft des Alter, Größe, Geschlecht Merkmalsträgers Merkmalsausprägung Mögliches Alter (Jahre): 19, 20, 22,... (auch: Merkmalswert) Ergebnis, das Größe (m): 1,65, 1,70,... festgestellt Geschlecht: m, w, divers werden kann Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 24 Stand: 10.10.2024 Beispiele (2/2) Grundbegriff Beschreibung Beispiel Grundgesamtheit Menge aller Merkmalsträger, die Menge aller die übereinstimmende Angehörigen an der HS Abgrenzungsmerkmale Bochum besitzen sachlich Festlegung, wer oder was eingeschriebene unter einem Merkmalsträger Studierende / Gasthörer zu verstehen ist räumlich Gebiet, in dem der Standort Bochum Merkmalsträger liegen muss oder Velbert/Heiligenhaus zeitlich Zeitpunkt oder Zeitraum, an / Zeitpunkt: 30.10.2010 in dem der Merkmalsträger Zeitraum: WS 2012/2013 Teil der Grundgesamtheit ist Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 25 Stand: 10.10.2024 Teilgesamtheiten/Stichproben Jede echte Teilmenge der Grundgesamtheit von Ω heißt Teilgesamtheit. Teilgesamtheiten heißen Stichproben (engl.: sample), wenn bei der Auswahl der Elemente der Zufall wesentlich beteiligt war. Erläuterung: „Stichprobe“ bedeutet im Hüttenwesen eigentlich, die mit dem Problöffel dem Stichherd (der Herd oder Vortiegel, in dem die Schmelzmasse nach dem Anstechen des Ofens fließt) entnommene Probe, um den Metallgehalt der Schmelzmasse zu ermitteln. Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 26 Stand: 10.10.2024 Stichproben Reine Zufallsstichprobe Jedes Element der Grundgesamtheit hat die gleiche Chance, in die Stichprobe mit aufgenommen zu werden. Repräsentative Stichprobe Ziel ist es, eine Teilgesamtheit auszuwählen, die repräsentativ für die Grundgesamtheit ist. Da die Struktur bezüglich der interessierenden Merkmale vor der Erhebung unbekannt ist, versucht man, die Repräsentanz bezüglich anderer Merkmale zu gewährleisten, wobei angenommen wird, dass das zu untersuchende Merkmal mit diesem anderem Merkmal in einem gewissen „statistischen Zusammenhang“ steht. Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 27 Stand: 10.10.2024 Repräsentativität. Repräsentative Stichprobe Ziel ist es, eine Teilgesamtheit auszuwählen, die repräsentativ für die Grundgesamtheit ist. Da die Struktur bezüglich der interessierenden Merkmale vor der Erhebung unbekannt ist, versucht man, die Repräsentanz bezüglich anderer Merkmale zu gewährleisten, wobei angenommen wird, dass das zu untersuchende Merkmal mit diesem anderem Merkmal in einem gewissen „statistischen Zusammenhang“ steht. Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 28 Stand: 10.10.2024 Klassifizierung von Merkmalen X :M → R αi X ( αi ) =xi kategorial quantitativ qualitativ komparativ diskret stetig dichotom Es gibt höchstens Es gibt über- abzählbar viele abzählbar viele Merkmalswerte. Merkmalswerte. häufbar nicht-häufbar Ein Merkmalsträger hat Ein Merkmalsträger hat mind. zwei Ausprägungen genau eine Ausprägung des Merkmals. des Merkmals. Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 33 Stand: 10.10.2024 Beispiele Merkmalsart Beispiele Kategoriales Merkmal A) Qualitatives Merkmal dichotom B) Komparatives Merkmal Quantitatives Merkmal diskret (abzählbar) stetig Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 34 Stand: 10.10.2024 Beispiele Merkmalsart Beispiele Kategoriales Merkmal Qualitatives Merkmal Familienstand, Konfession dichotom Schwangerschaft Komparatives Merkmal Schulnote, Rating Quantitatives Merkmal diskret (abzählbar) Einwohner, Anzahl Kinder, Geburten Stetig Körpergröße, Geschwindigkeit , Aktienkurs (häufbar!) Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 35 Stand: 10.10.2024 Übung Entscheiden Sie ob es sich um diskrete oder stetige Merkmale handelt. a) Geschwindigkeit von Pkws b) Hörerzahl einer Vorlesung c) Anzahl der Mitarbeiter eines Betriebes d) Einkommen e) Zeit für die Beschleunigung eines Pkws von 0 auf 100 km/h f) Punkte in einer Klausur g) Bücherbestand in einer Bibliothek h) Stromverbrauch i) Treibstoffverbrauch eines Orbiters in Abhängigkeit von der Flughöhe Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 36 Stand: 10.10.2024 Ermittlung der Messwerte Definition: Eine Skala ist eine strukturtreue Zuordnung eines empirischen Relativs in ein numerisches Relativs. Beispiel (das Relativ ist „weniger als“) Empirisches Relativ Numerisches Relativ Ohne Abschluss 0 Hauptschulabschluss 1 Realschulabschluss 2 Fachhochschulreife 3 Allgemeine Hochschulreife 4 Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 37 Stand: 10.10.2024 Skalenniveaus nach Stevens1 Wir unterscheiden folgende Skalenniveaus: Nominalskala für qualitative Merkmale Ordinalskala für komparative Merkmale Intervallskala und auch Kardinalskalen Verhältnisskala für quantitative Merkmale oder metrische Skalen 1 Stevens, Stanley Smith: On the Theory of Scales of Measuremant, Science Vol. 103, No 2684, 1946, S. 677 - 680 Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 38 Stand: 10.10.2024 Nominalskala Merkmalsausprägungen sind als Klassenbezeichnungen abgetragen, die gleichberechtigt nebeneinander angeordnet sind. Die Beziehung untereinander ist „ungleich“. Die Relative/Merkmalsausprägungen sind klassifikatorische Begriffe, für die gelten: Die Klassifikationen müssen disjunkt sein, d. h. die Merkmalsausprägungen müssen sich gegenseitig ausschließen. Die Klassifikation muss exhaustiv sein, d. h. die Merkmalsausprägungen müssen das Merkmal ausschöpfen. Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 39 Stand: 10.10.2024 Nominalskala Für die EDV-mäßige Verarbeitung wird das empirische Relativ oft genutzt. Merkmal Merkmalsausprägung Numerisches Relativ Ja 1 Raucher Nein 0 Bei mathematischen Operationen mit diesen Werten muss sehr auf die Sinnhaftigkeit geachtet werden. Im o. g. Beispiel kann die Addition über den Schlüssel die Anzahl der Raucher ergeben. Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 40 Stand: 10.10.2024 Ordinalskala Merkmalsausprägungen sind als Klassenbezeichnungen abgetragen, für die gelten, dass auf ihnen einen Ordnungsrelation < definiert ist, d. h. sie sind nicht mehr gleichberechtigt, sondern können in eine Rangfolge gebracht werden. Merkmal Merkmals- Numerisches ausprägung Relativ sehr gut 1 Gut 2 Schulnoten befriedigend 3 ausreichend 4 Der Rang stellt keine Quantifizierung des Merkmalswertes dar: „2 ist nicht doppelt so gut wie 4.“ Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 41 Stand: 10.10.2024 Ordinalskala Rangplätze einer Ordinalskala liefern nur komparative Informationen; quantitative Differenzen zwischen den Ausprägungen sind unbekannt bzw. undefiniert. Man darf daher nicht annehmen, dass die numerischen Rangdifferenzen quantitativen Merkmalsdifferenzen entsprächen. Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 42 Stand: 10.10.2024 Intervallskala Skalenwert von 0 ist willkürlich gewählt. Merkmal Merkmalswert Temperatur (Celsius) …, -12° C, …, 0, …, 8, …, 12, …, 36 Einfacher Abstand kann zwischen zwei Merkmalswerten gemessen werden (Intervall). Abstand zwischen 12°C und 36°C = 24 °C. Verhältnisse sind nicht aussagekräftig! Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 43 Stand: 10.10.2024 Verhältnisskala Skalenwert von 0 ist ein natürlicher, absoluter Nullpunkt. Merkmal Merkmalswert Alter 0 Jahre, …, 15 Jahre, …, 19 Jahre, … 23 Jahre, … Gewicht 0 kg, …, 44 kg, …, 56 kg, … Einfacher Abstand kann zwischen zwei Merkmalswerten gemessen werden (Intervall): Janine ist ein Jahr jünger als Jennifer (20 – 19 Jahre = 1 Jahr). Verhältnis kann gemessen werden (Merkmalswert kann als ein Vielfaches ausgedrückt werden): Mein Vater ist doppelt so alt wie ich (50 Jahre / 25 Jahre = 2). Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 44 Stand: 10.10.2024 Zusammenfassung Quelle: Wewel, C. (2011): Statistik im Bachelor-Studium der BWL und VWL, S. 25. Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 45 Stand: 10.10.2024 Zusammenfassung Quelle: Wewel, C. (2011): Statistik im Bachelor-Studium der BWL und VWL, S. 25. Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 46 Stand: 10.10.2024 Missbrauch von Statistiken (2/4) Durch Verzerrungen der y-Achse wird manipuliert. Umsätze in Mio. € Umsätze in Mio. € 5,0 4,6 4,0 4,5 4,4 3,0 4,3 2,0 4,2 1,0 4,1 0,0 4,0 2005 2006 2007 2008 2009 2005 2006 2007 2008 2009 Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 49 Stand: 10.10.2024 Missbrauch von Statistiken (3/4) Falsche Angaben werden gemacht. Definitionen oder erklärende Informationen fehlen. Stichprobe ist nicht repräsentativ. Auswahl der Merkmale ist irreführend. Fragestellungen beeinflussen den Befragten. Auswahl der Bezugsgröße wird manipuliert. Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 50 Stand: 10.10.2024 Missbrauch von Statistiken (4/4) Zusammenhänge werden vorgetäuscht. 90 Geburten in Tsd. in NRW 85 (1992 bis 2005) 80 75 70 65 200 300 400 500 600 Störche: Anzahl Paare Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 51 Stand: 10.10.2024 Literatur Essential Readings: Mittag, Schüller: Statistik, S. 41 - 45 Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 53 Stand: 10.10.2024 Phasen einer statistischen Untersuchung 1. Planung 2. Datenerhebung 3. Datenaufbereitung und - darstellung 4. Datenanalyse und - interpretation Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 54 Stand: 10.10.2024 Phasen einer statistischen Untersuchung 1. Planung 2. Datenerhebung 3. Datenaufbereitung und - darstellung 4. Datenanalyse und - interpretation Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 55 Stand: 10.10.2024 1. Planung (1/3) Zeitplanung Für welchen Zeitpunkt oder Berichtszeitraum werden statistische Informationen benötigt Planung des Erhebungszeitraums Fragebogen und Erhebungspapier erstellen Druck, Versand und Rücklauf Testerhebungen Überprüfung der Unterlagen und Erhebungsmethoden verhindert Verzögerung Prüfen der EDV-Programme, Schulung von Interviewern,… Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 56 Stand: 10.10.2024 1. Planung (2/3) Kostenplanung Genauigkeit bei der Hochrechnung Umfang der Erhebung (Voll-/Teilerhebung, Stichprobengröße) Kosten der Befragung Versand von Fragebogen, Interviewer benötigt Nutzung von vorhandenen Information Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 57 Stand: 10.10.2024 1. Planung (3/3) Zusammenfassend: Abgrenzung und Auswahl der zu erfassenden Merkmalsträger Festlegung der Erhebungsform Festlegung der zu erhebenden Merkmale und Werte Ausarbeitung des Fragebogens Ausarbeitung von Plausibilitätskontrollen Erstellung und Tests von Software Aufstellung von Kosten-, Zeit- und Personaleinsatzplänen Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 58 Stand: 10.10.2024 Phasen einer statistischen Untersuchung 1. Planung 2. Datenerhebung 3. Datenaufbereitung und - darstellung 4. Datenanalyse und - interpretation Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 59 Stand: 10.10.2024 2. Datenerhebung 2. 1. Konkretisierung des Untersuchungsziels 2.2. Erhebungstechniken 2.2.1. Herkunft der Daten 2.2.2. Erhebungsumfang 2.2.3. Arten der Erhebung Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 60 Stand: 10.10.2024 2. Datenerhebung 2. 1. Konkretisierung des Untersuchungsziels 2.2. Erhebungstechniken 2.2.1. Herkunft der Daten 2.2.2. Erhebungsumfang 2.2.3. Arten der Erhebung Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 61 Stand: 10.10.2024 2.1. Konkretisierung des Untersuchungsziels deutliche und präzise Formulierung Abgrenzung der Grundgesamtheit (sachlich, räumlich, zeitlich) Zweck der Untersuchung Beseitigung von eventuellen Unstimmigkeiten Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 62 Stand: 10.10.2024 2. Datenerhebung 2. 1. Konkretisierung des Untersuchungsziels 2.2. Erhebungstechniken 2.2.1. Herkunft der Daten 2.2.2. Erhebungsumfang 2.2.3. Arten der Primärerhebung Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 63 Stand: 10.10.2024 2.2.1. Herkunft der Daten Sekundär- ? Primär- erhebung erhebung Befragung Beobachtung Experiment Häufig werden Sekundärerhebung und Primärerhebung mit einander verknüpft. Prof. Dr. Thomas Skill Wintersemester Winterssemester2013/2014 2024/25 Einheit 01 Folie 64 Stand: 10.10.2024 2.2.1. Herkunft der Daten – Erhebungsmethoden Primärerhebung Sekundärerhebung Befragung der Absatzstatistiken Mitarbeiter des Kostenrechnung intern Informationsquelle Außendienstes Kunden-/Lieferantenkarteien Vertreterberichte Befragung amtliche Statistiken Beobachtung Datenbanken Experimente Geschäftsberichte extern Panels Veröffentlichung von Verbänden Gutachten Analystenreports Primärforschung erfolgt erst nachdem Sekundärquellen genutzt wurden (Kosten-Nutzen-Abwägung). Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 65 Stand: 10.10.2024 2.2.1. Herkunft der Daten – Eigenschaften von Primär- und Sekundärerhebung Primärerhebung Sekundärerhebung Kosten hoch niedrig Zeitaufwand hoch niedrig Zielbezug stark evtl. eingeschränkt zeitliche aktuell evtl. weniger aktuell Nähe Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 66 Stand: 10.10.2024 2. Datenerhebung 2. 1. Konkretisierung des Untersuchungsziels 2.2. Erhebungstechniken 2.2.1. Herkunft der Daten 2.2.2. Erhebungsumfang 2.2.3. Arten der Primärerhebung Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 67 Stand: 10.10.2024 2.2.2. Erhebungsumfang Voll- ? Teil- erhebung erhebung Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 68 Stand: 10.10.2024 2.2.2. Erhebungsumfang – Eigenschaften von Voll- und Teilerhebung Vollerhebung Teilerhebung Kosten hoch niedrig Zeitaufwand hoch niedrig Genauigkeit groß evtl. geringer zeitliche i.d.R. aktuell aktuell Nähe Durchführ- nicht immer fast immer möglich barkeit möglich Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 69 Stand: 10.10.2024 2.2.2. Erhebungsumfang – Teilerhebung Auswahlverfahren „Auswahlverfahren nennt man die Verfahren zur Auswahl von statistischen Einheiten [Merkmalsträgern, Anm. d. Verf.] bei Stichprobenuntersuchungen.“ Quelle: Eckey, Kosfeld, Türck (2008): Deskriptive Statistik: 5. Auflage, Gabler, Wiesbaden, S. 24. Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 70 Stand: 10.10.2024 2.2.2. Erhebungsumfang – Teilerhebung Wichtige Auswahlverfahren Auswahlverfahren nicht repräsentativ willkürliche Auswahl Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 71 Stand: 10.10.2024 Willkürliche Auswahl (1/2) willkürlicher Auswahlprozess Grundgesamtheit Auswahl Auswahl der Befragungseinheiten Stichprobe Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 72 Stand: 10.10.2024 Willkürliche Auswahl (2/2) Auswahl aufs Geratewohl kein Repräsentanzschluss erlaubt! systematische Verzerrungen sind möglich geeignet für Meinungstendenzen und Pretests Beispiel: Befragung von Kunden an einem Vormittag im Supermarkt nach Waschmitteln Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 73 Stand: 10.10.2024 2.2.2. Erhebungsumfang – Teilerhebung Wichtige Auswahlverfahren Auswahlverfahren repräsentativ nicht repräsentativ Zufallsauswahl willkürliche Auswahl einfache Zufallsauswahl etc. Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 74 Stand: 10.10.2024 Einfache Zufallsauswahl (1/2) Einfacher Auswahlprozess Grundgesamtheit Auswahl durch p= Auswahl der Befragungseinheiten Losen 1 / 60 Stichprobe Quelle: Wettschureck, G.: Grundlagen der Stichprobenbildung, in: Behrens, C. (Hrsg.): Handbuch der Marktforschung, Wiesbaden: Gabler, 1974, S. 194 Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 75 Stand: 10.10.2024 Einfache Zufallsauswahl (2/2) „Bei einer Zufallsauswahl gelangt jede statistische Einheit der Grundgesamtheit mit einer berechenbaren Wahrscheinlichkeit in die Stichprobe. Über den Zufallsmechanismus wird die Repräsentativität sicher gestellt.“ nicht mit der willkürlichen Auswahl zu verwechseln! Wahrscheinlichkeit liegt hier zu Grunde! Beispiel: Anruf von zufällig ausgewählten Personen aus einer Telefonliste, die die Grundgesamtheit enthält Quelle: Eckey, Kosfeld, Türck (2008): Deskriptive Statistik: 5. Auflage, Gabler, Wiesbaden, S. 26/27. Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 76 Stand: 10.10.2024 2.2.2. Erhebungsumfang – Teilerhebung Wichtige Auswahlverfahren Auswahlverfahren repräsentativ nicht repräsentativ Zufallsauswahl bewusste Auswahl willkürliche Auswahl einfache Quotenverfahren Zufallsauswahl Konzentrations- etc. verfahren typische Auswahl Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 77 Stand: 10.10.2024 Bewusste Auswahl „Bei der bewussten Auswahl erfolgt die Auswahl der statistischen Einheiten gezielt nach bestimmten Merkmalen. Über diese Merkmale soll die Repräsentativität hergestellt werden.“ Beispiel: Warenkorb zur Berechnung von Preisindices Quelle: Eckey, Kosfeld, Türck (2008): Deskriptive Statistik: 5. Auflage, Gabler, Wiesbaden, S. 27. Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 78 Stand: 10.10.2024 Quotenverfahren „Beim Quotenverfahren werden Quoten (Anteile für Merkmale) für die Stichprobe vorgegeben, so dass die Zusammensetzung der Stichprobe für diese Merkmale (=Quotenmerkmale) der Zusammensetzung der Grundgesamtheit entspricht.“ Beispiel: Befragung in einer Gemeinde mit 51,2% weiblichen Bürgern und 48,8% männlichen Bürgern. Die Stichprobe soll 1.000 Personen umfassen: 512 Frauen der Gemeinde 488 Männer der Gemeinde Quelle: Eckey, Kosfeld, Türck (2008): Deskriptive Statistik: 5. Auflage, Gabler, Wiesbaden, S. 27. Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 79 Stand: 10.10.2024 Beispiel Quotenanweisung Gesamtzahl der Interviews: 17 Stadtteil: Wiemelhausen 1 2 3 4 5 6 7 Hustadt 1 2 3 4 Querenburg 1 2 3 4 5 6 Geschlecht: männlich 1 2 3 4 5 6 7 8 weiblich 1 2 3 4 5 6 7 8 9 Alter: 18-29 1 2 30-39 1 2 3 4 40-49 1 2 3 4 5 50-59 1 2 3 4 60 und älter 1 2 Beruf: Arbeiter 1 2 3 4 5 6 Angestellter 1 2 3 4 Beamter 1 2 3 4 Selbständig 1 2 3 Personenstand: verheiratet 1 2 3 4 5 6 7 8 9 10 ledig/geschieden 1 2 3 4 5 6 7 Quelle: In Anlehnung an: Hammann, P.; Erichson, B.: Marktforschung, 4. Aufl., Stuttgart: Lucius & Lucius, 2000, S. 85 Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 80 Stand: 10.10.2024 Konzentrationsverfahren (1/2) Konzentrations- verfahren Grundgesamtheit („geschichtet“) Auswahl der Auswahl wichtigsten Schicht Stichprobe Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 81 Stand: 10.10.2024 Konzentrationsverfahren (2/2) auch Abschneideverfahren genannt ausschließlich die wichtigsten Einheiten einer Grundgesamtheit werden ausgewählt (oft ist „wichtig“ mit dem größten Beitrag gleichzusetzen) die unwichtigeren Einheiten werden nicht berücksichtigt (abgeschnitten) Beispiel: Auswahl von Unternehmen in der Stahlbranche mit mehr als 5.000 Beschäftigten Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 82 Stand: 10.10.2024 Typische Auswahl nur statistische Einheiten, die typisch sind, werden berücksichtigt Merkmal, nach dem statistische Einheiten ausgewählt werden, ist subjektiv festgelegt Beispiel: Marktuntersuchung in solchen Städten, die typisch für das betreffende Land sind Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 83 Stand: 10.10.2024 2. Datenerhebung 2. 1. Konkretisierung des Untersuchungsziels 2.2. Erhebungstechniken 2.2.1. Herkunft der Daten 2.2.2. Erhebungsumfang 2.2.3. Arten der Primärerhebung Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 84 Stand: 10.10.2024 2.2.3 Arten der Erhebung Beobachtung Teilnehmende Beobachtung Laborbeobachtung Feldbeobachtung Mystery-Shopping Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 85 Stand: 10.10.2024 2.2.3 Arten der Primärerhebung Befragung Qualitative Quantitativ Panel: festgelegte Mitglieder einer Zielgruppe. DIESELBEN Menschen werden wiederholt in regelmäßigen Abständen oder auch fortlaufend zum Thema befragt oder beobachtet Tracking: wiederholte Erhebung zum selben Thema, jedoch werden immer wieder ANDERE Menschen in neuen strukturgleichen Stichproben befragt. Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 86 Stand: 10.10.2024 2.2.3 Arten der Erhebung – Beispiele für Beobachtungen Kundenlaufstudien in Handelsgeschäften Blickschwerpunkte im Supermarktregal Blickverlauf bei Anzeigen Wirkungen der Gestaltung von Werbemitteln Besucherfrequenzen in einem Geschäft Einkaufsverhalten Quelle: Kamenz, U.: Marktforschung, 2. Auflage, Stuttgart: Schäffer-Poeschel, 2001, S. 73. Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 87 Stand: 10.10.2024 Beispiel: Der Kundenlauf im Supermarkt Quelle: Becker, W.: Beobachtungsverfahren in der demoskopischen Marktforschung, Stuttgart: Ulmer, 1973, S. 208 Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 88 Stand: 10.10.2024 Beispiele: Eye-Tracking Geräte Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 89 Stand: 10.10.2024 Eigenschaften der Arten der Befragung Befragung Beobachtung schriftlich mündlich Kosten relativ gering niedrig hoch Zeitaufwand relativ gering niedrig hoch evtl. Genauigkeit groß evtl. ungenau ungenau zeitliche evtl. längere aktuell i.d.R. aktuell Nähe Rücklaufzeit Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 90 Stand: 10.10.2024 Fazit: Beobachtung versus Befragung Beobachtung sinnvoll zur Erfassung von tatsächlichem Verhalten (objektiv) Befragung sinnvoll zur Erfassung von Präferenzen, Einstellungen, Erinnerung (subjektiv) Viele Merkmale lassen sich nicht durch Beobachtung messen. Oft sind Befragungen unumgänglich. Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 91 Stand: 10.10.2024 Formen der Befragung Papierbe- Befragung fragung mündlich schriftlich (mit Interviewer) (ohne Interviewer) CAWI-Online f2f telefonisch Computer Assisted face to face Web Interviews PAPI CAPI CATI WATI Paper Assisted Computer Assisted Computer Assisted Web Assisted Personal Interviews Personal Interviews Telephone Interview Telephone Interview Quelle: Claus Braunecker: How to do Empirie, how to do SPSS, utb – facultas, Wien, S. 31 Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 92 Stand: 10.10.2024 Zusammenhang von Fragen und Skala (1/2) Nominale Fragen Wie heißen Sie? Welcher Branche gehört das Unternehmen an? Ordinale Fragen Welchen Schulabschluss haben Sie? Schätzen Sie die Aussage ein: „Die Arbeitsmarktlage heute ist schlechter als vor einem Jahr.“ dazu die Leiterskala X Trifft auf keinen Fall zu 0 1 2 3 4 5 6 7 8 9 10 Trifft auf jeden Fall zu Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 93 Stand: 10.10.2024 Zusammenhang von Fragen und Skala (2/2) Quantitative Fragen Wie alt sind Sie? Um wie viel Prozent ist der Umsatz gestiegen? Wie hoch ist Ihr monatliches Nettoeinkommen? Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 94 Stand: 10.10.2024 Entwicklung der Bedeutung der einzelnen Formen der Befragung (2000 – 2009) 50% Persönliche 40% Interviews Telefon- 30% interviews 20% Schriftliche Interviews 10% Online- Interviews 0% 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 Quelle: ADM Arbeitskreis Deutscher Markt- und Sozialforschungsinstitute e.V., http://www.adm-ev.de/ Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 95 Stand: 10.10.2024 Phasen einer statistischen Untersuchung 1. Planung 2. Datenerhebung 3. Datenaufbereitung und -darstellung 4. Datenanalyse und -interpretation Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 96 Stand:14.03.2023 Phasen einer statistischen Untersuchung 1. Planung 2. Datenerhebung 3. Datenaufbereitung und -darstellung 4. Datenanalyse und -interpretation Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 97 Stand:14.03.2023 3. Datenaufbereitung 3.1. Kontrolle der Daten 3.2. Auszählen der Daten 3.3. Tabellarische Darstellung von Daten 3.4. Graphische Darstellung von Daten Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 98 Stand:14.03.2023 3. Datenaufbereitung 3.1. Kontrolle der Daten 3.2. Auszählen der Daten 3.3. Tabellarische Darstellung von Daten 3.4. Graphische Darstellung von Daten Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 99 Stand:14.03.2023 Kontrolle der Daten Vollständigkeit der Erfassung prüfen Sind alle Merkmalsträger erfasst? Vollständigkeit der Beantwortung prüfen Liegen alle Merkmalswerte vor? Glaubwürdigkeit und Plausibilität prüfen ggf. Nacherhebung nötig! Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 100 Stand:14.03.2023 Behandlung unplausibler/fehlender Antworten Antworten wie „10-jährig“ und „verheiratet“ sind unmöglich, aber „65-jährig“ und „Student“ ist möglich. Muss-Fehler (wie 1. Antwortkombination) Hier ist zu korrigieren bzw. nachzuerheben Kann-Fehler (wie 2. Antwortkombination) Hier kann korrigiert werden. Allerdings aufwändig, da die Durchsicht des gesamten Datensatzes erforderlich sein kann Fehlende Antworten werden „sinnvoll“ ergänzt, d. h. ohne Verfälschung/Beeinflussung der Analyse. Einsetzung des Mittelwertes aus den vorhandenen Angaben Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 101 Stand:14.03.2023 3. Datenaufbereitung 3.1. Kontrolle der Daten 3.2. Auszählen der Daten 3.3. Tabellarische Darstellung von Daten 3.4. Graphische Darstellung von Daten Prof. Dr. Thomas Skill Winterssemester 2024/25 Einheit 01 Folie 102 Stand: 10.10.2024 Urliste / Statistische Reihe Urliste 𝐸𝐸1 𝐸𝐸2 ⋯ 𝐸𝐸𝑖𝑖 ⋯ 𝐸𝐸𝑛𝑛 Elemente Beobachtungs- 𝑏𝑏1 𝑏𝑏2 ⋯ 𝑏𝑏𝑖𝑖 ⋯ 𝑏𝑏𝑛𝑛 werte Die Folge der n Werte heißt Urliste (= statistische Reihe). Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 103 Stand:14.03.2023 Datenmatrix x1 xr xp E1 b11 b1r b1p Ei bi1 bir bip En bn1 bnr bnp Wechseln wir von der Urliste zur Häufigkeitstabelle betrachten wir nicht mehr die Beobachtungswerte, sondern die möglichen Merkmalsausprägungen. Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 104 Stand:14.03.2023 Häufigkeit Die Anzahl der Merkmalswerte, die die realisierte Ausprägung xi des Merkmals aufweisen, heißt (absolute) Häufigkeit des Merkmalswert. Sie wird mit h(xi) bezeichnet. Der relative (prozentuale) Anteil der Häufigkeit einer realisierten Merkmalsausprägung xi an der Gesamtzahl der Merkmalswerte heißt relative Häufigkeit f(xi). Es gilt h ( xi ) f ( xi ) = n oder h ( xi ) ( xi ) f= ⋅100 in Prozent. n Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 105 Stand:14.03.2023 Kumulierte Häufigkeit Die kumulierte absolute Häufigkeit (=absolute Summen- häufigkeit) ist k H ( xk ) = ∑ = h ( x ) ∑ h ( x ) , k ≤ n. xi ≤ x k i i= 1 i Die kumulierte relative Häufigkeit (=relative Summen- häufigkeit) ist H ( xk ) h ( xi ) k F( xk ) = = n ∑ xi ≤ x k = n ∑= f (x ) ∑f (x ). xi ≤ x k i i= 1 i Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 106 Stand:14.03.2023 Erstellen der Urliste Nr. Name, Vorname Familienstand Zahl der Kinder Tarifgruppe 1 Amberger, Heinz ledig 0 II 2 Bauer, Regine verheiratet 2 I Beispiel: 3 Bertram, Günther geschieden 1 II 4 Dünnes, Riuta ledig 0 I Familienstand, 5 Engel, Erika verheiratet 1 II Zahl der Kinder, 6 Frühauf, Ernst verwitwet 1 III und Tarifgruppe 7 Frisch, Anton verheiratet 3 II der 20 Beschäftigten 8 Gillhuber, Erwin geschieden 0 III der Firma Maier KG 9 Hell, Marion ledig 0 II 10 Jahn, Josef verheiratet 2 II 11 Kaps, Wolfgang verwitwet 0 III 12 Lechner, Ernst verheiratet 4 II 13 Maier, Waltraud ledig 0 II 14 Mayer, Elisabeht ledig 1 I 15 Pagler, Fritz ledig 1 IV 16 Polzer, Herrmann verheiratet 2 IV 17 Rabe, Armin verheiratet 3 III 18 Reiser, Gabriele geschieden 2 II 19 Schmidt, Heinz verheiratet 1 IV 20 Wenisch, Willy verheiratet 0 I s. Bourier, S. 35 Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 107 Stand:14.03.2023 1. Schritt zur Häufigkeitstabelle s. Bourier, S. 36 Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 108 Stand:14.03.2023 Häufigkeitstabelle s. Bourier, S. 37 Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 109 Stand:14.03.2023 3. Datenaufbereitung 3.1. Kontrolle der Daten 3.2. Auszählen der Daten 3.3. Tabellarische Darstellung von Daten 3.4. Graphische Darstellung von Daten Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 110 Stand:14.03.2023 Aufbau einer Tabelle DIN 55301: „Gestaltung statistischer Tabellen“ Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 111 Stand:14.03.2023 Aufbau einer Tabelle - Beispiel Die Studierendenschaft einer Hochschule soll nach Semesterzahl, Heimatland und Fachbereichszugehörigkeit gegliedert werden, und zwar in der folgenden Form: Semesterzahl: 1.- 4. Sem. / 5.- 8. Sem. / 9. und höhere Heimatland: Deutschland (D) / EU-Land (EU) / Nicht-EU (A) Fachbereiche: Rechtswiss. (R) / Math. und Naturwiss. (N) / Theologie (T) / Medizin (M) / Philosophie (P) Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 112 Stand:14.03.2023 Aufbau einer Tabelle - Übung Entwerfen Sie ein übersichtliches Tabellenschema für die Darstellung von Kraftfahrzeugzulassungszahlen für zwei Hersteller A und B, gegliedert nach Zulassungsjahr und Fahrzeugtypen (Hersteller A: 3 Typen, Hersteller B: 2 Typen). Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 113 Stand:14.03.2023 Eindimensionale Häufigkeitsverteilung Primäre Verteilungstafel Nr. Zahl der Anzahl der in % Kumulierte in % Rest Rest Kinder Beschäftigten Zahl der hfk. hfhk. Beschäftigten in % Lauf- Merkmals- absolute relative kum. absolute kum. rel. index ausprägung Häufigkeit Häufigkeit Häufigkeit Häufigkeit i xi h(xi) f(xi) H(xi) F(xi) RH RF 1 0 7 35% 7 35% 13 65% 2 1 6 30% 13 65% 7 35% 3 2 4 20% 17 85% 3 15% 4 3 2 10% 19 95% 1 5% 5 4 1 5% 20 100% 0 0% Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 114 Stand:14.03.2023 Eindimensionale Häufigkeitsverteilung Einfache Häufigkeitsverteilung Nr. Anzahl der Kinder Anzahl der in Prozent Beschäftigten Laufindex Merkmalsausprägung absolute Häufigkeit relative Häufigkeit i xi h(xi) f(xi) 1 0 7 35% 2 1 6 30% 3 2 4 20% 4 3 2 10% 5 4 1 5% 20 100% Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 115 Stand:14.03.2023 Mehrdimensionale Häufigkeitsverteilung/ Kreuztabelle Zahl der Kinder yk 5 h(𝑥𝑥𝑘𝑘 , xi i=1 0 1 2 3 4 𝑦𝑦𝑖𝑖 ) I 2 1 1 0 0 4 Tarifgruppe II 3 2 2 1 1 9 III 2 1 0 1 0 4 IV 0 2 1 0 0 3 4 h(𝑥𝑥𝑖𝑖 , 𝑦𝑦𝑘𝑘 ) 7 6 4 2 1 20 i=1 Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 116 Stand:14.03.2023 Häufigkeitstabellen sind geeignet für: nominal skalierte Daten (z.B. Familienstand) ordinal skalierte Daten (z.B. Tarifgruppe) intervall- und verhältnisskalierte Daten mit wenigen Merkmalsausprägungen (z.B. Anzahl der Kinder) Bei zu vielen Merkmalsausprägungen metrisch skalierter Daten (z.B. Größe, Rechnungsbeträge, etc.) müssen Klassen gebildet werden (Klassifizierung), um Häufigkeitsverteilungen aufstellen zu können. Durch die Klassifizierung wird der Informationsgehalt der Daten reduziert, da das Skalenniveau von metrisch auf nicht-metrisch heruntertransformiert wird. Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 117 Stand:14.03.2023 Klassifizierte Häufigkeitsverteilung Rechnungsbeträge von Kunden Nr. Rechnungs- Anzahl in Prozent Kumulierte in Prozent betrag der Zahl der von … bis unter … Kunden Kunden i xi h(xi) f(xi) H(xi) F(xi) 1 0€ 20 € 10 7% 10 7% 2 20 € 40 € 20 14% 30 21% 3 40 € 60 € 60 43% 90 64% 4 60 € 80 € 35 25% 125 89% 5 80 € 100 € 10 7% 135 96% 6 100 € 120 € 5 4% 140 100% Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 118 Stand:14.03.2023 Klassifizierte Häufigkeitsverteilung Anzahl der Klassen weniger Klassen, weniger Information Einzelfallentscheidung Klassenbreite möglichst identische Klassenbreiten Eindeutige Zuordnung der Merkmalswerte überschneidungsfreie Klassen vollständige Klassen Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 119 Stand:14.03.2023 3. Datenaufbereitung 3.1. Kontrolle der Daten 3.2. Auszählen der Daten 3.3. Tabellarische Darstellung von Daten 3.4. Graphische Darstellung von Daten Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 120 Stand:14.03.2023 Das Stab-/Balkendiagramm Tarifgruppe h(xi) 10 9 8 I 4 Anzahl 6 4 4 II 9 4 3 2 III 4 0 I II III IV IV 3 Tarifgruppe Eignung für qualitative Merkmale und diskrete, nicht-klassifizierte Merkmale Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 121 Stand:14.03.2023 Das Kreisdiagramm Kapital Mio. € Eigenkapital 43,3 Eigenkapital 70,9% Rückstellungen 3,9 Rückstellung en 22,7% Verbindlichkeiten 13,9 6,4% Eignung für qualitative Merkmale und diskrete, nicht-klassifizierte Merkmale für die Angabe relativer Häufigkeiten Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 122 Stand:14.03.2023 Das Histogramm Rechnungsbetrag Anzahl 70 von … bis unter … der 60 Anzahl der Rechnungen Kunden 50 40 0€ 20 € 10 30 20 20 € 40 € 20 10 40 € 60 € 60 0 0,00 - 20,00 - 40,00 - 60,00 - 80,00 - 60 € 80 € 35 19,99 39,99 59,99 79,99 99,99 Rechnungsbetrag in € 80 € 100 € 10 Eignung für klassifizierte Merkmale (Daten der x-Achse sind metrisch) Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 123 Stand:14.03.2023 Der Polygonzug Rechnungs- Klassen Anzahl betrag mitte der 70 von … bis unter … xi‘ Rechnungen 60 50 Rechnungen Anzahl der 0€ 20 € 10 € 10 40 30 20 € 40 € 30 € 20 20 40 € 60 € 50 € 60 10 0 60 € 80 € 70 € 35 0 20 40 60 80 100 Rechnungsbetrag in € 80 € 100 € 90 € 10 Eignung für klassifizierte Merkmale (Daten der x-Achse sind metrisch) Vergleich mit anderen Häufigkeitsverteilungen Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 124 Stand:14.03.2023 Empirische Verteilungsfunktion (Treppenfunktion) Tarifgruppe h(xi) H(xi) 25 Anzahl der Mitarbeiter 20 I 4 4 15 II 9 13 10 5 III 4 17 0 IV 3 20 0 1 2 3 4 Tarifgruppe Eignung für ordinal-skalierte und diskrete, nicht-klassifizierte Merkmale Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 125 Stand:14.03.2023 Empirische Verteilungsfunktion (Summenpolygon) Forderung h(xi) H(xi) F(xi) 1 Anteil an Forderungen von … bis unter 0,8 50 100 15 15 0,06 0,6 100 200 50 65 0,27 0,4 200 300 80 145 0,59 0,2 300 400 40 185 0,76 0 400 600 40 225 0,92 0 200 400 600 800 1000 600 1000 20 245 1,00 Forderungsbetrag Eignung für klassifizierte Häufigkeitsverteilungen Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 126 Stand:14.03.2023 Phasen einer statistischen Untersuchung 1. Planung 2. Datenerhebung 3. Datenaufbereitung und -darstellung 4. Datenanalyse und -interpretation Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 127 Stand:14.03.2023 Learning outcomes / Lernergebnisse Bis zum Ende der Vorlesung werden Sie in der Lage sein Daten zu kontrollieren und auszuzählen, Daten tabellarisch darzustellen, Daten graphisch darzustellen. Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 128 Stand:14.03.2023 Datenanalyse und -interpretation Analyse der Eigenschaften der Häufigkeitsverteilung Lage und Struktur der Häufigkeitsverteilung (Mittelwerte, Quartile, Streuungs-, Schiefe- und Wölbungsmaße, Konzentrationsmaße) Bildung von Relationen von Zahlen Verhältniszahlen und Indexzahlen Zeitreihenanalyse Ermittlung von Trends und Schwankungen Analyse des Zusammenhangs zwischen Merkmalen Korrelations- und Regressionsanalyse Prof. Dr. Thomas Skill Sommersemester 2023 Einheit 01 Folie 129 Stand:14.03.2023