Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

Document Details

StrongEuropium4531

Uploaded by StrongEuropium4531

Universität Augsburg

2024

Tags

stochastic processes statistics mathematics

Full Transcript

Mathematik II – Teil Stochastik Stochastik für Wirtschaftsingenieure Stochastik für MSE Stochastik für Wirtschaftsinformatik Sommersemester 2024 Kapitel 0: Organisatorisches Prof. Dr. Andreas Rathgeber Dr.-Ing. Amelie Schischke Gliede...

Mathematik II – Teil Stochastik Stochastik für Wirtschaftsingenieure Stochastik für MSE Stochastik für Wirtschaftsinformatik Sommersemester 2024 Kapitel 0: Organisatorisches Prof. Dr. Andreas Rathgeber Dr.-Ing. Amelie Schischke Gliederung 0. Organisatorisches 0.1. Vorstellung Prof. Dr. Rathgeber und Dr.-Ing. Schischke 0.2. Vorlesung und Übungen 0.3. Klausur 0.4. Lehrmaterialien 1. Deskriptive Statistik 2. Wahrscheinlichkeitstheorie 3. Induktive Statistik 2 Mathematik II - Teil Stochastik Sommersemester 2024 Gliederung 0. Organisatorisches 0.1. Vorstellung Prof. Dr. Rathgeber und Dr.-Ing. Schischke 0.2. Vorlesung und Übungen 0.3. Klausur 0.4. Lehrmaterialien 1. Deskriptive Statistik 2. Wahrscheinlichkeitstheorie 3. Induktive Statistik 3 Mathematik II - Teil Stochastik Sommersemester 2024 Vorstellung Prof. Dr. Rathgeber & Dr.-Ing. Schischke Prof. Dr. Andreas Rathgeber Dr.-Ing. Amelie Schischke Gebäude W, Raum 3009 Email: [email protected] Am Technologiezentrum 8 Telefon: +49 821 598 - 69193 86159 Augsburg Gebäude W, Raum 3004 Sprechzeiten: Nach Vereinbarung Am Technologiezentrum 8 86159 Augsburg Sprechzeiten: Nach Vereinbarung 4 Mathematik II - Teil Stochastik Sommersemester 2024 Gliederung 0. Organisatorisches 0.1. Vorstellung Prof. Dr. Rathgeber und Dr.-Ing. Schischke 0.2. Vorlesung und Übungen 0.3. Klausur 0.4. Lehrmaterialien 1. Deskriptive Statistik 2. Wahrscheinlichkeitstheorie 3. Induktive Statistik 5 Mathematik II - Teil Stochastik Sommersemester 2024 Die Vorlesung Dozierende: Prof. Dr. Andreas Rathgeber, Dr.-Ing. Amelie Schischke Termin: Donnerstag, 14:00 - 15:30 Uhr (wöchentlich ab 18.04.2024) Achtung: an Christi Himmelfahrt (09.05.2024) und an Fronleichnam (30.05.2024) entfällt die Vorlesung! Freitag, 15:45 – 17:15 Uhr (Puffertermine, bitte Ablaufplan in Digicampus beachten) Raum: C HS II Hinweis: Die aktuellen Vorlesungsunterlagen sind über Digicampus erhältlich. Für organisatorische Fragen zur Vorlesung steht Ihnen Matteo Ligorati gerne zur Verfügung ([email protected]). Aktuelle Informationen werden grundsätzlich über Digicampus veröffentlicht. 6 Mathematik II - Teil Stochastik Sommersemester 2024 Zeitplan Stochastik Vorlesung Datum Kalenderwoche Thema in der Vorlesung 1.1.1 Begrifflichkeiten 18.04.2024 KW 16 1.1.2 Häufigkeiten 1.2 Graphen 1.3 Lage und Streuung 19.04.2024 KW 16 1.4 Bivariate Kennzahlen 2.0 Mengenlehre 25.04.2024 KW 17 2.1 Wahrscheinlichkeitsräume 2.2 Bedingte Wahrscheinlichkeit 26.04.2024 KW 17 2.3 Zufallsvariablen 2.4 Dichte 2.5.1 Erwartung 02.05.2024 KW 18 2.5.2 Varianz 2.5.3 Kovarianz 2.6.1 Diskrete Gleichverteilung 2.6.2 Binomialverteilung 03.05.2024 KW 18 2.6.3 Poissonverteilung 2.6.4 Stetige Gleichverteilung 2.6.5 Exponentialverteilung 7 Mathematik II - Teil Stochastik Sommersemester 2024 Zeitplan Stochastik Vorlesung Datum Kalenderwoche Thema in der Vorlesung 09.05.2024 KW 19 Christi Himmelfahrt – Vorlesung entfällt 2.6.6 Weibullverteilung 16.05.2024 KW 20 2.6.7 Normalverteilung 2.6.8 Testverteilungen 23.05.2024 KW 21 2.7 Wichtige Theoreme 30.05.2024 KW 22 Fronleichnam – Vorlesung entfällt 3.1 Begrifflichkeiten 07.06.2024 KW 23 3.2 Inklusionsschlüsse 13.06.2024 KW24 3.3 Repräsentationsschlüsse 14.06.2024 KW 24 3.4 Statistische Hypothesentests 20.06.2024 KW 25 3.4 Statistische Hypothesentests 27.06.2024 KW 26 3.4 Statistische Hypothesentests 04.07.2024 KW 27 3.4 Statistische Hypothesentests 11.07.2024 KW 28 Probeklausur 8 Mathematik II - Teil Stochastik Sommersemester 2024 Übung Termine: Montag, 10:00 – 11:30 Uhr, W-1020 Mittwoch, 12:15 – 13:45 Uhr, W-1019 Donnerstag, 15:45 –17:15 Uhr, T-1003 Freitag, 10:00 – 11:30, W-1020 Hinweis: Die Übungsblätter sind über Digicampus erhältlich. Matteo Ligorati E-Mail: [email protected] Gebäude W, Am Technologiezentrum 8, Raum 3001 Dr.-Ing. Florian Schmid E-Mail: [email protected] Gebäude W, Am Technologiezentrum 8, Raum 3005 Andreas Maulberger E-Mail: [email protected] Gebäude W, Am Technologiezentrum 8, Raum 3001 9 Mathematik II - Teil Stochastik Sommersemester 2024 Zeitplan Stochastik Übung Datum Übungsblatt Raum 22.04.2024 1 W-1020 24.04.2024 1 W-1019 25.04.2024 1 T-1003 26.04.2024 1 W-1020 29.04.2024 2 W-1020 01.05.2024 Tag der Arbeit – Übung entfällt 02.05.2024 2 T-1003 03.05.2024 2 W-1020 06.05.2024 3 W-1020 08.05.2024 2 W-1019 09.05.2024 Christi Himmelfahrt – Übung entfällt 10.05.2024 Brückentag – Übung entfällt 10 Mathematik II - Teil Stochastik Sommersemester 2024 Zeitplan Stochastik Übung Datum Übungsblatt Raum 13.05.2024 4 W-1020 15.05.2024 3 W-1019 16.05.2024 3 T-1003 17.05.2024 3 W-1020 20.05.2024 Pfingstmontag – Übung entfällt 22.05.2024 4 W-1019 23.05.2024 4 T-1003 24.05.2024 4 W-1020 27.05.2024 5 W-1020 29.05.2024 5 W-1019 30.05.2024 Fronleichnam – Übung entfällt 31.05.2024 Brückentag – Übung entfällt 11 Mathematik II - Teil Stochastik Sommersemester 2024 Zeitplan Stochastik Übung Datum Übungsblatt Raum 03.06.2024 6 W-1020 05.06.2024 6 W-1019 06.06.2024 5 T-1003 07.06.2024 5 W-1020 10.06.2024 7 W-1020 12.06.2024 7 W-1019 13.06.2024 6 T-1003 14.06.2024 6 W-1020 17.06.2024 8 W-1020 19.06.2024 8 W-1019 20.06.2024 7 T-1003 21.06.2024 7 W-1020 12 Mathematik II - Teil Stochastik Sommersemester 2024 Zeitplan Stochastik Übung Datum Übungsblatt Raum 24.06.2024 9 W-1020 26.06.2024 9 W-1019 27.06.2024 8 T-1003 28.06.2024 8 W-1020 01.07.2024 10 W-1020 03.07.2024 10 W-1019 04.07.2024 9 T-1003 05.07.2024 9 W-1020 11.07.2024 10 T-1003 12.07.2024 10 W-1020 13 Mathematik II - Teil Stochastik Sommersemester 2024 Gliederung 0. Organisatorisches 0.1. Vorstellung Prof. Dr. Rathgeber und Dr.-Ing. Schischke 0.2. Übungen 0.3. Klausur 0.4. Lehrmaterialien 1. Deskriptive Statistik 2. Wahrscheinlichkeitstheorie 3. Induktive Statistik 14 Mathematik II - Teil Stochastik Sommersemester 2024 Klausur Der Klausurtermin wird noch bekannt gegeben. Allgemein: Diese Veranstaltung beinhaltet den Teil "Stochastik" von Prof. Rathgeber des Moduls Mathematik II (MRM-1001) des Studiengangs WING (PO 21). Für den Teil "Lineare Algebra und Optimierung" von Prof. Klein des Moduls Mathematik II (MRM-1001) des Studiengangs WING (PO 21) gibt es eine separate Veranstaltung. Studierende des Studiengangs WING (PO 15) können diese Veranstaltung als Modul MRM-0002 „Statistik" belegen. Studierende des Studiengangs MSE können diese Veranstaltung als Modul MRM-0148 "Stochastik für MSE" belegen. Studierende des Studiengangs WIN (PO 22) können diese Veranstaltung als Modul MRM-0145 "Stochastik" belegen. Modul Mathematik II (8 ECTS): Am Ende des Semesters wird eine gemeinsame Klausur, 90 Minuten, zu Mathematik II gestellt. Dabei werden zum Teil „Lineare Algebra und Optimierung“ sowie zum Teil „Stochastik“ Aufgaben mit Umfang von je 45 Minuten abgefragt. Modul Stochastik WING (5 ECTS): Am Ende des Semesters wird eine Klausur im Umfang von 60 Minuten gestellt. Modul Stochastik WIN (5 ECTS): Am Ende des Semesters wird eine Klausur im Umfang von 60 Minuten gestellt. Modul Stochastik für MSE (6 ECTS): Am Ende des Semesters wird eine Klausur im Umfang von 60 Minuten gestellt. 15 Mathematik II - Teil Stochastik Sommersemester 2024 Zwischentest Im Vorfeld der Klausur kann durch erfolgreiches Bestehen eines sogenannten „Zwischentests“ Zusatzpunkte für die reguläre Klausur gesammelt werden. Der Zwischentest behandelt dabei den aktuellen Vorlesungs- und Übungsstoff. Der Inhalt wird in der Vorlesung bekanntgeben. Für den Zwischentest muss man sich in Digicampus anmelden (diese Anmeldung ersetzt nicht die Prüfungsmeldung über Studis) Eine (erfolgreiche) Teilnahme am Zwischentest ist keine Zulassungsvoraussetzung für die Klausur, bietet aber die Möglichkeit Zusatzpunkte zu sammeln und damit die eigene Note zu verbessern. Der Zwischentest findet am 16.05.2024 im Vorlesungsslot statt. 16 Mathematik II - Teil Stochastik Sommersemester 2024 Zwischentest Verteilung der Bonuspunkte Punkte im Bonuspunkte Bonuspunkte Zwischentest (45 min Klausur) (60 min Klausur) 15 5 6 14.5 5 6 14 5 6 13.5 2.5 3 13 2.5 3 12.5 2.5 3 12 2.5 3 11.5 2 2.5 11 2 2.5 10.5 1.5 2 10 1.5 2 9.5 1 1.5 9 1 1.5 8.5 0.5 1 8 0.5 1 7.5 0.5 0.5 7-0 0 0 17 Mathematik II - Teil Stochastik Sommersemester 2024 Klausur Der Klausurtermin wird noch bekannt gegeben. Anmeldung: Anmeldung erfolgt über. Anmeldephase für reguläre Prüfungen: 06.06.24 – 17.06.24. (Start und Ende jeweils 12.00 Uhr Mittags!) Erlaubte Hilfsmittel: Taschenrechner: Nicht programmierbar, keine Grafikfähigkeit, keine Möglichkeit Ableitungen oder Integrale zu lösen, keine Möglichkeit mithilfe einer SOLVE-, CALC- oder ähnlichen Taste Gleichungen zu lösen, nicht finanzmathematisch: https://www.uni-augsburg.de/de/fakultaet/mntf/mrm/prof/fimgt/lehre/taschenrechner/ Formelsammlung: steht digital im Digicampus zur Verfügung; muss eigenständig geheftet zur Klausur mitgebracht werden; farbige Markierungen sind erlaubt, schriftliche Ergänzungen (auch während der Klausur!) untersagt. Keine Open-Book Klausur! Selbst mitgebrachtes Papier darf nicht verwendet werden! Einbringbarkeit: Bachelor-Studiengang Wirtschaftsingenieur, Materials Science and Engineering, Wirtschaftsinformatik. Es wird eine Wiederholungsprüfung gegen Ende der vorlesungsfreien Zeit angeboten. 18 Mathematik II - Teil Stochastik Sommersemester 2024 Klausureinsicht Informationen zur Klausureinsicht werden zu gegebener Zeit auf der Homepage der Lehrstuhls veröffentlicht. Die Meldungen für Studierende befinden sich relativ weit unten auf der Website. https://www.uni-augsburg.de/de/fakultaet/mntf/mrm/prof/fimgt/willkommen 19 Mathematik II - Teil Stochastik Sommersemester 2024 Notenverteilung (SS23) Notenverteilung Sommersemester 2023 45 41 40 35 30 25 Anzahl 20 14 ∅3,88 15 10 10 10 9 7 6 5 5 5 3 3 2 2 0 1 1.3 1.7 2 2.3 2.7 3 3.3 3.7 4 4.3 4.7 5 Notenskala 20 Mathematik II - Teil Stochastik Sommersemester 2024 Gliederung 0. Organisatorisches 0.1. Vorstellung Prof. Dr. Rathgeber und Dr.-Ing. Schischke 0.2. Übungen 0.3. Klausur 0.4. Lehrmaterialien 1. Deskriptive Statistik 2. Wahrscheinlichkeitstheorie 3. Induktive Statistik 21 Mathematik II - Teil Stochastik Sommersemester 2024 Lehrmaterialien Literaturempfehlungen: Max C. Wewel: Statistik im Bachelor-Studium der BWL und VWL, Pearson Verlag. Andreas Quatember: Statistik ohne Angst vor Formeln, Pearson Verlag. Wichtiger Hinweis: Die Vorlesungsunterlagen dienen der Reduktion des Mitschreibeaufwands und ersetzen weder den Besuch der Vorlesung/Übung noch das Studium der empfohlenen bzw. beigelegten Literatur. 22 Mathematik II - Teil Stochastik Sommersemester 2024 Mathematik II - Teil Stochastik Sommersemester 2024 Kapitel 1: Deskriptive Statistik Prof. Dr. Andreas Rathgeber Dr.-Ing. Amelie Schischke Veranstaltungsübersicht Stochastik Statistik Wahrscheinlichkeits- Rechnung Deskriptive Statistik 1 Induktive Statistik 3 2 auch beschreibende Statistik auch mathematische Statistik, auch Wahrscheinlichkeitstheorie: oder empirische Statistik: schließende Statistik oder Als Teilgebiet der Mathematik dient sie Daten werden in geeigneter Inferenzstatistik): der Formalisierung, der Modellierung Weise beschrieben, aufbereitet In der Induktiven Statistik leitet und der Untersuchung von und zusammengefasst. Mit man aus den Daten einer Zufallsgeschehen. ihren Methoden verdichtet man Stichprobe Eigenschaften einer quantitative Daten zu Tabellen, Grundgesamtheit ab. Die Wahrscheinlichkeitstheorie liefert graphischen Darstellungen und die Grundlagen für die erforderlichen Kennzahlen. Schätz- und Testverfahren der induktiven Statistik. 24 Mathematik II - Teil Stochastik Sommersemester 2024 Gliederung 0. Organisatorisches 1. Deskriptive Statistik 1.1. Begrifflichkeiten 1.2. Graphische Darstellung: Balken-, Kreisdiagramme, Histogramme, Boxplots 1.3. Kennzahlen: Lage- und Streuungsmaße 1.4. Unabhängigkeit, Kontigenzmaße, Kovarianz, Korrelationskoeffizient 2. Wahrscheinlichkeitstheorie 3. Induktive Statistik 25 Mathematik II - Teil Stochastik Sommersemester 2024 Fragen dieses Kapitels 1. Kapitel 3. Kapitel 2. Kapitel ? Wie können Informationen unter Zuhilfenahme geeigneter Aggregations- mechanismen verdichtet werden? Welcher Informationsverlust entsteht dabei? ? Wie lassen sich die verdichteten Informationen graphisch darstellen? ? Wie lassen sich bivariate Zusammenhänge erkennen? 26 Mathematik II - Teil Stochastik Sommersemester 2024 Gliederung 0. Organisatorisches 1. Deskriptive Statistik 1.1. Begrifflichkeiten 1.2. Graphische Darstellung: Balken-, Kreisdiagramme, Histogramme, Boxplots 1.3. Kennzahlen: Lage- und Streuungsmaße 1.4. Unabhängigkeit, Kontigenzmaße, Kovarianz, Korrelationskoeffizient 2. Wahrscheinlichkeitstheorie 3. Induktive Statistik 27 Mathematik II - Teil Stochastik Sommersemester 2024 Mathematische Grundlagen (I-1): Abbildungen Definition Seien 𝐴 und 𝐵 zwei beliebige Mengen. Eine Abbildung 𝑓: 𝐴 ⟶ 𝐵, 𝑎 ↦ 𝑓(𝑎) [ = 𝑏] ordnet jedem Element 𝑎 ∈ 𝐴 ein Element 𝑏 ∈ 𝐵 zu. 𝐴 heißt Urbildbereich und 𝐵 heißt Bildbereich der Abbildung 𝑓. Ist 𝑓(𝑎) = 𝑏, so heißt 𝑏 das Bild zu 𝑎, und 𝑎 heißt ein Urbild zu 𝑏. Bemerkung: Sei 𝑓 ∶ 𝐴 ⟶ 𝐵 eine beliebige Abbildung. Dann existiert zu jedem Urbildelement 𝑎 ∈ 𝐴 ein eindeutiges Bildelement 𝑏 ∈ 𝐵. Umgekehrt ist dies jedoch nicht der Fall: Zu einem Bildelement 𝑏 ∈ 𝐵 können mehrere Urbildelemente 𝑎 ∈ 𝐴 (oder auch gar keins) existieren. Die Menge aller Urbilder von 𝑏 wird mit 𝑓 −1 (𝑏) bezeichnet. Für jedes 𝑎 ∈ 𝐴 ist dann also 𝑓(𝑎) ein Element aus 𝐵 (also 𝑓(𝑎) ∈ 𝐵), und für jedes 𝑏 ∈ 𝐵 ist 𝑓 −1 (𝑏) eine Menge von Elementen aus 𝐴 (also 𝑓 −1 (𝑏) ⊆ 𝐴, ggf. 𝑓 −1 𝑏 = { }). 28 Mathematik II - Teil Stochastik Sommersemester 2024 Mathematische Grundlagen (I-2): Abbildungen Definition Eine Abbildung 𝑓: 𝐴 ⟶ 𝐵 heißt injektiv, falls zu jedem Bildelement 𝑏 ∈ 𝐵 höchstens ein Urbildelement 𝑎 ∈ 𝐴 existiert, so dass 𝑓(𝑎) = 𝑏 ist, d.h. es gilt: Unterschiedliche Urbilder werden auf unterschiedliche Bilder abgebildet. Anders- herum formuliert, gleiche Bilder können auf gleiche Urbilder zurückgeführt werden: 𝑓 𝑎1 = 𝑓 𝑎2 ⇒ 𝑎1 = 𝑎2 für alle 𝑎1 , 𝑎2 ∈ 𝐴. 𝐴 𝐵 a1 b1 a2 b2 a3 b3 b4 injektiv 29 Mathematik II - Teil Stochastik Sommersemester 2024 Mathematische Grundlagen (I-3): Abbildungen Definition Eine Abbildung 𝑓: 𝐴 ⟶ 𝐵 heißt surjektiv, falls zu jedem Bildelement 𝑏 ∈ 𝐵 mindestens ein Urbildelement 𝑎 ∈ 𝐴 existiert, so dass 𝑓(𝑎) = 𝑏. Eine Abbildung 𝑓: 𝐴 ⟶ 𝐵 heißt bijektiv, falls zu jedem Bildelement 𝑏 ∈ 𝐵 genau ein Urbildelement 𝑎 ∈ 𝐴 existiert, so dass 𝑓(𝑎) = 𝑏. Eine Abbildung ist genau dann bijektiv, wenn sie injektiv und surjektiv ist. 𝐴 𝐵 𝐴 𝐵 a1 b1 a1 b1 a2 b2 a2 b2 a3 b3 a3 b3 a4 a4 b4 surjektiv bijektiv 30 Mathematik II - Teil Stochastik Sommersemester 2024 Mathematische Grundlagen (II): Mächtigkeit Definition Sei 𝐴 eine beliebige Menge. 𝐴 heißt endlich, falls 𝐴 über eine endliche Anzahl von Elementen verfügt; in diesem Fall heißt die Zahl der Elemente Mächtigkeit von 𝐴 und wird mit 𝐴 bezeichnet. Andernfalls heißt 𝐴 unendlich, in Zeichen: |𝐴| = ∞. Definition Sei 𝐴 eine unendliche Menge. 𝐴 heißt abzählbar unendlich, falls eine bijektive Abbildung 𝑓: 𝐴 ⟶ ℕ existiert, d.h. die (unendlich vielen) Elemente von 𝐴 eindeutig nummeriert werden können, so dass jede Nummer genau einmal vergeben ist. Ist dies nicht möglich, so heißt 𝐴 überabzählbar. Eine abzählbare Menge ist entweder endlich oder abzählbar unendlich. 31 Mathematik II - Teil Stochastik Sommersemester 2024 Begrifflichkeiten (I-1) Definition Gegenstand einer jeden statistischen Untersuchung sind gewisse Objekte, bei denen man sich für bestimmte Eigenschaften interessiert. Diese Eigenschaften heißen Merkmale (z.B. Geschlecht); sie können in verschiedenen (Merkmals-)Ausprägungen auftreten (z.B. männlich/weiblich/divers). Die untersuchten Objekte werden als Merkmalsträger (z.B. Personen) bezeichnet, und die Menge aller Merkmalsträger ist in der Population bzw. Grundgesamtheit (z.B. Bevölkerung in Deutschland) zusammengefasst. Wichtig hierbei ist, dass die Zuordnung der Merkmalausprägung zu den Merkmalsträgern eindeutig sein muss (eine Person kann nicht männlich und weiblich sein). Durch die statistische Untersuchung entsteht eine Reihe von Beobachtungswerten, die nun mithilfe der deskriptiven Statistik quantitativ analysiert werden kann. 32 Mathematik II - Teil Stochastik Sommersemester 2024 Begrifflichkeiten (I-2) Notation: Die Population sei im Folgenden mit 𝑃 ∶= {𝑝1, … 𝑝𝑛} bezeichnet, wobei 𝑛 für die Größe der Population steht. Die Menge der verschiedenen (theoretischen) Merkmalsausprägungen sei mit 𝑀 bezeichnet; für eine endliche Zahl von möglichen Merkmalsausprägungen sei 𝑀 ∶= {𝑚1, … , 𝑚𝑘 }, bzw. im abzählbar unendlichen Fall 𝑀 ∶= {𝑚1, 𝑚2, … }. Die (realisierten) Beobachtungswerte der einzelnen Merkmalsträger seien mit (𝑥1, … , 𝑥𝑛) bezeichnet; dabei ist offensichtlich 𝑥𝑖 ∈ 𝑀 für alle 𝑖 ∈ {1, … , 𝑛}. Die Anzahl der Beobachtungsobjekte, die Merkmal 𝑚𝑗 aufweisen, sei mit 𝑛𝑗 bezeichnet. Merkmalsträger bzw. realisierte Merkmalsausprägungen werden mit 𝑖 indiziert (also 𝑝𝑖 bzw. 𝑥𝑖 ), theoretische Merkmalsausprägungen mit 𝑗 (also 𝑚𝑗). 33 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel: Begrifflichkeiten Beispiel: Geplanter Spezialisierungsbereich des WING-Studiengangs an der Universität Augsburg Grundgesamtheit: Menge der 150 immatrikulierten WING- Studenten, Studierende, also etwa 𝑃 ≔ 𝑆𝑡𝑢𝑑𝑒𝑛𝑡 1, … , 𝑆𝑡𝑢𝑑𝑒𝑛𝑡 150 Merkmal: geplanter Spezialisierungsbereich Menge der Merkmalsausprägungen: 𝑀𝑎𝑡𝑒𝑟𝑖𝑎𝑙𝑠 𝐸𝑛𝑔𝑖𝑛𝑒𝑒𝑟𝑖𝑛𝑔 & 𝐷𝑖𝑔𝑖𝑡𝑖𝑧𝑎𝑡𝑖𝑜𝑛 (𝑀𝐸𝐷); 𝑀𝑎𝑡𝑒𝑟𝑖𝑎𝑙𝑠 𝑆𝑐𝑖𝑒𝑛𝑐𝑒 & 𝐶ℎ𝑒𝑚𝑖𝑠𝑡𝑟𝑦 (𝑀𝑆𝐶); 𝑀≔. … 𝐸𝑐𝑜𝑛𝑜𝑚𝑖𝑐𝑠 (𝐸) Konkrete Beobachtungswerte: (z.B.) 𝑥1 , … , 𝑥150 = 𝐸, 𝑀𝑆𝐶, 𝐸, 𝑀𝐸𝐷, … , 𝐹𝐴𝐶𝑇, 𝐸. 34 Mathematik II - Teil Stochastik Sommersemester 2024 Begrifflichkeiten (II) Definition Ein Merkmal heißt quantitativ, falls sich die Merkmalsausprägungen in einer sinnvollen Weise numerisch ausdrücken lassen; ansonsten heißt es qualitativ. Anmerkung: Oftmals werden qualitative Merkmale (z.B. Farben) durch Zahlen codiert (z.B.: 𝑟𝑜𝑡 = 1, 𝑏𝑙𝑎𝑢 = 2, 𝑔𝑒𝑙𝑏 = 3); dies ändert jedoch nichts an der qualitativen Natur des Merkmals! 35 Mathematik II - Teil Stochastik Sommersemester 2024 Begrifflichkeiten (III) Definition Ein Merkmal heißt diskret, falls die Menge 𝑀 der theoretisch möglichen Merkmals- ausprägungen höchstens abzählbar ist. Andernfalls heißt es kontinuierlich. Anmerkung: In der Literatur werden kontinuierliche Merkmale meist als stetig bezeichnet. Dies ist jedoch hinsichtlich der mathematischen Definition von Stetigkeit (im Zusammenhang mit Funktionen) irreführend. Im Folgenden werden wir daher immer den Begriff kontinuierlich gebrauchen. 36 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel: Begrifflichkeiten Beispiel: Quantitative vs. qualitative Merkmale Quantitativ: physikalische Messwerte Qualitativ: Farben Beispiel: Diskrete vs. kontinuierliche Merkmale Diskret: Jahresumsatz (auf Cent genau) Kontinuierlich: Erzgehalt (prinzipiell beliebig genau messbar) Bemerkung: Streng genommen handelt es sich bei Geldbeträgen, sofern sie nur auf Cent genau angegeben werden, um diskrete Merkmale; in der Praxis werden Geldbeträge jedoch meistens als kontinuierlich angenommen. 37 Mathematik II - Teil Stochastik Sommersemester 2024 Begrifflichkeiten (IV): Skalierung Definition Ein Merkmal mit Menge der möglichen Ausprägungen 𝑀 heißt nominal skaliert, falls keine inhärente Ordnungsstruktur existiert. 𝑀 heißt ordinal skaliert, falls eine (natürliche) Ordnung ≤ auf 𝑀 existiert, d.h. die Elemente von 𝑀 können in eine sinnvolle Reihenfolge gebracht werden, etwa: 𝑚1 ≤ 𝑚2 ≤ 𝑚3 ≤ ⋯ Falls darüber hinaus Differenzen in 𝑀 sinnvoll interpretiert werden können, so liegt eine Differenzskala bzw. Intervallskala vor. Falls darüber hinaus Quotienten in 𝑀 sinnvoll interpretiert werden können, so liegt eine Verhältnisskala vor. Insbesondere existiert auf einer Verhältnisskala ein natürlicher Nullpunkt. 38 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel: Skalierung Beispiel: Skalierung Nominalskala: Produktnummern; Farben Ordinalskala: Schulnoten; Präferenzen; Bundesligatabelle Differenzskala: Temperatur (Celsius und Fahrenheit); IQ-Skala Verhältnisskala: Temperatur (Kelvin); Geschwindigkeit; Länge; Alter Achtung: Je nach Skala sind unterschiedliche Rechenoperationen möglich. 39 Mathematik II - Teil Stochastik Sommersemester 2024 Begrifflichkeiten (V): Messung Definition Unter einer statistischen Messung versteht man die (eindeutige!) Zuordnung von Merkmalsausprägungen zu den einzelnen Beobachtungsobjekten. Formal handelt es sich also hierbei um eine Abbildung 𝑓: 𝑃 ⟶ 𝑀, 𝑝𝑖 ↦ 𝑥𝑖. Bemerkung: Die Anzahl 𝑛𝑗 der jeweiligen Merkmalsträger, die das Merkmal 𝑚𝑗 aufweisen, ergibt sich dann als die Mächtigkeit der Urbildmenge von 𝑚𝑗 : 𝑛𝑗 = 𝑓 −1 𝑚𝑗 = 𝑥𝑖 𝑥𝑖 = 𝑚𝑗 , 𝑗 = 1, … , 𝑘. Beispiel: Rohstoffvorkommen in Chile Population: 𝑃 ≅ Rohstoffvorkommen in Chile (Minen) Merkmal: Geförderter Rohstoff Merkmalsausprägungen: 𝑀 = 𝐾𝑢𝑝𝑓𝑒𝑟, 𝐺𝑜𝑙𝑑, 𝑆𝑖𝑙𝑏𝑒𝑟, 𝐾𝑜ℎ𝑙𝑒, 𝐸𝑖𝑠𝑒𝑛𝑒𝑟𝑧 𝒏𝟏 = 𝒇−𝟏 𝒎𝟏 : Anzahl der Kupfervorkommen in Chile 40 Mathematik II - Teil Stochastik Sommersemester 2024 Begrifflichkeiten (VI-1): Häufigkeiten Definition Sei (𝑥1 , … , 𝑥𝑛 ) eine Reihe von Beobachtungswerten eines diskreten Merkmals. Die Anzahlen 𝑛𝑗 der Merkmalsträger, bei denen die Ausprägung 𝑚𝑗 beobachtet wird, heißen absolute Häufigkeiten. Durch Division durch die Populationsgröße 𝑛 erhält man die relativen Häufigkeiten ℎ𝑗, also den Anteil der Merkmalsträger, die die Ausprägung 𝑚𝑗 aufweisen: 𝑛𝑗 ℎ𝑗 =. 𝑛 Durch die Abbildung 𝑚𝑗 ↦ ℎ𝑗 ergibt sich eine Häufigkeitsverteilung. 41 Mathematik II - Teil Stochastik Sommersemester 2024 Begrifflichkeiten (VI-2): Häufigkeiten Bemerkung: Definitionsgemäß summieren sich für diskrete Merkmale die relativen Häufigkeiten zu 1 auf: 𝑘 ෍ ℎ𝑗 = 1 𝑗=1 bzw., für den abzählbar unendlichen Fall, ∞ ෍ ℎ𝑗 = 1. 𝑗=1 Die Bildung von relativen Häufigkeiten erleichtert den Vergleich von Verteilungen, geht jedoch auch mit einem Informationsverlust einher (nämlich die Populationsgröße 𝑛). 42 Mathematik II - Teil Stochastik Sommersemester 2024 Begrifflichkeiten (VI-3): Häufigkeiten Definition Gegeben seien eine Population 𝑃 der Größe |𝑃| = 𝑛, ein ordinal skaliertes, diskretes Merkmal mit der Menge 𝑀 = {𝑚1, 𝑚2, 𝑚3, … } der Merkmalsausprägungen und einer Ordnung ≤ (also etwa 𝑚1 ≤ 𝑚2 ≤ 𝑚3 ≤ ⋯). Dann lassen sich neben den relativen auch die kumulierten Häufigkeiten 𝐻𝑗 bilden. Dabei gibt 𝐻𝑘 denjenigen Populationsanteil an, deren Merkmalsausprägung höchstens 𝑚𝑘 beträgt: 𝑘 𝑓 −1 𝑚1 , … , 𝑚𝑘 𝑥𝑗 𝑥𝑗 ≤ 𝑚𝑘 𝐻𝑘 = = = ෍ ℎ𝑗. 𝑛 𝑛 𝑗=1 43 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel: Häufigkeiten Beispiel: Rohstoffvorkommen in Chile Population: 𝑃 ≅ Rohstoffvorkommen in Chile (Minen) Merkmal: Geförderter Rohstoff Merkmalsausprägungen: 𝑀 = {𝐾𝑢𝑝𝑓𝑒𝑟, 𝐺𝑜𝑙𝑑, 𝑆𝑖𝑙𝑏𝑒𝑟, 𝐾𝑜ℎ𝑙𝑒, 𝐸𝑖𝑠𝑒𝑛𝑒𝑟𝑧} Merkmalsausprägungen (sortiert) Gold Silber Eisenerz Kohle Kupfer ෍ Absolute Häufigkeit 𝑛𝑗 5 7 12 18 23 65 5 7 12 18 23 Relative Häufigkeit ℎ𝑗 = 𝑛𝑗 /𝑛 1 65 65 65 65 65 k Kumulierte 5 12 24 42 𝐻𝑘 = ෍ ℎ𝑖 1 n/a Häufigkeit 65 65 65 65 j=1 44 Mathematik II - Teil Stochastik Sommersemester 2024 Begrifflichkeiten (VII-1): Klassierung Definition Gegeben sei eine Population 𝑃 der Größe |𝑃| = 𝑛 und ein ordinal skaliertes Merkmal mit der Menge 𝑀 möglicher Merkmalsausprägungen und Messfunktion 𝑓: 𝑃 ⟶ 𝑀. Unter einer Klassierung von 𝑀 versteht man die Aufteilung von 𝑀 in Intervalle 𝐾𝑗 ≔ ൣ𝑎𝑗 ; 𝑏𝑗 ൯ = 𝑚 ∈ 𝑀 𝑎𝑗 ≤ 𝑚 < 𝑏𝑗 , 𝑗 = 1, … , 𝑘. Damit jede auftretende Merkmalsausprägung eindeutig einer Klasse zugeordnet werden kann, muss 𝑎𝑗+1 = 𝑏𝑗 für 𝑗 = 1, … , 𝑘 − 1 gelten; unter Umständen muss außerdem 𝑎1 = −∞ und 𝑏𝑘 = ∞ gesetzt werden, und die so entstandenen Klassen 𝐾1 = (−∞, 𝑏1) und 𝐾𝑘 = [𝑎𝑘, ∞) heißen Randklassen. Mit Ausnahme dieser Randklassen kann für jede Klasse 𝐾𝑗 die Klassenbreite bestimmt werden als 𝑤𝑗 = 𝑏𝑗 − 𝑎𝑗. 45 Mathematik II - Teil Stochastik Sommersemester 2024 Begrifflichkeiten (VII-2): Klassierung Definition Gegeben sei eine Population 𝑃 der Größe |𝑃| = 𝑛 und ein ordinal skaliertes Merkmal mit der Menge 𝑀 möglicher Merkmalsausprägungen, Messfunktion 𝑓: 𝑃 ⟶ 𝑀 und Klassierung 𝐾1 , … 𝐾𝑘. Für eine feste Klasse 𝐾𝑗 heißt die Anzahl 𝑛𝑗 aller Objekte, die über eine Merkmalsausprägung aus der Klasse 𝐾𝑗 verfügen, die absolute Klassenhäufigkeit 𝑛𝑗. Sie ergibt sich als Mächtigkeit der Urbildmenge von 𝐾𝑗: 𝑛𝑗 = 𝑓 −1 𝐾𝑗. Analog lassen sich die relativen Klassenhäufigkeiten ℎ𝑗 berechnen als 𝑛𝑗 ℎ𝑗 =. 𝑛 46 Mathematik II - Teil Stochastik Sommersemester 2024 Begrifflichkeiten (VII-3): Klassierung Bemerkung: Die Notwendigkeit einer Klassierung liegt in der Regel bei stetigen Merkmalen (etwa physikalische Messwerten) vor und u.U. auch bei diskreten Merkmalen mit einer sehr großen Zahl an möglichen Merkmalsausprägungen, da oftmals in solchen Fällen jede konkrete Merkmalsausprägung nur einmal auftritt. Randklassen, sofern diese vorliegen, müssen zum Zweck der statistischen Auswertung „künstlich geschlossen“ werden, um die Berechnung der Klassenbreite 𝑤𝑗 für alle Klassen 𝐾𝑗 zu ermöglichen. Nachteil: Die Wahl der Klassengrenzen beinhaltet i.d.R. eine gewissen Beliebigkeit. Jede Klassierung ist mit einem gewissen Maß an Informationsverlust verbunden, der optimalerweise durch das gewonnene Maß an Übersichtlichkeit ausgeglichen wird. Beispiel: Bei der Darstellung von Einkommensverteilungen etwa existiert keine natürlich vorgegebene obere Schranke; hier muss die letzte Klasse nach oben hin künstlich geschlossen werden. 47 Mathematik II - Teil Stochastik Sommersemester 2024 Begrifflichkeiten (VII-4): Klassierung Bemerkung: Eine Klassierung ist letztendlich nichts anderes als die Überführung einer „großen“ Menge an Merkmalsausprägungen 𝑀 in eine „kleine“ Menge 𝑀′ = {𝑚′1 , … , 𝑚′𝑘 }, wobei 𝑚′𝑗 = 𝐾𝑗 für 𝑗 = 1, … , 𝑘. Die Ordnungsstruktur ≤ auf 𝑀 bleibt dabei erhalten insofern, als dass für zwei Merkmale 𝑚1 ∈ 𝐾𝑗1 , 𝑚2 ∈ 𝐾𝑗2 gilt: 𝑚1 ≤ 𝑚2 sofern 𝑗1 ≤ 𝑗2. 48 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel: Klassierung Beispiel: Das MRM Institut hat die Monatsverdienste seiner Mitarbeiter aufgelistet. (Achtung: fiktiv!) Häufigkeitsverteilung Verdienst 0 ≤ 𝑥 < 400 400 ≤ 𝑥 < 1000 1000 ≤ 𝑥 < 2000 2000 ≤ 𝑥 < 5000 ෍ Absolute 𝑛𝑗 18 22 8 2 50 Häufigkeit Relative 18 22 8 2 ℎ𝑗 1 Häufigkeit 50 50 50 50 Klassenbreite 𝑤𝑗 400 600 1000 3000 n/a 49 Mathematik II - Teil Stochastik Sommersemester 2024 Gliederung 0. Organisatorisches 1. Deskriptive Statistik 1.1. Begrifflichkeiten 1.2. Graphische Darstellung: Balken-, Kreisdiagramme, Histogramme, Boxplots 1.3. Kennzahlen: Lage- und Streuungsmaße 1.4. Bivariate Zusammenhänge: Kovarianz und Korrelationskoeffizient 2. Wahrscheinlichkeitstheorie 3. Induktive Statistik 50 Mathematik II - Teil Stochastik Sommersemester 2024 Graphische Darstellung Häufig verwendete Darstellungsmöglichkeiten: Balkendiagramme Kreisdiagramme Liniendiagramme Histogramme Boxplots Scatterplots Achtung: Die Wahl der Graphik hängt u.a. vom vorliegenden Skalenniveau ab! 51 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel: Balkendiagramm Beispiel: Weltweite Kupferproduktion nach Ländern 2010 Balkendiagramm Minenproduktion 2010 6000000 Minenproduktion Kupfer in Tonnen 5000000 4000000 3000000 2000000 1000000 0 Chile Peru United States Indonesia China Other Länder Minenproduktion 2010 Achtung: Auf korrekte Darstellung und „Fälschungen“ achten! 52 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel: Manipulation mit Balkendiagrammen Beispiel: Einbürgerungen in der Schweiz laut SVP (Schweizerische Volkspartei) 53 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel: Manipulation mit Balkendiagrammen Beispiel: Einbürgerungen in der Schweiz laut SVP (Schweizerische Volkspartei) Wie kam diese Graphik zustande? Die y-Achse startet bei 5000 anstatt bei 0 Die x-Achse ist gestaucht. Es wird nur jedes zweite Jahr dargestellt 54 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel: Manipulation mit Balkendiagrammen Beispiel: Einbürgerungen in der Schweiz laut SVP (Schweizerische Volkspartei) Korrekte Darstellung! 55 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel: Kreisdiagramm Beispiel: Weltweite Kupferproduktion nach Ländern 2010 Kreisdiagramm 34.0% 38.0% Copper - Production (in T tons) 2010 2010 Chile 5390 34,0% Peru 1275 8,0% 8.0% United States 1180 7,4% 6.3% Indonesia 996 6,3% 6.3% 7.4% China 995 6,3% Other 6024 38,0% Chile Peru United States Indonesia China Other World total 15860 1 Achtung: Genaue Häufigkeitsangaben sind graphisch schwer darstellbar und müssen daher explizit angegeben werden! 56 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel: Liniendiagramm Beispiel: Entwicklung Silberpreis 2011, monatlich ($ pro Unze) Liniendiagramm Silberpreisentwicklung im Jahr 2011 50 45 40 Preis in $ pro Unze 35 30 25 20 15 10 5 0 Jan Feb Mrz Apr Mai Jun Jul Aug Sep Okt Nov Dez Jahr 2011 Silberpreis 57 Mathematik II - Teil Stochastik Sommersemester 2024 Definition: Histogramm Definition Gegeben sei ein klassiertes Merkmal mit Menge 𝑀 der möglichen Merkmals- ausprägungen, Klassen 𝐾1, … , 𝐾𝑘 und relativen Klassenhäufigkeiten ℎ1, … , ℎ𝑘. Im Histogramm wird die Häufigkeitsverteilung durch Flächeninhalte von Rechtecken symbolisiert; dabei wird die relative Häufigkeit ℎ𝑗 ins Verhältnis zur Klassenbreite 𝑤𝑗 gesetzt, und es ergeben sich somit die normierten relativen Häufigkeiten ℎ𝑗 ∗ : ∗ ℎ𝑗 ℎ𝑗 = , 𝑗 = 1, … , 𝑘. 𝑤𝑗 Die Klassenbreite 𝑤𝑗 ist die Grundlinie und die normierte relative Häufigkeit ℎ𝑗 ∗ die Höhe des Rechtecks. Das Histogramm ist dann die Fläche unterhalb der Funktion 𝐻 𝑥 = ℎ𝑗 ∗ , 𝑥 ∈ ൣ𝑎𝑗 ; 𝑏𝑗 ൯. 58 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel: Histogramm Beispiel: Monatsverdienste (in T €) Das MRM Institut hat die Monatsverdienste seiner Mitarbeiter aufgelistet. Monatsverdienste 1.0 0.8 normierte relative Häufigkeit 0.6 0.4 0.2 0.0 0 1 2 3 4 5 Gehalt in T € 59 Mathematik II - Teil Stochastik Sommersemester 2024 Erklärung: Boxplot Boxplot Silber: Kennwert Beschreibung Lage im Boxplot Minimum Kleinster Datenwert Entferntester Ausreißer Die kleinsten 25 % der Beispiel eines Boxplots Unteres Quartil Datenwerte sind kleiner oder Beginn der Box gleich diesem Kennwert Die kleinsten 50 % der Werte Waagrechter Strich Median sind kleiner oder gleich innerhalb der Box diesem Richtwert Die kleinsten 75 % der Oberes Quartil Datenwerte sind kleiner oder Ende der Box gleich diesem Richtwert Ende eines Whiskers oder Maximum Größter Datenwert entferntester Ausreißer Gesamter Wertebereich des Gesamte Länge des Spannweite Datensatzes Boxplots Der Wertebereich, in dem sich Interquartilsabstand die mittleren 50 % der Daten Ausdehnung der Box befinden Hinweis: Die Berechnung der Kennzahlen wird in Kapital 1.3. behandelt! 60 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel: Boxplot Beispiel: Silberproduktion 1970 bis 2009 (in t) Silberproduktion weltweit (1970 - 2009) Jahr Produktionsmenge in t 1970 9360 1971 9170 1972 9380 1973 9700 1974 9260 1975 9430 1976 9840 1977 10300 1978 10700 1979 10800 1980 10700 Silberproduktion 1981 11200 1982 11500 1983 1984 12100 13100 1970 – 2009 in 1985 13100 Tonnen 1986 13000 1987 1988 14000 15500 Minimum 9170 1989 16400 1990 16600 Unteres Quantil 10775 1991 15600 Median 14500 1992 14900 1993 14100 1994 14000 1995 1996 14900 15100 Oberes Quantil 17725 1997 16500 1998 17200 Maximum 21800 1999 17600 2000 2001 18100 18900 Spannweite 12630 2002 18800 2003 18800 Interquartilsabstand 6950 2004 20000 2005 20800 2006 20300 2007 21100 2008 21300 2009 21800 61 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel: Scatterplot Beispiel: Platinum, Preis ~ Minenproduktion, 1970 - 2010 (in tt) Scatterplot Achtung: Scatterplots machen eventuelle bivariate Zusammenhänge erkennbar; daraus darf aber nicht auf Kausalität geschlossen werden! 62 Mathematik II - Teil Stochastik Sommersemester 2024 Gliederung 0. Organisatorisches 1. Deskriptive Statistik 1.1. Begrifflichkeiten 1.2. Graphische Darstellung: Balken-, Kreisdiagramme, Histogramme, Boxplots 1.3. Kennzahlen: Lage- und Streuungsmaße 1.4. Bivariate Zusammenhänge: Kovarianz und Korrelationskoeffizient 2. Wahrscheinlichkeitstheorie 3. Induktive Statistik 63 Mathematik II - Teil Stochastik Sommersemester 2024 Lagemaße (I): Modus Definition Gegeben sei ein endliches (bzw. klassiertes) Merkmal mit Menge 𝑀 der möglichen Merkmalsausprägungen, also 𝑀 = {𝑚1, … , 𝑚𝑘 }. Dann ist der Modus 𝑥ො diejenige Merk- malsausprägung, die am häufigsten besetzt ist: 𝑥ො = 𝑚𝑗0 mit 𝑗0 = arg max ℎ𝑗. 𝑗 Bemerkung: Der Modus als Lagemaß wird hauptsächlich für nominal skalierte Merkmale verwendet, kann aber auch für höhere Skalierung genutzt werden. 64 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel: Modus Beispiel: Geplanter Spezialisierungsbereich des ersten WING-Studiengangs an der Universität Augsburg (fiktiv!) Menge der Merkmalsausprägungen: 𝐷𝑒𝑠𝑖𝑔𝑛 𝑜𝑓 𝐹𝑢𝑛𝑐𝑡𝑖𝑜𝑛𝑎𝑙 𝑀𝑎𝑡𝑒𝑟𝑖𝑎𝑙𝑠 𝑎𝑛𝑑 𝑃𝑟𝑜𝑑𝑢𝑐𝑡𝑠 (𝐷𝑂𝑀); 𝑀≔ 𝑀𝑎𝑡𝑒𝑟𝑖𝑎𝑙𝑠 𝑅𝑒𝑠𝑜𝑢𝑟𝑐𝑒 𝑀𝑎𝑛𝑎𝑔𝑒𝑚𝑒𝑛𝑡 (𝑅𝐸𝑀); = 𝑚1 , 𝑚2 , 𝑚3. 𝐹𝑖𝑛𝑎𝑛𝑐𝑒, 𝑂𝑝𝑒𝑟𝑎𝑡𝑖𝑜𝑛𝑠 𝑎𝑛𝑑 𝐼𝑛𝑓𝑜𝑟𝑚𝑎𝑡𝑖𝑜𝑛 𝑀𝑎𝑛𝑎𝑔𝑒𝑚𝑒𝑛𝑡 (𝐹𝑂𝐼𝑀) 20 Studenten wollen den Spezialisierungsbereich DOM wählen; 60 Studenten wollen den Spezialisierungsbereich REM wählen; 40 Studenten wollen den Spezialisierungsbereich FOIM wählen: 1 1 1 ℎ1 = , ℎ2 = , ℎ3 =. 6 2 3 max ℎ1 , ℎ2. ℎ3 = ℎ2 ⇒ 𝑗0 = arg max ℎ1 , ℎ2. ℎ3 = 2. Als Modus ergibt sich damit: 𝑥ො = 𝑚𝑗0 = 𝑚2 = 𝑅𝐸𝑀. 65 Mathematik II - Teil Stochastik Sommersemester 2024 Lagemaße (II): Median Definition Gegeben sei ein ordinales Merkmal (diskret oder kontinuierlich) mit Menge 𝑀 der möglichen Merkmalsausprägungen und Ordnungsstruktur ≤. Dann lässt sich die Reihe 𝑥1 , … , 𝑥𝑛 der Messwerte anordnen gemäß 𝑥1 ≤ 𝑥2 ≤ ⋯ ≤ 𝑥𝑛 , und der Median 𝑥෤ ist diejenige Merkmalsausprägung, die die geordnete Reihe der Messwerte in die „unteren 50%“ und die „oberen 50%“ aufteilt, d.h. es gilt 𝑛 𝑛 𝑥𝑗 𝑥𝑗 ≤ 𝑥෤ ≥ und 𝑥𝑗 𝑥𝑗 ≥ 𝑥෤ ≥ 2. 2 Bemerkung: Der Median ist unter Umständen nicht eindeutig bestimmt. 66 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel: Median Beispiel: Letzte Woche hat Professor Rathgeber die tägliche Fahrtzeit zur Uni gestoppt und folgende Ergebnisse ermittelt (in Minuten): 37; 45; 28; 32; 55. Dies lässt sich steigend anordnen: 28 ≤ 32 ≤ 37 ≤ 45 ≤ 55. Der Median ist dann der mittlere Wert, also 𝑥෤ = 37. Diese Woche verbringt Professor Rathgeber einen Forschungstag zuhause und erhält daher die folgenden 4 (statt 5) Werte: 22; 35; 27; 48. Hier gibt es keinen eindeutigen mittleren Wert – sowohl 𝑥෤ = 27 als auch 𝑥෤ = 35 sind Mediane. Oft wird in solchen Fällen einfach der Durchschnitt der beiden infrage kommenden Werte gebildet, also 𝑥෤ = 31. 67 Mathematik II - Teil Stochastik Sommersemester 2024 Lagemaße (III): Arithmetisches Mittel Definition Gegeben sei ein intervallskaliertes Merkmal mit Menge M der Merkmalsausprägungen und eine Messreihe 𝑥1 , … , 𝑥𝑛. Dann berechnet sich das arithmetische Mittel 𝑥ҧ dieser Messreihe als: 𝑛 1 𝑥ҧ = ෍ 𝑥𝑖. 𝑛 𝑖=1 Bemerkung: Das arithmetische Mittel 𝑥ҧ einer Messreihe 𝑥1 , … , 𝑥𝑛 gibt an, wie viel auf jeden einzelnen Merkmalsträger 𝑝1, … , 𝑝𝑛 entfiele, wenn die Merkmalssumme σ𝑛𝑖=1 𝑥𝑖 gleichmäßig auf alle Merkmalsträger aufgeteilt würde. 68 Mathematik II - Teil Stochastik Sommersemester 2024 Lagemaße (IV): Geometrisches Mittel Definition Gegeben sei ein verhältnisskaliertes Merkmal mit Menge 𝑀 der Merkmalsausprägungen und eine Messreihe 𝑥1 , … , 𝑥𝑛. Dann berechnet sich das geometrische Mittel dieser Messreihe als 𝑛 𝑛 𝑥𝑔ҧ = ෑ 𝑥𝑖 𝑖=1 Bemerkung: Das geometrische Mittel ist bei der Mittelung von Wachstumsfaktoren anzuwenden. Bei gegebenen Wachstumsfaktoren 𝑟1, … , 𝑟𝑛 (die sich auf jeweils gleichlange Zeiträume beziehen müssen) gibt das geometrische Mittel 𝑟𝑔ҧ denjenigen Wachstumsfaktor an, der bei konstantem Wachstum über den gesamten Zeitraum das gleiche Ergebnis produziert hätte. 69 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel: Mittelwerte Arithmetisches Mittel: Durchschnitt monatlicher Goldpreis 2011 ($ pro Unze) Jan Feb Mrz Apr Mai Jun Jul Aug Sep Okt Nov Dez 1350 1370 1420 1500 1510 1520 1550 1800 1750 1680 1710 1680 1 1 𝑥ҧ = 𝑛 σ𝑛𝑖=1 𝑥𝑖 = 12 ∗ 1350$ + 1370$ + … + 1680$ = 1570$ Geometrisches Mittel: Der Goldkurs steigt im ersten Jahr um 40% und fällt im zweiten Jahr um 40% 𝑥𝑔ҧ = 𝑛 ς𝑛𝑖=1 𝑥𝑖 = 1,4 ∗ 0,6 = 0,9165 ≜ −8,35% 70 Mathematik II - Teil Stochastik Sommersemester 2024 Streuungsmaße (I) Definition Gegeben sei ein intervallskaliertes Merkmal mit möglichen Merkmalsausprägungen 𝑀 und eine geordnete Messreihe 𝑥1 ≤ 𝑥2 ≤ … ≤ 𝑥𝑛. Dann wird die Spannweite definiert als der Abstand zwischen dem maximalen und dem minimalen Messwert: 𝑆𝑝 = 𝑥𝑛 − 𝑥1. Bemerkung: Die Spannweite hat nur beschränkten Informationsgehalt, da sie lediglich zwei der 𝑛 Messwerte berücksichtigt. Außerdem reagiert sie konstruktionsgemäß extrem empfindlich auf Ausreißer. Beispiel: Durchschnitt monatlicher Goldpreis 2011 ($ pro Unze) Jan Feb Mrz Apr Mai Jun Jul Aug Sep Okt Nov Dez 1350 1370 1420 1500 1510 1520 1550 1800 1750 1680 1710 1680 Spannweite: 𝑆𝑝 = 𝑥𝑛 − 𝑥1 = 1800$ − 1350$ = 450$ 71 Mathematik II - Teil Stochastik Sommersemester 2024 Streuungsmaße (II) Definition Gegeben sei ein intervallskaliertes Merkmal mit möglichen Merkmalsausprägungen 𝑀 und eine geordnete Messreihe 𝑥1 ≤ 𝑥2 ≤ … ≤ 𝑥𝑛. Dann wird der Quartilsabstand Q definiert als der Abstand zwischen ersten und dem dritten Quartil: 2. Quartil 1. Quartil 3. Quartil 𝑛𝑗 𝑄 = 𝑥𝑄3 − 𝑥𝑄1. Q 25% 25% 25% 25% Ausprägung Der Quartilsabstand gibt also an, über welche Spannweite sich die „mittleren 50%“ der Beobachtungswerte erstrecken. Dabei ist das erste Quartil 𝑥𝑄1 definiert als derjenige Wert, der die Messreihe in die unteren 25% und die oberen 75% einteilt; entsprechend ist das dritte Quartil 𝑥𝑄3 definiert als derjenige Wert, der die Messreihe in die unteren 75% und die oberen 25% einteilt. Bemerkung: Der Quartilsabstand hat bereits einen deutlich höheren Informationsgehalt als die Spannweite, da bei der Quartilsberechnung generell alle Messwerte einfließen. Außerdem ist er stabil gegenüber Ausreißern. 72 Mathematik II - Teil Stochastik Sommersemester 2024 Streuungsmaße (III) Definition Gegeben sei ein verhältnisskaliertes Merkmal mit möglichen Merkmalsausprägungen 𝑀 und eine geordnete Messreihe 𝑥1 ≤ 𝑥2 ≤ … ≤ 𝑥𝑛 mit arithmetischem Mittel 𝑥.ҧ Dann wird die (empirische) Varianz σ2 definiert als arithmetisches Mittel der quadrierten Abstände vom arithmetischen Mittel: 𝑛 1 𝜎 2 = ෍ 𝑥𝑖 − 𝑥ҧ 2 𝑛 𝑖=1 Aufgrund der Quadrierung liegt die Varianz immer in der entsprechenden quadrierten Einheit der Messwerte vor. Um dies zu vermeiden, wird die (empirische) Standardabweichung als Quadratwurzel der Varianz eingeführt: 𝜎= 𝜎 2. 73 Mathematik II - Teil Stochastik Sommersemester 2024 Streuungsmaße (IV) Definition Gegeben sei ein verhältnisskaliertes Merkmal mit möglichen Merkmalsausprägungen 𝑀 und eine geordnete Messreihe 𝑥1 ≤ 𝑥2 ≤ … ≤ 𝑥𝑛 mit arithmetischem Mittel 𝑥ҧ und em- pirischer Standardabweichung σ. Dann wird der Variationskoeffizient V definiert als die Standardabweichung der Messreihe, in Bezug gesetzt zum arithmetischen Mittel: 𝜎 𝑉=. 𝑥ҧ Bemerkung: Der Variationskoeffizient ist, im Gegensatz zu den bisher vorgestellten absoluten Streuungsmaßen, ein relatives Streuungsmaß und bietet sich in dieser Eigenschaft an für den Streuungsvergleich zweier Verteilungen, deren Beobachtungswerte verschiedene Größenordnungen haben. 74 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel: Streuungsmaße Beispiel: Durchschnitt monatlicher Goldpreis 2011 ($ pro Unze) Jan Feb Mrz Apr Mai Jun Jul Aug Sep Okt Nov Dez 1350 1370 1420 1500 1510 1520 1550 1800 1750 1680 1710 1680 Empirische Varianz: 12 2 1 2 251400$2 𝜎 = ෍ 𝑥𝑖 − 1570$ = = 20950$2. 𝑛 12 𝑖=1 Standardabweichung: 𝜎= 𝜎2 = 20950$2 ≈ 145$. Variationskoeffizient: 𝜎 145$ Zum Vergleich: Silberpreis 𝑉= = ≈ 0,092 = 9,2%. 𝜎 4$ 𝑥ҧ 1570$ 𝑉= = ≈ 0,114 = 11,4%. 𝑥ҧ 35$ Daten zur Berechnung: siehe F.72 75 Mathematik II - Teil Stochastik Sommersemester 2024 Gliederung 0. Organisatorisches 1. Deskriptive Statistik 1.0. Motivation 1.1. Begrifflichkeiten 1.2. Graphische Darstellung: Balken-, Kreisdiagramme, Histogramme, Boxplots 1.3. Kennzahlen: Lage- und Streuungsmaße 1.4. Bivariate Zusammenhänge: Kovarianz und Korrelationskoeffizient 2. Wahrscheinlichkeitstheorie 3. Induktive Statistik 76 Mathematik II - Teil Stochastik Sommersemester 2024 Bivariate Zusammenhänge (I-1) Definition Gegeben seien zwei endliche (oder klassierte) Merkmale 𝑀 = 𝑚1 , … 𝑚𝑘 und 𝑀′ = 𝑚′1 , … , 𝑚′𝑘′ auf einer Population 𝑃 der Größe 𝑛, mit entsprechenden Häufigkeitsverteilungen ℎ𝑗 bzw. ℎ′𝑗 und Beobachtungswerten (𝑥1 , … , 𝑥𝑛 ) bzw. (𝑦1 , … , 𝑦𝑛 ). Dann ist die (empirische) Kovarianz definiert als das arithmetische Mittel der Produkte der jeweiligen Abweichungen der Beobachtungswerte von ihren jeweiligen arithmetischen Mitteln 𝑥ҧ bzw. 𝑦: ത 𝑛 1 𝜎𝑀,𝑀′ = ෍(𝑥𝑗 −𝑥)ҧ ∙ (𝑦𝑗 − 𝑦). ത 𝑛 𝑗=1 77 Mathematik II - Teil Stochastik Sommersemester 2024 Bivariate Zusammenhänge (I-2) Bemerkung: Mithilfe der Kovarianz kann eine Aussage über die Richtung des Zusammenhangs zweier Merkmale abgeleitet werden: 𝜎𝑀, 𝑀′ > 0 → positiver Zusammenhang 𝜎𝑀, 𝑀′ = 0 → kein Zusammenhang 𝜎𝑀, 𝑀′ < 0 → negativer Zusammenhang Die Dimension der Kovarianz ist das Produkt der Dimensionen der beiden Merkmale und daher wenig anschaulich. Die Intensität des Zusammenhangs kann deswegen auch nicht abgelesen werden. 78 Mathematik II - Teil Stochastik Sommersemester 2024 Bivariate Zusammenhänge (II) Definition Für zwei verhältnisskalierte Merkmale 𝑀, 𝑀′ mit Häufigkeitsverteilungen ℎ𝑗1 bzw. ℎ′𝑗2 und Beobachtungswerten (𝑥1 , … , 𝑥𝑛 ) bzw. (𝑦1 , … , 𝑦𝑛 ) entsteht der (empirische) Korrelationskoeffizient durch Normierung der Kovarianz: 𝜎𝑀,𝑀′ 𝑟𝑀,𝑀′ =. 𝜎𝑀 ∙ 𝜎𝑀′ Bemerkung: Aufgrund der Normierung ist der Korrelationskoeffizient dimensionslos, und es gilt −1 ≤ 𝑟𝑀,𝑀′ ≤ 1. Für 𝑟𝑀,𝑀′ = 1 (bzw. 𝑟𝑀,𝑀′ = −1) besteht ein perfekter positiver linearer Zusammenhang (bzw. negativer linearer Zusammenhang); für 𝑟𝑀,𝑀′ = 0 besteht gar kein linearer Zusammenhang. 79 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel: Bivariate Zusammenhänge Beispiel: Durchschnitt monatlicher Goldpreis 2011 ($ pro Unze) Jan Feb Mrz Apr Mai Jun Jul Aug Sep Okt Nov Dez 1350 1370 1420 1500 1510 1520 1550 1800 1750 1680 1710 1680 𝑥ҧ = 1570$; σ𝑥 = 145$ Durchschnitt monatlicher Silberpreis 2011 ($ pro Unze) Jan Feb Mrz Apr Mai Jun Jul Aug Sep Okt Nov Dez 28 31 36 42 37 36 38 40 38 32 33 30 𝑦ത = 35$; σ𝑦 = 4$ 12 1 Kovarianz: 𝜎𝑋,𝑌 = ෍(𝑥𝑗 −1570$) ∙ (𝑦𝑗 − 35$) = ⋯ ≈ 167$². 12 𝑗=1 𝜎𝑋,𝑌 167$² Korrelation: 𝑟𝑋,𝑌 = = ≈ 0,3. 𝜎𝑋 ∙ 𝜎𝑌 145$ ∙ 4$ 80 Mathematik II - Teil Stochastik Sommersemester 2024 Umfrage PINGO 064822 pingo.coactum.de/064822 81 Mathematik II - Teil Stochastik Sommersemester 2024 Fragen dieses Kapitels 1. Kapitel 3. Kapitel 2. Kapitel ? Wie können Informationen unter Zuhilfenahme geeigneter Aggregations- mechanismen verdichtet werden? Welcher Informationsverlust entsteht dabei?  ? Wie lassen sich die verdichteten Informationen graphisch darstellen?  ? Wie lassen sich bivariate Zusammenhänge erkennen?  82 Mathematik II - Teil Stochastik Sommersemester 2024 Mathematik II - Teil Stochastik Sommersemester 2024 Kapitel 2: Wahrscheinlichkeitsrechnung Prof. Dr. Andreas Rathgeber Dr.-Ing. Amelie Schischke Veranstaltungsübersicht Stochastik Statistik Wahrscheinlichkeits- Rechnung Deskriptive Statistik 1 Induktive Statistik 3 2 auch beschreibende Statistik auch mathematische Statistik, auch Wahrscheinlichkeitstheorie: oder empirische Statistik: schließende Statistik oder Als Teilgebiet der Mathematik dient sie Daten werden in geeigneter Inferenzstatistik): der Formalisierung, der Modellierung Weise beschrieben, aufbe-reitet In der Induktiven Statistik leitet und der Untersuchung von und zusammengefasst. Mit man aus den Daten einer Zufallsgeschehen. ihren Methoden verdichtet man Stichprobe Eigenschaften einer quantitative Daten zu Tabellen, Grundgesamtheit ab. Die Wahrscheinlichkeitstheorie liefert graphischen Dar-stellungen und die Grundlagen für die erforderlichen Kennzahlen. Schätz- und Testverfahren der induktiven Statistik. 84 Mathematik II - Teil Stochastik Sommersemester 2024 Gliederung 0. Organisatorisches 1. Deskriptive Statistik 2. Wahrscheinlichkeitstheorie 2.0. Mathematische Grundlagen 2.1. Wahrscheinlichkeitsräume 2.2. Bedingte Wahrscheinlichkeiten 2.3. Zufallsvariablen 2.4. Dichtefunktionen & Verteilungsfunktionen 2.5. Kenngrößen 2.6. Wahrscheinlichkeitsverteilungen 2.7. Wichtige Theoreme 3. Induktive Statistik 85 Mathematik II - Teil Stochastik Sommersemester 2024 Fragen dieses Kapitels 1. Kapitel 3. Kapitel 2. Kapitel ? Wie lassen sich Zufallsexperimente mathematisch modellieren? ? Welche Aussagen lassen sich, trotz des Zufallscharakters solcher Experimente, treffen? ? Wie hängt die Wahrscheinlichkeitstheorie mit der deskriptiven Statistik zusammen? 86 Mathematik II - Teil Stochastik Sommersemester 2024 Gliederung 0. Organisatorisches 1. Deskriptive Statistik 2. Wahrscheinlichkeitstheorie 2.0. Mathematische Grundlagen 2.1. Wahrscheinlichkeitsräume 2.2. Bedingte Wahrscheinlichkeiten 2.3. Zufallsvariablen 2.4. Dichtefunktionen & Verteilungsfunktionen 2.5. Kenngrößen 2.6. Wahrscheinlichkeitsverteilungen 2.7. Wichtige Theoreme 3. Induktive Statistik 87 Mathematik II - Teil Stochastik Sommersemester 2024 Mathematische Grundlagen (I-1): Mengenlehre Definition Eine Menge ist eine „Zusammenfassung von wohlunterschiedenen Objekten zu einem Ganzen“ (Georg Cantor, Begründer der Mengenlehre,1895). Die Objekte werden als Elemente der Menge bezeichnet. Schreibweise: Ist ein Objekt 𝑥 Element einer Menge 𝐴, so schreibt man dafür 𝑥 ∈ 𝐴. Andernfalls ist 𝑥 ∉ 𝐴. Konvention: Im Folgenden werden Mengen immer als Teil einer Grundgesamtheit Ω verstanden, d.h. alle betrachteten Elemente stammen aus der Menge Ω. Definition Eine Menge 𝐴 heißt Teilmenge einer Menge 𝐵 (in Zeichen: 𝐴 ⊆ 𝐵), falls alle Elemente von 𝐴 auch Elemente von 𝐵 sind: 𝐴 ⊆ 𝐵 ∶⟺ 𝑥 ∈ 𝐴 ⇒ 𝑥 ∈ 𝐵. 88 Mathematik II - Teil Stochastik Sommersemester 2024 Mathematische Grundlagen (I-2): Mengenlehre Mengenoperationen: Die Schnittmenge zweier Mengen 𝐴, 𝐵 ⊆ Ω enthält jene Elemente, die in beiden Mengen liegen: 𝐴 ∩ 𝐵 ≔ 𝑥 ∈ Ω 𝑥 ∈ 𝐴 und 𝑥 ∈ 𝐵. Die Vereinigungsmenge zweier Mengen 𝐴, 𝐵 ⊆ Ω enthält jene Elemente, die in mindestens einer der beiden Mengen liegen: 𝐴 ∪ 𝐵 ≔ 𝑥 ∈ Ω 𝑥 ∈ 𝐴 oder 𝑥 ∈ 𝐵. Die Differenzmenge zweier Mengen 𝐴, 𝐵 ⊆ Ω enthält jene Elemente, die in der ersten Menge, aber nicht in der zweiten Menge enthalten sind: 𝐴 ∖ 𝐵 ≔ 𝑥 ∈ Ω 𝑥 ∈ 𝐴 und 𝑥 ∉ 𝐵. Das Komplement einer Menge 𝐴 ⊆ Ω enthält jene Elemente, die nicht in der Menge liegen: 𝐴ҧ ≔ 𝑥 ∈ Ω 𝑥 ∉ 𝐴. 89 Mathematik II - Teil Stochastik Sommersemester 2024 Mathematische Grundlagen (I-3): Mengenlehre Definition Zwei Mengen 𝐴, 𝐵 ⊆ Ω heißen disjunkt, falls ihr Schnitt leer ist, also 𝐴 ∩ 𝐵 = ∅. Beliebige Mengen 𝐴1 , 𝐴2 , … ⊆ Ω heißen paarweise disjunkt, falls 𝐴𝑖 ∩ 𝐴𝑗 = ∅ für alle 𝑖 ≠ 𝑗. Definition Unter der Potenzmenge 𝔓(𝐴) einer Menge 𝐴 versteht man die Menge aller Teilmengen von 𝐴: 𝔓 𝐴 ≔ 𝐴′ ⊆ Ω 𝐴′ ⊆ 𝐴. 90 Mathematik II - Teil Stochastik Sommersemester 2024 Mathematische Grundlagen (I-4): Mengenlehre Gesetze der Mengenlehre: Kommutativgesetze: 𝐴∪𝐵 = 𝐵∪𝐴 𝐴∩𝐵 = 𝐵∩𝐴 Assoziativgesetze: 𝐴∪𝐵 ∪𝐶 =𝐴∪ 𝐵∪𝐶 𝐴∩𝐵 ∩𝐶 =𝐴∩ 𝐵∩𝐶 Distributivgesetze: 𝐴∪ 𝐵∩𝐶 = 𝐴∪𝐵 ∩ 𝐴∪𝐶 𝐴 ∩ 𝐵 ∪ 𝐶 = (𝐴 ∩ 𝐵) ∪ (𝐴 ∩ 𝐶) De Morgansche Gesetze: 𝐴 ∪ 𝐵 = 𝐴ҧ ∩ 𝐵ത 𝐴 ∩ 𝐵 = 𝐴ҧ ∪ 𝐵ത 91 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel: Mengenlehre Beispiel: Verschiedene Rohölsorten Ω 𝐴∩𝐵 𝐴 𝐵 𝛀 alle Rohölsorten 𝑨 schwefelarmes Rohöl (im Gegensatz zu saurem Rohöl – Schwefelanteil < 0,5%) 𝑩 Leichtrohöl (im Gegensatz zu Schwerrohöl – geringere Viskosität, höherer Preis) 𝑨∩𝑩 schwefelarmes Leichtrohöl (beliebtestes Underlying für Futures) 92 Mathematik II - Teil Stochastik Sommersemester 2024 Gliederung 0. Organisatorisches 1. Deskriptive Statistik 2. Wahrscheinlichkeitstheorie 2.0. Motivation & mathematische Grundlagen 2.1. Wahrscheinlichkeitsräume 2.2. Bedingte Wahrscheinlichkeiten 2.3. Zufallsvariablen 2.4. Dichtefunktionen & Verteilungsfunktionen 2.5. Kenngrößen 2.6. Wahrscheinlichkeitsverteilungen 2.7. Wichtige Theoreme 3. Induktive Statistik 93 Mathematik II - Teil Stochastik Sommersemester 2024 Wahrscheinlichkeitsräume (I): Begriffe Definition Ein Wahrscheinlichkeitsraum (kurz: W-Raum) ist ein Tripel (Ω, 𝒜, 𝑃), bestehend aus einer Ergebnismenge Ω (Menge aller Elementarereignisse), einer σ-Algebra 𝒜 ⊆ 𝔓(Ω) (Menge der „interessanten“ Ereignisse), und einem Wahrscheinlichkeitsmaß 𝑃 ∶ 𝒜 ⟶ 0; 1. Grundbegriffe: Jede Menge 𝐴 ∈ 𝒜 heißt Ereignis bzw. messbare Menge. Die Gesamtmenge Ω ist das sichere Ereignis, und die leere Menge Ø ist das unmögliche Ereignis. Ein Ereignis 𝐴 ∈ 𝒜 heißt Teilereignis von 𝐵 ∈ 𝒜, falls 𝐴 ⊆ 𝐵. Ein Ereignis 𝐴 ∈ 𝒜 heißt Gegenereignis zu 𝐵 ∈ 𝒜, falls 𝐴 = 𝐵ത. 94 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel: Ereignisse Beispiel: Würfeln mit einem Würfel Ergebnismenge: Ω = 1; 2; 3; 4; 5; 6 Ereignis: 𝐴 = 2; 4; 6 (Würfeln einer geraden Augenzahl) Gegenereignis: 𝐴ҧ = Ω ∖ 𝐴 = 1; 3; 5 (Würfeln einer ungeraden Augenzahl) Teilereignis: 𝐴′ = 4 ⊆ 𝐴 (Würfeln einer durch 4 teilbaren Augenzahl) Unmögliches Ereignis: 𝐴=Ø (Würfeln einer geraden und ungeraden Augenzahl) Sicheres Ereignis: 𝐴 = Ω = 1; 2; 3; 4; 5; 6 (Würfeln irgendeiner Augenzahl) 95 Mathematik II - Teil Stochastik Sommersemester 2024 Wahrscheinlichkeitsräume (II-1): σ-Algebren Definition Ein Mengensystem 𝒜 ⊆ 𝔓(Ω) heißt σ-Algebra, falls gilt: das sichere Ereignis ist enthalten: Ω∈𝒜 Abgeschlossenheit bzgl. Komplementbildung: 𝐴 ∈ 𝒜 ⇒ 𝐴ҧ ∈ 𝒜 Abgeschlossenheit bzgl. abzählbarer Vereinigungen: ∞ 𝐴1 , 𝐴2 , … ∈ 𝒜 ⇒ ራ 𝐴𝑖 ∈ 𝒜. 𝑖=1 96 Mathematik II - Teil Stochastik Sommersemester 2024 Wahrscheinlichkeitsräume (II-2): σ-Algebren Folgerungen: Sei 𝒜 ⊆ 𝔓(Ω) eine σ-Algebra, dann gilt: Das unmögliche Ereignis ist enthalten: ∅∈𝒜 Abgeschlossenheit bzgl. abzählbarer Durchschnitte: ∞ 𝐴1 , 𝐴2 , … ∈ 𝒜 ⇒ ሩ 𝐴𝑖 ∈ 𝒜. 𝑖=1 Abgeschlossenheit bzgl. Differenzbildung: 𝐴, 𝐵 ∈ 𝒜 ⇒ 𝐴 ∖ 𝐵 ∈ 𝒜. 97 Mathematik II - Teil Stochastik Sommersemester 2024 Wahrscheinlichkeitsräume (II-3): Borelsche σ-Algebra Definition Die Borelsche σ-Algebra 𝔹 auf den reellen Zahlen ℝ ist die kleinste σ-Algebra auf ℝ, die alle Intervalle enthält. Die Mengen 𝐵 ∈ 𝔹 heißen Borelmengen. Für ein beliebiges Intervall 𝐼 ⊆ ℝ ist 𝔹(𝐼) die Borelsche σ-Algebra auf 𝑰 die kleinste σ-Algebra, die alle Intervalle aus 𝐼 enthält. Konvention: Für abzählbare Ergebnismengen Ω (etwa Ω = {1; 2; 3; 4; 5; 6} oder auch Ω = ℕ) kann als σ- Algebra einfach die Potenzmenge 𝔓(Ω) gewählt werden. Im Fall der Überabzählbarkeit hingegen (etwa Ω = 0; 1 oder Ω = ℝ) führt dies zu inneren Widersprüchen, weswegen auf Borelmengen zurückgegriffen werden muss. 98 Mathematik II - Teil Stochastik Sommersemester 2024 Wahrscheinlichkeitsräume (III-1): Wahrscheinlichkeitsmaße Definition Gegeben sei eine σ-Algebra 𝒜 ⊆ 𝔓(Ω) auf einer Grundmenge Ω. Eine Abbildung 𝑃 ∶ 𝒜 ⟶ 0; 1 heißt Wahrscheinlichkeitsmaß (kurz: W-Maß) oder Wahrscheinlichkeitsverteilung, falls gilt: Normiertheit: Das sichere Ereignis tritt ein, also 𝑃 Ω = 1. σ-Additivität: Paarweise disjunkte Ereignisse lassen sich „aufspalten“, d.h. ∞ ∞ 𝑃 ራ 𝐴𝑖 = ෍ 𝑃(𝐴𝑖 ) 𝑖=1 𝑖=1 für alle paarweise disjunkten Ereignisse 𝐴1 , 𝐴2 , … ∈ 𝒜. 99 Mathematik II - Teil Stochastik Sommersemester 2024 Wahrscheinlichkeitsräume (III-2): Wahrscheinlichkeitsmaße Folgerungen: Sei (Ω, 𝒜, 𝑃) ein W-Raum mit W-Maß 𝑃 ∶ 𝒜 ⟶ 0; 1. Dann gilt: Die Wahrscheinlichkeit des Gegenereignisses lässt sich aus der Wahrscheinlichkeit des Ereignisses selbst berechnen; es ist nämlich 𝑃 𝐴ҧ = 1 − 𝑃 𝐴. Das unmögliche Ereignis tritt nie ein: 𝑃 ∅ = 0. Die Wahrscheinlichkeit von zusammengesetzten Ereignissen berechnet sich gemäß 𝑃 𝐴∪𝐵 = 𝑃 𝐴 +𝑃 𝐵 −𝑃 𝐴∩𝐵. Die Wahrscheinlichkeit endlicher Ereignismengen 𝐴 = {𝑎1 , … , 𝑎𝑘 } lässt sich durch Aufaddieren der einzelnen Ergebniswahrscheinlichkeiten ermitteln: 𝑘 𝑃 𝐴 = ෍ 𝑃 𝑎𝑖. 𝑖=1 100 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel (I-1): Wahrscheinlichkeitsräume Beispiel: Würfeln mit einem unfairen (!) Würfel Ergebnismenge: Ω = 1; 2; 3; 4; 5; 6 σ-Algebra: 𝒜=𝔓 Ω W-Maß: 𝑃 1 = 1Τ3 𝑃 2 = 1Τ4 𝑃 3 = 1Τ5 𝑃 4 = 1Τ10 𝑃 5 = 1Τ15 𝑃 6 = 1Τ20 Ereignis A: 𝐴 = 2; 4; 6 (Würfeln einer durch 2 teilbaren Augenzahl) Ereignis B: 𝐵 = 3; 6 (Würfeln einer durch 3 teilbaren Augenzahl) Würfeln einer durch 2 oder durch 3 teilbaren Augenzahl: 𝑃 𝐴∪𝐵 =𝑃 𝐴 +𝑃 𝐵 −𝑃 𝐴∩𝐵 = 1 1 1 1 1 1 2 1 1 3 + + + + − = + − = 4 10 20 5 20 20 5 4 20 5 101 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel (I-2): Wahrscheinlichkeitsräume Beispiel: Glücksrad Ergebnismenge: Ω = [0; 2𝜋) (Winkel zwischen Nullpunkt und Endposition) σ-Algebra: 𝒜 = 𝔹([0; 2𝜋)) W-Maß: 𝑃 ∶ 𝒜 ⟶ 0; 1 mit 𝑏−𝑎 𝑃 𝑎; 𝑏 = 2𝜋 102 Mathematik II - Teil Stochastik Sommersemester 2024 Gliederung 0. Organisatorisches 1. Deskriptive Statistik 2. Wahrscheinlichkeitstheorie 2.0. Motivation & mathematische Grundlagen 2.1. Wahrscheinlichkeitsräume 2.2. Bedingte Wahrscheinlichkeiten 2.3. Zufallsvariablen 2.4. Dichtefunktionen & Verteilungsfunktionen 2.5. Kenngrößen 2.6. Wahrscheinlichkeitsverteilungen 2.7. Wichtige Theoreme 3. Induktive Statistik 103 Mathematik II - Teil Stochastik Sommersemester 2024 Bedingte Wahrscheinlichkeiten (I) Definition Sei (Ω, 𝒜, 𝑃) ein W-Raum und 𝐴, 𝐵 ∈ 𝒜 zwei beliebige Ereignisse. Dann heißt 𝑃 (𝐴 ∩ 𝐵) 𝑃 𝐴𝐵 = 𝑃(𝐵) die Wahrscheinlichkeit von A unter der Bedingung B bzw. die Wahrscheinlichkeit von A gegeben B. Multiplikationssatz: Sei (Ω, 𝒜, 𝑃) ein W-Raum und 𝐴, 𝐵 ∈ 𝒜 zwei beliebige Ereignisse. Dann gilt: 𝑃 𝐴∩𝐵 = 𝑃 𝐴 𝐵 ⋅𝑃 𝐵. 104 Mathematik II - Teil Stochastik Sommersemester 2024 Bedingte Wahrscheinlichkeiten (II): Unabhängigkeit Definition Sei (Ω, 𝒜, 𝑃) ein W-Raum. Zwei Ereignisse 𝐴, 𝐵 ∈ 𝒜 heißen unabhängig, falls die Wahrscheinlichkeit des Schnitts dem Produkt der Einzelwahrscheinlichkeiten entspricht: 𝑃 𝐴∩𝐵 =𝑃 𝐴 ⋅𝑃 𝐵. Folgerung: Ist (Ω, 𝒜, 𝑃) ein W-Raum und sind die Ereignisse 𝐴, 𝐵 ∈ 𝒜 unabhängig, dann ist 𝑃(𝐴|𝐵) = 𝑃(𝐴). 105 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel (I): Bedingte Wahrscheinlichkeiten & Unabhängigkeit Beispiel: Würfeln mit einem unfairen (!) Würfel W-Maß: 𝑃 1 = 1Τ3 𝑃 2 = 1Τ4 𝑃 3 = 1Τ5 𝑃 4 = 1Τ10 𝑃 5 = 1Τ15 𝑃 6 = 1Τ20 Ereignis 𝑨: 𝐴 = 2; 4; 6 (Würfeln einer durch 2 teilbaren Augenzahl) Ereignis 𝑩: 𝐵 = 3; 6 (Würfeln einer durch 3 teilbaren Augenzahl) Die Ereignisse 𝐴 und 𝐵 sind nicht unabhängig: 2 1 1 1 𝑃 𝐴 ∙𝑃 𝐵 = ∙ = ≠ =𝑃 𝐴∩𝐵. 5 4 10 20 Die bedingten Wahrscheinlichkeiten sind 𝑃(𝐴 ∩ 𝐵) 1 𝑃(𝐴 ∩ 𝐵) 1 𝑃 𝐴𝐵 = = 𝑏𝑧𝑤. 𝑃 𝐵 𝐴 = = 𝑃(𝐵) 5 𝑃(𝐴) 8 106 Mathematik II - Teil Stochastik Sommersemester 2024 Beispiel (I): Bedingte Wahrscheinlichkeiten & Unabhängigkeit Ω Beispiel: Ölreserven Ω weltweite Ölreserven 𝐴 Leichtöl (weltweit, etwa 30%) A 𝐵 Ölreserven in Saudi Arabien (etwa 20%) 𝐴∩𝐵 saudisches Leichtöl (etwa 12%) A∩𝐵 𝐵 Bei wie viel Prozent der Ölreserven in Saudi Arabien handelt es sich um Leichtöl ? : 𝑃(𝐴 ∩ 𝐵) 0,12 𝑃 𝐴𝐵 = = = 0,6 ≙60% 𝑃(𝐵) 0,2 ≙" 𝐴 und 𝐵 sind nicht unabhängig: 𝑃 𝐴 ∙ 𝑃 𝐵 = 0,06 ≠ 0,12 = 𝑃(𝐴 ∩ 𝐵) 107 Mathematik II - Teil Stochastik Sommersemester 2024 Bedingte Wahrscheinlichkeiten (III): Satz von Bayes Satz von Bayes Sei (Ω, 𝒜, 𝑃) ein W-Raum mit Ereignissen 𝐴, 𝐵 ∈ 𝒜. Dann besteht folgender Zusammenhang zwischen den A-priori-Wahrscheinlichkeiten 𝑃 𝐴 und ?

Use Quizgecko on...
Browser
Browser