Podcast
Questions and Answers
Welche der folgenden Aussagen beschreibt am besten den Hauptzweck des Soll-Ist-Vergleichs im Kontext der Aufdeckung von Wirtschaftskriminalität?
Welche der folgenden Aussagen beschreibt am besten den Hauptzweck des Soll-Ist-Vergleichs im Kontext der Aufdeckung von Wirtschaftskriminalität?
- Die Effizienz der internen Kontrollsysteme zu messen und zu verbessern.
- Fehlende Sensibilisierung des Umfelds des Betrügers zu beseitigen.
- Die genaue Einhaltung von Umsatzprognosen zu gewährleisten, um finanzielle Stabilität zu demonstrieren.
- Abweichungen zwischen geplanten und tatsächlichen Werten zu identifizieren, die auf potenziell betrügerische Aktivitäten hinweisen könnten. (correct)
Welche der folgenden Methoden zur Aufdeckung von Wirtschaftskriminalität ist am besten geeignet, um Auffälligkeiten in Zahlenreihen zu identifizieren, die auf der erwarteten Häufigkeit bestimmter Anfangsziffern basieren?
Welche der folgenden Methoden zur Aufdeckung von Wirtschaftskriminalität ist am besten geeignet, um Auffälligkeiten in Zahlenreihen zu identifizieren, die auf der erwarteten Häufigkeit bestimmter Anfangsziffern basieren?
- Local Outlier Detection (LOF)
- Benford-Analyse (correct)
- Boxplot-Analyse
- Preisvolatilitätsprüfung
Was ist der Hauptnachteil der Verwendung eines Boxplots zur Analyse von Daten im Rahmen der Aufdeckung von Wirtschaftskriminalität?
Was ist der Hauptnachteil der Verwendung eines Boxplots zur Analyse von Daten im Rahmen der Aufdeckung von Wirtschaftskriminalität?
- Boxplots können nur für große Datensätze verwendet werden.
- Boxplots erfordern eine Normalverteilung der Daten.
- Boxplots sind anfällig für Verzerrungen durch Ausreißer.
- Boxplots betrachten nur eine Dimension der Daten auf einmal. (correct)
Was bedeutet ein hoher LOF-Wert (Local Outlier Factor) bei der Anwendung von Local Outlier Detection?
Was bedeutet ein hoher LOF-Wert (Local Outlier Factor) bei der Anwendung von Local Outlier Detection?
Was ist das Hauptziel der Latent Class Regression im Kontext der Aufdeckung von Wirtschaftskriminalität?
Was ist das Hauptziel der Latent Class Regression im Kontext der Aufdeckung von Wirtschaftskriminalität?
Welche Aussage beschreibt am besten den Zweck univariater Analysen im Kontext einer multivariaten Regressionsanalyse?
Welche Aussage beschreibt am besten den Zweck univariater Analysen im Kontext einer multivariaten Regressionsanalyse?
Welche der folgenden Aussagen beschreibt am besten die Interpretation eines hohen p-Wertes im Kontext eines statistischen Tests?
Welche der folgenden Aussagen beschreibt am besten die Interpretation eines hohen p-Wertes im Kontext eines statistischen Tests?
Welche der folgenden Maßnahmen ist NICHT Teil der Modellverbesserung bei negativer Modellkritik im Rahmen einer Prognose?
Welche der folgenden Maßnahmen ist NICHT Teil der Modellverbesserung bei negativer Modellkritik im Rahmen einer Prognose?
Was impliziert die Entscheidung, die Nullhypothese nicht zu verwerfen?
Was impliziert die Entscheidung, die Nullhypothese nicht zu verwerfen?
Warum ist es bei der bivariaten Voranalyse im Rahmen einer multivariaten Regressionsanalyse wichtig, dass zwischen den erklärenden Variablen idealerweise kein starker Zusammenhang besteht?
Warum ist es bei der bivariaten Voranalyse im Rahmen einer multivariaten Regressionsanalyse wichtig, dass zwischen den erklärenden Variablen idealerweise kein starker Zusammenhang besteht?
Was ist der Zweck eines F-Tests im Rahmen der Regressionsanalyse?
Was ist der Zweck eines F-Tests im Rahmen der Regressionsanalyse?
In welcher Phase des Prognoseprozesses wird entschieden, ob aufgrund von Qualitätsmängeln der Daten oder des Modells auf eine Prognose verzichtet werden muss?
In welcher Phase des Prognoseprozesses wird entschieden, ob aufgrund von Qualitätsmängeln der Daten oder des Modells auf eine Prognose verzichtet werden muss?
Wie wird die Teststatistik im F-Test berechnet?
Wie wird die Teststatistik im F-Test berechnet?
Welche der folgenden Analysen wird typischerweise NICHT im Rahmen einer bivariaten Voranalyse für eine multiple lineare Regression durchgeführt?
Welche der folgenden Analysen wird typischerweise NICHT im Rahmen einer bivariaten Voranalyse für eine multiple lineare Regression durchgeführt?
Wovon hängt die Wahl der Irrtumswahrscheinlichkeit (alpha) ab?
Wovon hängt die Wahl der Irrtumswahrscheinlichkeit (alpha) ab?
Was ist der Hauptunterschied zwischen einer bivariaten und einer multivariaten Regressionsanalyse hinsichtlich der Variablenarten?
Was ist der Hauptunterschied zwischen einer bivariaten und einer multivariaten Regressionsanalyse hinsichtlich der Variablenarten?
Angenommen, Sie führen eine bivariate Voranalyse für eine multiple Regression durch und stellen fest, dass eine Ihrer erklärenden Variablen hoch korreliert ist mit der Zielvariable, aber auch stark mit einer anderen erklärenden Variablen. Welche der folgenden Maßnahmen wäre am angemessensten?
Angenommen, Sie führen eine bivariate Voranalyse für eine multiple Regression durch und stellen fest, dass eine Ihrer erklärenden Variablen hoch korreliert ist mit der Zielvariable, aber auch stark mit einer anderen erklärenden Variablen. Welche der folgenden Maßnahmen wäre am angemessensten?
Welche Aussage über die ANOVA-Tabelle ist zutreffend?
Welche Aussage über die ANOVA-Tabelle ist zutreffend?
Was repräsentieren die Freiheitsgrade (df) in der ANOVA-Tabelle?
Was repräsentieren die Freiheitsgrade (df) in der ANOVA-Tabelle?
In welcher Situation wäre es am wahrscheinlichsten, dass man akzeptieren muss, dass kein passendes Modell für eine Prognose gefunden werden kann?
In welcher Situation wäre es am wahrscheinlichsten, dass man akzeptieren muss, dass kein passendes Modell für eine Prognose gefunden werden kann?
Angenommen, Sie führen einen F-Test durch und erhalten einen p-Wert von 0.08. Ihr vorher festgelegtes Signifikanzniveau (alpha) beträgt 0.05. Was ist die korrekte Schlussfolgerung?
Angenommen, Sie führen einen F-Test durch und erhalten einen p-Wert von 0.08. Ihr vorher festgelegtes Signifikanzniveau (alpha) beträgt 0.05. Was ist die korrekte Schlussfolgerung?
Welche Aussage beschreibt am besten die Interpretation des F-Wertes bei der Modellkritik einer linearen Regression?
Welche Aussage beschreibt am besten die Interpretation des F-Wertes bei der Modellkritik einer linearen Regression?
Warum ist es wichtig, bei der Aufnahme von Variablen in ein lineares Regressionsmodell eine 'richtige Balance' zu finden, anstatt einfach so viele Variablen wie möglich aufzunehmen?
Warum ist es wichtig, bei der Aufnahme von Variablen in ein lineares Regressionsmodell eine 'richtige Balance' zu finden, anstatt einfach so viele Variablen wie möglich aufzunehmen?
Welche Aussage beschreibt am besten, wie man bei der Analyse von Residuenplots auf eine Verletzung der Annahme konstanter Varianz (Homoskedastizität) schließen könnte?
Welche Aussage beschreibt am besten, wie man bei der Analyse von Residuenplots auf eine Verletzung der Annahme konstanter Varianz (Homoskedastizität) schließen könnte?
Warum ist es sinnvoll, bei der Identifizierung von Ausreißern in einem linearen Regressionsmodell sowohl solche zu betrachten, die nicht ins Muster passen, als auch solche, die sehr gut ins Muster passen?
Warum ist es sinnvoll, bei der Identifizierung von Ausreißern in einem linearen Regressionsmodell sowohl solche zu betrachten, die nicht ins Muster passen, als auch solche, die sehr gut ins Muster passen?
Welche Schlussfolgerung kann gezogen werden, wenn ein lineares Regressionsmodell sachlich nicht plausibel ist?
Welche Schlussfolgerung kann gezogen werden, wenn ein lineares Regressionsmodell sachlich nicht plausibel ist?
Was ist der Hauptzweck des Chi-Quadrat-Unabhängigkeitstests im Kontext von zwei kategorialen Variablen?
Was ist der Hauptzweck des Chi-Quadrat-Unabhängigkeitstests im Kontext von zwei kategorialen Variablen?
Im Rahmen des Chi-Quadrat-Unabhängigkeitstests, wie werden die 'erwarteten absoluten Häufigkeiten' ermittelt, wenn nur die beobachteten Häufigkeiten bekannt sind?
Im Rahmen des Chi-Quadrat-Unabhängigkeitstests, wie werden die 'erwarteten absoluten Häufigkeiten' ermittelt, wenn nur die beobachteten Häufigkeiten bekannt sind?
Welche Auswirkungen hat die Verletzung der Annahme unabhängiger Residuen bei der linearen Regression auf die Gültigkeit der Regressionsergebnisse?
Welche Auswirkungen hat die Verletzung der Annahme unabhängiger Residuen bei der linearen Regression auf die Gültigkeit der Regressionsergebnisse?
Welche Aussage beschreibt am besten die Interpretation einer Prognose, die mit einer logistischen Regression für eine Gruppe erstellt wurde?
Welche Aussage beschreibt am besten die Interpretation einer Prognose, die mit einer logistischen Regression für eine Gruppe erstellt wurde?
Warum ist es wichtig, dass die Trefferrate eines logistischen Regressionsmodells signifikant höher ist als der Anteil des Modus der dichotomen Zielvariable?
Warum ist es wichtig, dass die Trefferrate eines logistischen Regressionsmodells signifikant höher ist als der Anteil des Modus der dichotomen Zielvariable?
Was ist der Hauptzweck des Omnibus-Tests im Kontext der logistischen Regression?
Was ist der Hauptzweck des Omnibus-Tests im Kontext der logistischen Regression?
Was ist das 'Null-Modell' (Anfangsblock) in der logistischen Regression und welchen Zweck erfüllt es?
Was ist das 'Null-Modell' (Anfangsblock) in der logistischen Regression und welchen Zweck erfüllt es?
Wie wird die Modellgüte bei der logistischen Regression bewertet und welche spezifischen Aspekte werden dabei berücksichtigt?
Wie wird die Modellgüte bei der logistischen Regression bewertet und welche spezifischen Aspekte werden dabei berücksichtigt?
Welche Herausforderungen können bei der Hochrechnung der Trefferrate eines logistischen Modells von der Stichprobe auf die Grundgesamtheit auftreten?
Welche Herausforderungen können bei der Hochrechnung der Trefferrate eines logistischen Modells von der Stichprobe auf die Grundgesamtheit auftreten?
Warum ist die Analyse von Residuen und die Modellkritik ein wichtiger Bestandteil bei der Anwendung der logistischen Regression?
Warum ist die Analyse von Residuen und die Modellkritik ein wichtiger Bestandteil bei der Anwendung der logistischen Regression?
Welchen Vorteil bietet die Verwendung der logistischen Regression im Vergleich zu linearen Regressionsmodellen, insbesondere wenn es um abhängige Variablen geht?
Welchen Vorteil bietet die Verwendung der logistischen Regression im Vergleich zu linearen Regressionsmodellen, insbesondere wenn es um abhängige Variablen geht?
Die ÖBB erhebt die Zufriedenheit ihrer Pendler auf einer Skala von 0 bis 10. Wie ist dieses Merkmal strukturell und bezüglich seines Skalenniveaus korrekt zu kategorisieren?
Die ÖBB erhebt die Zufriedenheit ihrer Pendler auf einer Skala von 0 bis 10. Wie ist dieses Merkmal strukturell und bezüglich seines Skalenniveaus korrekt zu kategorisieren?
Welche der folgenden Kombinationen aus grafischer Darstellung und Kennzahlen ist am besten geeignet, um die Variable 'Anzahl der Verspätungen im letzten Monat' (Variable 2) univariat zu analysieren?
Welche der folgenden Kombinationen aus grafischer Darstellung und Kennzahlen ist am besten geeignet, um die Variable 'Anzahl der Verspätungen im letzten Monat' (Variable 2) univariat zu analysieren?
Die Variable 'Geschlecht' (Variable 4) soll univariat analysiert werden. Welche grafische Darstellung und Kennzahlen sind hierfür am sinnvollsten?
Die Variable 'Geschlecht' (Variable 4) soll univariat analysiert werden. Welche grafische Darstellung und Kennzahlen sind hierfür am sinnvollsten?
Welche Aussage beschreibt die korrekte Vorgehensweise bei der bivariaten Analyse, wenn sowohl die erklärende als auch die Zielvariable metrisch skaliert sind (wie bei Variablen 2, 3 und 5)?
Welche Aussage beschreibt die korrekte Vorgehensweise bei der bivariaten Analyse, wenn sowohl die erklärende als auch die Zielvariable metrisch skaliert sind (wie bei Variablen 2, 3 und 5)?
Nehmen wir an, Sie möchten untersuchen, ob es einen Zusammenhang zwischen dem 'Beruf' (Variable 6) und der 'Zufriedenheit' (Variable 1) gibt. Welche bivariate Analysemethode ist hierfür am besten geeignet?
Nehmen wir an, Sie möchten untersuchen, ob es einen Zusammenhang zwischen dem 'Beruf' (Variable 6) und der 'Zufriedenheit' (Variable 1) gibt. Welche bivariate Analysemethode ist hierfür am besten geeignet?
Wie verändern sich die geeigneten Analysemethoden, wenn anstelle der exakten Altersangabe (Variable 5) lediglich Altersgruppen (z.B. 18-30, 31-45, 46-60, 61+) erhoben werden?
Wie verändern sich die geeigneten Analysemethoden, wenn anstelle der exakten Altersangabe (Variable 5) lediglich Altersgruppen (z.B. 18-30, 31-45, 46-60, 61+) erhoben werden?
Welche Herausforderung entsteht bei der Interpretation der Ergebnisse, wenn die erhobene Strecke, auf der die Pendler befragt werden, hauptsächlich von Personen genutzt wird, die in der Nähe der Endhaltestellen wohnen?
Welche Herausforderung entsteht bei der Interpretation der Ergebnisse, wenn die erhobene Strecke, auf der die Pendler befragt werden, hauptsächlich von Personen genutzt wird, die in der Nähe der Endhaltestellen wohnen?
Angenommen, die ÖBB möchte zusätzlich zu den genannten Variablen das Einkommen der Pendler erheben, ist sich aber bewusst, dass viele Befragte ungern Auskunft darüber geben. Welche Strategie kann angewendet werden, um die Teilnahmebereitschaft zu erhöhen und dennoch valide Daten zu erhalten?
Angenommen, die ÖBB möchte zusätzlich zu den genannten Variablen das Einkommen der Pendler erheben, ist sich aber bewusst, dass viele Befragte ungern Auskunft darüber geben. Welche Strategie kann angewendet werden, um die Teilnahmebereitschaft zu erhöhen und dennoch valide Daten zu erhalten?
Flashcards
Soll-Ist-Vergleich
Soll-Ist-Vergleich
Vergleich von Soll- und Ist-Werten, um Abweichungen von Prognosen zu erkennen.
Wirtschaftskriminalität
Wirtschaftskriminalität
Aufdeckung und Untersuchung von Wirtschaftskriminalität innerhalb von Organisationen.
Benford Analyse
Benford Analyse
Analyse von Zahlen anhand ihrer Verteilung; niedrigere Anfangszahlen kommen häufiger vor.
Local Outlier Detection (LOF)
Local Outlier Detection (LOF)
Signup and view all the flashcards
Latent Class Regression
Latent Class Regression
Signup and view all the flashcards
Nullhypothese (Regression)
Nullhypothese (Regression)
Signup and view all the flashcards
Alternative Hypothese (Regression)
Alternative Hypothese (Regression)
Signup and view all the flashcards
F-Test
F-Test
Signup and view all the flashcards
P-Wert (F-Test)
P-Wert (F-Test)
Signup and view all the flashcards
Irrtumswahrscheinlichkeit (α)
Irrtumswahrscheinlichkeit (α)
Signup and view all the flashcards
P-Wert < α
P-Wert < α
Signup and view all the flashcards
F-Statistik Berechnung
F-Statistik Berechnung
Signup and view all the flashcards
ANOVA Tabelle
ANOVA Tabelle
Signup and view all the flashcards
Was ist der F-Wert?
Was ist der F-Wert?
Signup and view all the flashcards
Was ist der P-Wert?
Was ist der P-Wert?
Signup and view all the flashcards
Bedeutung von R²
Bedeutung von R²
Signup and view all the flashcards
Bedeutung der F-Statistik
Bedeutung der F-Statistik
Signup and view all the flashcards
Inspektion der Koeffizienten
Inspektion der Koeffizienten
Signup and view all the flashcards
Analyse der Residuenplots
Analyse der Residuenplots
Signup and view all the flashcards
Was sind Ausreißer?
Was sind Ausreißer?
Signup and view all the flashcards
Sachliche Plausibilität
Sachliche Plausibilität
Signup and view all the flashcards
Prognoseprozess Schritte
Prognoseprozess Schritte
Signup and view all the flashcards
Negative Modellkritik: To-Do
Negative Modellkritik: To-Do
Signup and view all the flashcards
Multivariate Regressionsanalyse
Multivariate Regressionsanalyse
Signup and view all the flashcards
Multivariate Analyse: Ablauf
Multivariate Analyse: Ablauf
Signup and view all the flashcards
Univariate Analyse Zweck
Univariate Analyse Zweck
Signup and view all the flashcards
Bivariate Regressionsanalyse
Bivariate Regressionsanalyse
Signup and view all the flashcards
Bivariate Voranalyse 1
Bivariate Voranalyse 1
Signup and view all the flashcards
Bivariate Voranalyse 2
Bivariate Voranalyse 2
Signup and view all the flashcards
Logistische Regression
Logistische Regression
Signup and view all the flashcards
Prognose mit logistischer Regression
Prognose mit logistischer Regression
Signup and view all the flashcards
Gruppenprognose
Gruppenprognose
Signup and view all the flashcards
Individualprognose
Individualprognose
Signup and view all the flashcards
Klassifizierungstabelle
Klassifizierungstabelle
Signup and view all the flashcards
Trefferrate vs. Modus
Trefferrate vs. Modus
Signup and view all the flashcards
Omnibus-Test
Omnibus-Test
Signup and view all the flashcards
Nullmodell
Nullmodell
Signup and view all the flashcards
Kategorial vs. Metrisch (Zufriedenheit)
Kategorial vs. Metrisch (Zufriedenheit)
Signup and view all the flashcards
Diskretes Merkmal
Diskretes Merkmal
Signup and view all the flashcards
Stetiges Merkmal
Stetiges Merkmal
Signup and view all the flashcards
Nominal Skaliert
Nominal Skaliert
Signup and view all the flashcards
Box-Whiskers-Plot (Boxplot)
Box-Whiskers-Plot (Boxplot)
Signup and view all the flashcards
Histogramm
Histogramm
Signup and view all the flashcards
Mittelwert, Standardabweichung, etc.
Mittelwert, Standardabweichung, etc.
Signup and view all the flashcards
Säulen-/Balken-/Kreisdiagramm
Säulen-/Balken-/Kreisdiagramm
Signup and view all the flashcards
Study Notes
Frageblock 1 – Analyseplanung
- Die ÖBB möchte die Zufriedenheit ihrer Pendler auf einer bestimmten Strecke ermitteln und führt eine Befragung in den Zügen durch.
Variablen und Skalenniveau
- Grundsätzliche Zufriedenheit: Kategoriales Merkmal, metrisch skaliert (0-10 Bewertung).
- Anzahl der Verspätungen: Diskretes Merkmal, metrisch skaliert.
- Fahrt Dauer: Stetiges Merkmal, metrisch skaliert.
- Geschlecht: Kategoriales Merkmal, nominal skaliert.
- Alter in Jahren: Diskretes Merkmal, metrisch skaliert.
- Beruf: Kategoriales Merkmal, nominal skaliert.
Univariate Voranalysen: Methoden
- Box-Whiskers-Plot oder Histogramm.
- Mittelwert, Standardabweichung, Spannweite, Quartilsabstand, Median.
- Säulen-/Balkendiagramm oder Kreisdiagramm.
- Absolute Häufigkeit, relative Häufigkeit, prozentuale Häufigkeit, Modus.
Bivariate Voranalysen: Methoden
- Wenn beide Variablen (erklärende und Zielvariable) metrisch sind, Scatterplot und Regression verwenden (Variablen 2, 3 und 5).
- Wenn die Zielvariable metrisch und die erklärende Variable nominal skaliert ist, Varianzanalyse und gruppierten Boxplot verwenden.
- Wenn beide, Zielvariable und die erklärende Variable nominal sind, Chi²-Test und gruppiertes Säulendiagramm.
- Wenn Zielvariable nominal und erklärende metrisch sind, logistische Regression und Linienplot verwenden.
Multivariate Methode
- Mit d. ist gemeint, anhand der Informationen ist dies nicht eindeutig zu definieren.
Frageblock 2: Abläufe – Statistischer Analyseprozess
- Start mit Grundgesamtheit (Objekte, Beobachtungseinheiten), über welche eine Frage beantwortet werden soll.
- Stichprobe wird zufällig aus der Grundgesamtheit gezogen.
- Messung der Daten aus Stichprobe → Datenmanagement.
- Erzeugung eines Datensatzes (Datentabelle).
- Deskriptive Statistik (beschreibende Statistik): Beschreibung anhand von Kennzahlen/Grafiken.
- Schließende Statistik, um Frage auf die Grundgesamtheit zu generalisieren.
- Analyse ist mittels des Kreislaufes abgeschlossen, mit der Beantwortung der Frage auf die Grundgesamtheit.
Bivariate Regressionsanalyse: Deskriptiver Ansatz
- Fragestellung beschreiben. Grundgesamtheit beschreiben.
- Stichprobe bestimmen (Stichprobenverfahren, Beschreibung der Probe und die Größe).
- Datenerfassung (messen und erfassen in einer Tabelle, z. B. Excel).
- Durchführung univariater Voranalyse aller Variablen: Kennzahlen und grafische Darstellungen verwenden.
- Datenkontrolle durchführen, erstes Bild von den Objekten bekommen.
Bivariate Analyse
- Streudiagramm erstellen.
- Inspektion des Streudiagramms anhand von Fragen: Gibt es einen Zusammenhang? Ist er linear? Wie stark ist er? Gibt es Ausreißer?
- Behandeln von Ausreißern: Datenkontrolle, Suche nach Erklärung, Entscheidung über Korrektur/Entfernung/Belassen.
- Modellberechnung: Geradengleichung und Bestimmtheitsmaß.
- Modellinterpretation: Übersetzung der Modellgleichung in verständliche Sprache.
- Modellkritik: Korrelation hoch? Bestimmtheitsmaß? Residuenplots prüfen.
- Plausibilitätscheck.
- Mögliche weitere Schritte je nach Ergebnis der Analyse: Ausreißer behandeln, Datenmanipulation, weitere Informationen.
- Ergebnisbeschreibung: Zusammenfassen der Schritte, Dokumentation, Modellgleichung.
Bivariate Regression: Schließende Statistik
- Abläufe sind ähnlich der deskriptiven Regressionsanalyse.
- Erweiterungen:
- Modellkritik: Korrelation/Bestimmtheitsmaß bestimmen und auf Signifikanz prüfen.
- Residuenplots erweitern, um Voraussetzungen für die Hochrechnung zu prüfen.
- Voraussetzungen: Stichprobe zufällig, keine Restmuster, Residuen unabhängig/normalverteilt.
- Werte des Regressors im Bereich der Stichprobe.
- Support des Regressors gleichmäßig und repräsentativ. Plausibilitätscheck durchführen.
- Wenn angebracht, mit Konfidenzintervallen den Achsenabschnitt prüfen.
To-dos
- Bei positiver Modellkritik:
- Abklären, ob die Fragestellung individuell oder für Gruppe ist.
- Auswahl der Objekte für Prognose.
- Durchführung der Prognose.
- Berechnung der Konfidenzintervalle.
- Interpretation und Reaktion.
- Bei negativer Modellkritik: -Keine Durchführung der Prognose, zurück an den Start. -Qualitätskontrolle bei Daten und durchführen. -Modellverbesserung durch: Erhöhen der Stichprobe, Wahl anderer Modelle, zusätzliche Variablen.
Multivariate Regressionsanalyse
- Ähnlicher Ablauf wie bivariate Regressionsanalyse, aber umfangreicher.
- Schritte: Fragestellung, Grundgesamtheit, Stichprobenverfahren, Datenerfassung, univariate/bivariate Analysen.
Unterschiede
- Bivariate Voranalysen:
- Zielvariable mit erklärenden Variablen vergleichen.
- Zwei erklärende Variablen miteinander vergleichen.
- Durchführung multipler Regressionsanalyse und Modellkritik:
- Multiples Bestimmtheitsmaß, F-Statistik, Koeffizienten Tabelle, Residuen.
- Modellinterpretation, Plausibilitätscheck. Eventuelle Ausreißer Behandlung, Datenmanipulation, Ergebnisbeschreibung
ANOVA Tabelle: Schema, Berechnung, Bedeutung R² und F-Test
- Bestimmtheitsmaß (r²): Verhältnis der erklärten Varianz zur Gesamtvarianz.
- F-Test: Prüfen, ob wenigstens ein Regressor einen Einfluss hat.
- Nullhypothese vs. alternative Hypothese.
- Teststatistik berechnen (f), unter Annahme einer bestimmten Verteilung (F-Verteilung).
- Bei geringer Wahrscheinlichkeit Nullhypothese verwerfen → Alternative akzeptieren.
- Irrtumswahrscheinlichkeit (P-Wert) sollte gering sein.
- Ist der P-Wert des F-Tests kleiner als das festgelegte Signifikanzniveau (α), wird die Nullhypothese verworfen
- ANOVA steht für Analysis of variance table.
- Schema: Erklärte Varianz, Restvarianz; Freiheitsgrade; mittlere Abweichungsquadrate; F-Wert; P-Wert.
Modellkritik bei linearer Regression
- R² groß, F-Statistik groß (Nullhypothese verwerfen).
- Koeffizienten: Einfluss der Variablen auf die Prognose prüfen, T-Test verwenden und insignifikante Koeffizienten entfernen.
- Residuenplots: Keine Restmuster, Normalverteilung, konstante Varianz.
- Ausreißer untersuchen und ggf. Modelle mit/ohne Ausreißer vergleichen.
- Sachliche Plausibilität prüfen.
Chi²-Unabhängigkeitstest für zwei Variablen
- Zwei kategoriale Variablen.
- Benötigt beobachtete absolute Häufigkeiten. Erwartete absolute Häufigkeiten ermitteln.
- Nullhypothese: Variablen sind unabhängig.
- Berechnung der erwarteten Häufigkeiten und Teststatistik.
- Chiquadrat Wert kommt aus einer Tabelle
Nicht-parametrische Zeitreihenanalyse
- Zerlegung der Zeitreihe.
- Bestimmung Periode p der saisonalen Komponente.
- Gleitendes Mittel der Länge p bilden.
- Saisonkomponente extrahieren und Fehler bestimmen.
- Restvarianz soll aus der Zeitreihe verschwinden, Saison extrahieren.
- Saison normieren.
- Zeitreihe der Residuen bestimmen.
Parametrische Zeitreihenanalyse
- Ziel: Lineares Regressionsmodell aufsetzen (benötigt metrische Variablen).
- Datenaufbereitung: Zeitvariablen in gemeinsame metrische Variable (Jahr_Quartale).
- Intervallskalierung beachten.
- Durchführung einer trivariaten Regressionsanalyse: Lineare Abhängigkeit, R², F-Test, Signifikanz, Residuen.
- Saisonalität verbessern durch Faktorvariable.
Zeitreihenanalyse mit Autokorrelation
- Benötigt LAG-Funktion.
- Daten mittels LAG aufbereiten.
- Autokorrelationsfunktion auf die einzelnen LAGs anwenden, um Korrelationen zu erkennen.
- Schwellenwert verwenden, um LAGs auszuwählen oder zu streichen.
Logistische Regression
- Nominale (abhängige Variable) und metrische (erklärende) Variable.
- Univariate Voranalyse, F-Test, Boxplots.
- Streudiagramme einfügen.
- Lineare Regression berechnen.
- Logistische Regression anwenden.
- Umstellung der Formel für Abhängigkeiten.
Prognose mit logistischer Regression
- Prognose für Gruppen (Anteil Erkrankter etc.)
- Prognose für Individuen (Wahrscheinlichkeit)
- Modellgüte anhand der Klassifizierungstabelle.
- Testen, ob Trefferrate signifikant verschieden vom einfachen Modell (Omnibus-Test).
- Vergleich vorheriger Ergebnisse.
Überbuchungssteuerung im Yield Management
- Mehr Tickets verkaufen als Kapazitäten vorhanden sind.
- Ziel: Bessere Auslastung und Erlössteigerung.
- Ökonomische Konsequenzen, Fencing Strategien, No-shows
- Ablauf der Überbuchungssteuerung: Limit festlegen/neubewerten (Reoptimierung des Überbuchungslimits).
Rechenmodell
- Wahrscheinlichkeit schätzen.
Mengenorientierte Kapazitätssteuerung im Yield Management
- Für jedes Produkt (mit anderem Preis) Kontingent festlegen.
- Nesting: Höherwertige Produkte dürfen auf Kontingente niederwertigerer Produkte zurückgreifen.
- Theftnesting: Kontingente werden mit der niedrigsten Preisstufe entnommen.
Erlösorientierte Kapazitätssteuerung
- Erlösoptimale Preissteuerung eines „allwissenden Agenten".
Benford Analyse
- Verteilung der ersten Ziffer in Buchungszahlen.
- Chi²-Test verwenden.
Fraud Audit
- Vergleich von Soll und Ist, Aufklärung ökonomischer Kriminalität.
- Methoden: Benford Analyse (Logarithmentafeln), Boxplot, Local Outlier Detection (LOF), Preisvolatilitätsprüfung
Latent Class Regression
- Kombination aus Clusteranalyse und Regressionsanalyse.
- Gruppierungsvariable wird vermutet.
- Clusterung in linearen Trend.
Korrelation
- Positive: Zusammenhang zwischen Variablen.
- Negative: Kein Zusammenhang.
- Kausalität kann nicht abgeleitet werden.
- Korrelationskoeffizient: Stärke des Zusammenhangs (-1 bis +1).
Bestimmtheitsmaß R²
- Wie gut Daten anhand linearer Regression vorhersagbar/Kennzah
Residuen
- Wie genau abhängige Variable geschätzt werden kann.
P-Wert
- Entscheidungshilfe, ob Nullhypothese abgelehnt werden kann.
T-Test
- Entscheidung Hilfe, ob die Nullhypothese abgelehnt werden kann
- Statistsich signifikant, wenn ein Zusammenhang besteht.
Skalenniveau
- Skalen kompatibel;Nominal,Ordinal, Metrisch mit Intervall
Konfidenzniveau
- Hilft genauigkeit Parameter anzugeben.
Steigungskoeffezient
Auch Regressionskoeffizienten genannt, gibt anstieg und Abfallpro
Schiefe ist eine Kennzahl, die die Artik und Stärke der Asymmetrie einer Wahrscheinlichkeisverteilung anzeigt.
dichotome variable
sind nur zwei Ausprägungen möglich
diskret
Beispiel Würfel nur enrdiche zahlen möglich.
stetig
beospieltemparture alles möglich.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Related Documents
Description
Dieser Test untersucht den Soll-Ist-Vergleich und Local Outlier Detection. Außerdem behandelt es Latent Class Regression. Ziel ist es, die wichtigsten Methoden zu verstehen.