Wirtschaftskriminalität Aufdeckung
45 Questions
1 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Welche der folgenden Aussagen beschreibt am besten den Hauptzweck des Soll-Ist-Vergleichs im Kontext der Aufdeckung von Wirtschaftskriminalität?

  • Die Effizienz der internen Kontrollsysteme zu messen und zu verbessern.
  • Fehlende Sensibilisierung des Umfelds des Betrügers zu beseitigen.
  • Die genaue Einhaltung von Umsatzprognosen zu gewährleisten, um finanzielle Stabilität zu demonstrieren.
  • Abweichungen zwischen geplanten und tatsächlichen Werten zu identifizieren, die auf potenziell betrügerische Aktivitäten hinweisen könnten. (correct)

Welche der folgenden Methoden zur Aufdeckung von Wirtschaftskriminalität ist am besten geeignet, um Auffälligkeiten in Zahlenreihen zu identifizieren, die auf der erwarteten Häufigkeit bestimmter Anfangsziffern basieren?

  • Local Outlier Detection (LOF)
  • Benford-Analyse (correct)
  • Boxplot-Analyse
  • Preisvolatilitätsprüfung

Was ist der Hauptnachteil der Verwendung eines Boxplots zur Analyse von Daten im Rahmen der Aufdeckung von Wirtschaftskriminalität?

  • Boxplots können nur für große Datensätze verwendet werden.
  • Boxplots erfordern eine Normalverteilung der Daten.
  • Boxplots sind anfällig für Verzerrungen durch Ausreißer.
  • Boxplots betrachten nur eine Dimension der Daten auf einmal. (correct)

Was bedeutet ein hoher LOF-Wert (Local Outlier Factor) bei der Anwendung von Local Outlier Detection?

<p>Der Punkt passt schlecht in sein Cluster und ist ein potenzieller Ausreißer. (B)</p> Signup and view all the answers

Was ist das Hauptziel der Latent Class Regression im Kontext der Aufdeckung von Wirtschaftskriminalität?

<p>Die Durchführung einer Clusteranalyse, um anschließend für jedes Cluster eine separate lineare Regression durchzuführen, basierend auf einer vermuteten, aber unbekannten Gruppierungsvariable. (D)</p> Signup and view all the answers

Welche Aussage beschreibt am besten den Zweck univariater Analysen im Kontext einer multivariaten Regressionsanalyse?

<p>Die Überprüfung, ob alle Daten erwartungsgemäß erfasst wurden und die Identifizierung von Erfassungsfehlern. (C)</p> Signup and view all the answers

Welche der folgenden Aussagen beschreibt am besten die Interpretation eines hohen p-Wertes im Kontext eines statistischen Tests?

<p>Die vorhandenen Daten liefern keine ausreichende Evidenz, um die Nullhypothese zu verwerfen. (D)</p> Signup and view all the answers

Welche der folgenden Maßnahmen ist NICHT Teil der Modellverbesserung bei negativer Modellkritik im Rahmen einer Prognose?

<p>Durchführung der Prognose trotz negativer Modellkritik. (B)</p> Signup and view all the answers

Was impliziert die Entscheidung, die Nullhypothese nicht zu verwerfen?

<p>Es gibt keine ausreichende Evidenz, um die Nullhypothese abzulehnen, aber sie könnte trotzdem falsch sein. (C)</p> Signup and view all the answers

Warum ist es bei der bivariaten Voranalyse im Rahmen einer multivariaten Regressionsanalyse wichtig, dass zwischen den erklärenden Variablen idealerweise kein starker Zusammenhang besteht?

<p>Um Multikollinearität zu vermeiden, die die Interpretation der Regressionsergebnisse erschweren kann. (D)</p> Signup and view all the answers

Was ist der Zweck eines F-Tests im Rahmen der Regressionsanalyse?

<p>Zu prüfen, ob mindestens einer der Regressoren einen signifikanten Einfluss auf die Zielvariable hat. (A)</p> Signup and view all the answers

In welcher Phase des Prognoseprozesses wird entschieden, ob aufgrund von Qualitätsmängeln der Daten oder des Modells auf eine Prognose verzichtet werden muss?

<p>To-do bei negativer Modellkritik. (C)</p> Signup and view all the answers

Wie wird die Teststatistik im F-Test berechnet?

<p>Als Quotient der mittleren Quadratsumme der erklärten Varianz und der mittleren Quadratsumme der Residuen. (D)</p> Signup and view all the answers

Welche der folgenden Analysen wird typischerweise NICHT im Rahmen einer bivariaten Voranalyse für eine multiple lineare Regression durchgeführt?

<p>Kreuztabellierung zur Analyse der Beziehung zwischen zwei kategorialen Variablen. (C)</p> Signup and view all the answers

Wovon hängt die Wahl der Irrtumswahrscheinlichkeit (alpha) ab?

<p>Von der Stichprobengröße, der Fragestellung und der Wichtigkeit, einen Fehler zu vermeiden. (A)</p> Signup and view all the answers

Was ist der Hauptunterschied zwischen einer bivariaten und einer multivariaten Regressionsanalyse hinsichtlich der Variablenarten?

<p>Bivariate Analysen untersuchen die Beziehung zwischen zwei Variablen, während multivariate Analysen die Beziehungen zwischen einer Zielvariable und mehreren erklärenden Variablen untersuchen. (B)</p> Signup and view all the answers

Angenommen, Sie führen eine bivariate Voranalyse für eine multiple Regression durch und stellen fest, dass eine Ihrer erklärenden Variablen hoch korreliert ist mit der Zielvariable, aber auch stark mit einer anderen erklärenden Variablen. Welche der folgenden Maßnahmen wäre am angemessensten?

<p>Die Variable aus dem Modell entfernen, um Multikollinearität zu vermeiden, und alternative Variablen in Betracht ziehen. (A)</p> Signup and view all the answers

Welche Aussage über die ANOVA-Tabelle ist zutreffend?

<p>Die dritte Spalte der ANOVA-Tabelle zeigt die mittleren Abweichungsquadrate. (C)</p> Signup and view all the answers

Was repräsentieren die Freiheitsgrade (df) in der ANOVA-Tabelle?

<p>Die Anzahl der unabhängigen Informationen, die zur Schätzung eines Parameters zur Verfügung stehen. (C)</p> Signup and view all the answers

In welcher Situation wäre es am wahrscheinlichsten, dass man akzeptieren muss, dass kein passendes Modell für eine Prognose gefunden werden kann?

<p>Wenn keine der verfügbaren erklärenden Variablen einen signifikanten Einfluss auf die Zielvariable hat. (C)</p> Signup and view all the answers

Angenommen, Sie führen einen F-Test durch und erhalten einen p-Wert von 0.08. Ihr vorher festgelegtes Signifikanzniveau (alpha) beträgt 0.05. Was ist die korrekte Schlussfolgerung?

<p>Die Nullhypothese wird nicht verworfen, da der p-Wert größer als 0.05 ist. (B)</p> Signup and view all the answers

Welche Aussage beschreibt am besten die Interpretation des F-Wertes bei der Modellkritik einer linearen Regression?

<p>Ein großer F-Wert deutet auf eine hohe erklärte Varianz im Verhältnis zu den Residuen hin, was dafür spricht, dass die Nullhypothese verworfen werden kann. (D)</p> Signup and view all the answers

Warum ist es wichtig, bei der Aufnahme von Variablen in ein lineares Regressionsmodell eine 'richtige Balance' zu finden, anstatt einfach so viele Variablen wie möglich aufzunehmen?

<p>Die Aufnahme zusätzlicher Variablen kann dazu führen, dass die Teststatistik des F-Tests kleiner wird, während R2 tendenziell größer wird, was die Interpretation erschwert. (D)</p> Signup and view all the answers

Welche Aussage beschreibt am besten, wie man bei der Analyse von Residuenplots auf eine Verletzung der Annahme konstanter Varianz (Homoskedastizität) schließen könnte?

<p>Die Residuen zeigen ein deutliches Muster, beispielsweise eine Trichterform, was auf eine nicht konstante Varianz hindeutet. (A)</p> Signup and view all the answers

Warum ist es sinnvoll, bei der Identifizierung von Ausreißern in einem linearen Regressionsmodell sowohl solche zu betrachten, die nicht ins Muster passen, als auch solche, die sehr gut ins Muster passen?

<p>Ausreißer, die gut ins Muster passen, können überproportional für ein hohes R2 verantwortlich sein, während Ausreißer, die nicht ins Muster passen, die Koeffizientenschätzer verzerren können. (A)</p> Signup and view all the answers

Welche Schlussfolgerung kann gezogen werden, wenn ein lineares Regressionsmodell sachlich nicht plausibel ist?

<p>Das Modell ist quasi wertlos, da es keine sinnvolle oder interpretierbare Beziehung zwischen den Variablen darstellt. (A)</p> Signup and view all the answers

Was ist der Hauptzweck des Chi-Quadrat-Unabhängigkeitstests im Kontext von zwei kategorialen Variablen?

<p>Festzustellen, ob es einen statistisch signifikanten Zusammenhang zwischen den beiden Variablen gibt oder ob sie unabhängig voneinander sind. (A)</p> Signup and view all the answers

Im Rahmen des Chi-Quadrat-Unabhängigkeitstests, wie werden die 'erwarteten absoluten Häufigkeiten' ermittelt, wenn nur die beobachteten Häufigkeiten bekannt sind?

<p>Unter der Annahme, dass die Variablen unabhängig sind, basierend auf den Randsummen der Kontingenztafel. (B)</p> Signup and view all the answers

Welche Auswirkungen hat die Verletzung der Annahme unabhängiger Residuen bei der linearen Regression auf die Gültigkeit der Regressionsergebnisse?

<p>Die Schätzungen der Regressionskoeffizienten bleiben unverzerrt, aber die Standardfehler sind ineffizient. (A)</p> Signup and view all the answers

Welche Aussage beschreibt am besten die Interpretation einer Prognose, die mit einer logistischen Regression für eine Gruppe erstellt wurde?

<p>Sie kann als der Anteil der Personen in der Gruppe interpretiert werden, die die betrachtete Eigenschaft aufweisen. (A)</p> Signup and view all the answers

Warum ist es wichtig, dass die Trefferrate eines logistischen Regressionsmodells signifikant höher ist als der Anteil des Modus der dichotomen Zielvariable?

<p>Um zu gewährleisten, dass das Modell nicht durch Zufall bessere Ergebnisse erzielt als eine einfache Zuordnung zur häufigsten Klasse. (D)</p> Signup and view all the answers

Was ist der Hauptzweck des Omnibus-Tests im Kontext der logistischen Regression?

<p>Der Vergleich der Trefferrate des logistischen Modells mit der Trefferrate eines einfachen Modells, um festzustellen, ob der Unterschied signifikant ist. (C)</p> Signup and view all the answers

Was ist das 'Null-Modell' (Anfangsblock) in der logistischen Regression und welchen Zweck erfüllt es?

<p>Ein logistisches Regressionsmodell, das nur die Konstante, aber keine unabhängigen Variablen enthält; es dient als Basismodell zum Vergleich mit Modellen, die unabhängige Variablen enthalten. (A)</p> Signup and view all the answers

Wie wird die Modellgüte bei der logistischen Regression bewertet und welche spezifischen Aspekte werden dabei berücksichtigt?

<p>Durch die Betrachtung der Klassifizierungstabelle, den Vergleich mit dem Null-Modell, den Omnibus-Test und die Prüfung des R-quadrat, zusätzlich zur Bewertung der Koeffizienten der Variablen. (D)</p> Signup and view all the answers

Welche Herausforderungen können bei der Hochrechnung der Trefferrate eines logistischen Modells von der Stichprobe auf die Grundgesamtheit auftreten?

<p>Die Trefferrate kann aufgrund von Unterschieden zwischen Stichprobe und Grundgesamtheit verzerrt sein, weshalb ein Test auf Signifikanz erforderlich ist. (D)</p> Signup and view all the answers

Warum ist die Analyse von Residuen und die Modellkritik ein wichtiger Bestandteil bei der Anwendung der logistischen Regression?

<p>Um die Annahmen des Modells zu überprüfen, potenzielle Probleme zu identifizieren und die Gültigkeit und Generalisierbarkeit der Ergebnisse sicherzustellen. (B)</p> Signup and view all the answers

Welchen Vorteil bietet die Verwendung der logistischen Regression im Vergleich zu linearen Regressionsmodellen, insbesondere wenn es um abhängige Variablen geht?

<p>Die logistische Regression ermöglicht es, Wahrscheinlichkeiten vorherzusagen, da sie die Werte in einen Bereich zwischen 0 und 1 transformiert, was bei dichotomen Variablen wichtig ist. (B)</p> Signup and view all the answers

Die ÖBB erhebt die Zufriedenheit ihrer Pendler auf einer Skala von 0 bis 10. Wie ist dieses Merkmal strukturell und bezüglich seines Skalenniveaus korrekt zu kategorisieren?

<p>Kategoriales Merkmal und metrisch skaliert (C)</p> Signup and view all the answers

Welche der folgenden Kombinationen aus grafischer Darstellung und Kennzahlen ist am besten geeignet, um die Variable 'Anzahl der Verspätungen im letzten Monat' (Variable 2) univariat zu analysieren?

<p>Histogramm; Median, Quartilsabstand (A)</p> Signup and view all the answers

Die Variable 'Geschlecht' (Variable 4) soll univariat analysiert werden. Welche grafische Darstellung und Kennzahlen sind hierfür am sinnvollsten?

<p>Säulen-/Balkendiagramm; absolute Häufigkeit, relative Häufigkeit, Modus (A)</p> Signup and view all the answers

Welche Aussage beschreibt die korrekte Vorgehensweise bei der bivariaten Analyse, wenn sowohl die erklärende als auch die Zielvariable metrisch skaliert sind (wie bei Variablen 2, 3 und 5)?

<p>Nutze einen Scatterplot und eine Regressionsanalyse, um den Zusammenhang und die Stärke des Einflusses zu untersuchen. (A)</p> Signup and view all the answers

Nehmen wir an, Sie möchten untersuchen, ob es einen Zusammenhang zwischen dem 'Beruf' (Variable 6) und der 'Zufriedenheit' (Variable 1) gibt. Welche bivariate Analysemethode ist hierfür am besten geeignet?

<p>Varianzanalyse und gruppierter Boxplot (A)</p> Signup and view all the answers

Wie verändern sich die geeigneten Analysemethoden, wenn anstelle der exakten Altersangabe (Variable 5) lediglich Altersgruppen (z.B. 18-30, 31-45, 46-60, 61+) erhoben werden?

<p>Die Variable wird von metrisch zu ordinal, was den Einsatz von Rangkorrelationen und nicht-parametrischen Tests nahelegt. (D)</p> Signup and view all the answers

Welche Herausforderung entsteht bei der Interpretation der Ergebnisse, wenn die erhobene Strecke, auf der die Pendler befragt werden, hauptsächlich von Personen genutzt wird, die in der Nähe der Endhaltestellen wohnen?

<p>Die externe Validität der Ergebnisse ist gefährdet, weil die Stichprobe verzerrt ist. (A)</p> Signup and view all the answers

Angenommen, die ÖBB möchte zusätzlich zu den genannten Variablen das Einkommen der Pendler erheben, ist sich aber bewusst, dass viele Befragte ungern Auskunft darüber geben. Welche Strategie kann angewendet werden, um die Teilnahmebereitschaft zu erhöhen und dennoch valide Daten zu erhalten?

<p>Das Einkommen in einer sehr breiten Spanne abfragen (z.B. unter 20.000€, über 100.000€) (A)</p> Signup and view all the answers

Flashcards

Soll-Ist-Vergleich

Vergleich von Soll- und Ist-Werten, um Abweichungen von Prognosen zu erkennen.

Wirtschaftskriminalität

Aufdeckung und Untersuchung von Wirtschaftskriminalität innerhalb von Organisationen.

Benford Analyse

Analyse von Zahlen anhand ihrer Verteilung; niedrigere Anfangszahlen kommen häufiger vor.

Local Outlier Detection (LOF)

Identifiziert Datenpunkte, die sich deutlich von ihrer lokalen Umgebung unterscheiden.

Signup and view all the flashcards

Latent Class Regression

Kombiniert Cluster- und Regressionsanalyse, um verborgene Gruppierungen zu identifizieren.

Signup and view all the flashcards

Nullhypothese (Regression)

Kein Einfluss der erklärenden Variablen auf die Zielvariable.

Signup and view all the flashcards

Alternative Hypothese (Regression)

Mindestens ein Regressor hat Einfluss auf die Zielvariable.

Signup and view all the flashcards

F-Test

Teststatistik zur Überprüfung der Nullhypothese in der Regression.

Signup and view all the flashcards

P-Wert (F-Test)

Wahrscheinlichkeit, einen Wert der F-Statistik zu erhalten, der genauso groß oder größer ist, unter der Nullhypothese.

Signup and view all the flashcards

Irrtumswahrscheinlichkeit (α)

Die Wahrscheinlichkeit, die Nullhypothese fälschlicherweise zu verwerfen.

Signup and view all the flashcards

P-Wert < α

Die Wahrscheinlichkeit, mit der die Nullhypothese verworfen wird.

Signup and view all the flashcards

F-Statistik Berechnung

Verhältnis der mittleren Quadratsumme der erklärten Varianz zur mittleren Quadratsumme der Residuen.

Signup and view all the flashcards

ANOVA Tabelle

Tabelle zur Analyse der Varianz.

Signup and view all the flashcards

Was ist der F-Wert?

Mittlere Quadratsumme der erklärten Varianz geteilt durch die mittlere Quadratsumme der Residuen.

Signup and view all the flashcards

Was ist der P-Wert?

Irrtumswahrscheinlichkeit, die sich aus dem Wert der Teststatistik ergibt.

Signup and view all the flashcards

Bedeutung von R²

Ein hoher Wert deutet auf eine gute Modellanpassung hin.

Signup and view all the flashcards

Bedeutung der F-Statistik

Die Teststatistik sollte groß sein, um die Nullhypothese zu verwerfen.

Signup and view all the flashcards

Inspektion der Koeffizienten

Überprüfe Größe und Vorzeichen der Koeffizienten auf Plausibilität.

Signup and view all the flashcards

Analyse der Residuenplots

Deskriptiv (keine Muster) und Prognose (Normalverteilt, unabhängig, konstante Varianz).

Signup and view all the flashcards

Was sind Ausreißer?

Datenpunkte, die stark vom Muster abweichen oder das Ergebnis stark beeinflussen.

Signup and view all the flashcards

Sachliche Plausibilität

Überprüfung, ob das Modell inhaltlich sinnvoll und nachvollziehbar ist.

Signup and view all the flashcards

Prognoseprozess Schritte

Die Schritte sind: Objektauswahl, Prognosedurchführung, Konfidenzintervalle berechnen, Interpretation & Reaktion.

Signup and view all the flashcards

Negative Modellkritik: To-Do

Datenqualitätsprüfung, Modellverbesserung (Stichprobe, Modelle, Variablen).

Signup and view all the flashcards

Multivariate Regressionsanalyse

Ähnlich bivariat, aber umfangreicher und mit Anpassungen.

Signup and view all the flashcards

Multivariate Analyse: Ablauf

Frage, Grundgesamtheit, Stichprobe, Datenerfassung, Analyse.

Signup and view all the flashcards

Univariate Analyse Zweck

Kennzahlenbasierte Analyse jeder Variable auf Fehler und Auffälligkeiten.

Signup and view all the flashcards

Bivariate Regressionsanalyse

Zusammenhang zwischen metrischen Variablen (grafisch & rechnerisch).

Signup and view all the flashcards

Bivariate Voranalyse 1

Wirkung erklärender Variable auf Zielvariable prüfen.

Signup and view all the flashcards

Bivariate Voranalyse 2

Zusammenhänge zwischen zwei erklärenden Variablen untersuchen (kein Zusammenhang erwünscht).

Signup and view all the flashcards

Logistische Regression

Nichtlineare Transformation (ln), um Werte zwischen 0 und 100% zu erhalten.

Signup and view all the flashcards

Prognose mit logistischer Regression

Vorhersage des Wertes der abhängigen Variable für Messungen innerhalb und außerhalb der Stichprobe.

Signup and view all the flashcards

Gruppenprognose

Anteil von Betroffenen in einer Gruppe (z.B. Altersgruppe).

Signup and view all the flashcards

Individualprognose

Wahrscheinlichkeit für ein Individuum oder Einstufung in eine Klasse, wenn ein bestimmter Wert überschritten wird.

Signup and view all the flashcards

Klassifizierungstabelle

Bestimmt die Güte des Modells; schlecht, wenn die Trefferquote nahe 50% liegt.

Signup and view all the flashcards

Trefferrate vs. Modus

Die Trefferrate des Modells muss signifikant höher sein als die des einfachen Modells.

Signup and view all the flashcards

Omnibus-Test

Test, ob die Trefferrate des logistischen Modells signifikant vom einfachen Modell abweicht (Chi2-verteilt).

Signup and view all the flashcards

Nullmodell

Logistisches Regressionsmodell ohne unabhängige Variable, nur mit Konstanten.

Signup and view all the flashcards

Kategorial vs. Metrisch (Zufriedenheit)

Bewertung auf einer Skala (z.B. 0-10), die subjektive Meinungen oder Zufriedenheit misst.

Signup and view all the flashcards

Diskretes Merkmal

Variable, die ganze Zahlen annimmt und zählbar ist (z.B. Anzahl der Verspätungen).

Signup and view all the flashcards

Stetiges Merkmal

Variable, die jeden Wert innerhalb eines Bereichs annehmen kann (z.B. Fahrtzeit in Minuten).

Signup and view all the flashcards

Nominal Skaliert

Variable, die Kategorien oder Gruppen zuordnet (z.B. Geschlecht, Beruf).

Signup and view all the flashcards

Box-Whiskers-Plot (Boxplot)

Grafische Darstellung für metrische Daten, um Verteilung und Ausreißer zu zeigen.

Signup and view all the flashcards

Histogramm

Grafische Darstellung für die Häufigkeit von Werten.

Signup and view all the flashcards

Mittelwert, Standardabweichung, etc.

Kennzahlen zur Beschreibung metrischer Daten.

Signup and view all the flashcards

Säulen-/Balken-/Kreisdiagramm

Grafische Darstellung für nominale Daten, um Häufigkeiten oder Anteile zu zeigen.

Signup and view all the flashcards

Study Notes

Frageblock 1 – Analyseplanung

  • Die ÖBB möchte die Zufriedenheit ihrer Pendler auf einer bestimmten Strecke ermitteln und führt eine Befragung in den Zügen durch.

Variablen und Skalenniveau

  • Grundsätzliche Zufriedenheit: Kategoriales Merkmal, metrisch skaliert (0-10 Bewertung).
  • Anzahl der Verspätungen: Diskretes Merkmal, metrisch skaliert.
  • Fahrt Dauer: Stetiges Merkmal, metrisch skaliert.
  • Geschlecht: Kategoriales Merkmal, nominal skaliert.
  • Alter in Jahren: Diskretes Merkmal, metrisch skaliert.
  • Beruf: Kategoriales Merkmal, nominal skaliert.

Univariate Voranalysen: Methoden

  • Box-Whiskers-Plot oder Histogramm.
  • Mittelwert, Standardabweichung, Spannweite, Quartilsabstand, Median.
  • Säulen-/Balkendiagramm oder Kreisdiagramm.
  • Absolute Häufigkeit, relative Häufigkeit, prozentuale Häufigkeit, Modus.

Bivariate Voranalysen: Methoden

  • Wenn beide Variablen (erklärende und Zielvariable) metrisch sind, Scatterplot und Regression verwenden (Variablen 2, 3 und 5).
  • Wenn die Zielvariable metrisch und die erklärende Variable nominal skaliert ist, Varianzanalyse und gruppierten Boxplot verwenden.
  • Wenn beide, Zielvariable und die erklärende Variable nominal sind, Chi²-Test und gruppiertes Säulendiagramm.
  • Wenn Zielvariable nominal und erklärende metrisch sind, logistische Regression und Linienplot verwenden.

Multivariate Methode

  • Mit d. ist gemeint, anhand der Informationen ist dies nicht eindeutig zu definieren.

Frageblock 2: Abläufe – Statistischer Analyseprozess

  • Start mit Grundgesamtheit (Objekte, Beobachtungseinheiten), über welche eine Frage beantwortet werden soll.
  • Stichprobe wird zufällig aus der Grundgesamtheit gezogen.
  • Messung der Daten aus Stichprobe → Datenmanagement.
  • Erzeugung eines Datensatzes (Datentabelle).
  • Deskriptive Statistik (beschreibende Statistik): Beschreibung anhand von Kennzahlen/Grafiken.
  • Schließende Statistik, um Frage auf die Grundgesamtheit zu generalisieren.
  • Analyse ist mittels des Kreislaufes abgeschlossen, mit der Beantwortung der Frage auf die Grundgesamtheit.

Bivariate Regressionsanalyse: Deskriptiver Ansatz

  • Fragestellung beschreiben. Grundgesamtheit beschreiben.
  • Stichprobe bestimmen (Stichprobenverfahren, Beschreibung der Probe und die Größe).
  • Datenerfassung (messen und erfassen in einer Tabelle, z. B. Excel).
  • Durchführung univariater Voranalyse aller Variablen: Kennzahlen und grafische Darstellungen verwenden.
  • Datenkontrolle durchführen, erstes Bild von den Objekten bekommen.

Bivariate Analyse

  • Streudiagramm erstellen.
  • Inspektion des Streudiagramms anhand von Fragen: Gibt es einen Zusammenhang? Ist er linear? Wie stark ist er? Gibt es Ausreißer?
  • Behandeln von Ausreißern: Datenkontrolle, Suche nach Erklärung, Entscheidung über Korrektur/Entfernung/Belassen.
  • Modellberechnung: Geradengleichung und Bestimmtheitsmaß.
  • Modellinterpretation: Übersetzung der Modellgleichung in verständliche Sprache.
  • Modellkritik: Korrelation hoch? Bestimmtheitsmaß? Residuenplots prüfen.
  • Plausibilitätscheck.
  • Mögliche weitere Schritte je nach Ergebnis der Analyse: Ausreißer behandeln, Datenmanipulation, weitere Informationen.
  • Ergebnisbeschreibung: Zusammenfassen der Schritte, Dokumentation, Modellgleichung.

Bivariate Regression: Schließende Statistik

  • Abläufe sind ähnlich der deskriptiven Regressionsanalyse.
  • Erweiterungen:
    • Modellkritik: Korrelation/Bestimmtheitsmaß bestimmen und auf Signifikanz prüfen.
    • Residuenplots erweitern, um Voraussetzungen für die Hochrechnung zu prüfen.
    • Voraussetzungen: Stichprobe zufällig, keine Restmuster, Residuen unabhängig/normalverteilt.
    • Werte des Regressors im Bereich der Stichprobe.
    • Support des Regressors gleichmäßig und repräsentativ. Plausibilitätscheck durchführen.
    • Wenn angebracht, mit Konfidenzintervallen den Achsenabschnitt prüfen.

To-dos

  • Bei positiver Modellkritik:
    • Abklären, ob die Fragestellung individuell oder für Gruppe ist.
    • Auswahl der Objekte für Prognose.
    • Durchführung der Prognose.
    • Berechnung der Konfidenzintervalle.
    • Interpretation und Reaktion.
  • Bei negativer Modellkritik: -Keine Durchführung der Prognose, zurück an den Start. -Qualitätskontrolle bei Daten und durchführen. -Modellverbesserung durch: Erhöhen der Stichprobe, Wahl anderer Modelle, zusätzliche Variablen.

Multivariate Regressionsanalyse

  • Ähnlicher Ablauf wie bivariate Regressionsanalyse, aber umfangreicher.
  • Schritte: Fragestellung, Grundgesamtheit, Stichprobenverfahren, Datenerfassung, univariate/bivariate Analysen.

Unterschiede

  • Bivariate Voranalysen:
    • Zielvariable mit erklärenden Variablen vergleichen.
    • Zwei erklärende Variablen miteinander vergleichen.
  • Durchführung multipler Regressionsanalyse und Modellkritik:
    • Multiples Bestimmtheitsmaß, F-Statistik, Koeffizienten Tabelle, Residuen.
  • Modellinterpretation, Plausibilitätscheck. Eventuelle Ausreißer Behandlung, Datenmanipulation, Ergebnisbeschreibung

ANOVA Tabelle: Schema, Berechnung, Bedeutung R² und F-Test

  • Bestimmtheitsmaß (r²): Verhältnis der erklärten Varianz zur Gesamtvarianz.
  • F-Test: Prüfen, ob wenigstens ein Regressor einen Einfluss hat.
  • Nullhypothese vs. alternative Hypothese.
  • Teststatistik berechnen (f), unter Annahme einer bestimmten Verteilung (F-Verteilung).
  • Bei geringer Wahrscheinlichkeit Nullhypothese verwerfen → Alternative akzeptieren.
  • Irrtumswahrscheinlichkeit (P-Wert) sollte gering sein.
  • Ist der P-Wert des F-Tests kleiner als das festgelegte Signifikanzniveau (α), wird die Nullhypothese verworfen
  • ANOVA steht für Analysis of variance table.
  • Schema: Erklärte Varianz, Restvarianz; Freiheitsgrade; mittlere Abweichungsquadrate; F-Wert; P-Wert.

Modellkritik bei linearer Regression

  • R² groß, F-Statistik groß (Nullhypothese verwerfen).
  • Koeffizienten: Einfluss der Variablen auf die Prognose prüfen, T-Test verwenden und insignifikante Koeffizienten entfernen.
  • Residuenplots: Keine Restmuster, Normalverteilung, konstante Varianz.
  • Ausreißer untersuchen und ggf. Modelle mit/ohne Ausreißer vergleichen.
  • Sachliche Plausibilität prüfen.

Chi²-Unabhängigkeitstest für zwei Variablen

  • Zwei kategoriale Variablen.
  • Benötigt beobachtete absolute Häufigkeiten. Erwartete absolute Häufigkeiten ermitteln.
  • Nullhypothese: Variablen sind unabhängig.
  • Berechnung der erwarteten Häufigkeiten und Teststatistik.
  • Chiquadrat Wert kommt aus einer Tabelle

Nicht-parametrische Zeitreihenanalyse

  • Zerlegung der Zeitreihe.
  • Bestimmung Periode p der saisonalen Komponente.
  • Gleitendes Mittel der Länge p bilden.
  • Saisonkomponente extrahieren und Fehler bestimmen.
  • Restvarianz soll aus der Zeitreihe verschwinden, Saison extrahieren.
  • Saison normieren.
  • Zeitreihe der Residuen bestimmen.

Parametrische Zeitreihenanalyse

  • Ziel: Lineares Regressionsmodell aufsetzen (benötigt metrische Variablen).
  • Datenaufbereitung: Zeitvariablen in gemeinsame metrische Variable (Jahr_Quartale).
  • Intervallskalierung beachten.
  • Durchführung einer trivariaten Regressionsanalyse: Lineare Abhängigkeit, R², F-Test, Signifikanz, Residuen.
  • Saisonalität verbessern durch Faktorvariable.

Zeitreihenanalyse mit Autokorrelation

  • Benötigt LAG-Funktion.
  • Daten mittels LAG aufbereiten.
  • Autokorrelationsfunktion auf die einzelnen LAGs anwenden, um Korrelationen zu erkennen.
  • Schwellenwert verwenden, um LAGs auszuwählen oder zu streichen.

Logistische Regression

  • Nominale (abhängige Variable) und metrische (erklärende) Variable.
  • Univariate Voranalyse, F-Test, Boxplots.
  • Streudiagramme einfügen.
  • Lineare Regression berechnen.
  • Logistische Regression anwenden.
  • Umstellung der Formel für Abhängigkeiten.

Prognose mit logistischer Regression

  • Prognose für Gruppen (Anteil Erkrankter etc.)
  • Prognose für Individuen (Wahrscheinlichkeit)
  • Modellgüte anhand der Klassifizierungstabelle.
  • Testen, ob Trefferrate signifikant verschieden vom einfachen Modell (Omnibus-Test).
  • Vergleich vorheriger Ergebnisse.

Überbuchungssteuerung im Yield Management

  • Mehr Tickets verkaufen als Kapazitäten vorhanden sind.
  • Ziel: Bessere Auslastung und Erlössteigerung.
  • Ökonomische Konsequenzen, Fencing Strategien, No-shows
  • Ablauf der Überbuchungssteuerung: Limit festlegen/neubewerten (Reoptimierung des Überbuchungslimits).

Rechenmodell

  • Wahrscheinlichkeit schätzen.

Mengenorientierte Kapazitätssteuerung im Yield Management

  • Für jedes Produkt (mit anderem Preis) Kontingent festlegen.
  • Nesting: Höherwertige Produkte dürfen auf Kontingente niederwertigerer Produkte zurückgreifen.
  • Theftnesting: Kontingente werden mit der niedrigsten Preisstufe entnommen.

Erlösorientierte Kapazitätssteuerung

  • Erlösoptimale Preissteuerung eines „allwissenden Agenten".

Benford Analyse

  • Verteilung der ersten Ziffer in Buchungszahlen.
  • Chi²-Test verwenden.

Fraud Audit

  • Vergleich von Soll und Ist, Aufklärung ökonomischer Kriminalität.
  • Methoden: Benford Analyse (Logarithmentafeln), Boxplot, Local Outlier Detection (LOF), Preisvolatilitätsprüfung

Latent Class Regression

  • Kombination aus Clusteranalyse und Regressionsanalyse.
  • Gruppierungsvariable wird vermutet.
  • Clusterung in linearen Trend.

Korrelation

  • Positive: Zusammenhang zwischen Variablen.
  • Negative: Kein Zusammenhang.
  • Kausalität kann nicht abgeleitet werden.
  • Korrelationskoeffizient: Stärke des Zusammenhangs (-1 bis +1).

Bestimmtheitsmaß R²

  • Wie gut Daten anhand linearer Regression vorhersagbar/Kennzah

Residuen

  • Wie genau abhängige Variable geschätzt werden kann.

P-Wert

  • Entscheidungshilfe, ob Nullhypothese abgelehnt werden kann.

T-Test

  • Entscheidung Hilfe, ob die Nullhypothese abgelehnt werden kann
  • Statistsich signifikant, wenn ein Zusammenhang besteht.

Skalenniveau

  • Skalen kompatibel;Nominal,Ordinal, Metrisch mit Intervall

Konfidenzniveau

  • Hilft genauigkeit Parameter anzugeben.

Steigungskoeffezient

Auch Regressionskoeffizienten genannt, gibt anstieg und Abfallpro

Schiefe ist eine Kennzahl, die die Artik und Stärke der Asymmetrie einer Wahrscheinlichkeisverteilung anzeigt.

dichotome variable

sind nur zwei Ausprägungen möglich

diskret

Beispiel Würfel nur enrdiche zahlen möglich.

stetig

beospieltemparture alles möglich.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

Description

Dieser Test untersucht den Soll-Ist-Vergleich und Local Outlier Detection. Außerdem behandelt es Latent Class Regression. Ziel ist es, die wichtigsten Methoden zu verstehen.

More Like This

Use Quizgecko on...
Browser
Browser