Podcast
Questions and Answers
Welche der folgenden Aussagen beschreibt am besten, was Reliabilität in Bezug auf diagnostische Verfahren bedeutet?
Welche der folgenden Aussagen beschreibt am besten, was Reliabilität in Bezug auf diagnostische Verfahren bedeutet?
- Die Genauigkeit, mit der ein Test ein bestimmtes Merkmal misst, unabhängig davon, was er vorgibt zu messen. (correct)
- Das Ausmaß, in dem ein Test ökonomisch und zumutbar für die Testperson ist.
- Die Übereinstimmung der Ergebnisse verschiedener Bewerter bei der Anwendung des Tests.
- Das Ausmaß, in dem ein Test misst, was er zu messen vorgibt.
Was bedeutet ein Reliabilitätskoeffizient von rtt = 1?
Was bedeutet ein Reliabilitätskoeffizient von rtt = 1?
- Der Test misst absolut fehlerfrei. (correct)
- Der Test ist nicht objektiv.
- Es besteht kein Zusammenhang zwischen den Testergebnissen.
- Die Testergebnisse werden vollständig durch Messfehler bestimmt.
Welche Aussage trifft auf die Korrelation zwischen zwei Variablen zu, wenn r = -1 ist?
Welche Aussage trifft auf die Korrelation zwischen zwei Variablen zu, wenn r = -1 ist?
- Es besteht ein perfekter negativer Zusammenhang. (correct)
- Es besteht kein Zusammenhang.
- Es besteht ein perfekter positiver Zusammenhang.
- Die Variablen sind redundant.
Warum sind perfekte Zusammenhänge in der psychologischen Diagnostik eher selten?
Warum sind perfekte Zusammenhänge in der psychologischen Diagnostik eher selten?
Wie werden Inkonsistenzen bei wiederholten Messungen im Rahmen der Reliabilitätstheorie typischerweise interpretiert?
Wie werden Inkonsistenzen bei wiederholten Messungen im Rahmen der Reliabilitätstheorie typischerweise interpretiert?
Was ist eine Konsequenz von Messfehlern bei diagnostischen Verfahren?
Was ist eine Konsequenz von Messfehlern bei diagnostischen Verfahren?
Wie wirken sich systematische Messfehler auf die Ergebnisse einer Messung aus?
Wie wirken sich systematische Messfehler auf die Ergebnisse einer Messung aus?
Welche der folgenden Aussagen beschreibt am besten unsystematische Messfehler?
Welche der folgenden Aussagen beschreibt am besten unsystematische Messfehler?
Was ist das zentrale Konzept der Klassischen Testtheorie (KTT) in Bezug auf Messwiederholungen?
Was ist das zentrale Konzept der Klassischen Testtheorie (KTT) in Bezug auf Messwiederholungen?
Welche Annahme trifft die Klassische Testtheorie bezüglich des Mittelwerts der Messfehler bei unendlich vielen Messungen?
Welche Annahme trifft die Klassische Testtheorie bezüglich des Mittelwerts der Messfehler bei unendlich vielen Messungen?
Wie wird die Reliabilität der beobachteten Werte (Testvariable Y) im Rahmen der Klassischen Testtheorie definiert?
Wie wird die Reliabilität der beobachteten Werte (Testvariable Y) im Rahmen der Klassischen Testtheorie definiert?
Welches der folgenden Verfahren dient zur Bestimmung der Reliabilität?
Welches der folgenden Verfahren dient zur Bestimmung der Reliabilität?
Was wird bei der Testwiederholungsreliabilität hauptsächlich betrachtet?
Was wird bei der Testwiederholungsreliabilität hauptsächlich betrachtet?
Wovon ist die Retestreliabilität eines Tests hauptsächlich abhängig?
Wovon ist die Retestreliabilität eines Tests hauptsächlich abhängig?
Was wird bei der Interrater-Reliabilität untersucht?
Was wird bei der Interrater-Reliabilität untersucht?
Welchen Aspekt betrachtet man hauptsächlich, wenn man die Paralleltest-Reliabilität bestimmt?
Welchen Aspekt betrachtet man hauptsächlich, wenn man die Paralleltest-Reliabilität bestimmt?
Was ist eine Herausforderung bei der Anwendung der Splitt-Half-Reliabilität?
Was ist eine Herausforderung bei der Anwendung der Splitt-Half-Reliabilität?
Was misst Cronbachs Alpha?
Was misst Cronbachs Alpha?
Wie wird Cronbachs Alpha berechnet?
Wie wird Cronbachs Alpha berechnet?
Was bedeutet ein niedriger Wert für die Testhalbierungsreliabilität (z.B. rtt < .80) von Intelligenz- und Leistungstests?
Was bedeutet ein niedriger Wert für die Testhalbierungsreliabilität (z.B. rtt < .80) von Intelligenz- und Leistungstests?
Welche der folgenden Aussagen über die Interpretation der Reliabilität ist zutreffend?
Welche der folgenden Aussagen über die Interpretation der Reliabilität ist zutreffend?
Was ist eine notwendige Voraussetzung für eine hohe Reliabilität eines Tests?
Was ist eine notwendige Voraussetzung für eine hohe Reliabilität eines Tests?
Was konnte in der Studie von Eells (1930) bezüglich der Reliabilität von Schulnoten festgestellt werden?
Was konnte in der Studie von Eells (1930) bezüglich der Reliabilität von Schulnoten festgestellt werden?
Wie verändert sich der Zusammenhang zwischen gemittelten Noten in der Grundschule von Jahr zu Jahr?
Wie verändert sich der Zusammenhang zwischen gemittelten Noten in der Grundschule von Jahr zu Jahr?
Im Sekundarbereich, wie verändert sich der Zusammenhang der Reliabilität?
Im Sekundarbereich, wie verändert sich der Zusammenhang der Reliabilität?
Was charakterisiert den Standardmessfehler (SM)?
Was charakterisiert den Standardmessfehler (SM)?
Wovon ist der Standardmessfehler (SM) abhängig?
Wovon ist der Standardmessfehler (SM) abhängig?
Wozu wird der Standardmessfehler (SM) in der Praxis verwendet?
Wozu wird der Standardmessfehler (SM) in der Praxis verwendet?
Was gibt das Konfidenzintervall an?
Was gibt das Konfidenzintervall an?
Ein Schüler erzielt in einem Rechentest einen Standardwert von 79 vor einer Förderung und 86 nach der Förderung. Wie kann beurteilt werden, ob sich seine Rechenleistungen tatsächlich verbessert haben?
Ein Schüler erzielt in einem Rechentest einen Standardwert von 79 vor einer Förderung und 86 nach der Förderung. Wie kann beurteilt werden, ob sich seine Rechenleistungen tatsächlich verbessert haben?
Wie kann festgestellt werden, ob die im Intelligenztest erreichte Leistung von Paul (IQ = 145) das Kriterium der Hochbegabung (IQ ≥ 130) tatsächlich erfüllt?
Wie kann festgestellt werden, ob die im Intelligenztest erreichte Leistung von Paul (IQ = 145) das Kriterium der Hochbegabung (IQ ≥ 130) tatsächlich erfüllt?
Welche der folgenden Formeln wird zur Berechnung des 95%-Konfidenzintervalls (Kl95%) verwendet, wobei X der beobachtete Testwert und SM der Standardmessfehler ist?
Welche der folgenden Formeln wird zur Berechnung des 95%-Konfidenzintervalls (Kl95%) verwendet, wobei X der beobachtete Testwert und SM der Standardmessfehler ist?
Welche Bedeutung hat der Begriff Reliabilität im Kontext von Gütekriterien für Messinstrumente?
Welche Bedeutung hat der Begriff Reliabilität im Kontext von Gütekriterien für Messinstrumente?
Ein diagnostisches Verfahren weist eine hohe Objektivität auf. Was kann daraus geschlossen werden?
Ein diagnostisches Verfahren weist eine hohe Objektivität auf. Was kann daraus geschlossen werden?
Welches der folgenden Beispiele verdeutlicht eine niedrige Reliabilität?
Welches der folgenden Beispiele verdeutlicht eine niedrige Reliabilität?
Welche der folgenden Aussagen über systematische Messfehler ist korrekt?
Welche der folgenden Aussagen über systematische Messfehler ist korrekt?
Welche der genannten Einflüsse können zu unsystematischen Messfehlern führen?
Welche der genannten Einflüsse können zu unsystematischen Messfehlern führen?
Welche der folgenden Methoden dient NICHT der Bestimmung der Reliabilität eines Tests?
Welche der folgenden Methoden dient NICHT der Bestimmung der Reliabilität eines Tests?
Ein Forscher möchte die Reliabilität eines neu entwickelten Fragebogens zur Erfassung von Angst bestimmen. Welche der folgenden Methoden wäre am besten geeignet, um die interne Konsistenz des Fragebogens zu prüfen?
Ein Forscher möchte die Reliabilität eines neu entwickelten Fragebogens zur Erfassung von Angst bestimmen. Welche der folgenden Methoden wäre am besten geeignet, um die interne Konsistenz des Fragebogens zu prüfen?
Was ist die geeignete Maßnahme, um die Reliabilität bei der Durchführung von Beobachtungen zu evaluieren?
Was ist die geeignete Maßnahme, um die Reliabilität bei der Durchführung von Beobachtungen zu evaluieren?
Im Rahmen der testtheoretischen Grundlagen wird der beobachtete Wert einer Person in einem Test in zwei Komponenten zerlegt.
Im Rahmen der testtheoretischen Grundlagen wird der beobachtete Wert einer Person in einem Test in zwei Komponenten zerlegt.
Was ist bei der Interpretation von Konfidenzintervallen wichtig zu beachten?
Was ist bei der Interpretation von Konfidenzintervallen wichtig zu beachten?
Welchen Wert kann der Reliabilitätskoeffizient rtt annehmen?
Welchen Wert kann der Reliabilitätskoeffizient rtt annehmen?
Was bedeutet eine hohe positive Korrelation (r nahe +1) zwischen zwei Variablen in Bezug auf die Reliabilität?
Was bedeutet eine hohe positive Korrelation (r nahe +1) zwischen zwei Variablen in Bezug auf die Reliabilität?
Warum sind perfekte Korrelationen (r = 1 oder r = -1) in der psychologischen Diagnostik selten?
Warum sind perfekte Korrelationen (r = 1 oder r = -1) in der psychologischen Diagnostik selten?
Wie werden Inkonsistenzen bei wiederholten Messungen im Rahmen der Reliabilitätstheorie interpretiert?
Wie werden Inkonsistenzen bei wiederholten Messungen im Rahmen der Reliabilitätstheorie interpretiert?
Was ist die Auswirkung von Messfehlern auf die beobachteten Werte?
Was ist die Auswirkung von Messfehlern auf die beobachteten Werte?
Wie wirken sich systematische Messfehler auf die Ergebnisse aus?
Wie wirken sich systematische Messfehler auf die Ergebnisse aus?
Was sind unsystematische Messfehler?
Was sind unsystematische Messfehler?
Welche Aussage trifft auf die zentrale Annahme der KTT bezüglich der Zusammensetzung eines beobachteten Wertes zu?
Welche Aussage trifft auf die zentrale Annahme der KTT bezüglich der Zusammensetzung eines beobachteten Wertes zu?
Was wird bei der Testwiederholungsreliabilität gemacht?
Was wird bei der Testwiederholungsreliabilität gemacht?
Von welchem Faktor ist die Retestreliabilität maßgeblich abhängig?
Von welchem Faktor ist die Retestreliabilität maßgeblich abhängig?
Was wird bei der Bestimmung der Interrater-Reliabilität untersucht?
Was wird bei der Bestimmung der Interrater-Reliabilität untersucht?
Welchen Aspekt betrachtet die Paralleltest-Reliabilität?
Welchen Aspekt betrachtet die Paralleltest-Reliabilität?
Welches Problem kann bei der Anwendung der Splitt-Half-Reliabilität auftreten?
Welches Problem kann bei der Anwendung der Splitt-Half-Reliabilität auftreten?
Welchen Schluss kann man aus einer niedrigen Testhalbierungsreliabilität (< .80) für Intelligenz- und Leistungstests ziehen?
Welchen Schluss kann man aus einer niedrigen Testhalbierungsreliabilität (< .80) für Intelligenz- und Leistungstests ziehen?
Was ist eine notwendige, aber nicht hinreichende Bedingung für eine hohe Reliabilität?
Was ist eine notwendige, aber nicht hinreichende Bedingung für eine hohe Reliabilität?
Was fand Eells (1930) in seiner Studie über die Reliabilität von Schulnoten heraus?
Was fand Eells (1930) in seiner Studie über die Reliabilität von Schulnoten heraus?
Wie verhält sich der Zusammenhang zwischen gemittelten Zeugnisnoten in der Grundschule von Jahr zu Jahr typischerweise?
Wie verhält sich der Zusammenhang zwischen gemittelten Zeugnisnoten in der Grundschule von Jahr zu Jahr typischerweise?
Wie sieht die Reliabilität von Zeugnisnoten typischerweise im Sekundarbereich aus?
Wie sieht die Reliabilität von Zeugnisnoten typischerweise im Sekundarbereich aus?
Wozu dient der Standardmessfehler (SM) in der Praxis?
Wozu dient der Standardmessfehler (SM) in der Praxis?
Welche Aussage über systematische Messfehler ist zutreffend?
Welche Aussage über systematische Messfehler ist zutreffend?
Welches Verfahren zielt primär darauf ab, systematische Messfehler zu reduzieren?
Welches Verfahren zielt primär darauf ab, systematische Messfehler zu reduzieren?
In welchem Fall wäre eine Reliabilitätsprüfung besonders wichtig?
In welchem Fall wäre eine Reliabilitätsprüfung besonders wichtig?
Welche der folgenden Maßnahmen ist am wenigsten geeignet, um die Reliabilität eines Beobachtungsinstruments zu erhöhen?
Welche der folgenden Maßnahmen ist am wenigsten geeignet, um die Reliabilität eines Beobachtungsinstruments zu erhöhen?
Flashcards
Reliabilität (Definition)
Reliabilität (Definition)
Grad der Genauigkeit, mit dem ein Persönlichkeits- oder Verhaltensmerkmal gemessen wird.
Was ist der Reliabilitätskoeffizient (rtt)?
Was ist der Reliabilitätskoeffizient (rtt)?
Ein Wert zwischen 0 und 1, der die Messfehlerfreiheit eines Tests angibt.
Was misst die Korrelation?
Was misst die Korrelation?
Gibt an, wie eng der Zusammenhang zwischen zwei Variablen ist.
Waage (Reliabilität)
Waage (Reliabilität)
Signup and view all the flashcards
Was ist ein Messfehler?
Was ist ein Messfehler?
Signup and view all the flashcards
Was sind systematische Messfehler?
Was sind systematische Messfehler?
Signup and view all the flashcards
Was sind unsystematische Messfehler?
Was sind unsystematische Messfehler?
Signup and view all the flashcards
Unsystematische Messfehlerquellen
Unsystematische Messfehlerquellen
Signup and view all the flashcards
Was ist Reliabilität (Formel)?
Was ist Reliabilität (Formel)?
Signup and view all the flashcards
KTT (Formel)
KTT (Formel)
Signup and view all the flashcards
Testwiederholung
Testwiederholung
Signup and view all the flashcards
Interrater-Reliabilität
Interrater-Reliabilität
Signup and view all the flashcards
Paralleltest-Reliabilität
Paralleltest-Reliabilität
Signup and view all the flashcards
Split-Half-Reliabilität
Split-Half-Reliabilität
Signup and view all the flashcards
Testhalb.
Testhalb.
Signup and view all the flashcards
Interne Konsistenz
Interne Konsistenz
Signup and view all the flashcards
Objektivität
Objektivität
Signup and view all the flashcards
Standardmessfehler (SM)
Standardmessfehler (SM)
Signup and view all the flashcards
Konfidenzintervall
Konfidenzintervall
Signup and view all the flashcards
Test A und Test B
Test A und Test B
Signup and view all the flashcards
Study Notes
Grundlagen der Diagnostik: Reliabilität von Messinstrumenten
- Zu den Hauptgütekriterien diagnostischer Verfahren gehören:
- Objektivität
- Reliabilität (Zuverlässigkeit)
- Validität (Gültigkeit).
- Nebengütekriterien umfassen:
- Normierung
- Ökonomie
- Zumutbarkeit
- Fairness
- Akzeptanz.
Definition der Reliabilität
- Reliabilität stammt von dem englischen Wort "reliable", was zuverlässig bedeutet.
- Reliabilität oder Zuverlässigkeit eines Verfahrens bezieht sich auf den Grad der Genauigkeit, mit dem ein bestimmtes Persönlichkeits- oder Verhaltensmerkmal gemessen werden kann, unabhängig davon, was das Verfahren zu messen vorgibt.
- Sie wird durch den Reliabilitätskoeffizienten rtt angegeben.
- rtt kann Werte zwischen 0 und 1 annehmen, wobei höhere Werte eine bessere Reliabilität anzeigen.
- Ein rtt von 1 bedeutet, dass der Test absolut messfehlerfei ist.
- Ein rtt von 0 bedeutet, dass die Testergebnisse ausschließlich durch Messfehler bestimmt werden.
Exkurs: Korrelation
- Die Höhe der Korrelation gibt an, wie eng der Zusammenhang zwischen zwei Variablen ist.
- Negative Reliabilitäten deuten auf Probleme wie falsche Berechnungen hin, können aber grundsätzlich herauskommen.
- Mögliche Werte für r:
- r = 1: perfekter positiver Zusammenhang
- r = 0: kein Zusammenhang
- r = -1: perfekter negativer Zusammenhang
- Korrelationen erlauben keine Aussage über Kausalität.
- In der psychologischen Diagnostik gibt es in der Regel keine perfekten Zusammenhänge.
Reliabilität und Messfehler
- Reliabilität ist der Grad der Übereinstimmung der Messergebnisse (z. B. Testwerte) für eine Gruppe von Merkmalsträgern bei wiederholter Messung mit einem Verfahren.
- Es wird angenommen, dass unter denselben Bedingungen die mehrfache Messung eines Merkmals (theoretisch) zu denselben Ergebnissen bei den Merkmalsträgern führen sollte.
- Inkonsistenzen werden als unsystematische, zufällige Messfehler aufgefasst.
- Jede Messung ist messfehlerbehaftet.
- Bei wiederholter Messung weichen die Messwerte mehr oder weniger stark voneinander ab.
- Je geringer die Abweichungen der Messwerte bei wiederholter Nessung sind, desto weniger wird die Messung durch Messfehler beeinflusst.
Beobachteter Wert vs. wahrer Wert
- Der beobachtete Wert entspricht nicht dem wahren Wert, sondern wird durch den Messfehler beeinflusst.
- Reliabilität ist das Verhältnis von "Wahrem" Anteil (z. B. Fähigkeit) zu "Wahrem" Anteil (z. B. Fähigkeit) + Fehleranteil (z. B. Tagesform, Messfehler etc.).
- Je größer der Fehleranteil (je niedriger die Reliabilität), desto ungenauer ist das Messergebnis.
Quellen für Messfehler
- Systematische Messfehlerquellen: Die Abweichungen durch den Messfehler haben immer die gleiche Richtung.
- Durch standardisierte Bedingungen versucht man, systematische Messfehlerquellen zu kontrollieren.
- Unsystematische Messfehlerquellen: Die Abweichungen erfolgen nach oben und unten, wobei die Ursache unbekannt bzw. nicht kontrollierbar ist (z. B. Schlaf, Müdigkeit, Konzentration)
- Beispiele für unsystematische Messfehler: Psychische Dispositionen des Probanden (Emotionen, Motivation, Ermüdung), Merkmale des Untersuchers (Alter, Geschlecht, Auftreten), Durchführungsbedingungen (Testinstruktionen, Testraum, Störungen).
Klassische Testtherorie
- Das klassische Konzept der Reliabilität basiert auf der Klassischen Testtheorie (KTT).
- KTT umfasst mehrere Annahmen, die es ermöglichen, die Reliabilität über den Zusammenhang mehrerer Messungen desselben Merkmals bei einer Gruppe von Personen zu schätzen.
- Zentrale Idee der Messwiederholung: beobachtete Werte = wahre Werte + Messfehler
- Zwei zentrale Annahmen der KTT:
- Ein beobachteter Messwert (Y) einer Person in einem Test setzt sich additiv zusammen aus einem wahren Wert (T) und einem Messfehler (E): Y = T + E.
- Der Mittelwert (Erwartungswert: Erw) der Messfehler über unendlich viele Messungen desselben Merkmals bei einer Person ist null: Erw (E) = Erw(Y-T) = 0 → Erw(Y)= T (d.h. die Messfehler sind zufällig, d.h. frei von systematischen Unterscheiden zwischen den Messungen).
Verfahren zur Reliabilitätsbestimmung
- Es gibt verschiedene Verfahren zur Reliabilitätsbestimmung:
- Testwiederholung (Test-Retest-Reliabilität)
- Mehrfache Kodierung (Interrater-Reliabilität)
- Paralleltestung (Paralleltestreliabilität)
- Testteilung (Splitt-Half-Reliabilität oder Interne Konsistenz)
Testwiederholung (Test-Retest-Reliabilität)
- Derselbe Test wird den Versuchspersonen zu verschiedenen Zeitpunkten dargeboten. Die Ergebnisse der ersten und zweiten Messung werden korreliert.
- Gleichheit bzw. Ähnlichkeit der Messergebnisse bei Anwendung zu unterschiedlichen Zeitpunkten.
- Betrachtet den (zeitlichen) Stabilitätsaspekt bei Messwiederholungen.
- Die Retestreliabilität ist abhängig von der relativen Stabilität eines Merkmals und dem Zeitintervall zwischen den Testungen.
- Sie drückt die relative (nicht die absolute) Stabilität des Tests aus.
Stabilität (Absolut and Relativ)
- Absolute Stabilität: Das Merkmal bleibt konstant (z. B. Werte von 90 bis 100).
- Relative Stabilität: Rangfolge zwischen beiden Personen bleibt gleich (z. B. Werte von 80 bis 90).
Interrater-Reliabilität
- Mehrere Rater bewerten dasselbe Material oder Objekt. Sie bewerte die Konsistenz bzw. Vergleichbarkeit der Urteile von mehreren Bewertern.
Paralleltest-Reliabilität
- Es liegen mehrere vergleichbare Tests vor. Die Mittelwerte und weitere statistische Kenngrößen sollten für beide Tests sehr ähnlich sein.
- Die Reliabilität wird über die Korrelation zwischen den beiden Tests bestimmt
- Betrachtet den Äquivalenzaspekt, wenn echte Paralleltests vorliegen.
Splitt-Half-Reliabilität
- Es liegt nur ein Test vor: der Test wird in zwei Hälften unterteilt, jede Hälfte ist ein „Paralleltest" zur anderen Hälfte
- Betrachtet den Konsistenzaspekt
- Die Mittelwerte und weitere statistische Kenngrößen sollten für beide Hälften ähnlich sein.
- Die Reliabilität wird bestimmt über die Korrelation zwischen den beiden Hälften.
- Kor(YA,YB) unterschätzt die tatsächliche Reliabilität und muss daher korrigiert werden, Spearman-Brown-Formel verwenden.
Interne Konsistenz
- Die Weiterführung der Idee von Splitt-Half-Reliabilität (Zerlegung des Tests in mehr als 2 Teile)
- Ein Maß dafür, wie die Items einer Skala miteinander zusammenhängen.
- Sie wird häufig berechnet durch Cronbachs Alpha: α = (N * r) / (1 + (N-1) * r
- N: Anzahl der Items pro Skala
- r: durchschnitttliche Inter-Item-Korrelation
Beurteilungen der Reliabilität
- Paralleltest - bzw. Retestreliabilität von Intelligenz - und Leistungstests
- .75 < rtt < .80 → gut
- .80 < rtt < .85 → sehr gut
- rtt > .85 → exzellent
- Referenz: Rost, 2007, S. 157
- Testhalbierungsreliabilität und Interne Konsistenz von Intelligenz- und Leistungstests
- rtt <. 80 → niedrig
- .80 < rtt <. 90 → mittel
- rtt > .90 → hoch
- Referenz: Fisseni, 1997, S. 124
COTAN System
- Beurteilung der Reliabilität
- Niveau 1: unzureichend <.80; ausreichend .80-.90; gut >.90
- Niveau 2: unzureichend <.70; ausreichend .70-.80; gut >.80
- Niveau 3: unzureichend <.60; ausreichend .60-.70; gut >.70
Objektivität und Reliabilität
- Voraussetzung für eine hohe Reliabilität ist die Objektivität des Tests.
- Nur ein objektiver Test kann eine hohe Reliabilität erreichen.
- Die Objektivität des Tests ist eine notwendige, aber keine hinreichende Voraussetzung für eine hohe Reliabilität!
Reliabilität von Schulnoten
- Studie von Eells, 1930:
- 61 Lehrkräfte bewerteten Schülerantworten auf Frage aus den Bereichen Geographie und Geschichte, erneute Bewertung nach 11 Wochen.
- Korrelation zwischen den Bewertungen: r = 0.25 bis r = 0.51
- Bei Untersuchungen einzelner Arbeiten ist die Reliabilität schlecht.
- Die Notendurchschnitte (Zeugnisnoten) weisen über die Schulzeit hinweg jedoch ine hohe Stabilität auf.
- Schulleistungen korrelieren von Jahr zu Jahr bei rtt = .80.
- Im Sekundarbereich sinkt der Zusammenhang etwas, aber im reliv hohen Bereich (rtt = 0.70).
Standardmessfehler
- Der Standardmessfehler bestimmt das Ausmaß der Konfidenzintervals, in dem sich der „wahre Wert“ mit Wahrscheinlichkeit befindet.
- Er ist ist abhängig von der Standardabweichung (sₜ) und Reliabilität (rₜ) des Tests.
- SM = sₜ√1 - rₜ
- Die Formeln zur Berechnung des Konfidenzintervalls sind:
- 95%-Konfidenzintervall: KI₉₅% = X ± 1.96 • SM
- 99%-Konfidenzintervall: KI₉₉% = X ± 2.58 • SM
- 68%-Konfidenzintervall: KI₆₈% = X ± 1 • SM
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.