90 Questions
Was sind die beiden Aspekte, die bei der Beantwortung dieser Frage beachtet werden sollten?
den Anwendungskontext des Tests und die Referenzpopulation
Welche Bewertungskonvention gilt für Reliabilitäten größer als 0,90?
gut
Was sind die Bewertungskonventionen für Reliabilitäten zwischen 0,80 und 0,90?
ausreichend
Wie werden Reliabilitäten unter 0,80 bewertet?
unzureichend
In welchem Kontext können niedrigere Reliabilitätswerte akzeptabel sein?
Forschungskontext
Was sollte möglichst übereinstimmen, damit Reliabilitätskoeffizienten auf einen aktuellen Anwendungskontext generalisiert werden können?
der vorliegende Anwendungskontext mit dem bei der Konstruktion des Tests ins Auge gefassten Anwendungskontext
Was ist die Retest-Methode zur Bestimmung der Reliabilität?
Die Retest-Methode beinhaltet die Verwendung desselben Instruments bei derselben Personenstichprobe zweimal.
Welche Methode zur Reliabilitätsbestimmung basiert auf der Korrelation zwischen den Testwerten zweier Paralleltests?
Die Paralleltest-Methode basiert auf der Korrelation zwischen den Testwerten zweier nach den gleichen Kriterien konstruierter Tests.
Was beinhaltet die Testhalbierungs-Methode zur Bestimmung der Reliabilität?
Die Testhalbierungs-Methode teilt die Indikatoren eines Messinstruments per Zufall in zwei Hälften auf und berechnet für jede Hälfte einen Testwert.
Wovon hängt die Wahl des Zeitintervalls bei der Retest-Methode ab?
Die Wahl des Zeitintervalls bei der Retest-Methode hängt von Annahmen zur zeitlichen Stabilität des Konstrukts ab.
Was ist das Maß der Messgenauigkeit bei der Retest-Methode?
Die Korrelation der Testwerte zwischen erstem und zweitem Messzeitpunkt.
Was wird bei der Paralleltest-Methode als Maß für die Messgenauigkeit des Instruments verwendet?
Die Korrelation zwischen den Testwerten der beiden Paralleltests.
Was wird als Nachweis für die prognostische Validität betrachtet?
Leistungen 15-jähriger Schüler mit ihren später erworbenen Berufsabschlüssen korrelieren
Was sind die beiden Möglichkeiten, um Testwerte zu beurteilen?
(a) in Bezug zur Verteilung der Testwerte in einer Referenzgruppe (soziale Bezugsnorm) oder (b) in Bezug zu einem definierten Kriterium (kriteriale Bezugsnorm)
Welche Qualitätskriterien sind bei der sozialnormorientierten Diagnostik zu beachten?
Aktualität, Repräsentativität und Größe der Vergleichsstichprobe
Was spielt bei der kriteriumsnormorientierten Diagnostik eine wichtige Rolle?
Die Validität der Schwellenwerte
Warum ist die Validität der Schwellenwerte wichtig?
Um festzustellen, ob eine Person ein bestimmtes Kriterium erfüllt oder nicht
Was sollte bei der Schwellenwertbestimmung hinreichend wissenschaftlich abgesichert und dokumentiert sein?
Der Prozess der Schwellenwertbestimmung
Warum sind die empirischen Befunde zur Objektivität von Schulnoten ernüchternd?
Lehrkräfte setzen die Leistung bei der Notenvergabe entweder zur Leistung der anderen Schüler oder zur individuellen Leistungsentwicklung ins Verhältnis, was zu unterschiedlichen Noten führt.
Was zeigte eine Untersuchung mit den Daten aus PISA-2000 über Mathematiknoten von Jugendlichen?
Jugendliche mit ähnlichen Mathematikleistungen erhielten an unterschiedlichen Gymnasien im selben Bundesland sehr unterschiedliche Mathematiknoten.
Warum erhalten Schüler für dieselbe Schülerarbeit oft unterschiedliche Noten?
Verschiedene Lehrkräfte bewerten dieselbe Schülerarbeit oft sehr unterschiedlich.
Was zeigt die Forschung über die Vorhersagekraft von Abschlussnoten?
Abschlussnoten können weiterführende Studien- oder Ausbildungserfolge in substanziellem Maße vorhersagen.
Welche Auswirkung haben unterschiedliche Bezugsnormen auf die Notenvergabe?
Lehrkräfte bewerten Schülerleistungen unterschiedlich je nachdem, ob sie soziale oder individuelle Bezugsnormen verwenden.
Warum stimmen Lehrkräfte oft nicht mit ihren früheren Benotungen überein?
Selbst ein und dieselbe Lehrkraft stimmt bei wiederholter Benotung derselben Schülerarbeit häufig nicht mit ihren früheren Benotungen überein.
Was versteht man im allgemeinen Sprachgebrauch unter dem Begriff Evaluation?
Eine Beurteilung oder Bewertung.
Was sind mögliche Gegenstände von pädagogisch-psychologischen Evaluationen?
Interventionsprogramme, einzelne Schulen, Schularten oder ganze Bildungssysteme.
Was wird unter Bildungsmonitoring verstanden?
Die Evaluation von Bildungssystemen im Rahmen großer internationaler Schulleistungsstudien.
Welchen Zweck sollen die getroffenen Entscheidungen auf Basis von Evaluationen erfüllen?
Die Qualität von pädagogischen Maßnahmen, Einrichtungen oder Bildungssystemen sichern oder verbessern.
Welche Ziele sollen anhand von Evaluationen im pädagogischen Kontext erreicht werden?
Die Qualität von Maßnahmen zur Leseförderung sichern oder verbessern.
Was ist das Ziel von Bildungsmonitoring?
Das Überprüfen des Erreichens von Bildungsstandards durch Bildungseinrichtungen.
Was ist das Hauptaugenmerk der sozialnormorientierten Diagnostik?
Interindividuelle Unterschiede
Welche Informationen werden aus Normierungsstudien für die sozialnormorientierte Diagnostik benötigt?
Ergebnisse von repräsentativen Stichproben
Was geben Normwerte in Bezug auf die Testperson?
Relative Position in der Referenzpopulation
Was ist der Zweck der kriteriumsnormorientierten Diagnostik?
Messung in Bezug auf sachlich definierte Kriterien
Was wird bei der individualnormorientierten Diagnostik berücksichtigt?
Individuelle Entwicklung und Profile
Was ist das Ziel der individuellen Diagnostik?
Erfassung der individuellen Entwicklung
Was gibt der Prozentrang an?
Welcher Anteil von Personen in der Referenzgruppe einen gleich hohen oder einen geringeren Testwert erreicht hat.
Welchen Nachteil hat die Prozentrangskala?
Die Messwerte über die gesamte Spannbreite sind sehr ungleich verteilt.
Was bedeutet ein Prozentrang von 10?
10% der Personen in der Referenzgruppe haben einen niedrigeren oder gleich hohen Testwert.
Was sind Standardabweichungen und was bedeuten sie?
Maß für die Variation der Testwerte um den Mittelwert der Verteilung.
Welche Verteilung entspricht der Prozentrangskala?
Der Anteil von Personen in den Segmenten der Normalverteilungskurve.
Was sind zentrale Kennwerte der Prozentrangskala?
T-Werte, IQ-Werte und z-Werte.
Welche Konstruktfacetten sollten bei der Definition des Konstrukts durch eine größere Anzahl von Indikatoren abgebildet werden?
Konstruktfacetten, die zentral für die Definition des Konstrukts sind
Was dient als üblicher Gradmesser für die inhaltliche Validität?
Übereinstimmung der Expertenurteile
Was ist das Ziel der Analyse der Inhaltsvalidität bei der Validität von Testwerten?
Die repräsentative Abbildung des Zielkonstrukts durch die Testaufgaben sicherstellen.
Welche Methode untersucht die Passung zwischen Zielkonstrukt und den individuellen Antwortprozessen?
Analyse individueller Antwortprozesse
Welche Art von Verfahren sind besonders vielversprechend zur Erfassung der Bearbeitungsprozesse?
Technologiegestützte Verfahren
Welche Formen empirischer Evidenz sollten zur Beurteilung der Validität von Testwerten herangezogen werden?
Inhaltsvalidität, Antwortprozesse, interne Struktur, konvergente und diskriminante Zusammenhänge.
Warum ist die Validität von Testwerten bei der diagnostischen Entscheidungsfindung wichtig?
Da die Testwerte die empirische Grundlage für diagnostische Entscheidungen bilden.
Welche Art von Protokollen können mit technologiegestützten Verfahren aufgezeichnet werden?
Detailgenaue Bearbeitungsprotokolle
Wofür dienen die Abfolge und Dauer der Bearbeitungsschritte bei der Analyse individueller Antwortprozesse?
Als Indikatoren für individuelle Antwortprozesse beim Lösen von Testaufgaben
Was wird bei der Validität von Testwerten durch Experteneinschätzungen überprüft?
Inhaltliche Repräsentativität des definierten Konstrukts und angemessene Abdeckung in Breite und Struktur.
Welche verschiedenen Formen von empirischer Evidenz spielen bei der Beurteilung der Validität von Testwerten eine Rolle?
Inhaltsvalidität, Antwortprozesse, interne Struktur, konvergente und diskriminante Zusammenhänge.
Warum ist die Frage nach der Validität von Testwerten im Hinblick auf Theorie und empirische Befunde relevant?
Um die Interpretation von Testwerten im Bezug auf die vorgesehene Testanwendung zu sichern.
Warum sind von Lehrkräften entwickelte Verfahren der Leistungsüberprüfung oft nicht professionell?
hoher zeitlicher, finanzieller und personeller Aufwand
Welches Problem stellt die eingeschränkte Güte der diagnostischen Urteile von Lehrkräften dar?
weitreichende Konsequenzen für das spätere Leben von Schülern
Was ist das Ziel der Einführung von Bildungsstandards in Deutschland?
diagnostische Kompetenz von Lehrkräften verbessern
Was definieren Bildungsstandards in verschiedenen Schulfächern und Kompetenzbereichen?
inhaltliche Anforderungen
Was beinhalten Bildungsstandards neben den inhaltlichen Anforderungen?
zahlreiche Aufgabenbeispiele und Unterrichtsmaterialien
Welchen Beitrag sollen Bildungsstandards zur Qualitätssicherung schulischer Diagnostik leisten?
die diagnostische Kompetenz von Lehrkräften verbessern
Was ist ein Beispiel für die Personenselektion im Bildungsbereich?
Hochschulzulassung
Was ist ein Beispiel für die Modifikation von Personen im pädagogischen Kontext?
Förderung der Leseleistung von Karl
Was ist ein Beispiel für die Modifikation einer Lernumwelt?
Einrichtung zusätzlicher Förderkurse für lese-/rechtschreibschwache Schüler
Was bildet die Grundlage für Entscheidungen, die auf Veränderungen in pädagogischen Handlungsfeldern abzielen?
Modifikationsdiagnostik
Was bezeichnet die Auswahl einer bestimmten Berufsausbildung aus einer Vielzahl von Möglichkeiten?
Auswahl einer Lernumwelt
Was ist ein Beispiel für die Wahl einer Schule, die sich auf die Förderung von Kindern mit Lese-Rechtschreibschwäche spezialisiert hat?
Wahl einer Lernumwelt
Was ist das Ziel der Reliabilität?
Messgenauigkeit der Testwerte
Welche Methode wird zur Bestimmung der Reliabilität basierend auf der Korrelation zwischen den Testwerten zweier Paralleltests verwendet?
Paralleltest-Methode
Was wird als Maß für die Messgenauigkeit des Instruments bei der Paralleltest-Methode verwendet?
Korrelation zwischen den Testwerten
Welche Bewertungskonvention gilt für Reliabilitäten unter 0,80?
Niedrige Reliabilität
Warum ist die Validität der Schwellenwerte wichtig?
Für eine sinnvolle Interpretation der Testwerte
Welche methodischen Zugänge stehen zur Bestimmung der Reliabilität zur Verfügung?
Verschiedene
Erklären Sie, warum die Qualität des Selektionsverfahrens in bestimmten Fällen irreführend beurteilt werden kann.
Die Fehlerrate der falsch negativen Entscheidungen ist unbekannt.
Was sind die Qualitätsmerkmale, die bei der Formulierung eines Gutachtens beachtet werden sollten?
Erklärung von Fachbegriffen, Gliederung am diagnostischen Prozess orientiert
Wie korreliert die Leistung im Aufnahmetest mit der Abschlussleistung in den Teilabbildungen?
r = 0,70
Was sind die Abkürzungen RN, FN, FP und RP in Bezug auf die Studienzulassungsentscheidung?
RN = richtig negativ; FN = falsch negativ; FP = falsch positiv; RP = richtig positiv
Was wird häufig in Form schriftlicher Gutachten festgehalten?
Entscheidung bzw. Empfehlung
Warum ist es bei der Beurteilung der Qualität des Selektionsverfahrens problematisch, wenn die Fehlerrate der falsch negativen Entscheidungen unbekannt ist?
Die Fehlerrate der falsch negativen Entscheidungen ist ein wichtiger Aspekt zur Bewertung der Qualität des Verfahrens.
Was sind Abweichungsnormen und welche Werte werden insbesondere genutzt?
Abweichungsnormen orientieren sich am Mittelwert und der Standardabweichung der Verteilung. Insbesondere werden z-Werte, T-Werte und IQ-Werte genutzt.
Was zeigt die Normalverteilungskurve von Testwerten?
Die Normalverteilungskurve zeigt, dass ca. 68,26 % der Fälle im Messwertbereich von M ± 1S und ca. 95 % der Fälle im Messwertbereich von M ± 2S liegen.
Warum ist die Überführung von Abweichungsnormen in Prozentränge verzerrt?
Die Überführung von Abweichungsnormen in Prozentränge ist umso stärker verzerrt, je mehr die tatsächliche Verteilung der Testwerte von einer Normalverteilung abweicht.
Wie viele Prozent der Fälle liegen im Messwertbereich von M ± 1S und M ± 2S?
Ca. 68,26 % der Fälle liegen im Messwertbereich von M ± 1S und ca. 95 % der Fälle liegen im Messwertbereich von M ± 2S.
Was sind Prozentränge und wie können sie in Abweichungsnormen überführt werden?
Prozentränge geben an, in welchem Prozentbereich ein Messwert liegt. Sie können in Abweichungsnormen überführt werden, wenn die Verteilung der Testwerte einer Normalverteilung folgt.
Warum ist die Wahl des Zeitintervalls bei der Retest-Methode abhängig?
Die Wahl des Zeitintervalls bei der Retest-Methode hängt von der Stabilität der zu messenden Merkmale ab.
Was waren die vier Lesestrategien, auf die sich die Förderung der Lesekompetenz bezog?
Aktivierung des Vorwissens, Wichtiges unterstreichen, Methoden zum Umgang mit Verständnisschwierigkeiten, Wichtiges zusammenfassen
Welche Texte wurden für die Förderung der Lesemotivation ausgewählt?
Sachtexte mit Themen, die auf die Interessen der Zielgruppe abgestimmt waren
In welcher Form erfolgte die Förderung der Schüler?
In Kleingruppen von 4 bis 6 Schülern durch Studierende der Psychologie
Wie viele Schüler waren in der Traingruppe und wie viele in der Kontrollgruppe?
150 Schüler in der Traingruppe und 85 Schüler in der Kontrollgruppe
Welche Effektgröße wurde in der Evaluation des Trainings verwendet?
d = 0,28 - 0,49
Was waren die drei Ergebnisse der Evaluation des LekoLemo-Trainings?
Gegenstandsbezogene Lesemotivation, erlebnisbezogene Lesemotivation, Leseselbstkonzept
Explore different classical and modern methods for determining the reliability of instruments, such as the retest method. Learn about using correlations between test values at different time points and considerations for time intervals. Enhance your understanding of reliability in measurement.
Make Your Own Quizzes and Flashcards
Convert your notes into interactive study material.
Get started for free