Testkonstruktion und -administration

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Welche der folgenden Beschreibungen trifft am besten auf die intuitive Konstruktionsstrategie zu?

  • Sie orientiert sich an der Häufigkeit und Intensität des beobachtbaren Verhaltens.
  • Sie wird verwendet, wenn wenig theoretisches Wissen über das interessierende Merkmal vorhanden ist. (correct)
  • Sie ist die am häufigsten angewandte Strategie zur Testkonstruktion.
  • Sie basiert auf einer elaborierten Theorie über die Unterschiede in der Merkmalsausprägung.

Was ist ein Hauptmerkmal der rationalen Konstruktionsstrategie?

  • Sie basiert auf der Intuition und Erfahrung des Testkonstrukteurs.
  • Sie nutzt deduktive Schlussfolgerungen, um Items zu generieren. (correct)
  • Sie ist die am häufigsten angewendete Strategie zur Testkonstruktion.
  • Sie wird hauptsächlich in neuen Forschungszweigen angewendet.

Welche Aussage beschreibt die Unterschiede zwischen quantitativen und qualitativen Merkmalen am besten?

  • Quantitative Merkmale sind zeitlich stabil, qualitative Merkmale zeitlich veränderbar.
  • Quantitative Merkmale sind unidimensional, qualitative Merkmale multidimensional.
  • Quantitative Merkmale können gemessen und quantifiziert werden, qualitative Merkmale nicht. (correct)
  • Quantitative Merkmale sind durch beobachtbare Verhaltensweisen definiert, qualitative Merkmale durch innere Prozesse.

Welche der folgenden Merkmale ist nicht in der Gliederung der Testplanung enthalten?

<p>Itemformulierung (B)</p> Signup and view all the answers

Was ist ein wichtiger Aspekt der Testadministration?

<p>Die Sicherstellung standardisierter Testbedingungen (C)</p> Signup and view all the answers

Welche Konstruktionsstrategie wird am häufigsten verwendet?

<p>Rational (D)</p> Signup and view all the answers

Wie wird der Geltungsbereich eines Tests definiert?

<p>Durch die spezifische Gruppe, für die der Test entwickelt wurde (A)</p> Signup and view all the answers

Was ist der Unterschied zwischen unidimensionalen und multidimensionalen Merkmalen?

<p>Unidimensionale Merkmale bestehen aus einer einzigen Dimension, multidimensionale Merkmale aus mehreren Dimensionen. (C)</p> Signup and view all the answers

Was betrifft die Zumutbarkeit eines Tests?

<p>Der physischen und psychischen Aufwand für die Testperson. (B)</p> Signup and view all the answers

Was bedeutet Unverfälschbarkeit in Bezug auf psychologische Tests?

<p>Die Testperson kann ihr Testergebnis nur geringfügig beeinflussen. (B)</p> Signup and view all the answers

Welches Kriterium beschreibt die Fairness eines Tests?

<p>Ein Test ist fair, wenn keine Diskriminierung bestimmter Gruppen erfolgt. (D)</p> Signup and view all the answers

Was ist eine häufige Einflussnahme bei Persönlichkeitsfragebögen?

<p>Die absichtliche Beeinflussung von Testergebnissen durch Soziale Erwünschtheit. (B)</p> Signup and view all the answers

In welchem Szenario ist es eher unwahrscheinlich, dass eine Testperson absichtlich schlechte Leistungen erbringt?

<p>Bei einem Leistungstest für eine Sportart. (C)</p> Signup and view all the answers

Was bedeutet eine Reliabilität von 0,85?

<p>Die Reliabilität ist hoch. (A)</p> Signup and view all the answers

Welches Verfahren zur Bestimmung der Reliabilität berücksichtigt zeitliche Stabilität?

<p>Retest-Reliabilität (C)</p> Signup and view all the answers

Welche Aussage über die Paralleltest-Reliabilität ist korrekt?

<p>Es müssen mehrere gleichschwere Parallelformen entwickelt werden. (C)</p> Signup and view all the answers

Was wird bei der Testhalbierungs-Reliabilität getan?

<p>Die Tests werden in zwei gleich große Gruppen geteilt. (A)</p> Signup and view all the answers

Welches Maß ist das am häufigsten verwendete zur Berechnung der internen Konsistenz?

<p>Cronbach α (B)</p> Signup and view all the answers

Was ist ein Limitationsfaktor bei der Retest-Reliabilität?

<p>Erinnerungs- und Lerneffekte. (B)</p> Signup and view all the answers

Wie wird die interne Konsistenz berechnet?

<p>Durch Korrelation zwischen allen Items. (C)</p> Signup and view all the answers

Welche Aussage über Reliabilität ist falsch?

<p>Reliabilität ist unabhängig von Objektivität. (C)</p> Signup and view all the answers

Was wird bei der normorientierten Beurteilung verwendet, um Testergebnisse zu interpretieren?

<p>Die Testergebnisse werden in Relation zur Eichstichprobe gesetzt. (A)</p> Signup and view all the answers

Was ist eine wichtige Eigenschaft der Eichstichprobe in der normorientierten Beurteilung?

<p>Sie sollte möglichst groß und bevölkerungsrepräsentativ sein. (D)</p> Signup and view all the answers

Welche der folgenden Aussagen über die Standardabweichung ist korrekt?

<p>Die Standardabweichung dient zur Berechnung von Normwerten. (D)</p> Signup and view all the answers

Was stellt die Eichung in der normorientierten Beurteilung dar?

<p>Die Eichung dokumentiert Testergebnisse in Normtabellen. (A)</p> Signup and view all the answers

Wie hoch ist der Mittelwert (M) auf einer IQ-Skala, die auf der Normierung basiert?

<p>100 (C)</p> Signup and view all the answers

Welche Aussage beschreibt den z-Wert im Kontext der Standardnormwerte?

<p>Ein z-Wert von +3 deutet auf eine extreme Überlegenheit hin. (C)</p> Signup and view all the answers

Welchen Prozentsatz der Bevölkerung repräsentiert ein z-Wert von +1?

<p>84% (D)</p> Signup and view all the answers

Was repräsentiert der Prozentrang in einer normorientierten Beurteilung?

<p>Der Prozentrang stellt dar, wie viele Personen besser abschnitten als die getestete Person. (C)</p> Signup and view all the answers

Welche Aussage beschreibt das Konzept der Selbsttäuschung am besten?

<p>Unbewusste positive Selbsteinschätzung, die als ehrlich wahrgenommen wird. (B)</p> Signup and view all the answers

Was versteht man unter dem Begriff 'Fremdtäuschung'?

<p>Das Bestreben, den eigenen Eindruck in sozialen Kontexten zu steuern. (C)</p> Signup and view all the answers

Welche Antworttendenz beschreibt die unkritische Zustimmung unabhängig vom Inhalt?

<p>Akquieszenz. (A)</p> Signup and view all the answers

Welche der folgenden Ursachen kann zu einer Tendenz zur Mitte führen?

<p>Der Eindruck, dass die Antwortkategorien unzureichend sind. (D)</p> Signup and view all the answers

Welchen Effekt hat die Tendenz zur Mitte auf die Itemvarianz?

<p>Verringert die Itemvarianz. (D)</p> Signup and view all the answers

Was ist eine mögliche strategische Maßnahme zur Bekämpfung der Akquieszenz?

<p>Umpolung von Items. (A)</p> Signup and view all the answers

Welche Form der Antworttendenz wird am stärksten durch mündliche Interviews beeinflusst?

<p>Soziale Erwünschtheit. (D)</p> Signup and view all the answers

Was beschreibt das Konzept der Itempolung in Bezug auf Antworttendenzen?

<p>Der Versuch, positive und negative Items auszugleichen. (A)</p> Signup and view all the answers

Was bezeichnet der Begriff 'Soziale Erwünschtheit' in der Itembeantwortung?

<p>Ein Einfluss von sozialen Normen auf die Antworten (C)</p> Signup and view all the answers

Welches Modell beschreibt den Unterschied zwischen gründlicher und oberflächlicher Bearbeitung von Aufgaben?

<p>Optimizing-Satisficing-Modell (D)</p> Signup and view all the answers

Welche der folgenden Fehlerquellen beeinflusst die Validität von Ratingdaten?

<p>Soziale Erwünschtheit (B)</p> Signup and view all the answers

Was bedeutet 'Satisficing' im Kontext der Itembearbeitung?

<p>Zufriedenstellen mit minimalem Aufwand (C)</p> Signup and view all the answers

Eine der folgenden Antworttendenzen führt typischerweise zu verzerrten Ergebnissen in der Itembearbeitung. Welche ist das?

<p>Akquieszenz (D)</p> Signup and view all the answers

In welchem Kontext kann 'Optimizing' auftreten?

<p>Wenn ein positiver Anreiz zur gründlichen Bearbeitung besteht (A)</p> Signup and view all the answers

Welche Antwortart ist am wenigsten fehleranfällig in der Itemkonstruktion?

<p>Gebundenes Antwortformat (D)</p> Signup and view all the answers

Vor welchem Hintergrund treten systematische Fehler in der Itembearbeitung auf?

<p>Aufgrund von sozialen und psychologischen Einflüssen (D)</p> Signup and view all the answers

Flashcards

Reliabilität

Das Maß, wie stabil und zuverlässig ein Test ist, unabhängig von Zufallsschwankungen.

Hohe Reliabilität

Hohe Reliabilität bedeutet, dass Tests hohe Objektivität aufweisen und somit weniger von Zufälligkeiten betroffen sind.

Bewertung der Reliabilität

Reliabilität wird in Kategorien unterteilt: niedrig (<0,80), hoch (0,80-0,90), sehr hoch (>0,90).

Retest-Reliabilität

Die Übereinstimmung von Testergebnissen bei Wiederholung des Tests an derselben Personengruppe.

Signup and view all the flashcards

Paralleltest-Reliabilität

Die Korrelation zwischen zwei parallelen Testformen, die als gleichwertig angesehen werden.

Signup and view all the flashcards

Testhalbierungs-Reliabilität

Die Aufteilung eines Tests in zwei Hälften und die Analyse der Korrelationswerte zwischen diesen Hälften.

Signup and view all the flashcards

Interne Konsistenz

Die Korrelation zwischen den einzelnen Items eines Tests, gemessen durch Cronbach alpha.

Signup and view all the flashcards

Cronbach α

Ein gängiger Konsistenzkoeffizient zur Messung der internen Konsistenz eines Tests.

Signup and view all the flashcards

Normorientierte Beurteilung

Die Testergebnisse einer Person werden im Vergleich zu einer Eichstichprobe interpretiert.

Signup and view all the flashcards

Eichstichprobe

Eine repräsentative Gruppe von Personen für die Testeichung.

Signup and view all the flashcards

Normtabellen

Tabellen, die Ergebnisse der Testeichung dokumentieren.

Signup and view all the flashcards

Standardabweichung

Ein Maß für die Streuung der Testergebnisse um den Mittelwert.

Signup and view all the flashcards

z-Werte

Abstand eines Wertes vom Mittelwert in Standardabweichungen angegeben.

Signup and view all the flashcards

Prozentrang

Prozentsatz der Ergebnisse, die unter einem bestimmten Wert liegen.

Signup and view all the flashcards

Stanine

Eine Art der Normierung, die Testergebnisse in 9 Kategorien einteilt.

Signup and view all the flashcards

Testergebnisse

Die Resultate, die aus einem Test oder einer Messung abgeleitet werden.

Signup and view all the flashcards

Testplanung

Der Prozess zur Gestaltung und Strukturierung von Tests.

Signup and view all the flashcards

Merkmalsarten

Kategorisierung von Merkmalen in quantitativ/qualitativ und stabil/veränderbar.

Signup and view all the flashcards

Testarten

Verschiedene Kategorien von Tests basierend auf Zweck und Inhalt.

Signup and view all the flashcards

Geltungsbereich und Zielgruppe

Der spezifische Anwendungsbereich und die Zielgruppe eines Tests.

Signup and view all the flashcards

Struktureller Testaufbau

Die systematische Anordnung der Testinhalte und Aufgabentypen.

Signup and view all the flashcards

Intuitive Konstruktion

Testkonstruktion basierend auf Intuition und Erfahrung, wenn wenig Theorie vorhanden ist.

Signup and view all the flashcards

Rationale Konstruktion

Eine deduktive Testkonstruktion, die auf elaborierten Theorien basiert.

Signup and view all the flashcards

Itemformulierung

Der Prozess der Formulierung von einzelnen Testfragen oder Aufgaben.

Signup and view all the flashcards

Aufgaben mit freiem Antwortformat

Aufgaben, bei denen die Probanden ihre Antworten in eigenen Worten formulieren können.

Signup and view all the flashcards

Aufgaben mit gebundenem Antwortformat

Aufgaben, in denen die Probanden aus vorgegebenen Antwortmöglichkeiten wählen müssen.

Signup and view all the flashcards

Atypisches Antwortformat

Antwortformate, die von den üblichen Standards abweichen, z.B. Rankings oder Slider.

Signup and view all the flashcards

Fehlerquellen bei Itembeantwortung

Systematische Fehler, die durch falsche Auswahl von Antwortkategorien entstehen.

Signup and view all the flashcards

Optimizing-Satisficing-Modell

Der Unterschied zwischen dem Streben nach bester Antwort (Optimizing) und dem Ausfüllen der Mindestanforderungen (Satisficing).

Signup and view all the flashcards

Soziale Erwünschtheit

Das Phänomen, bei dem antwortende Personen soziale Normen und Erwartungen in ihren Antworten berücksichtigen.

Signup and view all the flashcards

Akquieszenz

Die Tendenz, Fragen zugunsten der Zustimmung zu beantworten, unabhängig von der Meinung.

Signup and view all the flashcards

Konstruktirrelevante Varianz

Variabilität in Ratingdaten, die nicht mit dem interessierenden Merkmal zusammenhängt, und die Validität mindern kann.

Signup and view all the flashcards

Selbsttäuschung

Unbewusste Tendenz, sich selbst bessere Eigenschaften zuzuschreiben.

Signup and view all the flashcards

Fremdtäuschung

Die Kontrolle des Eindrucks, den man auf andere macht.

Signup and view all the flashcards

Antworttendenzen

Muster in der Beantwortung von Fragen, die Verzerrungen verursachen können.

Signup and view all the flashcards

Tendenz zur Mitte

Bevorzugung neutraler Antwortkategorien, bewusst oder unbewusst.

Signup and view all the flashcards

Itempolarität

Die Struktur von Umfragefragen, die beeinflussen kann, wie Antworten gegeben werden.

Signup and view all the flashcards

Itemverzerrung

Einfluss von Antworttendenzen auf die Varianz der Testitems.

Signup and view all the flashcards

Zumutbarkeit

Die Zumutbarkeit eines Tests betrifft den physischen und psychischen Aufwand für die Testperson.

Signup and view all the flashcards

Unverfälschbarkeit

Ein Test erfüllt das Gütekriterium der Unverfälschbarkeit, wenn die Person ihr Ergebnis nur gering beeinflussen kann.

Signup and view all the flashcards

Fairness

Ein Test ist fair, wenn er keine systematische Diskriminierung bestimmter Gruppen bewirkt.

Signup and view all the flashcards

Testökonomie

Die Testökonomie bezieht sich auf den Aufwand und Nutzen eines Tests für die Testperson.

Signup and view all the flashcards

Study Notes

Kapitel 2: Testgütekriterien - Haupt- und Nebengütekriterien

  • Testgütekriterien sind ein Instrument zur Qualitätsbeurteilung psychologisch-diagnostischer Tests.
  • Das Manual (Handbuch) eines Tests muss aufzeigen, wie die Testgütekriterien erfüllt sind.
  • Es gibt 10 Testgütekriterien.

2.1 Objektivität

  • Ein Test ist objektiv, wenn das gemessene Merkmal unabhängig von Testleiter, Auswerter und der Interpretation der Ergebnisse gemessen wird.
  • Objektivität wird in drei Aspekte unterteilt: Durchführungsobjektivität, Auswertungsobjektivität, Interpretationsobjektivität.

2.2 Reliabilität

  • Reliabilität betrifft die Messgenauigkeit des Tests.
  • Ein reliabler Test misst exakt, ohne Messfehler.
  • Der Reliabilitätskoeffizient gibt das Ausmaß der Reliabilität an (0 bis 1). Ein Wert von 1 bedeutet keine Messfehler, 0 zeigt an, dass das Testergebnis alleine durch Messfehler zustandekam.
  • Hohe Reliabilität hängt von hoher Objektivität ab.
  • Es gibt vier Verfahren zur Bestimmung der Reliabilität: Retest-Reliabilität, Paralleltest-Reliabilität, Testhalbierungs-Reliabilität und Innere Konsistenz.

2.2.1 Retest-Reliabilität

  • Eine wiederholte Messung an derselben Gruppe soll identische Ergebnisse liefern.
  • Geeignet für zeitstabile Merkmale (z.B. nach einer Woche).
  • Vorsicht: Erinnerungs- und Lerneffekte.

2.2.2 Paralleltest-Reliabilität

  • Entwicklung gleich schwerer Parallelformen (z.B. Form A und Form B).
  • Hohe Korrelation zwischen den Parallelformen ist notwendig.

2.2.3 Testhalbierungs-Reliabilität

  • Zufällige Aufteilung der Items auf zwei Hälften.
  • Hohe Korrelation zwischen den Ergebnissen der beiden Hälften.

2.2.4 Innere Konsistenz

  • Jedes Item wird als Einzeltest betrachtet.
  • Korrelation zwischen allen Items wird berechnet.
  • Cronbachs Alpha (α) ist das wichtigste Reliabilitätsmaß.
  • Homogenität

2.3 Validität

  • Validität befasst sich mit der Übereinstimmung zwischen dem gewünschten und tatsächlich gemessenen Merkmal.
  • Ein Test gilt als valide (gültig), wenn er das gewünschte Merkmal und nicht ein anderes misst.
  • Validität hat vier Aspekte: Inhaltsvalidität, Augenscheinvalidität, Konstruktvalidität und Kriteriumsvalidität.
  • 2.3.1 Inhaltsvalidität: Ein Test oder ein Testteil misst das Merkmal repräsentativ.
  • 2.3.2 Augenscheinvalidität: Die Plausibilität und Überzeugungskraft eines Tests.
  • 2.3.3 Konstruktvalidität: Der Rückschluss vom Verhalten auf zugrundeliegende Merkmale ist wissenschaftlich fundiert.
  • Es gibt verschiedene Ansätze zur Bestimmung der Konstruktvalidität (z.B. Faktorenanalyse).
  • 2.3.4 Kriteriumsvalidität: Der Zusammenhang zwischen der Testleistung und einem oder mehreren Kriterien (z.B. Schulnoten).

2.4 Skalierung

  • Das Gütekriterium Skalierung betrifft bei Leistungstests die Forderung, dass höhere Leistungen höhere Testwerte erhalten.
  • Die Relation der Leistungsfähigkeit sollte in den Testwerten widergespiegelt werden.
  • Skalierung bezieht sich auf interindividuelle und intraindividuelle Differenzen.
  • Das Skalenniveau (Nominalskala, Ordinalskala, Intervallskala, Verhältnisskala) beeinflusst die Umsetzbarkeit des Kriteriums.

2.5 Normierung (Eichung)

  • Normierung (Eichung) eines Tests dient zur Erstellung eines Bezugssystems.
  • Es ermöglicht, Testwerte im Vergleich zu anderen Personen einzustufen.
  • Die Eichstichprobe sollte repräsentativ für die Zielgruppe sein.
  • Testergebnisse werden in Normtabellen dokumentiert.

2.6 Testökonomie

  • Ökonomie bezeichnet die Wirtschaftlichkeit eines Tests.
  • Kostenfaktor bei der Testung.

2.7 Nützlichkeit

  • Ein Test ist nützlich, wenn er praktische Relevanz hat und die auf ihm basierenden Entscheidungen mehr Nutzen als Schaden bringen.

2.8 Zumutbarkeit

  • Psychologische Tests müssen bezüglich Zeit- und Aufwand geschont werden.
  • Die Zumutbarkeit betrifft die Testperson.
  • Testökonomie ist ein relevantes Kriterium.

2.9 Unverfälschbarkeit

  • Ein Test ist unverfälschbar, wenn die getestete Person ihr Testergebnis nicht oder nur unwesentlich beeinflussen kann.
  • Persönlichkeitsfragebögen können durch soziale Erwünschtheit beeinflusst werden.

2.10 Fairness

  • Ein fairer Test führt nicht zu systematischer Diskriminierung aufgrund ethnischer, soziokultureller oder geschlechtsspezifischer Merkmale.

Kapitel 3: Planung und Entwicklung von Tests und Fragebögen

  • 3.1 Testplanung: Entscheidung über das zu untersuchende Merkmal, die Testpersonen, den Geltungsbereich, den Aufbau des Tests und die Testadministration.
  • Quantitative vs. qualitative Merkmale, unidimensionale vs. multidimensionale, zeitstabile vs. zeitveränderbare Merkmale.
  • 3.2 Konstruktionsstrategien: intuitiv, rational, extern und intern. (intuitiv: basierend auf Erfahrung und Wissen, rational: theoriegeleitet, extern: basierend auf beobachtbaren Kriterien, intern: Faktorenanalyse)
  • 3.3 Aufgabentypen und Antwortformate: frei, gebunden, atypisch.
  • Entscheidungshilfen zur Auswahl des Aufgabentyps.

Kapitel 4: Deskriptive Statistik

  • 4.1 Einleitung: Analyse der Itemschwierigkeit, Bestimmung der Itemvarianzen, Trennschärfeanalyse, Itemselektion, Testwertermittlung und Normalisierung.
  • 4.2 Schwierigkeitanalyse: Schwierigkeitsindex (P-Wert), welcher Prozentsatz der Probanden die Aufgabe richtig gelöst hat. Absolut schwer (<20), mittel (20-80), niedrig (>80 oder < 20) und absolut leicht (100).
  • 4.3 Differenzierungsfähigkeit eines Items: Varianz des Items.
  • 4.4 Trennschärfeanalyse: Korrelative Zusammenhänge zwischen dem Item und den Gesamttestwerten.
  • 4.7 Testwertverteilung: Mittelwert, Median, Modalwert, Varianz, Standardabweichung (Range). Form (links- oder rechtsschief) und Wölbung (Normalverteilung oder nicht).

Kapitel 5: Axiome der Klassischen Testtheorie

  • 5.2 Axiome: X=T+E (beobachteter Wert = wahrer Wert + Messfehler)
  • Mittelwert des Messfehlers über alle Testwerte ist gleich Null.
  • Es gibt keinen systematischen Zusammenhang zwischen Messfehler und wahrem Wert.

Kapitel 10: Exploratorische und konfirmatorische Faktorenanalyse

  • 10.1 Exploratorische Faktorenanalyse (EFA): Ermittlung der Anzahl zugrundeliegender Faktoren. Keine a-priori Hypothesen über Variablenzuordnung zu Faktoren.
  • 10.2 Konfirmatorische Faktorenanalyse (KFA): Hypothesengestützte Bestimmung der Anzahl der Faktoren und ihrer Beziehungen zu den Variablen. Theorienbasierte Zuordnung der Variablen zu den Faktoren.
  • 10.2 Abbruchkriterien bei der EFA: Kaiser-Kriterium, Scree-Test, Parallelanalyse / Minimum Average Partial Test.

Kapitel 8: Interpretation von Testresultaten und Testeichung

  • 8.1 Testwertbildung und Testwertinterpretation: normorientiert, kriteriumsorientiert.
  • 8.2 Normorientierte Interpretation: Prozentrangnormen (welche Prozentsatz der Bezugspopulation ein niedrigeres oder gleich hohen Wert erreicht hat.), z-Transformation (Mittelwert als 0 und Standardabweichung als 1).
  • 8.3 Kriteriumsorientierte Interpretation: Bestimmen eines Kriteriums für die Interpretation, Bestimmung eines Schwellenwertes. ROC Kurve.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

More Like This

Item Analysis in Test Construction
20 questions

Item Analysis in Test Construction

SelfSufficientByzantineArt avatar
SelfSufficientByzantineArt
Test Construction and Evaluation
10 questions

Test Construction and Evaluation

WellInformedWeasel9012 avatar
WellInformedWeasel9012
Item Writing in Test Construction
47 questions
Use Quizgecko on...
Browser
Browser