Podcast
Questions and Answers
Samhengi vi klassska prffri (CTT), hvernig hefur skekkja treikningi fylgnistuuls tveggja breytna hrif tlkun raunverulegu sambandi eirra, me hlisjn af forsendum um tilviljunarkennda dreifingu villna?
Samhengi vi klassska prffri (CTT), hvernig hefur skekkja treikningi fylgnistuuls tveggja breytna hrif tlkun raunverulegu sambandi eirra, me hlisjn af forsendum um tilviljunarkennda dreifingu villna?
- Skekkjan leiir alltaf til ofmats raunverulegu fylgni, ar sem hn eykur samdreifni villutta.
- Skekkjan getur leitt bi til ofmats og vanmats, en hefur engin hrif tlkun raunverulegu sambandi breytanna.
- Skekkjan leiir alltaf til vanmats raunverulegu fylgni, ar sem hn dregur r samdreifni rauntta.
- Skekkjan leiir nr alltaf til vanmats raunverulegu fylgni, ar sem hn eykur heildardreifingu og dregur r hlutfalli raunverulegrar dreifingar. (correct)
Gefi a fylgni milli raunverulegra gilda prfi X og prfi Y ($r_{X_tY_t}$) er 0,75 og hlutfall dreifingar raunverulegra gilda af prfi X er 0,64 og hlutfall dreifingar raunverulegra gilda af prfi Y er 0,81. Hvert er fylgnistuullinn milli mldra gilda prfunum mia vi ofangreindar upplsingar?
Gefi a fylgni milli raunverulegra gilda prfi X og prfi Y ($r_{X_tY_t}$) er 0,75 og hlutfall dreifingar raunverulegra gilda af prfi X er 0,64 og hlutfall dreifingar raunverulegra gilda af prfi Y er 0,81. Hvert er fylgnistuullinn milli mldra gilda prfunum mia vi ofangreindar upplsingar?
- 0,600
- 0,836
- 0,675 (correct)
- 0,540
Rannskn ar sem skoa a meta fylgni milli tveggja flkinna slfrilegra eiginleika, ar sem bi mlitkin hafa fullkomna reianleika, hvernig tti rannsakandi a bregast vi til a f eins nkvma mynd af raunverulegri fylgni og mgulegt er?
Rannskn ar sem skoa a meta fylgni milli tveggja flkinna slfrilegra eiginleika, ar sem bi mlitkin hafa fullkomna reianleika, hvernig tti rannsakandi a bregast vi til a f eins nkvma mynd af raunverulegri fylgni og mgulegt er?
- Nota leirttingarformlu fyrir minnkaa styrkingu til a meta fylgnina, me v a deila fylgnistulinum me margfeldi af kvaratrtum reianleikastulanna. (correct)
- Nota Cronbach's alpha til a meta reianleika og draga a fr fylgnistulinum til a f leirtt gildi.
- Nota leirtta fylgnistuulinn, ar sem leirtting getur kt fylgnina og leitt til rangra lyktana.
- Nota Spearman-Brown formluna til a meta reianleika og nota hana til a leirtta fylgnistuulinn.
Hver er afleiingin af v a hunsa reianleika mlitkja egar kvaranir eru teknar grundvelli fylgni milli mlinga starfsmannavalssamhengi, og hvernig getur etta haft hrif rttmti rningaferlisins?
Hver er afleiingin af v a hunsa reianleika mlitkja egar kvaranir eru teknar grundvelli fylgni milli mlinga starfsmannavalssamhengi, og hvernig getur etta haft hrif rttmti rningaferlisins?
Ljsi ess a klasssk prffri (CTT) gerir r fyrir a villur su tilviljunarkenndar og har raunverulegum gildum, hvernig myndi frvik fr essari forsendu hafa hrif tlkun fylgni milli tveggja breytna?
Ljsi ess a klasssk prffri (CTT) gerir r fyrir a villur su tilviljunarkenndar og har raunverulegum gildum, hvernig myndi frvik fr essari forsendu hafa hrif tlkun fylgni milli tveggja breytna?
Hvaa fullyring lsir best hrifum reianleika prfs staalvillu mlingarinnar ($s_{em}$)?
Hvaa fullyring lsir best hrifum reianleika prfs staalvillu mlingarinnar ($s_{em}$)?
Hvernig breytist breidd ryggisbilsins vi rauntkomu ef reianleiki prfs minnkar, a llu ru breyttu?
Hvernig breytist breidd ryggisbilsins vi rauntkomu ef reianleiki prfs minnkar, a llu ru breyttu?
Hvaa tilgangi er staalvilla mlingarinnar (standard error of measurement, $s_{em}$) notu vi tlkun prftkomna?
Hvaa tilgangi er staalvilla mlingarinnar (standard error of measurement, $s_{em}$) notu vi tlkun prftkomna?
Myndau r a prf s me $s_{em} = 3$. Hvaa fullyring er lklegust um tlkun ryggisbils t fr essari $s_{em}$?
Myndau r a prf s me $s_{em} = 3$. Hvaa fullyring er lklegust um tlkun ryggisbils t fr essari $s_{em}$?
Hvaa hrif hefur str rtaksins sem nota er til a meta reianleika prfs str staalvillu mlingarinnar ($s_{em}$)?
Hvaa hrif hefur str rtaksins sem nota er til a meta reianleika prfs str staalvillu mlingarinnar ($s_{em}$)?
Starfsflk mannaus notar prf til a ra nja starfsmenn. Prfi hefur reianleikastuulinn 0,70. Afleiingarnar af v a nota etta prf eru ____. (Athugi: reianleikastuullinn er gefinn upp sem $R{xx}$)
Starfsflk mannaus notar prf til a ra nja starfsmenn. Prfi hefur reianleikastuulinn 0,70. Afleiingarnar af v a nota etta prf eru ____. (Athugi: reianleikastuullinn er gefinn upp sem $R{xx}$)
Prf hefur staalfrvik 10 og reianleikastuul 0,64. Hver er staalvillan mlingunni?
Prf hefur staalfrvik 10 og reianleikastuul 0,64. Hver er staalvillan mlingunni?
Nemandi fr tkomuna 70 prfi. Mealtal prfsins er 60, staalfrviki er 8 og reianleiki prfsins er 0,84. Hvert er mati raunverulegri tkomu nemandans?
Nemandi fr tkomuna 70 prfi. Mealtal prfsins er 60, staalfrviki er 8 og reianleiki prfsins er 0,84. Hvert er mati raunverulegri tkomu nemandans?
Hvaða fullyrðing lýsir best hvernig áreiðanleiki mælitækis hefur áhrif á fylgni milli tveggja breyta samkvæmt klassískri próffræði (CTT)?
Hvaða fullyrðing lýsir best hvernig áreiðanleiki mælitækis hefur áhrif á fylgni milli tveggja breyta samkvæmt klassískri próffræði (CTT)?
Hvaða áhrif hefur ófullkominn áreiðanleiki mælitækis á staðalfrávik mældra gilda (observed scores) samanborið við staðalfrávik raunverulegra gilda (true scores)?
Hvaða áhrif hefur ófullkominn áreiðanleiki mælitækis á staðalfrávik mældra gilda (observed scores) samanborið við staðalfrávik raunverulegra gilda (true scores)?
Hvaða fullyrðing lýsir best hlutverki samdreifni (covariance; $C_{X_tY_t}$) í jöfnunni fyrir fylgni milli tveggja breyta innan ramma klassískrar próffræði?
Hvaða fullyrðing lýsir best hlutverki samdreifni (covariance; $C_{X_tY_t}$) í jöfnunni fyrir fylgni milli tveggja breyta innan ramma klassískrar próffræði?
Ef fylgni milli raunverulegs sjálfsálits og raunverulegs námsárangurs er metin sem $r_{X_tY_t} = 0.60$, en áreiðanleiki mælinga á sjálfsáliti er $R_{XX} = 0.49$ og áreiðanleiki mælinga á námsárangri er $R_{YY} = 0.64$, hver er þá fylgni milli mældra gilda (observed scores) samkvæmt CTT?
Ef fylgni milli raunverulegs sjálfsálits og raunverulegs námsárangurs er metin sem $r_{X_tY_t} = 0.60$, en áreiðanleiki mælinga á sjálfsáliti er $R_{XX} = 0.49$ og áreiðanleiki mælinga á námsárangri er $R_{YY} = 0.64$, hver er þá fylgni milli mældra gilda (observed scores) samkvæmt CTT?
Í rannsókn á tengslum milli tveggja sálfræðilegra eiginleika, er fylgnistuðull milli mældra gilda (observed scores) reiknaður sem 0.25. Ef vitað er að áreiðanleiki mælinga á eiginleika X er 0.64 og á eiginleika Y er einnig 0.64, hver er þá áætluð fylgni milli raunverulegra gilda (true scores)?
Í rannsókn á tengslum milli tveggja sálfræðilegra eiginleika, er fylgnistuðull milli mældra gilda (observed scores) reiknaður sem 0.25. Ef vitað er að áreiðanleiki mælinga á eiginleika X er 0.64 og á eiginleika Y er einnig 0.64, hver er þá áætluð fylgni milli raunverulegra gilda (true scores)?
Í samhengi við klassíska próffræði (CTT), hvaða fullyrðing lýsir best sambandinu milli áreiðanleika mælinga og möguleikans á að hafna réttri núlltilgátu (Type II villa) í tölfræðilegri greiningu?
Í samhengi við klassíska próffræði (CTT), hvaða fullyrðing lýsir best sambandinu milli áreiðanleika mælinga og möguleikans á að hafna réttri núlltilgátu (Type II villa) í tölfræðilegri greiningu?
Hvernig hefur undiráætlun á áreiðanleika mælinga (e. attenuation) áhrif á túlkun fylgnistuðla í rannsóknum á flóknum sálfræðilegum fyrirbærum?
Hvernig hefur undiráætlun á áreiðanleika mælinga (e. attenuation) áhrif á túlkun fylgnistuðla í rannsóknum á flóknum sálfræðilegum fyrirbærum?
Í tilviki þar sem rannsakandi notar tvö óáreiðanleg mælitæki til að kanna samband tveggja fræðilegra hugsmíða, en vanrækir að leiðrétta fyrir áreiðanleika mælinganna, hvaða áhrif hefur það á niðurstöður rannsóknarinnar og túlkun þeirra?
Í tilviki þar sem rannsakandi notar tvö óáreiðanleg mælitæki til að kanna samband tveggja fræðilegra hugsmíða, en vanrækir að leiðrétta fyrir áreiðanleika mælinganna, hvaða áhrif hefur það á niðurstöður rannsóknarinnar og túlkun þeirra?
Hvernig hefur óáreiðanleiki mælinga áhrif á aðferðafræðilega ákvarðanatöku í rannsóknum, sérstaklega þegar kemur að því að meta gildmæti orsakaskýringa út frá fylgnistuðlum?
Hvernig hefur óáreiðanleiki mælinga áhrif á aðferðafræðilega ákvarðanatöku í rannsóknum, sérstaklega þegar kemur að því að meta gildmæti orsakaskýringa út frá fylgnistuðlum?
Hvernig getur rannsakandi hagað rannsókn til að draga úr áhrifum óáreiðanleika mælinga, og hverjar eru helstu takmarkanir þessara aðferða?
Hvernig getur rannsakandi hagað rannsókn til að draga úr áhrifum óáreiðanleika mælinga, og hverjar eru helstu takmarkanir þessara aðferða?
Hvernig er jafna 7.3 ($r_{XY}=r_{X_tY_t}\sqrt{R_{XX}R_{YY}}$) notuð til að meta áhrif óáreiðanleika á fylgni milli tveggja breyta?
Hvernig er jafna 7.3 ($r_{XY}=r_{X_tY_t}\sqrt{R_{XX}R_{YY}}$) notuð til að meta áhrif óáreiðanleika á fylgni milli tveggja breyta?
Hvernig getur vanmat á áreiðanleika haft áhrif á túlkun rannsóknarniðurstaðna og hvaða afleiðingar getur það haft fyrir ákvarðanatöku í vísindalegum rannsóknum?
Hvernig getur vanmat á áreiðanleika haft áhrif á túlkun rannsóknarniðurstaðna og hvaða afleiðingar getur það haft fyrir ákvarðanatöku í vísindalegum rannsóknum?
Í hvaða tilvikum getur verið ásættanlegt að nota mælitæki með lága áreiðanleika og hverjar eru helstu varúðarráðstafanir sem þarf að gera í slíkum tilvikum?
Í hvaða tilvikum getur verið ásættanlegt að nota mælitæki með lága áreiðanleika og hverjar eru helstu varúðarráðstafanir sem þarf að gera í slíkum tilvikum?
Hver er munurinn á því að nota Cohen's d og $\eta^2$ samanborið við fylgnistuðla til að meta tengsl milli breyta og hvernig hefur áreiðanleiki mælinga áhrif á þessar tölfræðilegu stærðir?
Hver er munurinn á því að nota Cohen's d og $\eta^2$ samanborið við fylgnistuðla til að meta tengsl milli breyta og hvernig hefur áreiðanleiki mælinga áhrif á þessar tölfræðilegu stærðir?
Hvernig geta rannsakendur notað aðferðir til að meta og leiðrétta fyrir óáreiðanleika mælinga (e.g., leiðrétting fyrir attenuation) og hverjar eru takmarkanir þessara aðferða í raunverulegum rannsóknum?
Hvernig geta rannsakendur notað aðferðir til að meta og leiðrétta fyrir óáreiðanleika mælinga (e.g., leiðrétting fyrir attenuation) og hverjar eru takmarkanir þessara aðferða í raunverulegum rannsóknum?
Hvernig geta vísindamenn beitt kenningum um áreiðanleika og mælingarskekkju til að þróa nýjar og betri aðferðir til að meta sálfræðileg fyrirbæri og draga úr áhrifum skekkna?
Hvernig geta vísindamenn beitt kenningum um áreiðanleika og mælingarskekkju til að þróa nýjar og betri aðferðir til að meta sálfræðileg fyrirbæri og draga úr áhrifum skekkna?
Hvernig breytist túlkun á öryggisbilum þegar notast er við staðlað skekkjumark (standard error of measurement) samanborið við staðlað skekkju mat (standard error of estimate) við útreikning þeirra, að því gefnu að áreiðanleiki mælingar hafi áhrif á báðar stærðir?
Hvernig breytist túlkun á öryggisbilum þegar notast er við staðlað skekkjumark (standard error of measurement) samanborið við staðlað skekkju mat (standard error of estimate) við útreikning þeirra, að því gefnu að áreiðanleiki mælingar hafi áhrif á báðar stærðir?
Ímyndaðu þér rannsókn þar sem þú reiknar 95% öryggisbil fyrir raunverulegt gildi (true score) einstaklings. Niðurstaðan er bil á milli 45 og 55. Hvaða fullyrðing endurspeglar best algengustu (en hugsanlega umdeildustu) túlkun á þessu öryggisbili?
Ímyndaðu þér rannsókn þar sem þú reiknar 95% öryggisbil fyrir raunverulegt gildi (true score) einstaklings. Niðurstaðan er bil á milli 45 og 55. Hvaða fullyrðing endurspeglar best algengustu (en hugsanlega umdeildustu) túlkun á þessu öryggisbili?
Hvaða fullyrðing lýsir best gagnrýni Dudecks (1979) á algenga túlkun öryggisbila, þar sem fullyrt er að "það sé 95% líkur á að raunverulegt gildi falli innan öryggisbilsins"?
Hvaða fullyrðing lýsir best gagnrýni Dudecks (1979) á algenga túlkun öryggisbila, þar sem fullyrt er að "það sé 95% líkur á að raunverulegt gildi falli innan öryggisbilsins"?
Hver er helsti munurinn á því að nota mæld gildi (observed scores) annars vegar og leiðrétt raunveruleg gildismat (adjusted true score estimates) hins vegar, til að reikna öryggisbil?
Hver er helsti munurinn á því að nota mæld gildi (observed scores) annars vegar og leiðrétt raunveruleg gildismat (adjusted true score estimates) hins vegar, til að reikna öryggisbil?
Hvaða áhrif hefur það á stærð og túlkun öryggisbils þegar öryggi (confidence level) er aukið úr 95% í 99%, að öðru óbreyttu?
Hvaða áhrif hefur það á stærð og túlkun öryggisbils þegar öryggi (confidence level) er aukið úr 95% í 99%, að öðru óbreyttu?
Í hvaða tilfelli er líklegast að notkun á leiðréttu raunvirði (adjusted true score) frekar en mældu gildi (observed score) sé talin nauðsynleg við útreikning öryggisbila, samkvæmt hefðbundinni sálfræðilegri próffræði?
Í hvaða tilfelli er líklegast að notkun á leiðréttu raunvirði (adjusted true score) frekar en mældu gildi (observed score) sé talin nauðsynleg við útreikning öryggisbila, samkvæmt hefðbundinni sálfræðilegri próffræði?
Ímyndaðu þér að þú sért að útskýra fyrir samstarfsmanni muninn á staðlaðri skekkjumælingu (standard error of measurement) og staðlaðri skekkjumati (standard error of estimate) við útreikning öryggisbila. Hvaða samlíking væri nákvæmust til að útskýra þetta?
Ímyndaðu þér að þú sért að útskýra fyrir samstarfsmanni muninn á staðlaðri skekkjumælingu (standard error of measurement) og staðlaðri skekkjumati (standard error of estimate) við útreikning öryggisbila. Hvaða samlíking væri nákvæmust til að útskýra þetta?
Í hvaða samhengi gæti ágreiningur um túlkun öryggisbila, eins og Dudek (1979) lýsti, haft mest áhrif á ákvarðanatöku í sálfræðilegri ráðgjöf?
Í hvaða samhengi gæti ágreiningur um túlkun öryggisbila, eins og Dudek (1979) lýsti, haft mest áhrif á ákvarðanatöku í sálfræðilegri ráðgjöf?
Hvernig hámarkar hátt áreiðanleikastuðull í sálfræðilegum prófum trúverðugleika ákvarðana sem teknar eru á grundvelli þeirra, sérstaklega í samhengi eins og dómstólaákvarðana um dauðarefsingar?
Hvernig hámarkar hátt áreiðanleikastuðull í sálfræðilegum prófum trúverðugleika ákvarðana sem teknar eru á grundvelli þeirra, sérstaklega í samhengi eins og dómstólaákvarðana um dauðarefsingar?
Hvernig metur sérfræðingur í sálfræðilegri mælingafræði áhrif óáreiðanlegra prófskora á menntastofnanir, þar sem inntökur í háskóla og úthlutun sérkennslu eru í húfi?
Hvernig metur sérfræðingur í sálfræðilegri mælingafræði áhrif óáreiðanlegra prófskora á menntastofnanir, þar sem inntökur í háskóla og úthlutun sérkennslu eru í húfi?
Hvernig metur reyndur mannauðsstjóri áhrif lélegrar áreiðanleika í ráðningarprófum á langtímaárangur fyrirtækis, sérstaklega með tilliti til framleiðni og starfsánægju?
Hvernig metur reyndur mannauðsstjóri áhrif lélegrar áreiðanleika í ráðningarprófum á langtímaárangur fyrirtækis, sérstaklega með tilliti til framleiðni og starfsánægju?
Hvernig getur sérfræðingur í kennslufræði nýtt sér áreiðanleika prófskora til að bæta kennsluaðferðir og námsárangur nemenda í stórum háskólanámskeiðum?
Hvernig getur sérfræðingur í kennslufræði nýtt sér áreiðanleika prófskora til að bæta kennsluaðferðir og námsárangur nemenda í stórum háskólanámskeiðum?
Í ljósi þess að raunverulegt stig einstaklings á sálfræðilegum eiginleika er óþekkt, hvernig dregur fagleg túlkun á áreiðanleika prófa úr hættunni á röngum ályktunum um getu eða hæfileika einstaklings?
Í ljósi þess að raunverulegt stig einstaklings á sálfræðilegum eiginleika er óþekkt, hvernig dregur fagleg túlkun á áreiðanleika prófa úr hættunni á röngum ályktunum um getu eða hæfileika einstaklings?
Hvernig getur sálfræðingur nýtt sér áreiðanleika viðmiðunarhóps til að staðla nýtt sálfræðilegt próf og tryggja að það sé sanngjarnt og hlutlægt fyrir fjölbreyttan hóp fólks?
Hvernig getur sálfræðingur nýtt sér áreiðanleika viðmiðunarhóps til að staðla nýtt sálfræðilegt próf og tryggja að það sé sanngjarnt og hlutlægt fyrir fjölbreyttan hóp fólks?
Hvernig breytist túlkun á mælanlegri skekkju (e. standard error of measurement, SEM) út frá áreiðanleikastuðli prófs þegar verið er að meta einstaklingsbundnar framfarir í meðferð, sérstaklega í klínísku samhengi þar sem lítilsháttar breytingar geta haft verulega þýðingu?
Hvernig breytist túlkun á mælanlegri skekkju (e. standard error of measurement, SEM) út frá áreiðanleikastuðli prófs þegar verið er að meta einstaklingsbundnar framfarir í meðferð, sérstaklega í klínísku samhengi þar sem lítilsháttar breytingar geta haft verulega þýðingu?
Í hvernig aðstæðum, sem snúa að þróun nýs sálfræðilegs prófs, gæti rannsakandi ákveðið að fórna innri samkvæmni til að auka innihaldsrökréttingu, og hvaða afleiðingar hefur það fyrir túlkun og notkun prófsins?
Í hvernig aðstæðum, sem snúa að þróun nýs sálfræðilegs prófs, gæti rannsakandi ákveðið að fórna innri samkvæmni til að auka innihaldsrökréttingu, og hvaða afleiðingar hefur það fyrir túlkun og notkun prófsins?
Flashcards
Áreiðanleiki
Áreiðanleiki
Stöðugleiki prófa við endurteknar mælingar eða áreiðanleiki mælinga.
Notkun sálfræðiprófa
Notkun sálfræðiprófa
Notað til að taka ákvarðanir sem hafa áhrif á líf fólks, t.d. í menntun eða atvinnu.
Afleiðingar óáreiðanleika
Afleiðingar óáreiðanleika
Ef próf er óáreiðanlegt geta ákvarðanir byggðar á því haft alvarlegar afleiðingar.
Óþekkt 'sönn' geta
Óþekkt 'sönn' geta
Signup and view all the flashcards
Próf sem vísbending
Próf sem vísbending
Signup and view all the flashcards
Áhrif prófa á menntun
Áhrif prófa á menntun
Signup and view all the flashcards
Áhrif prófa á atvinnu
Áhrif prófa á atvinnu
Signup and view all the flashcards
Mikilvægi áreiðanleika
Mikilvægi áreiðanleika
Signup and view all the flashcards
Öryggisbil
Öryggisbil
Signup and view all the flashcards
Mismunandi öryggisstig
Mismunandi öryggisstig
Signup and view all the flashcards
Staðalvilla mælinga
Staðalvilla mælinga
Signup and view all the flashcards
Staðalvilla mats
Staðalvilla mats
Signup and view all the flashcards
Notkun á mati
Notkun á mati
Signup and view all the flashcards
Dreifing raungilda
Dreifing raungilda
Signup and view all the flashcards
Mæld gildi
Mæld gildi
Signup and view all the flashcards
Túlkun á öryggisbili
Túlkun á öryggisbili
Signup and view all the flashcards
Staðalvilla mælingar (s em )
Staðalvilla mælingar (s em )
Signup and view all the flashcards
Áreiðanleiki og s em
Áreiðanleiki og s em
Signup and view all the flashcards
Formúla fyrir s em
Formúla fyrir s em
Signup and view all the flashcards
95% öryggisbil
95% öryggisbil
Signup and view all the flashcards
Reikna s em
Reikna s em
Signup and view all the flashcards
Reikna öryggisbil
Reikna öryggisbil
Signup and view all the flashcards
Áreiðanleiki og nákvæmni
Áreiðanleiki og nákvæmni
Signup and view all the flashcards
Fylgni (rXY)
Fylgni (rXY)
Signup and view all the flashcards
CXtYt
CXtYt
Signup and view all the flashcards
Skekkjur í CTT
Skekkjur í CTT
Signup and view all the flashcards
Áhrif skekkja á samdreifingu
Áhrif skekkja á samdreifingu
Signup and view all the flashcards
Breytileiki og áreiðanleiki
Breytileiki og áreiðanleiki
Signup and view all the flashcards
Gæði rannsókna
Gæði rannsókna
Signup and view all the flashcards
Áhrif áreiðanleika og mælingavillu
Áhrif áreiðanleika og mælingavillu
Signup and view all the flashcards
Markmið rannsókna
Markmið rannsókna
Signup and view all the flashcards
Fylgnistuðull
Fylgnistuðull
Signup and view all the flashcards
Cohen's d og η²
Cohen's d og η²
Signup and view all the flashcards
RXX
RXX
Signup and view all the flashcards
rXY = rXtYt√(RXXRYY)
rXY = rXtYt√(RXXRYY)
Signup and view all the flashcards
Áreiðanleiki skilgreining
Áreiðanleiki skilgreining
Signup and view all the flashcards
Staðalfrávik (mælt)
Staðalfrávik (mælt)
Signup and view all the flashcards
Fylgni leiðrétting
Fylgni leiðrétting
Signup and view all the flashcards
Raunveruleg fylgni
Raunveruleg fylgni
Signup and view all the flashcards
Mæld fylgni
Mæld fylgni
Signup and view all the flashcards
CTT áhrif á fylgni
CTT áhrif á fylgni
Signup and view all the flashcards
Áreiðanleiki og fylgni
Áreiðanleiki og fylgni
Signup and view all the flashcards
Lágt áreiðanleiki
Lágt áreiðanleiki
Signup and view all the flashcards
Study Notes
The Importance of Reliability
- Psychological measurement is vital for behavioral science research and application.
- Reliability is a cornerstone of a test's psychometric quality, essential for understanding and evaluating psychological measurements.
- The previous chapters detail the conceptual basis of reliability and the procedures to estimate test scores.
- Reliability plays important roles in applied behavioral science practice, behavioral research, and test construction/refinement.
Applied Behavioral Practice: Evaluation of an Individual's Test Score
- Psychologists and others rely on psychological test scores when making decisions that can impact people's lives.
- Intelligence tests can be used to determine eligibility for the death sentence for convicted murderers.
- It is vital to have reliable scores so a person is not unfairly sentenced based on an unreliable test.
- The reliability of test scores can impact many ordinary people's lives.
- Test scores affect decisions such as special classes, college admissions, hiring, and promotions.
- Test score reliability is important to the quality of decisions made with those scores.
- The "true" level on an unobservable psychological construct can never be known.
- We can never know someone's true intelligence, so test scores indicate or estimate an individual's "true' level of some psychological attribute.
- Test scores are just estimates of a person's actual psychological characteristics, we must evaluate the precision of such scores.
- Reliability helps calculate information that shows the precision of particular test scores.
Point Estimates of True Scores
- There are two important pieces of information for evaluating an individual's test score.
- A point estimate is a specific value, a "best estimate" of an individual's standing on a psychological attribute.
- A confidence interval reflects a range of values where the true score is likely to fall.
- The logic of a confidence interval recognizes that an observed score is simply an estimate of a true score.
- Measurement error means the observed score may not be equal to the true score
Point Estimates of True Scores
- Two kinds of point estimates can be made from an individual's observed test score representing the individual's single best true score estimate.
- The most widely used point estimate is based solely on an individual’s observed score which can be used as a point estimate.
- An example of using observed score as an estimate is when someone takes a self-esteem test and their score can be a point estimate of their true self-esteem score
Adjusted True Score Estimate
- A second type of point estimate, called an adjusted true score estimate, considers measurement error.
- Momentary factors can inflate or deflate an individual's observed score.
- An individual is likely to obtain differing observed scores across separate testing occasions.
- Reliability and the nature of measurement error helps estimate the score to be expected if tested repeatedly, producing the adjusted true score estimate via regression to the mean.
Regression to the Mean
- Regression to the mean applies to relatively extreme scores from an initial testing.
- The score is likely to be less extreme on a second testing (closer to the group mean).
- A high score is likely to be somewhat lower on a retest
- A low score is likely to be somewhat higher on a retest
- Classical test theory and random measurement error logic explain this prediction.
- Measurement error randomly inflates or deflates scores to some degree.
Figure 7.1 Illustrating Regression to the Mean
- Scores of 20 hypothetical people taking a test twice are plotted, with scores paired by a line.
- Each person's observed score at testing occasion 1 was created according to CTT, by adding a true score and a random error value.
- Each person's observed score at testing occasion 2 was created by using the same true score but a different random error value.
- The solid lines reflect the people with relatively extreme scores on occasion 1.
- High lines converge toward the mean for the second testing occasion.
Adjusted True Score
- The adjusted true score estimate intends to display discrepancy in individual observed scores across repeated testing occasions, due to regression to the mean.
- The size and direction of this discrepancy depends on:
- reliability of test scores
- extremity of the individual's observed score
- the direction of the difference between the observed score and the mean of the scores
- The adjusted true score estimate is calculated through the following equation:
- Xest = X + Rxx(X – X。)
Reliability factors
- Reliability affects the difference between the estimated true score as reliability decreases/worsens the difference increases.
- Poorer reliability leads to larger discrepancies between the estimated true score and the observed score reflecting the regression to the mean.
- The observed score's extremity affects the difference between the estimated true score and the observed score.
- The point adjustment increases for relatively extreme observed scores (high or low) compared to moderate scores.
- Adjusted true scores and regression to the mean should be approached with some caution.
- Correcting observed scores may not be necessary unless wanting to predict a person’s score on a subsequent test or to form a confidence interval.
Confidence Intervals
- Point estimates of individual's scores are usually reported in the range of confidence intervals.
- Confidence intervals aim to reflect, roughly, the accuracy or precision of the point estimate as an indicator of an individual's score.
- Wechsler Intelligence Scale provides examples a child obtains a score of 106, we might calculate a confidence interval and conclude that we are "95% confident that the individual's true IQ score falls in the range of 100-112"
- The width of a confidence interval (e.g., a 12-point range) reflects the precision of the point estimate. You will probably not be surprised to learn that this precision is closely related to reliability-
- when test scores have higher reliability, they provide more precise estimates of individuals' true scores. The range of individuals' true confidence intervals is closely related to reliability.
- When test scores have higher reliability, they provide more precise estimates of individuals' true scores.
Standard Error of Measurement
- The link between reliability and the precision of confidence intervals is the standard error of measurement (sem).
- As chapter 5 discussed, the sem represents the average size of the error scores that affect observed scores, and the larger the sem, the greater the average difference between observed scores and true scores
- sem can be seen as an index of measurement error, and is linked to reliability.
- Equation 5.16 presented the exact link between the standard error of measurement (sem), reliability (Rxx), and the standard deviation of a test's observed scores (so):
- sem = so√1- Rxx.
- After we estimate the standard error of measurement for a set of test scores, we can compute a confidence interval around an individual's estimated true score.
- For a 95% confidence interval around that score, we use the following equation:
- 95% confidence interval = Xest ± (1.96)(sem)
- where Xest is the adjusted true score estimate (i.e., a point estimate of the individual's true score) and sem is the standard error of measurement of the test scores.
- 95% confidence interval = Xest ± (1.96)(sem)
Confidence interval equation
- The final component of this equation (1.96) reflects the fact that we are interested in a 95% confidence interval rather than a 90% interval or any other "degree of confidence."
- Some readers might recognize this value(i.e., 1.96) as being associated with a probability of .95 from the standardnormal distribution.
- The individual's observed score is 38, based on a test with a mean observed score of X = 30, a standard deviation (of observed scores) of so = 6, and an estimated reliability of Rxx = .90, her adjusted true score estimate is Xest = 37.2
- Using Equation 5.16, we estimate the standard error of measurement as.
- sem = 6√1-.90 = 1.90.
- Based on Equation 7. 2, for our test, the 95% confidence interval is 33.5 to 40.9:
- 95% confidence interval = 37.2 ± (1.96)(1.90)
- = 37.2 ± 3.7
- = 33.5 to 40.9.
Reliability and confidence
- Logic expressed by previous quote from Wechsler (2003b), this result might mean that in indicating that we are confident an individual's true score falls in the range of 33.5 to 40.9
- As mentioned earlier the precision of a true score estimate is tied to reliability; briefly highly reliable tests produce narrower confidence intervals than less reliable tests. the sem was smaller and the confidence interval has a small range.
- However, lower reliability produces wider confidence intervals, reflecting a less precise estimate of the truc score the sem would be relatively larger and there is more imprecise data on observed scores.
Debate
- Although prior sections have outlined ways to report individual scores and confidence intervals around those scores, you might encounter other ways, and perhaps more commonly, you will see observed scores reported or confidence intervals computed around those observed scores and interpreted as above
- There are different perspectives: the ways in which confidence intervals are computed and integrated with true sore estimates as some are calculated through standard of measurement and other are not.
- An adjusted true score estimate allows for some adjustment where true estimates are deviated and scored differently if they had people with same true scores take the exam.
- However different ways of scoring and calculation has lead some interpretations up to debate depending on the situation in which scores are based.
Summary
- The most important general message from section is that reliability affects the confidence accuracy, or precision with which an individual's true score is estimated, that is, reliability affects the standard measurement, which affect widths of confidence intervals around individual's estimated true scores.
- Poor reliability produces scores that are imprecise reflections of individuals traits, skills and attitudes.
- In contrast good reliability produce scores that are more precise reflections of individuals true psychological attributes.
- If one uses psychological tests to make decisions about individual, then those tests should contain strong ability.
Behavioral Research
- Reliability has implications for conducting and interpreting reliable sciences
- Measurement procedures is used in the research
- Reliavbility and measurement error in effects of behavioral Research
- For interepting behavioral research In a productive way
- By how important variables are related to each other for scientific research
- the relationship between psychological Variables
- A correlation of coefficient The correlation between observed scores on two measures determined the correaltion between (1) the scores of Two Psycholoigcal (2) reliability Reliability
- Reliability effect test on measurement
Equation 7.3
- Equation 7.3 is a key element with important implied for research and applied Measurement.
- To better understand: Including the assumptions That error correlation for true scores
- equation a correlation between two deviations = The cavarionce divided by standard deviation
- in terms of observed scores: correlating score
- is equal variance divided by standard deviation
- therefore, the Cariance between for various composite variables CTT Error are Uncorrelated with true scores
- uncorrelated error scores thus reduce to the variance between the true scores
Reliability and Variability
- Variance can measure the relation to reliability
- defined as ratios of true score variance to the deviation
- relationship on these variances
CCT in research:
- The Correlation between Measure = Correlations or Measures
In addition, the study's reliability has the two best measured questionnaires. However, the better the reliability for measurement And with low measuring of self and academic scores, it could be smaller the CCT test CTT also implies that measurement errors must be calculated
Measurement Error (Low Reliability) Attenuates the Observed Associations Between Measures
- discrepancy 7.4's associations with 7.3 = again true of the implications on CTT's hold.
- This section's illustrations Observed will always to be between Constructs . Which happens from measuring as never affecting And measures cannot weak association error and a constant = correlations or reliable less than equal effects However, what do you mean by
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.