Kafli 7

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson
Download our mobile app to listen on the go
Get App

Questions and Answers

Samhengi vi klassska prffri (CTT), hvernig hefur skekkja treikningi fylgnistuuls tveggja breytna hrif tlkun raunverulegu sambandi eirra, me hlisjn af forsendum um tilviljunarkennda dreifingu villna?

  • Skekkjan leiir alltaf til ofmats raunverulegu fylgni, ar sem hn eykur samdreifni villutta.
  • Skekkjan getur leitt bi til ofmats og vanmats, en hefur engin hrif tlkun raunverulegu sambandi breytanna.
  • Skekkjan leiir alltaf til vanmats raunverulegu fylgni, ar sem hn dregur r samdreifni rauntta.
  • Skekkjan leiir nr alltaf til vanmats raunverulegu fylgni, ar sem hn eykur heildardreifingu og dregur r hlutfalli raunverulegrar dreifingar. (correct)

Gefi a fylgni milli raunverulegra gilda prfi X og prfi Y ($r_{X_tY_t}$) er 0,75 og hlutfall dreifingar raunverulegra gilda af prfi X er 0,64 og hlutfall dreifingar raunverulegra gilda af prfi Y er 0,81. Hvert er fylgnistuullinn milli mldra gilda prfunum mia vi ofangreindar upplsingar?

  • 0,600
  • 0,836
  • 0,675 (correct)
  • 0,540

Rannskn ar sem skoa a meta fylgni milli tveggja flkinna slfrilegra eiginleika, ar sem bi mlitkin hafa fullkomna reianleika, hvernig tti rannsakandi a bregast vi til a f eins nkvma mynd af raunverulegri fylgni og mgulegt er?

  • Nota leirttingarformlu fyrir minnkaa styrkingu til a meta fylgnina, me v a deila fylgnistulinum me margfeldi af kvaratrtum reianleikastulanna. (correct)
  • Nota Cronbach's alpha til a meta reianleika og draga a fr fylgnistulinum til a f leirtt gildi.
  • Nota leirtta fylgnistuulinn, ar sem leirtting getur kt fylgnina og leitt til rangra lyktana.
  • Nota Spearman-Brown formluna til a meta reianleika og nota hana til a leirtta fylgnistuulinn.

Hver er afleiingin af v a hunsa reianleika mlitkja egar kvaranir eru teknar grundvelli fylgni milli mlinga starfsmannavalssamhengi, og hvernig getur etta haft hrif rttmti rningaferlisins?

<p>a getur leitt til rangra lyktana um tengsl milli prfskora og starfsframmistu, sem dregur r rttmti rningaferlisins. (A)</p> Signup and view all the answers

Ljsi ess a klasssk prffri (CTT) gerir r fyrir a villur su tilviljunarkenndar og har raunverulegum gildum, hvernig myndi frvik fr essari forsendu hafa hrif tlkun fylgni milli tveggja breytna?

<p>a myndi gera tlkun fylgninni mgulega nema a nota flknari tlfrilegar aferir til a leirtta fyrir brotum forsendunum. (D)</p> Signup and view all the answers

Hvaa fullyring lsir best hrifum reianleika prfs staalvillu mlingarinnar ($s_{em}$)?

<p>Hrra reianleiki leiir til lgri staalvillu mlingarinnar, sem gefur til kynna nkvmari mlingu raunverulegri tkomu. (A)</p> Signup and view all the answers

Hvernig breytist breidd ryggisbilsins vi rauntkomu ef reianleiki prfs minnkar, a llu ru breyttu?

<p>Breidd ryggisbilsins eykst, sem gefur til kynna vissari tlun raunverulegri tkomu. (B)</p> Signup and view all the answers

Hvaa tilgangi er staalvilla mlingarinnar (standard error of measurement, $s_{em}$) notu vi tlkun prftkomna?

<p>Til a meta nkvmni einstaklingsbundinna tkomna og ba til ryggisbil um einstaklingsbundi raunverulegt stig. (B)</p> Signup and view all the answers

Myndau r a prf s me $s_{em} = 3$. Hvaa fullyring er lklegust um tlkun ryggisbils t fr essari $s_{em}$?

<p>68% ryggisbil gefur til kynna a raunveruleg tkomur einstaklings s lklega 3 punktum fr mldu tkomunni. (A)</p> Signup and view all the answers

Hvaa hrif hefur str rtaksins sem nota er til a meta reianleika prfs str staalvillu mlingarinnar ($s_{em}$)?

<p>Takmrku rtksstr getur leitt til nkvmari tlana reianleika, sem hefur ar me hrif $s_{em}$. (B)</p> Signup and view all the answers

Starfsflk mannaus notar prf til a ra nja starfsmenn. Prfi hefur reianleikastuulinn 0,70. Afleiingarnar af v a nota etta prf eru ____. (Athugi: reianleikastuullinn er gefinn upp sem $R{xx}$)

<p>a eru alvarlegar afleiingar. Bili raunverulegri tkomu einstaklings er breitt og v er erfitt a nota prftkomur. (A)</p> Signup and view all the answers

Prf hefur staalfrvik 10 og reianleikastuul 0,64. Hver er staalvillan mlingunni?

<p>6 (A)</p> Signup and view all the answers

Nemandi fr tkomuna 70 prfi. Mealtal prfsins er 60, staalfrviki er 8 og reianleiki prfsins er 0,84. Hvert er mati raunverulegri tkomu nemandans?

<p>68,4 (A)</p> Signup and view all the answers

Hvaða fullyrðing lýsir best hvernig áreiðanleiki mælitækis hefur áhrif á fylgni milli tveggja breyta samkvæmt klassískri próffræði (CTT)?

<p>Áreiðanleiki takmarkar hámarks mögulega fylgni milli tveggja breyta; óáreiðanleg mælitæki geta dregið úr fylgnistuðlinum. (B)</p> Signup and view all the answers

Hvaða áhrif hefur ófullkominn áreiðanleiki mælitækis á staðalfrávik mældra gilda (observed scores) samanborið við staðalfrávik raunverulegra gilda (true scores)?

<p>Ófullkominn áreiðanleiki eykur staðalfrávik mældra gilda. (A)</p> Signup and view all the answers

Hvaða fullyrðing lýsir best hlutverki samdreifni (covariance; $C_{X_tY_t}$) í jöfnunni fyrir fylgni milli tveggja breyta innan ramma klassískrar próffræði?

<p>Samdreifni táknar sameiginlega dreifingu raunverulegra gilda tveggja breyta og er grundvöllurinn fyrir skilningi á fylgni. (B)</p> Signup and view all the answers

Ef fylgni milli raunverulegs sjálfsálits og raunverulegs námsárangurs er metin sem $r_{X_tY_t} = 0.60$, en áreiðanleiki mælinga á sjálfsáliti er $R_{XX} = 0.49$ og áreiðanleiki mælinga á námsárangri er $R_{YY} = 0.64$, hver er þá fylgni milli mældra gilda (observed scores) samkvæmt CTT?

<p>0.336 (C)</p> Signup and view all the answers

Í rannsókn á tengslum milli tveggja sálfræðilegra eiginleika, er fylgnistuðull milli mældra gilda (observed scores) reiknaður sem 0.25. Ef vitað er að áreiðanleiki mælinga á eiginleika X er 0.64 og á eiginleika Y er einnig 0.64, hver er þá áætluð fylgni milli raunverulegra gilda (true scores)?

<p>0.390625 (D)</p> Signup and view all the answers

Í samhengi við klassíska próffræði (CTT), hvaða fullyrðing lýsir best sambandinu milli áreiðanleika mælinga og möguleikans á að hafna réttri núlltilgátu (Type II villa) í tölfræðilegri greiningu?

<p>Lægri áreiðanleiki eykur líkurnar á Type II villu, þar sem mælivillur geta grímt raunveruleg áhrif. (D)</p> Signup and view all the answers

Hvernig hefur undiráætlun á áreiðanleika mælinga (e. attenuation) áhrif á túlkun fylgnistuðla í rannsóknum á flóknum sálfræðilegum fyrirbærum?

<p>Undiráætlun getur leitt til rangrar synjunar á tengslum milli breyta, sem hamlar framgangi vísindalegrar þekkingar. (D)</p> Signup and view all the answers

Í tilviki þar sem rannsakandi notar tvö óáreiðanleg mælitæki til að kanna samband tveggja fræðilegra hugsmíða, en vanrækir að leiðrétta fyrir áreiðanleika mælinganna, hvaða áhrif hefur það á niðurstöður rannsóknarinnar og túlkun þeirra?

<p>Niðurstöðurnar gefa villandi mynd af raunverulegu sambandi hugsmíðanna, líklega undirmeta það, sem leiðir til rangra ályktana. (D)</p> Signup and view all the answers

Hvernig hefur óáreiðanleiki mælinga áhrif á aðferðafræðilega ákvarðanatöku í rannsóknum, sérstaklega þegar kemur að því að meta gildmæti orsakaskýringa út frá fylgnistuðlum?

<p>Óáreiðanleiki dregur alltaf úr stærð fylgnistuðla, sem gerir það að verkum að erfitt er að greina raunveruleg tengsl, jafnvel þótt þau séu til staðar. (D)</p> Signup and view all the answers

Hvernig getur rannsakandi hagað rannsókn til að draga úr áhrifum óáreiðanleika mælinga, og hverjar eru helstu takmarkanir þessara aðferða?

<p>Með því að nota margar mælingar á sama fyrirbæri og reikna meðaltal þeirra, en þetta getur aukið kostnað og flækjustig rannsóknar. (A)</p> Signup and view all the answers

Hvernig er jafna 7.3 ($r_{XY}=r_{X_tY_t}\sqrt{R_{XX}R_{YY}}$) notuð til að meta áhrif óáreiðanleika á fylgni milli tveggja breyta?

<p>Jafnan sýnir hvernig áreiðanleiki mælinga dregur úr fylgni milli mældra gilda miðað við raunveruleg gildi. (B)</p> Signup and view all the answers

Hvernig getur vanmat á áreiðanleika haft áhrif á túlkun rannsóknarniðurstaðna og hvaða afleiðingar getur það haft fyrir ákvarðanatöku í vísindalegum rannsóknum?

<p>Vanmat á áreiðanleika dregur úr líkum á að finna marktæk tengsl, sem getur leitt til þess að rannsóknir eru taldar ónothæfar þrátt fyrir raunveruleg tengsl. (D)</p> Signup and view all the answers

Í hvaða tilvikum getur verið ásættanlegt að nota mælitæki með lága áreiðanleika og hverjar eru helstu varúðarráðstafanir sem þarf að gera í slíkum tilvikum?

<p>Það getur verið ásættanlegt í upphaflegum rannsóknum þar sem markmiðið er að kanna hugmyndir, en þá verður að túlka niðurstöðurnar með varúð og viðurkenna takmarkanir mælinganna. (C)</p> Signup and view all the answers

Hver er munurinn á því að nota Cohen's d og $\eta^2$ samanborið við fylgnistuðla til að meta tengsl milli breyta og hvernig hefur áreiðanleiki mælinga áhrif á þessar tölfræðilegu stærðir?

<p>Cohen's d og $\eta^2$ eru næmari fyrir áhrifum óáreiðanleika, sem getur leitt til ónákvæmari niðurstaðna ef áreiðanleiki er ekki tekinn með í reikninginn. (C)</p> Signup and view all the answers

Hvernig geta rannsakendur notað aðferðir til að meta og leiðrétta fyrir óáreiðanleika mælinga (e.g., leiðrétting fyrir attenuation) og hverjar eru takmarkanir þessara aðferða í raunverulegum rannsóknum?

<p>Þessar aðferðir geta leiðrétt fyrir óáreiðanleika, en þær byggja á forsendum sem eru oft ekki uppfylltar í raunverulegum rannsóknum, sem getur leitt til ofleiðréttinga eða rangra ályktana. (A)</p> Signup and view all the answers

Hvernig geta vísindamenn beitt kenningum um áreiðanleika og mælingarskekkju til að þróa nýjar og betri aðferðir til að meta sálfræðileg fyrirbæri og draga úr áhrifum skekkna?

<p>Með því að nota kenningar um áreiðanleika til að meta og draga úr mælingarskekkjum, þróa staðlaðari mælikvarða og beita flóknari tölfræðilegum aðferðum. (D)</p> Signup and view all the answers

Hvernig breytist túlkun á öryggisbilum þegar notast er við staðlað skekkjumark (standard error of measurement) samanborið við staðlað skekkju mat (standard error of estimate) við útreikning þeirra, að því gefnu að áreiðanleiki mælingar hafi áhrif á báðar stærðir?

<p>Þegar staðlað skekkjumat er notað, gefur öryggisbilið til kynna svið þar sem raunverulegt gildi einstaklings er líklegra til að finnast ef mælingin væri endurtekin óendanlega oft. (C)</p> Signup and view all the answers

Ímyndaðu þér rannsókn þar sem þú reiknar 95% öryggisbil fyrir raunverulegt gildi (true score) einstaklings. Niðurstaðan er bil á milli 45 og 55. Hvaða fullyrðing endurspeglar best algengustu (en hugsanlega umdeildustu) túlkun á þessu öryggisbili?

<p>Við getum verið 95% viss um að raunverulegt gildi einstaklingsins liggi einhvers staðar á milli 45 og 55. (B)</p> Signup and view all the answers

Hvaða fullyrðing lýsir best gagnrýni Dudecks (1979) á algenga túlkun öryggisbila, þar sem fullyrt er að "það sé 95% líkur á að raunverulegt gildi falli innan öryggisbilsins"?

<p>Dudek telur að þessi túlkun sé of einfölduð og taki ekki tillit til þess að raunveruleg gildi dreifast í kringum mæld gildi, en ekki öfugt. (C)</p> Signup and view all the answers

Hver er helsti munurinn á því að nota mæld gildi (observed scores) annars vegar og leiðrétt raunveruleg gildismat (adjusted true score estimates) hins vegar, til að reikna öryggisbil?

<p>Leiðrétt raunveruleg gildismat dregur úr áhrifum tilviljunarkenndra skekkja, sem leiðir til öryggisbils sem er líklegra til að endurspegla raunverulegt gildi einstaklingsins. (C)</p> Signup and view all the answers

Hvaða áhrif hefur það á stærð og túlkun öryggisbils þegar öryggi (confidence level) er aukið úr 95% í 99%, að öðru óbreyttu?

<p>Öryggisbilið verður breiðara og túlkunin gefur til kynna meiri vissu um að raunverulegt gildi falli innan bilsins. (A)</p> Signup and view all the answers

Í hvaða tilfelli er líklegast að notkun á leiðréttu raunvirði (adjusted true score) frekar en mældu gildi (observed score) sé talin nauðsynleg við útreikning öryggisbila, samkvæmt hefðbundinni sálfræðilegri próffræði?

<p>Þegar niðurstöður prófs eru notaðar til að taka mikilvægar ákvarðanir um einstaklinga, þar sem leiðrétta raunvirðið hjálpar til við að lágmarka líkur á mistúlkun. (D)</p> Signup and view all the answers

Ímyndaðu þér að þú sért að útskýra fyrir samstarfsmanni muninn á staðlaðri skekkjumælingu (standard error of measurement) og staðlaðri skekkjumati (standard error of estimate) við útreikning öryggisbila. Hvaða samlíking væri nákvæmust til að útskýra þetta?

<p>Staðlað skekkjumæling er eins og að taka mynd með óskýrri myndavél, en staðlað skekkjumat er eins og að taka mynd með háskerpumyndavél: öryggisbilið endurspeglar þetta. (B)</p> Signup and view all the answers

Í hvaða samhengi gæti ágreiningur um túlkun öryggisbila, eins og Dudek (1979) lýsti, haft mest áhrif á ákvarðanatöku í sálfræðilegri ráðgjöf?

<p>Þegar metið er hvort einstaklingur uppfylli skilyrði fyrir ákveðnum meðferðarúrræðum, út frá prófskori sem nálgast viðmiðunarmörk. (C)</p> Signup and view all the answers

Hvernig hámarkar hátt áreiðanleikastuðull í sálfræðilegum prófum trúverðugleika ákvarðana sem teknar eru á grundvelli þeirra, sérstaklega í samhengi eins og dómstólaákvarðana um dauðarefsingar?

<p>Hann lágmarkar möguleikann á misflokkun einstaklinga sem fylgir óáreiðanlegum mælingum og tryggir sanngjarnari niðurstöður. (D)</p> Signup and view all the answers

Hvernig metur sérfræðingur í sálfræðilegri mælingafræði áhrif óáreiðanlegra prófskora á menntastofnanir, þar sem inntökur í háskóla og úthlutun sérkennslu eru í húfi?

<p>Með því að greina hvernig óáreiðanlegar prófskorur valda því að hæfileikaríkir nemendur eru ranglega settir í sérkennslu, og þar með hindrað vitsmunalegan þroska þeirra. (C)</p> Signup and view all the answers

Hvernig metur reyndur mannauðsstjóri áhrif lélegrar áreiðanleika í ráðningarprófum á langtímaárangur fyrirtækis, sérstaklega með tilliti til framleiðni og starfsánægju?

<p>Allt framangreint. (D)</p> Signup and view all the answers

Hvernig getur sérfræðingur í kennslufræði nýtt sér áreiðanleika prófskora til að bæta kennsluaðferðir og námsárangur nemenda í stórum háskólanámskeiðum?

<p>Allt framangreint. (D)</p> Signup and view all the answers

Í ljósi þess að raunverulegt stig einstaklings á sálfræðilegum eiginleika er óþekkt, hvernig dregur fagleg túlkun á áreiðanleika prófa úr hættunni á röngum ályktunum um getu eða hæfileika einstaklings?

<p>Allt framangreint. (B)</p> Signup and view all the answers

Hvernig getur sálfræðingur nýtt sér áreiðanleika viðmiðunarhóps til að staðla nýtt sálfræðilegt próf og tryggja að það sé sanngjarnt og hlutlægt fyrir fjölbreyttan hóp fólks?

<p>Allt framangreint. (B)</p> Signup and view all the answers

Hvernig breytist túlkun á mælanlegri skekkju (e. standard error of measurement, SEM) út frá áreiðanleikastuðli prófs þegar verið er að meta einstaklingsbundnar framfarir í meðferð, sérstaklega í klínísku samhengi þar sem lítilsháttar breytingar geta haft verulega þýðingu?

<p>Hærri áreiðanleikastuðull þýðir að SEM er lægra, sem gerir kleift að greina smærri, marktækar breytingar á stigum einstaklings með meiri vissu. (B)</p> Signup and view all the answers

Í hvernig aðstæðum, sem snúa að þróun nýs sálfræðilegs prófs, gæti rannsakandi ákveðið að fórna innri samkvæmni til að auka innihaldsrökréttingu, og hvaða afleiðingar hefur það fyrir túlkun og notkun prófsins?

<p>Þegar prófið á að ná yfir breitt svið af hegðun; túlkun verður að taka tillit til þess að einstakir hlutar prófsins gætu mælt mismunandi þætti hegðunarinnar. (B)</p> Signup and view all the answers

Flashcards

Áreiðanleiki

Stöðugleiki prófa við endurteknar mælingar eða áreiðanleiki mælinga.

Notkun sálfræðiprófa

Notað til að taka ákvarðanir sem hafa áhrif á líf fólks, t.d. í menntun eða atvinnu.

Afleiðingar óáreiðanleika

Ef próf er óáreiðanlegt geta ákvarðanir byggðar á því haft alvarlegar afleiðingar.

Óþekkt 'sönn' geta

Við getum aldrei vitað nákvæmlega 'sanna' getu einstaklings.

Signup and view all the flashcards

Próf sem vísbending

Sálfræðipróf gefa vísbendingu um getu einstaklings.

Signup and view all the flashcards

Áhrif prófa á menntun

Geta haft áhrif á úthlutun í sérdeildum og ákvarðanir um inntöku í háskóla.

Signup and view all the flashcards

Áhrif prófa á atvinnu

Getur haft áhrif á ráðningar og stöðuhækkanir.

Signup and view all the flashcards

Mikilvægi áreiðanleika

Áreiðanleiki er grundvallaratriði í sálfræðilegum mælingum.

Signup and view all the flashcards

Öryggisbil

Svið þar sem við teljum að raunverulegt gildi liggi með ákveðinni vissu.

Signup and view all the flashcards

Mismunandi öryggisstig

Hægt að reikna með mismunandi öryggisstigi (td. 99%, 90%).

Signup and view all the flashcards

Staðalvilla mælinga

Mælikvarði á hversu mikið mæld gildi dreifast frá raunverulegu gildinu.

Signup and view all the flashcards

Staðalvilla mats

Tengt hugtak, einnig háð áreiðanleika mælinga.

Signup and view all the flashcards

Notkun á mati

Hægt að nota á bæði mæld gildi og leiðrétt mat á raunverulegu gildinu.

Signup and view all the flashcards

Dreifing raungilda

Mæld gildi dreifast venjulega umhverfis raunverulegt gildi.

Signup and view all the flashcards

Mæld gildi

Besta ágiskun okkar á raunverulegt gildi.

Signup and view all the flashcards

Túlkun á öryggisbili

Túlkun þar sem raunverulegt gildi er talið vera innan öryggisbilsins.

Signup and view all the flashcards

Staðalvilla mælingar (s em ​ )

Staðalvilla mælingarinnar (s em ​ ) metur nákvæmni einstakra prófskora.

Signup and view all the flashcards

Áreiðanleiki og s em ​

Hærri áreiðanleiki leiðir til minni staðalvillu mælingarinnar og þrengri öryggisbila.

Signup and view all the flashcards

Formúla fyrir s em ​

s em ​ = s o ​ √(1 - R xx ​ ), þar sem s o ​ er staðalfrávik fenginna skora og R xx ​ er áreiðanleiki prófsins.

Signup and view all the flashcards

95% öryggisbil

Öryggisbil = X est ​ ± (1.96)(s em ​ ), þar sem X est ​ er áætluð raunveruleg skor.

Signup and view all the flashcards

Reikna s em ​

Notaðu gefnar upplýsingar til að reikna staðalvilluna mælingarinnar.

Signup and view all the flashcards

Reikna öryggisbil

Notaðu X est ​ og s em ​ til að reikna efri og neðri mörk öryggisbilsins.

Signup and view all the flashcards

Áreiðanleiki og nákvæmni

Próf með meiri áreiðanleika gefa þrengri öryggisbil.

Signup and view all the flashcards

Fylgni (rXY)

Fylgni milli tveggja breyta er samdreifingin deilt með staðalfrávikum þeirra.

Signup and view all the flashcards

CXtYt

Samdreifing milli raunverulegra gilda á prófi X og raunverulegra gilda á prófi Y.

Signup and view all the flashcards

Skekkjur í CTT

Í CTT er gert ráð fyrir að skekkjur séu tilviljanakenndar og því óháðar raunverulegum gildum og skekkjum á öðrum prófum.

Signup and view all the flashcards

Áhrif skekkja á samdreifingu

Þar sem skekkjur eru óháðar, minnkar samdreifingin milli raunverulegra gilda þegar skekkjur eru teknar með.

Signup and view all the flashcards

Breytileiki og áreiðanleiki

Breytileiki í gildum á prófi er tengdur áreiðanleika prófsins.

Signup and view all the flashcards

Gæði rannsókna

Gæði og þýðingarmikil rannsókn byggjast á gæðum mæliaðferðanna sem notaðar eru.

Signup and view all the flashcards

Áhrif áreiðanleika og mælingavillu

Útskýrir hvernig áreiðanleiki og mælingavilla hafa áhrif á niðurstöður rannsókna.

Signup and view all the flashcards

Markmið rannsókna

Að uppgötva hvernig mikilvæg breytur tengjast hver annari.

Signup and view all the flashcards

Fylgnistuðull

Algengasta leiðin til að mæla tengsl milli breyta í sálfræðirannsóknum.

Signup and view all the flashcards

Cohen's d og η²

Tölfræði sem notuð er til að sýna fram á tengsl milli breyta, sérstaklega í tilraunasálfræði.

Signup and view all the flashcards

RXX

Áreiðanleiki mælinga á breytu X.

Signup and view all the flashcards

rXY = rXtYt√(RXXRYY)

Fylgni milli mældra gilda á tveimur mælikvörðum er ákvörðuð af fylgni raunverulegra gilda og áreiðanleika mælikvarðanna.

Signup and view all the flashcards

Áreiðanleiki skilgreining

Hlutfallið af raunverulegri breytileika stiga á móti breytileika stiga sem við sjáum.

Signup and view all the flashcards

Staðalfrávik (mælt)

Staðalfrávik mældra gilda, reiknað út frá staðalfráviki raunverulegra gilda og áreiðanleika.

Signup and view all the flashcards

Fylgni leiðrétting

Formúla sem sýnir hvernig fylgni mældra gilda er tengd fylgni raunverulegra gilda og áreiðanleika mælinganna.

Signup and view all the flashcards

Raunveruleg fylgni

Fylgni milli raunverulegra gilda tveggja breyta.

Signup and view all the flashcards

Mæld fylgni

Fylgni sem fæst á milli mældra gilda tveggja breyta.

Signup and view all the flashcards

CTT áhrif á fylgni

Hugmyndin um að mæld fylgni sé undir áhrifum bæði raunverulegrar fylgni og áreiðanleika mælinganna.

Signup and view all the flashcards

Áreiðanleiki og fylgni

Ef mælingar eru óáreiðanlegar, verður fylgnin milli þeirra lægri en hún er í raun.

Signup and view all the flashcards

Lágt áreiðanleiki

Mælitæki með lágan áreiðanleika dregur úr fylgni milli mælinga, jafnvel þótt raunveruleg fylgni sé sterk.

Signup and view all the flashcards

Study Notes

The Importance of Reliability

  • Psychological measurement is vital for behavioral science research and application.
  • Reliability is a cornerstone of a test's psychometric quality, essential for understanding and evaluating psychological measurements.
  • The previous chapters detail the conceptual basis of reliability and the procedures to estimate test scores.
  • Reliability plays important roles in applied behavioral science practice, behavioral research, and test construction/refinement.

Applied Behavioral Practice: Evaluation of an Individual's Test Score

  • Psychologists and others rely on psychological test scores when making decisions that can impact people's lives.
  • Intelligence tests can be used to determine eligibility for the death sentence for convicted murderers.
  • It is vital to have reliable scores so a person is not unfairly sentenced based on an unreliable test.
  • The reliability of test scores can impact many ordinary people's lives.
  • Test scores affect decisions such as special classes, college admissions, hiring, and promotions.
  • Test score reliability is important to the quality of decisions made with those scores.
  • The "true" level on an unobservable psychological construct can never be known.
  • We can never know someone's true intelligence, so test scores indicate or estimate an individual's "true' level of some psychological attribute.
  • Test scores are just estimates of a person's actual psychological characteristics, we must evaluate the precision of such scores.
  • Reliability helps calculate information that shows the precision of particular test scores.

Point Estimates of True Scores

  • There are two important pieces of information for evaluating an individual's test score.
  • A point estimate is a specific value, a "best estimate" of an individual's standing on a psychological attribute.
  • A confidence interval reflects a range of values where the true score is likely to fall.
  • The logic of a confidence interval recognizes that an observed score is simply an estimate of a true score.
  • Measurement error means the observed score may not be equal to the true score

Point Estimates of True Scores

  • Two kinds of point estimates can be made from an individual's observed test score representing the individual's single best true score estimate.
  • The most widely used point estimate is based solely on an individual’s observed score which can be used as a point estimate.
  • An example of using observed score as an estimate is when someone takes a self-esteem test and their score can be a point estimate of their true self-esteem score

Adjusted True Score Estimate

  • A second type of point estimate, called an adjusted true score estimate, considers measurement error.
  • Momentary factors can inflate or deflate an individual's observed score.
  • An individual is likely to obtain differing observed scores across separate testing occasions.
  • Reliability and the nature of measurement error helps estimate the score to be expected if tested repeatedly, producing the adjusted true score estimate via regression to the mean.

Regression to the Mean

  • Regression to the mean applies to relatively extreme scores from an initial testing.
  • The score is likely to be less extreme on a second testing (closer to the group mean).
  • A high score is likely to be somewhat lower on a retest
  • A low score is likely to be somewhat higher on a retest
  • Classical test theory and random measurement error logic explain this prediction.
  • Measurement error randomly inflates or deflates scores to some degree.

Figure 7.1 Illustrating Regression to the Mean

  • Scores of 20 hypothetical people taking a test twice are plotted, with scores paired by a line.
  • Each person's observed score at testing occasion 1 was created according to CTT, by adding a true score and a random error value.
  • Each person's observed score at testing occasion 2 was created by using the same true score but a different random error value.
  • The solid lines reflect the people with relatively extreme scores on occasion 1.
  • High lines converge toward the mean for the second testing occasion.

Adjusted True Score

  • The adjusted true score estimate intends to display discrepancy in individual observed scores across repeated testing occasions, due to regression to the mean.
  • The size and direction of this discrepancy depends on:
    • reliability of test scores
    • extremity of the individual's observed score
    • the direction of the difference between the observed score and the mean of the scores
  • The adjusted true score estimate is calculated through the following equation:
    • Xest = X + Rxx(X – X。)

Reliability factors

  • Reliability affects the difference between the estimated true score as reliability decreases/worsens the difference increases.
  • Poorer reliability leads to larger discrepancies between the estimated true score and the observed score reflecting the regression to the mean.
  • The observed score's extremity affects the difference between the estimated true score and the observed score.
  • The point adjustment increases for relatively extreme observed scores (high or low) compared to moderate scores.
  • Adjusted true scores and regression to the mean should be approached with some caution.
  • Correcting observed scores may not be necessary unless wanting to predict a person’s score on a subsequent test or to form a confidence interval.

Confidence Intervals

  • Point estimates of individual's scores are usually reported in the range of confidence intervals.
  • Confidence intervals aim to reflect, roughly, the accuracy or precision of the point estimate as an indicator of an individual's score.
  • Wechsler Intelligence Scale provides examples a child obtains a score of 106, we might calculate a confidence interval and conclude that we are "95% confident that the individual's true IQ score falls in the range of 100-112"
  • The width of a confidence interval (e.g., a 12-point range) reflects the precision of the point estimate. You will probably not be surprised to learn that this precision is closely related to reliability-
  • when test scores have higher reliability, they provide more precise estimates of individuals' true scores. The range of individuals' true confidence intervals is closely related to reliability.
  • When test scores have higher reliability, they provide more precise estimates of individuals' true scores.

Standard Error of Measurement

  • The link between reliability and the precision of confidence intervals is the standard error of measurement (sem).
  • As chapter 5 discussed, the sem represents the average size of the error scores that affect observed scores, and the larger the sem, the greater the average difference between observed scores and true scores
  • sem can be seen as an index of measurement error, and is linked to reliability.
  • Equation 5.16 presented the exact link between the standard error of measurement (sem), reliability (Rxx), and the standard deviation of a test's observed scores (so):
    • sem = so√1- Rxx.
  • After we estimate the standard error of measurement for a set of test scores, we can compute a confidence interval around an individual's estimated true score.
  • For a 95% confidence interval around that score, we use the following equation:
    • 95% confidence interval = Xest ± (1.96)(sem)
      • where Xest is the adjusted true score estimate (i.e., a point estimate of the individual's true score) and sem is the standard error of measurement of the test scores.

Confidence interval equation

  • The final component of this equation (1.96) reflects the fact that we are interested in a 95% confidence interval rather than a 90% interval or any other "degree of confidence."
  • Some readers might recognize this value(i.e., 1.96) as being associated with a probability of .95 from the standardnormal distribution.
  • The individual's observed score is 38, based on a test with a mean observed score of X = 30, a standard deviation (of observed scores) of so = 6, and an estimated reliability of Rxx = .90, her adjusted true score estimate is Xest = 37.2
  • Using Equation 5.16, we estimate the standard error of measurement as.
    • sem = 6√1-.90 = 1.90.
  • Based on Equation 7. 2, for our test, the 95% confidence interval is 33.5 to 40.9:
    • 95% confidence interval = 37.2 ± (1.96)(1.90)
    • = 37.2 ± 3.7
    • = 33.5 to 40.9.

Reliability and confidence

  • Logic expressed by previous quote from Wechsler (2003b), this result might mean that in indicating that we are confident an individual's true score falls in the range of 33.5 to 40.9
  • As mentioned earlier the precision of a true score estimate is tied to reliability; briefly highly reliable tests produce narrower confidence intervals than less reliable tests. the sem was smaller and the confidence interval has a small range.
  • However, lower reliability produces wider confidence intervals, reflecting a less precise estimate of the truc score the sem would be relatively larger and there is more imprecise data on observed scores.

Debate

  • Although prior sections have outlined ways to report individual scores and confidence intervals around those scores, you might encounter other ways, and perhaps more commonly, you will see observed scores reported or confidence intervals computed around those observed scores and interpreted as above
  • There are different perspectives: the ways in which confidence intervals are computed and integrated with true sore estimates as some are calculated through standard of measurement and other are not.
  • An adjusted true score estimate allows for some adjustment where true estimates are deviated and scored differently if they had people with same true scores take the exam.
  • However different ways of scoring and calculation has lead some interpretations up to debate depending on the situation in which scores are based.

Summary

  • The most important general message from section is that reliability affects the confidence accuracy, or precision with which an individual's true score is estimated, that is, reliability affects the standard measurement, which affect widths of confidence intervals around individual's estimated true scores.
  • Poor reliability produces scores that are imprecise reflections of individuals traits, skills and attitudes.
  • In contrast good reliability produce scores that are more precise reflections of individuals true psychological attributes.
  • If one uses psychological tests to make decisions about individual, then those tests should contain strong ability.

Behavioral Research

  • Reliability has implications for conducting and interpreting reliable sciences
  • Measurement procedures is used in the research
  • Reliavbility and measurement error in effects of behavioral Research
  • For interepting behavioral research In a productive way
  • By how important variables are related to each other for scientific research
  • the relationship between psychological Variables
  • A correlation of coefficient The correlation between observed scores on two measures determined the correaltion between (1) the scores of Two Psycholoigcal (2) reliability Reliability
  • Reliability effect test on measurement

Equation 7.3

  • Equation 7.3 is a key element with important implied for research and applied Measurement.
  • To better understand: Including the assumptions That error correlation for true scores
  • equation a correlation between two deviations = The cavarionce divided by standard deviation
  • in terms of observed scores: correlating score
  • is equal variance divided by standard deviation
  • therefore, the Cariance between for various composite variables CTT Error are Uncorrelated with true scores
  • uncorrelated error scores thus reduce to the variance between the true scores

Reliability and Variability

  • Variance can measure the relation to reliability
  • defined as ratios of true score variance to the deviation
  • relationship on these variances

CCT in research:

  • The Correlation between Measure = Correlations or Measures

In addition, the study's reliability has the two best measured questionnaires. However, the better the reliability for measurement And with low measuring of self and academic scores, it could be smaller the CCT test CTT also implies that measurement errors must be calculated

Measurement Error (Low Reliability) Attenuates the Observed Associations Between Measures

  • discrepancy 7.4's associations with 7.3 = again true of the implications on CTT's hold.
  • This section's illustrations Observed will always to be between Constructs . Which happens from measuring as never affecting And measures cannot weak association error and a constant = correlations or reliable less than equal effects However, what do you mean by

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team
Use Quizgecko on...
Browser
Browser