Summary

Dokument vsebuje vprašanja iz statistike, ki se nanašajo na različne teme, kot so ordinalna merska lestvica, modus, verižni indeks in t-porazdelitev. Vsebina je ustvarjena za študente in učitelje statistike.

Full Transcript

**STATISTIKA VPRAŠANJA** **1. Ordinalna merska lestvica** Urejenostna/ordinalna merska lestvica je opisna/atributna omogoča razvrščanje spremenljivk po vrstnem redu, vendar ne omogoča natančnega merjenja razdalj med vrednostmi. Braun-Blaquetova skala. Pri opisnih spremenljivkah z ordinalno lestvi...

**STATISTIKA VPRAŠANJA** **1. Ordinalna merska lestvica** Urejenostna/ordinalna merska lestvica je opisna/atributna omogoča razvrščanje spremenljivk po vrstnem redu, vendar ne omogoča natančnega merjenja razdalj med vrednostmi. Braun-Blaquetova skala. Pri opisnih spremenljivkah z ordinalno lestvico je včasih potrebno zaradi lažje vsebinske interpretacije ali majhnih frekvenc za posamezno vrednost spremenljivke zmanjšati število vrednosti spremenljivke (5 kategorij 3 kategorije). **2. Kaj je modus?** Modus je najpogostejša vrednost statistične spremenljivke ali mesto gostitve spremenljivke in ustreza lokalnemu maksimumu frekvenčne porazdelitve. Je vrednost, ki se v naboru podatkov pojavi najpogosteje. Če imamo porazdelitev z ena mestom gostitve govorimo o unimodalnih porazdelitvah (zvonaste oblike), če pa imamo več mest gostitev pa o multimodalnih porazdelitvah. Pri opisnih spremenljivkah z nominalno ali ordinalno mersko lestvico je modus edina mera srednje vrednosti. **3. Verižni indeks** Verižni indeks je metoda za merjenje sprememb v vrednosti blaga ali storitev skozi čas (preučevanje pojavov v času -- časovne vrste). Izračunava se kot razmerje med vrednostjo v enem obdobju in vrednostjo v prejšnjem obdobju. **4. T porazdelitev** Studentova ali T porazdelitev je zvezna statistična porazdelitev, ki se uporablja za ocenjevanje povprečij, ko je velikost vzorca majhna in standardni odklon ni znan. Podobna je normalni porazdelitvi pri majhnih vzorcih je v primerjavi z normalno porazdelitvijo bolj razpotegnjena v levo in desno pri velikih vzorcih postaja čedalje bolj podobna z porazdelitvi. Je enoparametrska porazdelitev odvisna le od število enot v vzorcu. Če imamo znano verjetnostno porazdelitev za statistično spremenljivko lahko ugotovimo kolikšna je verjetnost da je vrednost te spremenljivke v populaciji večja/manjša od določene vrednosti ali kolikšna je verjetnost da je vrednost te spremenljivke v populaciji v določenem intervalu. **5. Kvotno vzorčenje** Kvotno vzorčenje je neslučajno vzorčenje metoda, pri kateri raziskovalec izbere vzorec, ki ustreza določenim kriterijem (npr. demografske lastnosti) do doseganja želenega števila enot v vsaki skupini. Kadar nimamo okvira vzorčenja (o populaciji vemo zelo malo) poznamo pa stratume. Populacijo razdelimo na stratume, znotraj vsakega stratuma izbiramo enote v delni vzorec, dokler ne dosežemo kvote za ta stratum. Primerno za hitro, grobo oceno, Pridobivamo pa kvalitativne informacije. Ne zagotavlja reprezentativnega vzorca. **6. Primerjava me, mo, arit. sr.** - **Me (mediana)**: srednja vrednost razvrščenih podatkov. Je vrednost od katere ima polovica enot manjše/enake vrednosti polovica enot pa večje/enake vrednosti. Mediana deli statistična vrsto na 2 enaka dela. - **Mo (modus)**: najpogostejša vrednost. Modus je najpogostejša vrednost statistične spremenljivke ali mesto gostitve spremenljivke in ustreza lokalnemu maksimumu frekvenčne porazdelitve. - **Aritmetična sredina**: skupna vsota vrednosti deljena s številom vrednosti. Je povprečje vseh individualnih vrednosti spremenljivke za vse enote. Definirana je kot vrednost od katere je vsota odklonov posameznih vrednosti enaka 0. **7. Kvartilni razmik** Kvartilni razmik je razlika med tretjim (Q3) in prvim kvartilom (Q1) in meri razpršenost srednjih 50 % podatkov. Razlika med tretjim in prvim kvartilom. Pove nam v katerem razponu leži 50 % vrednosti. Četrtina vrednosti je manjših kot Q1, četrtina pa večjih od Q3. Na kvartilni razmik ne vplivajo osamelci. Prikazujemo ga grafično na okvirju z ročaji. **8. Postopek testiranja hipotez** 1. Postavimo H0 in H1 in ju zapišemo. 2. Izberemo stopnjo značilnosti α (0,05; 0,01; 0,001). 3. Predpostavimo, da H0 velja, izberemo testno statistiko (z porazdelitev ali t porazdelitev če standardni odklon ni znan). 4. Iz vzorca izračunamo testno statistiko (npr. z~izr.~) in jo primerjamo s kriterialnimi vrednostmi testne statistike pri izbrani stopnji značilnosti (z~krit.~). 5. Postavimo statistični sklep: z~izr.~ \> z~krit.~ z~izr.~ je v kritičnem območju in H0 zavrnemo (rezultati so statistično različni). 6. Vsebinski sklep: verjetnost, da smo se zmotili ko smo zavrnili H0 hipotezo je največ α, obstaja 100×α odstotna verjetnost da ni pravilna H1 hipoteza. **9. Kako standardiziramo normalno porazdelitev?** Standardiziramo normalno porazdelitev tako, da od vsake vrednosti odštejemo povprečje in rezultat delimo s standardnim odklonom. Tako dobimo standardno normalno porazdelitev (Z). **10. Kaj vpliva na interval zaupanja za srednje vrednosti in kako vplivajo nanje?** - Velikost vzorca (večji vzorci, ožji intervali zaupanja). - Variabilnost proučevane spremenljivke (višja variabilnost, širši intervali). - Stopnja tveganja (α) oz. zaupanje (1 -- α), ki jo določimo sami (višji nivo, širši intervali). **11. Kdaj je spremenljivka zvezna?** Spremenljivka je zvezna, ko lahko zavzame neomejeno število vrednosti znotraj določenega intervala (npr. višina, teža, temperatura). Spremenljivka je zvezna, če med 2 njunima vrednostnima lahko vedno najdemo še tretjo vrednost. **12. Kvantilni diagram** Kvantilni diagram (box-plot) vizualizira razporeditev podatkov s prikazovanjem kvartilov, mediane in morebitnih izjem. **13. Kdaj so vzorci odvisni?** Vzorci so odvisni, ko obstaja povezanost med njimi, na primer pri ponovljenih meritvah na istih subjektih (npr. pre-test in post-test). Vzorci so odvisni kadar so vrednosti v ena vzorcu odvisne od vrednosti v drugem vzorcu (primerjamo povprečja parnih vzorcev). **14. Prilagojeni F-test -- Welchov test** Welchov test je parametričen test, ki se uporablja kadar imamo 2 neodvisna vzorca, normalno porazdelitev in variance niso homogene. Primerjamo razmerje vzorčnih varianc z razmerjem varianc ki ga bi dobili če bi bili varianci homogeni. **15. McNemarjev poskus simetrije -- kaj in kako?** McNemarjev test se uporablja za analizo sprememb v dvopostavčnih kategorijah (npr. pred in po posegu) pri odvisnih vzorcih. **16. Linearizacija regresijskega modela** Linearizacija regresijskega modela pomeni pretvorbo nelinearnih odnosov v linearne s pomočjo transformacij (npr. logaritemska transformacija). Uporablja se lahko tudi pri prilagajanju modelov, kjer ni homoskedastičnosti/konstante variance to pomeni, da varianca y s spreminjanjem x ostaja približno enaka, ne narašča ali pada (npr. logaritemska transformacija). **17. Beta napaka** Beta napaka se zgodi, ko se ne zavrne H0 hipoteza, čeprav je bila ta napačna. Povezana je s močjo testa. Zaradi beta napake si prizadevamo, da H0 zavrnemo v korist H1, pri čim manjši stopnji značilnosti alfa, s tem ne tvegamo posledic ki jih prinaša beta napaka. **18. Kako bi primerjal letno količino padavin po GGO?** Primerjavo letne količine padavin bi lahko izvedel z analizo variacije med GGO z uporabo ANOVE, t-testov ali regresijske analize. **19. Kako izračunamo F-kriterij pri ANOVI?** F-kriterij se izračuna kot razmerje med varianco med skupinami in varianco znotraj skupin. F = SKO~med~/ SKO~znotraj~ **20. Kaj so regresijski ostanki?** Regresijski ostanki so razlike med dejanskimi in napovedanimi vrednostmi v regresijskem modelu. Merijo, kako dobro model opisuje podatke. Uporabljajo se za oceno kakovosti modela. Nepojasnjen vpliv dejavnikov. **21. Mann-Whitney U test** Mann-Whitney U test je neparametrični test, ki se uporablja za primerjavo dveh neodvisnih skupin. Ugotavlja, ali se porazdelitvi skupin razlikujeta. Uporablja se takrat kadar ni predpostavke o porazdelitvi ali nehomogenosti varianc. **22. Homoskedastičnost regresijskega modela** Homoskedastičnost ali konstanta variance pomeni, da varianca y s spreminjanjem x ostaja približno enaka, ne narašča ali pada. **23. Kruskal-Wallisov test** Kruskal-Wallisov test je neparametrična različica ANOVE, ki se uporablja za več neodvisnih vzorcev, če porazdelitev ni vsaj približno normalna in če variance niso homogene. Ugotavlja, ali se vsaj ena skupina razlikuje od ostalih. **24. Pogoji za linearizacijo** Pogoji za linearizacijo vključujejo: - Nelinearni odnosi med neodvisnimi in odvisnimi spremenljivkami. - Homoskedastičnost in normalnost napak. - Odvisna in neodvisna spremenljivka morata biti zvezni (preveriti pravilno kodiranje spremenljivk) - Zveza med odvisno in neodvisno spremenljivko je linearna (če ni uporabimo transformacijo, nelinearno regresijo ali posplošeni linearni model) - Neodvisnost opazovanj (Durbin-Watsonov test mora pokazati da ni serialne korelacije ostankov) - Homosedaktičnost ali konstanta variance (da varianca y s spreminjanjem x ostaja približno enaka, ne narašča ali pada) - Porazdelitev ostankov (nepojasnjenega dela variabilnosti y) je približno normalna (histogram standardiziranih ostankov, P-P plot) **25. Kaj so kvantili** Kvantili so vrednosti, ki delijo nabor podatkov na enake dele. Glede na to, na koliko enakih delov razdeli kvantil ranžirno vrsto, ločimo: kvartile (4 enaki deli), Mediana (2 enaka dela), decile (10 enakih delov) in centile (100 enakih delov). **26. Orodja za normalnost porazdelitve** Poleg statističnih orodij lahko uporabimo tudi vizualne metode, kot so box-plot, P-P plot, Q-Q plot in histogramski grafi, da ocenimo normalnost porazdelitve.

Use Quizgecko on...
Browser
Browser