Zbirka vaj za Metode raziskovanja (PDF)
Document Details
Uploaded by Deleted User
Univerza v Mariboru, Ekonomsko-poslovna fakulteta
2018
Polona Tominc, Vesna Čančer, Maja Rožman
Tags
Related
- Tutorial Serii - Analiză Statistică
- Metode Statistika I (MAS61121) - 01 - Dasar-Dasar Statistika dan KegunaanNYA - PDF
- Statistika - Sažetak za Usmeni i Pismeni PDF
- Statistika - Sažetak za Usmeni i Pismeni PDF
- Souhrn Biostatistika pro matematickou biologii a biomedicínu PDF
- Metode și tehnici de cercetare sociologică PDF
Summary
To je zbirka vaj za predmet metode raziskovanja. Namenjena je uporabi statističnega programskega paketa SPSS za učenje kvantitativnih metod. Vaja obravnava deskriptivno statistiko, vzorčenja, normalno porazdelitev in parametrične ter neparametrične univariatne teste.
Full Transcript
Zbirka vaj za predmet Metode raziskovanja Avtorice dr. Polona Tominc dr. Vesna Čančer Maja Rožman December 2018 Naslov Zbirka vaj za predmet Metode raziskovanja Title A C...
Zbirka vaj za predmet Metode raziskovanja Avtorice dr. Polona Tominc dr. Vesna Čančer Maja Rožman December 2018 Naslov Zbirka vaj za predmet Metode raziskovanja Title A Collection of Exercises for the Research Methods Course Avtorice red. prof. dr. Polona Tominc Authors (Univerza v Mariboru, Ekonomsko-poslovna fakulteta) red. prof. dr. Vesna Čančer (Univerza v Mariboru, Ekonomsko-poslovna fakulteta) asist. Maja Rožman (Univerza v Mariboru, Ekonomsko-poslovna fakulteta) Recenzija red. prof. dr. Majda Bastič Review (MLC Fakulteta za management in pravo Ljubljana) izr. prof. dr. Tomaž Kramberger (Univerza v Mariboru, Fakulteta za logistiko) Tehnični urednik Jan Perša, mag. inž. prom. Technical editor (Univerzitetna založba Univerze v Mariboru) Oblikovanje ovitka Jan Perša, mag. inž. prom. Cover designer (Univerzitetna založba Univerze v Mariboru) Grafične priloge Avtorice Graphic material Izdajatelj / Co-published by Založnik / Published by Univerza v Mariboru, Ekonomsko-poslovna fakulteta Univerzitetna založba Univerze v Mariboru Razlagova ulica 14, 2000 Maribor, Slovenija Slomškov trg 15, 2000 Maribor, Slovenija http://epf.um.si, [email protected] http://press.um.si, [email protected] Izdaja Prva izdaja © Univerza v Mariboru, Edition Univerzitetna založba Vrsta publikacije e-knjiga Publication type Vse pravice pridržane. Brez pisnega dovoljenja založnika je prepovedano reproduciranje, Dostopno na distribuiranje, predelava ali druga uporaba tega http://press.um.si/index.php/ump/catalog/book/377 Available at dela ali njegovih delov v kakršnemkoli obsegu ali postopku, vključno s fotokopiranjem, Izdano tiskanjem ali shranjevanjem v elektronski Maribor, december 2018 Published obliki. CIP - Kataložni zapis o publikaciji Univerzitetna knjižnica Maribor 004.42:311.1(076) TOMINC, Polona Zbirka vaj za predmet Metode raziskovanja / avtorice Polona Tominc, Vesna Čančer, Maja Rožman. - 1. izd. - El. knjiga. - V Mariboru : Univerzitetna založba Univerze, 2018 Način dostopa (URL): http://press.um.si/index.php/ump/catalog/book/377. - Nasl. v kolofonu: A Collection of Exercises for the Research Methods Course ISBN 978-961-286-223-7 doi: 10.18690/978-961-286-223-7 1. Dr. vzp. stv. nasl. 2. Čančer, Vesna 3. Rožman, Maja, 1988- COBISS.SI-ID 95769601 ISBN 978-961-286-223-7 (PDF) DOI https://doi.org/10.18690/978-961-286-223-7 Cena Brezplačen izvod Odgovorna oseba založnika red. prof. dr. Zdravko Kačič, rektor Univerze v Mariboru ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA P. Tominc, V. Čančer in M. Rožman Zbirka vaj za predmet Metode raziskovanja POLONA TOMINC, VESNA ČANČER IN MAJA ROŽMAN Povzetek Zbirka vaj je namenjena predvsem uporabi statističnega programskega paketa SPSS za izbrane vsebinske sklope, ki sodijo v okvir kvantitativnega dela predmeta Metode raziskovanja, na magistrskem študijskem programu Ekonomske in poslovne vede, na UM EPF. Gradivo je dopolnitev k osnovni študijski literaturi pri kvantitativnem delu predmetu in k sklopom, obravnavanim v okviru predavanj. Gradivo je namenjeno študentom pri študiju in razumevanju klasifikacije kvantitativnih metod, glede na značilnosti zbranih podatkov in glede na postavljene raziskovalne domneve. Vsebinska analiza je prikazana z namenom pravilne razlage dobljenih rezultatov, pridobljenih s programom SPSS. Sestavni del aktivnega dela študentov na vajah pa je interpretacija dobljenih rezultatov za podporo poslovnemu odločanju. Študentom želimo uspešno uporabo obravnavanih metod. Ključne besede: Statistične kvantitativne metode deskriptivna statistika univariatne metode multivariatne metode SPSS NASLOVI AVTORIC: dr. Polona Tominc, redna profesorica, Univerza v Mariboru, Ekonomsko-poslovna fakulteta, Razlagova ulica 14, 2000 Maribor, Slovenija, e-pošta: [email protected]. dr. Vesna Čančer, redna profesorica, Univerza v Mariboru, Ekonomsko-poslovna fakulteta, Razlagova ulica 14, 2000 Maribor, Slovenija, e-pošta: [email protected]. Maja Rožman, asistentka, Univerza v Mariboru, Ekonomsko-poslovna fakulteta, Razlagova ulica 14, 2000 Maribor, Slovenija, e-pošta: [email protected]. DOI https://doi.org/10.18690/978-961-286-223-7 ISBN 978-961-286-223-7 Dostopno na: http://press.um.si. ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA P. Tominc, V. Čančer in M. Rožman Kazalo 1 DESKRIPTIVNA STATISTIKA IN VZORČNI PRISTOP.....................................................................1 1.1 Statistična enota, statistična množica, slučajni vzorec..........................................................................................1 1.2 Statistične spremenljivke...........................................................................................................................................2 1.3 Osnovni statistični parametri in statistike..............................................................................................................3 1.4 Analiza podatkov........................................................................................................................................................5 1.4.1 Vnos podatkov v program SPSS..............................................................................................................................5 1.4.2 Transformacija podatkov..........................................................................................................................................8 1.4.3 Uvoz podatkov iz Excela v program SPSS......................................................................................................... 10 1.4.4 Vzorčenje in intervalno ocenjevanje parametrov.............................................................................................. 13 2 NORMALNA PORAZDELITEV.................................................................................................................. 21 2.1 Opredelitev in značilnosti normalne porazdelitve............................................................................................. 21 2.2 Kolmogorov-Smirnov test in Shapiro-Wilk W test........................................................................................... 22 3 PARAMETRIČNI IN NEPARAMETRIČNI UNIVARIATNI STATISTIČNI TESTI............. 29 3.1 Parametrični test za odvisna vzorca: t-test za odvisna vzorca......................................................................... 30 3.2 Parametrični test za neodvisna vzorca: t-test za neodvisna vzorca................................................................. 34 3.3 Parametrični test za neodvisne vzorce: ANOVA.............................................................................................. 38 3.4 Neparametrični test: χ2 –test za analizo povezanosti dveh nominalnih spremenljivk................................ 43 3.5 Neparametrični test za odvisna vzorca: Wilcoxon signed ranks test.............................................................. 49 3.6 Neparametrični test za neodvisna vzorca: Mann-Whitney U test................................................................... 53 4 FAKTORSKA ANALIZA................................................................................................................................... 59 5 REGRESIJSKA ANALIZA............................................................................................................................... 71 5.1 Enostavna linearna regresija.................................................................................................................................. 71 5.2 Multipla regresijska analiza.................................................................................................................................... 75 6 DISKRIMINANTNA ANALIZA................................................................................................................... 81 LITERATURA IN VIRI............................................................................................................................................. 87 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA P. Tominc, V. Čančer in M. Rožman 1 DESKRIPTIVNA STATISTIKA IN VZORČNI PRISTOP Deskriptivna statistika ali opisna statistika je vrsta analize, katera kvantitativno opisuje ali povzema značilnosti zbranih podatkov. V deskriptivno statistiko sodijo metode, ki se nanašajo na prikazovanje in analiziranje značilnosti danega niza podatkov. O opisnih statističnih analizah govorimo takrat, kadar predstavljamo npr. velikost vzorca (n), ponazarjamo strukturo zbranih podatkov (strukturni %), pogostost pojavljanja posameznih vrednoti spremenljivke - frekvence (f ), minimalne (Min) in maksimalne (Max) vrednosti, srednje vrednosti, razpršenost podatkov okoli povprečja in drugo (Tominc & Kramberger, 2007; Goos & Meintrup, 2015). Na drugi strani inferenčna ali matematična statistika uporablja vzorčni pristop in je osredotočena na testiranje domnev o statističnih parametrih statistične množice na osnovi zbranih podatkov slučajnega vzorca (Tabachnick & Fidell, 2013). 1.1 Statistična enota, statistična množica, slučajni vzorec Statistična enota je vsak posamezen element statistične množice, ki je predmet opazovanja (npr. podjetje, gospodinjstvo, delavec, študent ipd.), v danem časovnem trenutku oziroma intervalu. Statistična enota je pojav, ki je opredeljen s stvarnega, krajevnega in časovnega vidika (Artenjak, 2003). Statistična množica je množica statističnih enot, ki izpolnjujejo določene opredeljujoče kriterije oziroma lastnosti. Statistično množico imenujemo tudi populacija. 2 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA Vzorec je del celotne populacije, na osnovi katerega izvedemo sklepanje o celotni populaciji. Temeljno načelo pri tem je, da mora biti vzorec slučajen. Za slučajni vzorec je značilno, da ima vsak element v populaciji znano in neničelno verjetnost, da ga vključimo oziroma izberemo v slučajni vzorec in ta verjetnost je vnaprej znana (Tominc & Kramberger, 2007). 1.2 Statistične spremenljivke Statistična spremenljivka opisuje lastnost statistične enote (Artenjak, 2003). Vrste spremenljivk (ibid): Opisne (atributne) spremenljivke so tiste spremenljivke, katerih vrednosti lahko opišemo le z besedami (npr. spol: moški, ženski). Številske (numerične) spremenljivke so tiste spremenljivke, katerih vrednosti lahko izrazimo s števili (npr. starost, dobiček podjetja). Med njimi ločimo: − zvezne spremenljivke, ki so številske spremenljivke, ki lahko zavzamejo katerokoli vrednost na intervalu (npr. dolžina, čas, teža) in − diskretne spremenljivke (ali nezvezne spremenljivke), ki so številske spremenljivke, ki lahko zavzamejo le določene končne, najpogosteje celoštevilčne, vrednosti (npr. število članov v gospodinjstvu). Vrste spremenljivk glede na tip merjenja (merske lestvice) (Bastič, 2006): Opisne spremenljivke merimo na nominalni in ordinalni merski lestvici, medtem ko številske spremenljivke merimo na intervalni in razmernostni lestvici. 1. Nominalne spremenljivke merimo na nominalni merski lestvici, katera omogoča razvrščanje enot po določeni skupni značilnosti. Statistične enote so razvrščene v skupine tako, da imajo enote, razvrščene v isto skupino, isto značilnost (npr. spol: 1-moški, 2-ženski; odgovor: 1-da, 2-ne). 2. Ordinalne spremenljivke merimo na ordinalni merski lestvici, katera omogoča, da so skupine razvrščene po določenem kriteriju, kar pomeni, da lahko vrednosti uredimo od najmanjše do največje (npr. stopnja izobrazbe, uspeh, velikost podjetja: 1-malo podjetje, 2-srednje veliko, 3-veliko podjetje). 3. Intervalne spremenljivke merimo na intervalni merski lestvici, za katero je značilno, da uporablja enoto mere. Med svojo začetno in končno točko je razčlenjena na enako velike intervale (npr. temperatura v °C). 4. Razmernostne spremenljivke merimo na razmernostni merski lestvici, za katero je značilno, da je njena začetna točka 0 in se ne spreminja. Navedena merska lestvica je absolutna in se razlika vedno meri od točke nič (npr. število turistov, starost, prihodek). Deskriptivna statistika in vzorčni pristop 3 1.3 Osnovni statistični parametri in statistike Parameter je številska ali opisna vrednost, ki opisuje neko značilnost statistične množice ali populacije (Artenjak, 2003). Statistika je številska ali opisna vrednost, ki ocenjuje neko značilnost statistične množice in jo pridobimo iz vzorca (ibid). Mere centralne tendence so vrednosti, ki jih največkrat uporabljamo pri osnovni opisni statistični analizi. Mere centralne tendence so predstavniki vseh opazovanih vrednosti. Med najpomembnejše mere centralne tendence uvrščamo aritmetično sredino, mediano in modus: Aritmetična sredina (ang. Mean) je srednja vrednost, ki jo dobimo tako, da vsoto vseh vrednosti spremenljivke delimo s številom enot v zbranih podatkih (n). Mediana (ang. Median) je srednja vrednost, od katere ima polovica enot manjše ali enake vrednosti, polovica pa večje. Označili jo bomo z Me. Modus (ang. Mode) ali gostiščnica je enaka tisti vrednosti spremenljivke, ki se najpogosteje pojavlja. Označili ga bomo z Mo (ibid). Med najpogostejše mere variabilnosti uvrščamo variacijski razmik, varianco in standardni odklon: Variacijski razmik (ang. Range) je razlika med največjo in najmanjšo vrednostjo spremenljivke. Varianca (ang. Variance) meri odstopanja posameznih vrednosti spremenljivke od aritmetične sredine. Definirana je kot povprečje kvadratov odklonov posameznih vrednosti od aritmetične sredine. Standardni odklon (ang. Standard deviation) je definiran kot kvadratni koren iz variance. S standardnim odklonom lahko izmerimo, kako so razpršene vrednosti okoli aritmetične sredine zbranih podatkov; izraža pa se v enakih merskih enotah kot opazovana spremenljivka. Če opazujemo več skupin enot po isti spremenljivki, velja, da višja kot je vrednost standardnega odklona, bolj so enote v vzorcu razpršene in obratno, nižja vrednost kaže na manjšo razpršenost enot in večjo koncentracijo enot okoli vrednosti aritmetične sredine (ibid). Asimetričnost in sploščenost Asimetričnost in sploščenost merimo z merami asimetrije in merami sploščenosti. Asimetrične porazdelitve (ang. skewness) so lahko asimetrične v desno (pozitivna asimetrična porazdelitev), za katere je značilna večja gostitev pri manjših vrednostih spremenljivke ali asimetrične v levo (negativna asimetrična porazdelitev), za katere je značilna večja gostitev vrednosti pri večjih vrednostih spremenljivke. Koeficient asimetrije je manjši od nič, če je za porazdelitev spremenljivke značilna asimetrija v levo; pri asimetriji v desno je koeficient asimetrije večji od 0. Bolj kot se koeficient 4 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA asimetrije razlikuje od vrednosti 0, večja je jakost asimetrije, koeficient asimetrije pa pri večini empiričnih porazdelitev lahko zavzame vrednost med -3 in +3 (Artenjak, 2003). Sploščenost porazdelitve (ang. kurtosis) primerjamo z normalno porazdelitvijo, za katero rečemo, da je normalno sploščena. Če je porazdelitev bolj koničasta od normalne porazdelitve, rečemo, da je porazdelitev koničasta (ima daljša repa in ožji osrednji del). Če je porazdelitev bolj sploščena od normalne, rečemo, da je porazdelitev sploščena. Za koeficient sploščenosti je značilno, da kadar je le-ta večji od 0, nakazuje na koničasto porazdelitev in v primeru, ko je koeficient sploščenosti manjši od 0, na sploščeno porazdelitev. Pri normalni porazdelitvi sta tako koeficienta asimetričnosti in sploščenosti enaka 0. Vrednosti obeh koeficientov (med drugim) pokažeta, kako se proučevana porazdelitev vrednosti spremenljivke razlikuje od normalne porazdelitve (Bastič, 2006). Deskriptivna statistika in vzorčni pristop 5 1.4 Analiza podatkov 1.4.1 Vnos podatkov v program SPSS Naloga 1. Raziskovalci so želeli analizirati stopnjo izvoza v letu 2017, za deset srednje velikih podjetij v Sloveniji. V tabeli 1 so podatki o stopnji izvoza v letu 2017, za deset srednje velikih podjetij (v % od celotnih prihodkov). Tabela 1: Podatki o stopnji izvoza v letu 2017, za deset srednje velikih podjetij (v % od celotnih prihodkov) Podjetje 1 2 3 4 5 6 7 8 9 10 Stopnja 6,7 9,1 10,7 11,8 12,0 13,1 131 12,3 10,6 9,0 izvoza 13,1 13,3 a) Opredelite statistično enoto, statistično spremenljivko in moč vzorca. b) Podatke o stopnji izvoza v letu 2017, za teh deset srednje velikih podjetij vnesite v program SPSS. Izračunajte in pojasnite rezultate opisne statistike za stopnjo izvoza v letu 2017 teh desetih podjetij. c) Na osnovi mere asimetričnosti in mere sploščenosti pojasnite ali so vrednosti navedene spremenljivke normalno porazdeljene. d) Za spremenljivko stopnja izvoza v letu 2017, za deset srednje velikih podjetij prikažite frekvenčno preglednico. e) Narišite še frekvenčni histogram z normalno krivuljo. Postopek vnosa podatkov: Podatke o stopnji izvoza v letu 2017 desetih srednje velikih podjetij vnesemo v SPSS tako, da spodaj v levem kotu kliknemo desno okence Variable View. V okence Name vpišemo ime spremenljivke stopnja_izvoza, v okencu Type določimo vrsto spremenljivke (numeric), v okencu Decimals določimo število decimalnih mest, v okencu Label zapišemo celotno ime spremenljivke (stopnja izvoza v letu 2017 desetih srednje velikih podjetij). Nato kliknemo spodnje levo okence Data View in zapišemo vrednosti spremenljivk v stolpec. Izračun rezultatov opisne statistike: kliknemo Analyze in nato Descriptive Statistics ter Descriptives (ali Frequencies). Odpre se pogovorno okno, v katerem kliknemo spremenljivko stopnja_izvoza in jo prenesemo v desno okence Variable(s). Kliknemo okence Options in izberemo statistike, ki jih želimo za prikaz rezultata. Frekvenčni histogram: kliknemo Frequencies in v desno okence Variable(s) prenesemo spremenljivko stopnja_izvoza. Kliknemo okence Charts, ter kliknemo na Histograms. 6 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA Odgovori in izpisi rezultatov: a) Statistična enota: 1 srednje veliko podjetje. Statistična spremenljivka: Stopnja izvoza (numerična, zvezna spremenljivka). b in c) Tabela 2: Opisna statistika za spremenljivko stopnja izvoza v letu 2017, desetih srednje velikih podjetij Valid 10 N Missing 0 Mean 10,940 Std. Error of Mean 0,6837 Median 11,250 Mode 13,1 Std. Deviation 2,1619 Variance 4,674 Skewness - 0,752 Std. Error of Skewness 0,687 Kurtosis - 0,091 Std. Error of Kurtosis 1,334 Range 6,6 Minimum 6,7 Maximum 13,3 V tabeli 2 so prikazani rezultati opisne statistike za spremenljivko stopnja izvoza v letu 2017 desetih srednje velikih podjetij. Vidimo, da je bilo v vzorec vključenih 10 srednje velikih podjetij (n) in ni nobene manjkajoče vrednosti (Missing = 0). Povprečna vrednost (Mean) stopnje izvoza v letu 2017 desetih podjetij znaša 10,940 (% od prihodka). Standardna napaka ocene aritmetične sredine (ang. Standard error of mean) znaša 0,684 (% od prihodka) in pomeni, da manjša kot je njena vrednost, manjša je variabilnost med vzorčnimi povprečnimi vrednostmi in boljši predstavnik statistične množice je vzorec. Mediana (Median) znaša 11,250 (% od prihodka), kar pomeni, da ima polovica (50 %) podjetij stopnjo izvoza manjšo ali enako od 11,250, ter polovica (50 %) podjetij več kot 11,250 (% od prihodka) stopnjo izvoza. Modus (Mode) je 13,1 (% od prihodka) in predstavlja tisto vrednost spremenljivke stopnja izvoza v letu 2017 desetih srednje velikih podjetij, ki se najpogosteje pojavlja (ta vrednost se pojavlja dvakrat, vse ostale po enkrat). Standardni odklon je kvadratni koren iz variance in v našem primeru znaša 2,162 (% od prihodka), ki opisuje razpršenost vrednosti spremenljivke okoli vrednosti aritmetične sredine. Varianca znaša 4,674 (% od prihodka)2. Koeficient asimetrije (Skewness) znaša ̶ 0,752, kar pomeni, da je porazdelitev asimetrična v levo (negativna asimetrična porazdelitev). Koeficient sploščenosti (Kurtosis) znaša ̶ 0,091, kar kaže na sploščeno porazdelitev (negativna vrednost). Variacijski razmik (Range) znaša 6,6 (%-nih točk) in je enak razliki med največjo (Maximum = 13,3 (% od prihodka)) in najmanjšo (Minimum = 6,7 (% od prihodka)) vrednostjo spremenljivke. Deskriptivna statistika in vzorčni pristop 7 d) Tabela 3: Frekvenčna preglednica - Stopnja izvoza v letu 2017, desetih srednje velikih podjetij Frequency Percent Valid Percent Cumulative Percent 6,7 1 10,0 10,0 10,0 9,0 1 10,0 10,0 20,0 9,1 1 10,0 10,0 30,0 10,6 1 10,0 10,0 40,0 10,7 1 10,0 10,0 50,0 Valid 11,8 1 10,0 10,0 60,0 12,0 1 10,0 10,0 70,0 13,1 2 20,0 20,0 90,0 13,3 1 10,0 10,0 100,0 Total 10 100,0 100,0 Tabela 3 kaže, da je imelo eno srednje veliko podjetje od desetih srednje velikih podjetij stopnjo izvoza 6,7 (% od prihodka). Prav tako je imelo eno srednje veliko podjetje od desetih srednje velikih podjetij stopnjo izvoza 9,0 (% od prihodka) in enako velja za ostale primere podjetij; le pri dveh srednje velikih podjetij od desetih srednje velikih podjetij vidimo, da sta imeli stopnji izvoza enaki, 13,1 (% od prihodka). e) Histogram 1: Frekvenčni histogram s krivuljo prilagojene normalne porazdelitve 8 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA 1.4.2 Transformacija podatkov Pretvorbo podatkov je mogoče doseči z uporabo transformacije. V primeru, kadar med vrednostmi proučevane spremenljivke nastopajo osamelci (tiste vrednosti spremenljivke, ki se bistveno razlikuje od ostalih vrednostih, angl. outlier) ali porazdelitev vrednosti spremenljivke ni normalna, si lahko pomagamo s transformacijo podatkov. Najpogosteje uporabljene transformacije so logaritmiranje podatkov, korenjenje vrednosti, recipročna transformacija ipd (Bastič, 2006). Naloga 2. Želimo zmanjšati negativno asimetrijo pri stopnji izvoza v letu 2017 desetih podjetij iz naloge 1. V našem primeru bomo uporabili logaritmiranje stopenj izvoza. Postopek: Kliknemo Transform in nato Compute Variable. V okencu Target Variable poimenujemo novo spremenljivko, ki jo bomo z logaritmiranjem oblikovali (npr. log_izvoz). V okencu Type & Label zapišemo opis novo poimenovane spremenljivke (npr. log stopnja izvoza). V desnem okencu Function group kliknemo na ustrezno transformacijo in sicer Arithmetic. V okencu Functions and Special variables kliknemo Lg10. Kliknemo na gumb s puščico navzgor. V okencu Numeric Expression, se izpiše Lg(?), kjer namesto vprašaja prenesemo ime spremenljivke (spremenljivka je napisana v okencu na levi strani), ki jo želimo logaritmirati ter kliknemo OK. V okencu Data View se izpiše nova spremenljivka (log_izvoz) z novimi vrednostmi, ki so prikazane v tabeli 3. Tabela 4: Nova spremenljivka (log_izvoz) z novimi vrednostmi Podjetje 1 2 3 4 5 6 7 8 9 10 Stopnja izvoza 6,7 9,1 10,7 11,8 12,0 13,1 13,1 12,3 10,6 9,0 v letu 2017 Nova spremenljivka: 0,83 0,96 1,03 1,07 1,08 1,12 1,12 1,12 1,03 0,95 log_izvoz Izračunajte in pojasnite rezultate opisne statistike za novo spremenljivko. Narišite še frekvenčni histogram z normalno porazdelitvijo in komentirajte rezultat. Deskriptivna statistika in vzorčni pristop 9 Odgovori in izpisi rezultatov: Tabela 5: Opisna statistika za spremenljivko log_izvoz Valid 10 N Missing 0 Mean 1,0304 Std. Error of Mean 0,02992 Median 1,0506 Mode 1,12 Std. Deviation 0,09463 Variance 0,009 Skewness -1,149 Std. Error of Skewness 0,687 Kurtosis 1,104 Std. Error of Kurtosis 1,334 Range 0,30 Minimum 0,83 Maximum 1,12 Histogram 2: Frekvenčni histogram s krivuljo prilagojene normalne porazdelitve (log_izvoz) 10 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA 1.4.3 Uvoz podatkov iz Excela v program SPSS Naloga 3. V datoteki Deskriptivna statistika in vzorčni pristop_Excel so podani podatki o številu zaposlenih v podjetjih, ki so razvrščena po standardni klasifikaciji dejavnosti v letu 2017 v devetih geografskih regijah. Prenesite datoteko Deskriptivna statistika_Excel v program SPSS. Postopek uvoza podatkov iz Excela v program SPSS: Odpremo program SPSS in kliknemo File, ter izberemo Open in nato še Data. Odpre se okence Open data v katerem poiščemo Excelovo datoteko (v okencu Files of type še označimo All files) in na koncu kliknemo Open. a) Izračunajte in pojasnite rezultate opisne statistike za spremenljivko število zaposlenih v predelovalni dejavnosti. b) Izračunajte in primerjajte rezultate opisne statistike za naslednje tri spremenljivke: število zaposlenih v gostinstvu, število zaposlenih v dejavnosti poslovanje z nepremičninami ter število zaposlenih v drugih raznovrstnnih poslovnih dejavnostih. Vsebinsko pojasnite povprečno vrednost in standardno napako ocene aritmetične sredine vseh treh spremenljivk. c) Izračunajte koeficient asimetrije in koeficient sploščenosti ter narišite frekvenčni histogram z normalno krivuljo za spremenljivko število zaposlenih v informacijski in komunikacijski dejavnosti. d) Za spremenljivko število zaposlenih v rudarstvu narišite stolpični diagram. Deskriptivna statistika in vzorčni pristop 11 Odgovori in izpisi rezultatov: a) Tabela 6: Opisna statistika - število zaposlenih v predelovalni dejavnosti Valid 9 N Missing 0 Mean 18309,78 Std. Error of Mean 288,786 Median 17690,00 Mode 17419a Std. Deviation 866,358 Variance 750575,694 Skewness 0,454 Std. Error of Skewness 0,717 Kurtosis -1,979 Std. Error of Kurtosis 1,400 Range 2137 Minimum 17419 Maximum 19556 a. Multiple modes exist. The smallest value is shown b) Tabela 7: Opisna statistika - število zaposlenih v dejavnostih gostinstvo, poslovanje z nepremičninami in druge raznovrstne poslovne dejavnosti Poslovanje z Druge raznovrstne Gostinstvo nepremičninami poslovne dejavnosti Valid 9 9 9 N Missing 0 0 0 Mean 9761,00 2428,33 5793,67 Std. Error of Mean 474,678 99,051 430,134 Median 9093,00 2414,00 5625,00 Std. Deviation 1424,033 297,152 1290,403 Variance 2027871,000 88299,250 1665139,250 Skewness 0,169 0,593 -0,008 Std. Error of Skewness 0,717 0,717 0,717 Kurtosis -2,074 -0,235 -1,221 Std. Error of Kurtosis 1,400 1,400 1,400 Range 3616 926 3767 Minimum 7965 2049 3823 Maximum 11581 2975 7590 12 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA c) Tabela 8: Koeficient asimetrije in koeficient sploščenosti – število zaposlenih v informacijski in komunikacijski dejavnosti N Skewness Kurtosis Statistic Statistic Std. Error Statistic Std. Error Informacijske in komunikacijske 9 0,062 0,717 -0,899 1,400 dejavnosti Valid N (listwise) 9 Histogram 3: Frekvenčni histogram z normalno krivuljo – število zaposlenih v informacijski in komunikacijski dejavnosti d) Diagram 1: Frekvenčni histogram – število zaposlenih v rudarstvu. Deskriptivna statistika in vzorčni pristop 13 1.4.4 Vzorčenje in intervalno ocenjevanje parametrov Vzorčenje Za učinkovito načrtovanje slučajnih vzorcev se v praksi uporabljajo številne tehnike verjetnostnega vzorčenja. Pri enostavnem slučajnem vzorcu sta dve najpogosteje uporabljani metodi za slučajen izbor enot v vzorec, metoda z uporabo tablice slučajnih števil (v preteklosti) in z generatorjem slučajnih števil. Med najbolj razširjenimi so še sistematično vzorčenje, večstopenjsko vzorčenje in vzorčenje z verjetnostjo, ki je sorazmerno velikosti stratumov (podmnožic) statistične množice. Za slučajni vzorec je značilno, da je za vsako statistično enoto statistične množice zagotovljena enaka verjetnost, da je izbrana v vzorec. Verjetnost, da je posamezna enota izbrana v vzorec, je znana, oziroma jo je mogoče izračunati (Agresti & Finlay, 2009). Na slučajnih vzorcih temelji statistična teorija vzorčenja, za katero je značilna možnost ocenjevanja kakovosti vzorčnih ocen statističnih parametrov z ustreznimi kazalci in opredelitev verjetnosti za nepravilni sklep, ki je sprejet na podlagi podatkov iz slučajnega vzorca. Statistična teorija torej temelji na slučajnih vzorcih, saj je z njimi zagotovljena objektivnost pri izbiri enot v opazovanje, reprezentativnost vzorca in možnost ugotavljanja kakovosti ocen za parametre, ki jih ocenjujemo iz vzorčnih podatkov (ibid). Intervalno ocenjevanje aritmetične sredine Vzorčna ocena aritmetične sredine statistične množice, je točkovna ocena. To je ocena vrednosti statističnega parametra, podana z eno samo vrednostjo, ki je izračunana iz slučajnega vzorca. Poleg točkovne ocene pa ocenjujemo vrednost statističnega parametra tudi z intervalno oceno, ki temelji na točkovni vzorčni oceni statističnega parametra (rezultat iz vzorca posplošimo na statistično množico). Na podlagi vzorčnih podatkov določimo interval, v katerem je z določeno stopnjo verjetnosti mogoče pričakovati, da se nahaja vrednost obravnavanega statističnega parametra. To verjetnost imenujemo stopnja zaupanja (običajno 90 %, 95 % ali 99 %), interval pa interval zaupanja. Verjetnost 100 % — stopnja zaupanja, imenujemo stopnja tveganja %. Če določimo meji intervala za vrednost statističnega parametra iz vzorčnih podatkov tako, da določimo zgornjo in spodnjo mejo intervala, ob dani stopnji zaupanja, govorimo o dvostranskem ocenjevanju statističnega parametra. Če postavimo samo eno od obeh mej, bodisi zgornjo ali spodnjo, ob dani stopnji zaupanja, govorimo o enostranskem ocenjevanju statističnega parametra (Artenjak, 2003). 14 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA Naloga 4. V datoteki Deskriptivna statistika in vzorčni pristop_Naloga4.sav so podatki o podjetju, ki opravlja storitve na tržišču (Bastič in drugi, 2008). Podatki prikazujejo podatke slučajnega vzorca za vrednost opravljenih storitev v določenem letu, število sklenjenih pogodb, podatke o tem, s katerimi oddelki v teh partnerskih podjetjih anketirana poslujejo in kolikšna je donosnost v podjetjih, s katerimi poslujejo. a) Izračunajte in pojasnite 95 %-ni in 80 %-ni interval zaupanja za spremenljivko vrednost storitev. Potek: Kliknemo na Analyze, nato na Descriptive Statistic ter izberemo funkcijo Explore. Iz levega okenca prenesemo spremenljivko vrednost storitev v desno okence Dependent List in kliknemo na okvirček Statistics ter obkljukamo Descriptives – pri Confidence Interval for Mean napišemo 95 %, ker želimo pojasniti 95 %-ni interval zaupanja za spremenljivko vrednost storitev (v primeru, če želimo pojasniti 80 %-ni interval zaupanja za spremenljivko napišemo 80 %). b) Vsa podjetja razdelite na dve skupini glede na vrednost mediane za spremenljivko donosnost. Postopek: V prvem koraku je potrebno ugotoviti vrednost mediane za spremenljivko donosnost - koraki si sledijo po naslednjem vrstnem redu: Analyze, nato Descriptive statistic in Explore. Vsa podjetja razdelite na dve skupini glede na vrednost mediane za spremeljivko donosnost: Kliknemo na Transform in izberemo ukaz Recode into Different Variables (kar pomeni, da ohranimo spremenljivko donosnost in tvorimo novo spremenljivko, z novim imenom, ki bo shranjena v datoteki s podatki). V desno okence Numeric Variable prenesemo spremenljivko, ki jo želimo preoblikovati – donosnost. V okencu Output Variable pod vrstico Name, vpišemo ime nove spremenjvke (npr. donosnost1), kliknemo na gumbek Change in nato na gumbek Old and New Values. Odpre se okno, kjer imamo na levi strani stare vrednosti (Old Value), na desni strani pa nove vrednosti (New Value). Vse vrednosti spremenljivke, ki so manjše ali enake od vrednosti 12 pri spremenljivki donosnost morajo biti enake 0 pri novi spremenljivki donosnost1. Vse vrednosti spremenljivke, ki so večje od vrednosti 12 pri spremenljivki donosnost morajo biti enake 1 pri novi spremenljivki donosnost1. Zato izberemo na levi strani (Old Value): Range, lowest through value: vtipkamo 12 in na desni strani (New Value) izberemo 0 in kliknemo Add. Nato ponovimo postopek za vse vrednosti, ki so večje od 12 in sicer: Na levi strani (Old Value): Range, value through highest vtipkamo 12 in na desni strani (New Value) izberemo 1 in kliknemo Add ter Continue, OK. c) Uvedite novo spremenljivko in jo poimenujte s Test, ki bo za posamezno podjetje, s katerim organizacija sodeluje, pojasnjevala povprečno vrednost storitev na pogodbo. Izračunajte deskriptivno statistiko za tako dobljeno spremenljivko. Postopek uvedbe oziroma oblikovanje nove spremenljivke: Kliknemo na Transform in izberemo ukaz Compute Variable. Odpre se okno, kjer na levi strani zgoraj pod Target Variable vpišemo ime nove spremenljivke, ki jo želimo oblikovati, na primer Test. V okence Numeric expression vpišemo računski izraz za izračun nove spremenljivke (v našem primeru vrednost storitev delimo s številom pogodb in tako dobimo novo spremenljivko – Test) in kliknemo OK. V datoteki s podatki Data View lahko v Deskriptivna statistika in vzorčni pristop 15 zadnji koloni najdemo zapisane vrednosti novo oblikovane spremenljivke, ki smo jo imenovali Test. Tudi pri Variable View lahko na koncu opazimo zapisano novo spremenljivko Test. d) Z uporabo generatorja slučajnih števil izberite cca 35 statističnih enot v slučajni vzorec. Izračunajte deskriptivno statistiko za spremenljivko vrednost storitev v tako dobljenem vzorcu. Postopek uporabe generatorja slučajnih števil: Kliknemo na Data in izberemo ukaz Select Cases. Kliknemo na gumb Random sample of cases in kliknemo okence Sample ter napišemo želeno vrednost pod Approximately __ % of all cases (v našem primeru smo napisali 50 %). Kliknemo na Continue in OK. Odgovori in izpisi rezultatov: a) Tabela 9: 95 %-ni interval zaupanja za spremenljivko vrednost storitev Statistic Std. Error Mean 55,45 12,423 95 % Confidence Interval Lower Bound 30,67 for Mean Upper Bound 80,23 5 % Trimmed Mean 38,47 Median 24,00 Variance 10803,400 Vrednost Std. Deviation 103,939 storitev Minimum 6 Maximum 777 Range 771 Interquartile Range 41 Skewness 5,325 0,287 Kurtosis 34,292 0,566 V tabeli 9 vidimo, da spodnja meja (Lower Bound) intervala zaupanja znaša 30,67 in zgornja meja (Upper Bound) znaša 80,23, kar pomeni, da s 95 % verjetnostjo ocenjujemo, da je povprečna vrednost storitev v statistični množici med 30,67 in 80,23 enotami. 16 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA Tabela 10: 80 %-ni interval zaupanja za spremenljivko vrednost storitev Statistic Std. Error Mean 55,45 12,423 80 % Confidence Interval Lower Bound 39,38 for Mean Upper Bound 71,52 5 % Trimmed Mean 38,47 Median 24,00 Variance 10803,400 Vrednost Std. Deviation 103,939 storitev Minimum 6 Maximum 777 Range 771 Interquartile Range 41 Skewness 5,325 0,287 Kurtosis 34,292 0,566 Z 80 % verjetnostjo ocenjujemo, da je povprečna vrednost storitev v statistični množici med 39,38 in 71,52 enot. b) Tabela 11: Izračun vrednosti mediane za spremenljivko donosnost Statistic Std. Error Mean 12,40 0,492 80% Confidence Interval Lower Bound 11,76 for Mean Upper Bound 13,04 5% Trimmed Mean 12,52 Median 12,00 Variance 16,910 Donosnost Std. Deviation 4,112 Minimum -3 Maximum 22 Range 25 Interquartile Range 5 Skewness -0,657 0,287 Kurtosis 1,897 0,566 V tabeli 11 vidimo, da mediana za spremenljivko donosnost (vzorčni podatki) znaša 12,00 (v %). Deskriptivna statistika in vzorčni pristop 17 c) Tabela 12: Opisna statistika za novo spremenljivko Test Valid 70 N Missing 0 Mean 12,9383 Std. Error of Mean 4,35546 Median 3,4186 Mode 48,50 Std. Deviation 36,44037 Variance 1327,900 Range 295,71 Minimum 0,29 Maximum 296,00 18 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA Naloga 5. V tabeli 13 so podani podatki za n = 15 anketiranih oseb, ki so odgovorile na vprašanje: Ali bi vas strah pred neuspehom odvirnil od tega, da bi ustanovili svoje podjetje? Anketirani so odgovarjali na vprašanje z možnimi odgovori: 0 ̶ Ne in 1 ̶ Da. Spol anketiranega je označen z 1 ̶ Moški in 2 ̶ Ženski spol. Starost je merjena v dopolnjenih letih. Tabela 13: Podatki o odgovorih anketiranih oseb Spol 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 Starost 45 45 58 62 64 55 57 20 23 20 21 33 25 33 30 Strah pred 0 0 0 0 0 1 1 0 0 1 1 1 1 1 1 neuspehom a) Vnesite podatke v program SPSS. Razdelite datoteko na dva dela, glede na spol anketiranega in opravite ločeno analizo za moške in ženske o odstotku tistih, ki bi jih strah pred neuspehom odvrnil od ustanovitve novega podjetja. Postopek razdelitve datoteke na dva dela (glede na spol): Kliknemo Data, nato Split File (ukaz bo datoteko razdelil na 2 dela in sicer glede na spol), kliknemo na Organize output by groups in prenesemo spremenljivko spol v desni okvirček (nad katerim piše Groups Based on..) ter kliknemo OK. Nato opravimo ločeno analizo za moške in ženske: kliknemo Analzye, nato izberemo ukaz Descriptive Statistic in kliknemo Descriptives (lahko tudi Frequencies ali Explore). b) Oblikujte novo spremenljivko, ki bo imela negativno vrednost, če je oseba mlajša od 40 let, in pozitivno vrednost, če je starejša od 40 let. Dobljeno spremenljivko pretvorite v novo spremenljivko, ki bo imela vrednost 0, če gre za osebo staro do 40 let, in vrednost 1, če gre za osebo, ki je starejša od 40 let. Postopek oblikovanja nove spremenljivke glede starosti: Kliknemo na Transform in izberemo ukaz Compute Variable. Odpre se okno, kjer na levi strani zgoraj pod Target Variable vpišemo ime nove spremenljivke, ki jo želimo oblikovati, na primer Starost1. V okence Numeric expression vpišemo računski izraz za izračun nove spremenljivke (v našem primeru vpišemo: starost ̶ 40 in tako dobimo novo spremenljivko – Starost1) in kliknemo OK. V datoteki s podatki Data View lahko v zadnji koloni najdemo vrednosti novo oblikovane spremenljivke, ki smo jo imenovali Starost1. Tudi pri Variable View lahko na koncu opazimo zapisano novo spremenljivko Starost1. Postopek pretvorbe v novo spremenljivko, ki bo imela vrednost 0, če gre za osebo staro do 40 let in vrednost 1, če gre za osebo, ki je starejša od 40 let: Kliknemo na Transform in izberemo ukaz Recode into Different Variables. V desno okence Numeric Variable prenesemo spremenljivko, ki jo želimo preoblikovati – Starost1. V okencu Output Variable pod vrstico Name, vpišemo ime nove spremenjvke (npr. Starost2), kliknemo na gumbek Change in nato na gumbek Old and New Values. Odpre se okno, Deskriptivna statistika in vzorčni pristop 19 kjer imamo na levi strani stare vrednosti (Old Value), na desni strani pa nove vrednosti (New Value). Vse vrednosti spremenljivke, ki so manjše ali enake 0 pri spremenljivki Starost1 morajo biti enake 0 pri novi spremenljivki Starost2. Zato izberemo na levi strani (Old Value): Range, lowest through value: vtipkamo 0 in na desni strani (New Value) izberemo 0 in kliknemo Add. Nato ponovimo postopek za vse vrednosti, ki so večje od 0 in sicer: Na levi strani (Old Value) izberemo All other values, na desni strani pa Value:1 ter kliknemo Add, nato continue in OK. c) Izračunajte 80 %-ni interval zaupanja za povprečno starost oseb v statistični množici. Odgovori in izpisi rezultatov: a) Tabela 14: Opisna statistika za anketirane osebe moškega spola Mini- Maxi- Std. N Range Mean Variance mum mum Deviation Std. Statistic Statistic Statistic Statistic Statistic Statistic Statistic Error Strah pred 7 1 0 1 0,29 0,184 0,488 0,238 neuspehom Valid N 7 (listwise) Tabela 15: Opisna statistika za anketirane osebe ženskega spola Mini- Maxi- Std. N Range Mean Variance mum mum Deviation Std. Statistic Statistic Statistic Statistic Statistic Statistic Statistic Error Strah pred 8 1 0 1 0,75 0,164 0,463 0,214 neuspehom Valid N 8 (listwise) Med moškimi bi jih 29 % strah pred neuspehom odvrnil od ustanovitve podjetja, pri ženskah ta odstotek znaša 75 %. 20 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA c) Tabela 16: 80 %-ni interval zaupanja za povprečno starost anketiranih oseb Statistic Std. Error Mean 39,40 4,263 80 % Confidence Interval Lower Bound 33,67 for Mean Upper Bound 45,13 5 % Trimmed Mean 39,11 Median 33,00 Variance 272,543 Starost anketiranih Std. Deviation 16,509 oseb Minimum 20 Maximum 64 Range 44 Interquartile Range 34 Skewness 0,236 0,580 Kurtosis -1,656 1,121 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA P. Tominc, V. Čančer in M. Rožman 2 NORMALNA PORAZDELITEV 2.1 Opredelitev in značilnosti normalne porazdelitve Normalna porazdelitev je najpomembnejša porazdelitev v teoriji in praksi statističnih postopkov. Na centralnem limitnem izreku in lastnostih normalne porazdelitve temelji inferenčna statistika (ali matematična statistika, statistično sklepanje o lastnostih in značilnostih statistične množice na osnovi značilnosti slučajnega vzorca) (Agresti & Finlay, 2009). Normalna porazdelitev je verjetnostna porazdelitev vrednosti statističnih enot v statistični populaciji in jo shematično prikazujemo na sliki 1. Slika 1: Prikaz normalne porazdelitve. (vir: Kožuh, 2005) 22 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA Krivulja normalne porazdelitve je zvonasta, unimodalna, simetrična in se asimptotično približuje osi x. Znana je tudi pod imenom Gaussova krivulja. Oblika normalne porazdelitve je odvisna od aritmetične sredine in od standardnega odklona (variance). Sprememba aritmetične sredine prestavlja krivuljo levo ali desno po osi x. Normalna porazdelitev ima vrh pri aritmetični sredini. Okoli te točke je gostota relativne frekvence največja. Z oddaljenostjo od aritmetične sredine pa pada. Standardni odklon spreminja razpon normalne porazdelitve (z naraščanjem standardnega odklona se krivulja širi in znižuje). Standardni odklon meri razpršenost vrednosti okoli aritmetične sredine, zato vpliva na sploščenost krivulje (večji kot je odklon, bolj sploščena je krivulja) (Kožuh, 2005). Pri normalni porazdelitvi je modus enak aritmetični sredini, zaradi simetričnosti pa je tema dvema enaka tudi mediana. Vrednosti levo in desno (navzgor in navzdol) od aritmetične sredine imajo vse manjšo verjetnostno gostoto. Za normalno porazdelitev velja, da sta koeficienta asimetričnosti in sploščenosti enaka 0. Za proučevano (neko empirično) porazdelitev nam vrednosti teh dveh koeficientov nakazujeta, kako je proučevana porazdelitev podobna normalni porazdelitvi (Bastič, 2006). 2.2 Kolmogorov-Smirnov test in Shapiro-Wilk W test Kolmogorov-Smirnov test in Shapiro-Wilk W test uporabimo takrat, kadar želimo preveriti trditev, da je obravnavana spremenljivka v statistični množici porazdeljena po normalni porazdelitvi, kar pomeni, da primerjamo pogostost pojavljanja proučevane spremenljivke na vzorčnih podatkih (empirične frekvence) s pogostostjo pojavljanja normalno porazdeljene spremenljivke z enako aritmetično sredino in standardnim odklonom, kot ga ima proučevana empirična porazdelitev (teoretične frekvence) (Bastič, 2006). V primeru, ko je test neznačilen (stopnja značilnosti preizkusa ali stopnja tveganja, p > 0,05), tedaj ničelne domneve (H0: Obravnavani spremenljivki je dopustno prilagoditi normalno porazdelitev) ne zavrnemo in lahko sklepamo, da se porazdelitev proučevane spremenljivke v statistični množici ne razlikuje od normalne porazdelitve. Sklepamo torej, da proučevana spremenljivka ni normalno porazdeljena, ko je test statistično značilen (p < 0,05). Normalna porazdelitev 23 Naloga 1. V podjetju so želeli izmeriti motiviranost svojih zaposlenih. Zaposleni so na 5-stopenjski Likertovi lestvici izrazili stopnjo strinjanja (kjer pomeni 1-sploh se ne strinjam in 5-popolnoma se strinjam) s štirimi trditvami o motiviranosti: 1. Na delovnem mestu in pri opravljanju svojega dela sem motiviran. 2. Vodstvo mi nudi ustrezno/primerno plačilo za moj dosežen uspeh. 3. Za doseganje uspešnih rezultatov v podjetju prejmemo zaposleni pohvalo ali priznanje. 4. Imam možnost kariernega razvoja. Podatki so v datoteki Normalna porazdelitev_Motiviranost.sav. a) Zapišite ničelno domnevo o normalni porazdelitvi vrednosti obravnavanih spremenljivk. b) Preverite, ali so štiri spremenljivke - komponente motiviranosti zaposlenih, porazdeljene po normalni porazdelitvi in narišite frekvenčni histogram za spremenljivko Za doseganje uspešnih rezultatov v podjetju prejmemo zaposleni pohvalo ali priznanje. Potek: Kliknemo na Analyze in nato Descriptive Statistic ter Explore. V okence Dependent List prenesemo vse štiri spremenljivke - komponente motiviranosti zaposlenih. Kliknemo gumb Plots in izberemo Normality plots with tests ter kliknemo Continue. Izpis rezultata: Odgovori in izpisi rezultatov: a) H0: Obravnavani i-ti spremenljivki je dopustno prilagoditi normalno porazdelitev; i=1,2,3,4. H1: Obravnavani i-ti spremenljivki ni dopustno prilagoditi normalne porazdelitve; i=1,2,3,4. 24 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA b) Tabela 17: Kolmogorov-Smirnov test in Shapiro-Wilk W test (angl. Tests of Normality). Kolmogorov-Smirnova Shapiro-Wilk Statistic df Sig. Statistic df Sig. Na delovnem mestu in pri opravljanju 0,221 216 0,000 0,881 216 0,000 svojega dela sem motiviran. Vodstvo mi nudi ustrezno/primerno 0,252 216 0,000 0,871 216 0,000 plačilo za moj dosežen uspeh. Za doseganje uspešnih rezultatov v podjetju prejmemo zaposleni pohvalo ali 0,246 216 0,000 0,876 216 0,000 priznanje. Imam možnost kariernega razvoja. 0,181 216 0,000 0,913 216 0,000 a. Lilliefors Significance Correction Kolmogorov-Smirnov test in Shapiro-Wilk W test (tabela 17) kažeta, da nobena od štirih obravnavanih spremenljivk – komponent motiviranosti zaposlenih, ni porazdeljena po normalni porazdelitvi, saj je stopnja tveganja v vseh primerih manjša od 0,001 (p < 0,001), kar pomeni, da ničelno domnevo zavrnemo in potrdimo raziskovalno domnevo, da i-ta spremenljivka ni normalno porazdeljena; i=1,2,3,4. Odstopanja od oblike normalne porazdelitve, ki so opazna na sliki frekvenčnega histograma za eno od obravnavanih trditev, so statistično značilna. Histogram 4: Frekvenčni histogram za spremenljivko Za doseganje uspešnih rezultatov v podjetju prejmemo zaposleni pohvalo ali priznanje s krivuljo prilagojene normalne porazdelitve. Normalna porazdelitev 25 Naloga 2. Podjetje je na tržišču uvedlo nov izdelek. V podjetju želijo ugotoviti, koliko novih izdelkov je bilo prodanih v prvem tednu, na osnovi slučajnega vzorca 30-ih različnih trgovin. Podatki o prodaji novega izdelka v prvem tednu so v datoteki Normalna porazdelitev_Prodaja izdelka.sav. a) Preverite ali je spremenljivka v statistični množici porazdeljena po normalni porazdelitvi in narišite frekvenčni histogram. Odgovori in izpisi rezultatov: a) H0: Spremenljivki prodaja izdelka je dopustno prilagoditi normalno porazdelitev. H1: Spremenljivki prodaja izdelka ni dopustno prilagoditi normalne porazdelitve. Tabela 18: Kolmogorov-Smirnov test in Shapiro-Wilk W test (angl. Tests of Normality). Kolmogorov-Smirnov Shapiro-Wilk Statistic df Sig. Statistic df Sig. Prodaja novega izdelka 0,125 30 0,200 0,964 30 0,384 Kolmogorov-Smirnov test in Shapiro-Wilk W test (tabela 18) kažeta, da ne zavrnemo ničelne domneve, da je obravnavana spremenljivka v statistični množici porazdeljena po normalni porazdelitvi, saj je stopnja tveganja pri Kolmogorov-Smirnovem testu 0,200 ter Shapiro-Wilkovem W testu 0,384, kar pa pomeni, da sta obe vrednosti stopnje tveganja večji od 0,05 (Kolmogorov-Smirnov 0,200 in Shapiro -Wilk 0,384). Histogram 5: Frekvenčni histogram za spremenljivko prodaja izdelka 26 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA Naloga 3. V datoteki Normalna porazdelitev_ Naloga3.sav so podatki o podjetju, ki opravlja storitve na tržišču. Podatki prikazujejo vrednost opravljenih storitev v določenem letu. a) Preverite, ali lahko sklepamo, da je spremenljivki vrednost storitev dopustno prilagoditi normalno porazdelitev. b) Na osnovi mer centralne tendence, koeficienta asimetrije in koeficienta sploščenosti pojasnite ali je porazdelitev obravnavane spremenljivke (empirični podatki), po svojih značilnostih podobna normalni porazdelitvi. c) Narišite še frekvenčni histogram. Odgovori in izpisi rezultatov: a) Tabela 19: Kolmogorov-Smirnov test in Shapiro-Wilk W test (angl. Tests of Normality). Kolmogorov-Smirnov Shapiro-Wilk Statistic df Sig. Statistic df Sig. Vrednost storitev 0,317 70 0,000 0,440 70 0,000 b) Tabela 20: Opisna statistika za spremenljivko vrednost storitev Valid 70 N Missing 0 Mean 55,45 Std. Error of Mean 12,423 Median 24,00 Mode 8a Std. Deviation 103,939 Variance 10803,400 Skewness 5,325 Std. Error of Skewness 0,287 Kurtosis 34,292 Std. Error of Kurtosis 0,566 Range 771 Minimum 6 Maximum 777 a. Multiple modes exist. The smallest value is shown V tabeli 20 vidimo, da aritmetična sredina ni enaka mediani, prav tako tudi modus ni enak aritmetični sredini in mediani (za normalno porazdelitev velja: aritmetična sredina = mediana = modus). Normalna porazdelitev 27 Pomanjkljivost obravnavane empirične porazdelitve se kaže tudi v tem, da ima več kot en modus. Koeficient asimetričnosti kaže, da je porazdelitev asimetrična v desno (pozitivna asimetrična porazdelitev) in pozitivne vrednosti koeficienta sploščenosti kažejo na koničasto porazdelitev. c) Histogram 6: Frekvenčni histogram za spremenljivko vrednost storitev 28 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA P. Tominc, V. Čančer in M. Rožman 3 PARAMETRIČNI IN NEPARAMETRIČNI UNIVARIATNI STATISTIČNI TESTI Parametrični test za ugotavljanje statistično značilnih razlik med povprečnimi vrednostmi spremenljivk v vzorcih uporabljamo, kadar je podatkom za odvisno spremenljivko na intervalni ali razmernostni lestvici dopustno prilagoditi normalno porazdelitev (Corder & Foreman, 2014). Kadar enote vzorcev pripadajo isti statistični množici, govorimo o odvisnih vzorcih. Kadar enote vzorca pripadajo različnim statističnim množicam, govorimo o neodvisnih vzorcih. Za analizo značilnih razlik med povprečnima vrednostma spremenljivke v dveh odvisnih vzorcev bomo uporabili t-test za odvisna vzorca, med povprečnima vrednostma spremenljivke v dveh neodvisnih vzorcih pa t-test za neodvisna vzorca. Za analizo značilnih razlik med povprečnimi vrednostmi v več kot dveh neodvisnih vzorcev bomo uporabili analizo variance ANOVA. Neparametrične ekvivalente parametričnim testom pa uporabimo, kadar za odvisno numerično spremenljivko podatkom, ki sicer temeljijo na intervalni ali razmernostni lestvici, ni dopustno prilagoditi normalne porazdelitve, ali kadar podatki za odvisno spremenljivko temeljijo na ordinalni lestvici (Corder & Foreman, 2014). Za primerjavo dveh neodvisnih vzorcev bomo uporabili Mann- Whitneyev U test, za primerjavo dveh odvisnih vzorcev pa Wilcoxon signed rank test. V primeru, da je odvisna spremenljivka nominalna, pa lahko za primerjavo neodvisnih vzorcev uporabimo χ2 –test. 30 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA 3.1 Parametrični test za odvisna vzorca: t-test za odvisna vzorca Naloga 1. V podjetju X pri preverjanju kakovosti izdelkov ugotavljajo le, ali izdelek ustreza postavljenim merilom kakovosti ali ne. V prvem nadzornem obdobju so 25-krat preverili po 300 naključno izbranih izdelkov in ugotavljali število slabih izdelkov v vsaki podskupini. Ob koncu prvega obdobja so izvedli nekatere ukrepe za izboljšanje kakovosti izdelkov in nato v drugem nadzornem obdobju 25-krat preverili po 300 naključno izbranih izdelkov ter beležili število slabih izdelkov. V datoteki t-test za odvisna vzorca_Nadzor kakovosti.sav so v prvem stolpcu podatki o številu slabih izdelkov v prvem nadzornem obdobju, v drugem stolpcu pa so podatki o številu slabih izdelkov v drugem nadzornem obdobju. Ugotoviti želimo, ali so ukrepi za izboljšanje kakovosti uspešni. V ta namen bomo preverili naslednji domnevi: H0: Povprečno število slabih izdelkov v prvem obdobju je enako povprečnemu številu slabih izdelkov drugem obdobju (μ1 = μ2). H1: Povprečno število slabih izdelkov v prvem obdobju je večje kot povprečno število slabih izdelkov v drugem obdobju (μ1 > μ2). Postopek: S Kolmogorov-Smirnovim in Shapiro-Wilkovim testom smo najprej ugotovili, da je podatkom dopustno prilagoditi normalno porazdelitev (postopek je opisan v drugem poglavju). Zato za preverjanje zapisanih domnev uporabimo parametrični test za odvisna vzorca, tj. t-test za odvisna vzorca. V izboru Analyze izberemo Compare Means, nato pa Paired-Samples T Test. Označimo spremenljivko število slabih izdelkov v prvem obdobju [slabi_1] in jo s klikom na gumb s puščico prenesemo v okvir Paired Variables, in sicer v celico pod Variable 1, spremenljivko število slabih izdelkov v drugem obdobju [slabi_2] pa prenesemo v celico pod Variable 2. Kliknemo OK, da izvedemo t-test za dva odvisna vzorca. Odgovori in izpisi rezultatov: Tabela 21: Rezultati testov za preverjanje, ali je podatkom o številu slabih izdelkov v obeh nadzornih obdobjih v podjetju X dopustno prilagoditi normalno porazdelitev Kolmogorov-Smirnova Shapiro-Wilk Statistic df Sig. Statistic df Sig. število slabih izdelkov v prvem 0,115 25 0,200* 0,958 25 0,379 obdobju število slabih izdelkov v drugem 0,115 25 0,200* 0,958 25 0,371 obdobju *. This is a lower bound of the true significance. a. Lilliefors Significance Correction Parametrični in neparametrični univariatni statistični testi 31 Iz tabele 21 je razvidno, da je pri obeh spremenljivkah p > 0,05, zato ničelne domneve Kolmogorov- Smirnovega testa in Shapiro-Wilkovega testa ne zavrnemo. Številu slabih izdelkov v prvem obdobju je dopustno prilagoditi normalno porazdelitev. Normalno porazdelitev je dopustno prilagoditi tudi številu slabih izdelkov v drugem obdobju. Tabela 22: Povprečno število slabih izdelkov v prvem in v drugem obdobju Mean N Std. Deviation Std. Error Mean število slabih izdelkov v prvem 14,88 25 5,442 1,088 obdobju Pair 1 število slabih izdelkov v drugem 11,80 25 5,172 1,034 obdobju Iz tabele 22 je razvidno, da je povprečno število slabih izdelkov v podjetju X v prvem obdobju 14,88 (zaokroženo na cela mesta: 15 kosov), v drugem obdobju pa je 11,80 (zaokroženo na cela mesta: 12 kosov). Tabela 23: Rezultati t-testa za odvisna vzorca v podjetju X Paired Differences Std. 95 % Confidence Interval of Std. Error the Difference Sig. Mean Deviation Mean Lower Upper t df (2-tailed) število slabih izdelkov v prvem Pair 1 obdobju - število 3,080 3,415 0,683 1,670 4,490 4,510 24 0,000 slabih izdelkov v drugem obdobju Iz rezultatov v zadnjem stolpcu v tabeli 23 je razvidno, da je izračunana dvostranska stopnja tveganja p < 0,001, kar velja tudi za enostransko stopnjo tveganja. Ker je p < 0,001, ničelno domnevo , ki smo jo zapisali pri Nalogi 1, zavrnemo. Povprečno število slabih izdelkov v prvem obdobju ni enako povprečnemu številu slabih izdelkov v drugem obdobju. Ob hkratnem upoštevanju rezultatov v tabeli 22 sprejmemo raziskovalno domnevo: H1: Povprečno število slabih izdelkov v prvem obdobju je večje kot povprečno število slabih izdelkov v drugem obdobju. 32 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA Naloga 2. Uspešnost ukrepov ekonomske politike v regiji smo proučevali na vzorcu 70 naključno izbranih podjetij. V ta namen smo zbrali podatke o donosnosti teh podjetij v letu pred uvedbo ukrepov ekonomske politike in v letu po uvedbi teh ukrepov. Ugotoviti želimo, ali je povprečna donosnost v letu po uvedbi ukrepov ekonomske politike statistično značilno višja kot v letu pred uvedbo teh ukrepov. Podatki so v datoteki t-test za odvisna vzorca_Donosnost.sav. a) Preverite, ali je podatkom za donosnost v letu pred uvedbo ukrepov ekonomske politike in v letu po uvedbi le-teh dopustno prilagoditi normalno porazdelitev. b) Utemeljite uporabo t-testa za odvisna vzorca, če želimo preveriti, ali je povprečna donosnost v letu po uvedbi ukrepov ekonomske politike statistično značilno višja kot v letu pred uvedbo teh ukrepov. c) Zapišite ničelno in raziskovalno domnevo. d) Preverite, ali je povprečna donosnost v letu po uvedbi ukrepov ekonomske politike statistično značilno višja kot v letu pred uvedbo teh ukrepov. Odgovori in izpisi rezultatov: a) Tabela 24: Rezultati testov za preverjanje, ali je podatkom o donosnosti podjetij v letu pred ukrepi ekonomske politike in v letu po njih dopustno prilagoditi normalno porazdelitev Kolmogorov-Smirnova Shapiro-Wilk Statistic df Sig. Statistic df Sig. Donosnost podjetja v letu pred 0,103 70 0,062 0,986 70 0,631 ukrepi ekonomske politike Donosnost podjetja v letu po 0,104 70 0,058 0,966 70 0,057 ukrepih ekonomske politike a. Lilliefors Significance Correction Iz tabele 24 je razvidno, da je pri obeh spremenljivkah p > 0,05: podatkom za donosnost podjetij v letu pred ukrepi ekonomske politike in za donosnost podjetij v letu po ukrepih ekonomske politike je dopustno prilagoditi normalno porazdelitev. b) Spremenljivki donosnost podjetja v letu pred ukrepi ekonomske politike in donosnost podjetja v letu po ukrepih ekonomske politike temeljita na razmernostni lestvici. Podatkom je dopustno prilagoditi normalno porazdelitev. Enote obeh vzorcev so iz iste statistične množice. Parametrični in neparametrični univariatni statistični testi 33 c) H0: Povprečna donosnost podjetij v letu pred ukrepi ekonomske politike in povprečna donosnost podjetij v letu po ukrepih ekonomske politike se statistično značilno ne razlikujeta (μ1 = μ2). H1: Povprečna donosnost podjetij v letu po ukrepih ekonomske politike je statistično značilno višja kot povprečna donosnost v letu pred uvedbo le-teh (μ2 > μ1). d) Tabela 25: Povprečna donosnost v letu pred ukrepi ekonomske politike in v letu po njih Mean N Std. Deviation Std. Error Mean Donosnost podjetja v letu pred 10,7429 70 4,05286 0,48441 ukrepi ekonomske politike Pair 1 Donosnost podjetja v letu po 12,4000 70 4,11219 0,49150 ukrepih ekonomske politike Tabela 26: Rezultati t-testa za odvisna vzorca za donosnost Paired Differences 95 % Confidence Std. Interval of the Std. Error Difference Sig. Mean Deviation Mean Lower Upper t df (2-tailed) Donosnost podjetja v letu pred ukrepi ekonomske politike - Pair 1 -1,65714 5,93415 0,70927 -3,07209 -0,24220 -2,336 69 0,022 Donosnost podjetja v letu po ukrepih ekonomske politike Ker je v raziskovalni domnevi zapisana stroga neenakost (μ2 > μ1), iz rezultatov v zadnjem stolpcu v tabeli 26 izračunamo enostransko stopnjo tveganja, ki je p/2 = 0,022/2 = 0,011, p/2 < 0,05. Povprečna donosnost podjetij v letu pred ukrepi ekonomske politike in povprečna donosnost v letu po njih se statistično značilno razlikujeta. Ob hkratnem upoštevanju rezultatov v tabeli 25 sprejmemo raziskovalno domnevo: H1: Povprečna donosnost podjetij v letu po ukrepih ekonomske politike je statistično značilno višja kot povprečna donosnost v letu pred uvedbo le-teh. 34 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA 3.2 Parametrični test za neodvisna vzorca: t-test za neodvisna vzorca Naloga 1. V podjetju X želijo v drugem obdobju po sprejetju ukrepov za izboljšanje kakovosti primerjati kakovost svojih izdelkov s kakovostjo izdelkov v konkurenčnem podjetju Y. Tudi v podjetju Y pri preverjanju kakovosti izdelkov ugotavljajo le, ali izdelek ustreza postavljenim merilom kakovosti ali ne. V istem časovnem obdobju kot v podjetju X so v podjetju Y 30-krat preverili po 300 izdelkov in ugotavljali število slabih izdelkov v vsaki podskupini. V datoteki t-test za neodvisna vzorca_Nadzor kakovosti.sav so za drugo nadzorno obdobje v prvem stolpcu podatki o številu slabih izdelkov v podjetju X, v drugem stolpcu pa so podatki o številu slabih izdelkov v podjetju Y. Ugotoviti želimo, ali se kakovost izdelkov v podjetju X statistično značilno razlikuje od kakovosti izdelkov v konkurenčnem podjetju Y. V ta namen bomo preverili naslednji domnevi: H0: Povprečno število slabih izdelkov v podjetju X je enako povprečnemu številu slabih izdelkov v podjetju Y (μX = μY). H1: Povprečno število slabih izdelkov v podjetju X se statistično značilno razlikuje od povprečnega števila slabih izdelkov v podjetju Y (μX ≠ μY). Postopek: S Kolmogorov-Smirnovim in Shapiro-Wilkovim testom smo najprej ugotovili, da je podatkom dopustno prilagoditi normalno porazdelitev (tabela 27). Zato za preverjanje zapisanih domnev uporabimo parametrični test za neodvisna vzorca, tj. t-test za neodvisna vzorca. V izboru Analyze izberemo Compare Means, nato pa Independent-Samples T Test. Odvisno spremenljivko število slabih izdelkov prenesemo v desno okno Test Variable(s). Nato spremenljivko oznaka podjetja prenesemo v okno Grouping Variable. Kliknemo na Define Groups in definiramo vrednosti skupin: pri Group 1 vpišemo 1 (tj. oznako podjetja X), pri Group 2 pa vpišemo 2 (tj. oznako podjetja Y) in kliknemo Continue. Kliknemo OK, da izvedemo t-test za dva neodvisna vzorca. Odgovori in izpisi rezultatov: Tabela 27: Rezultati testov za preverjanje, ali je podatkom o številu slabih izdelkov dopustno prilagoditi normalno porazdelitev Kolmogorov-Smirnova Shapiro-Wilk oznaka podjetja Statistic df Sig. Statistic df Sig. število slabih podjetje X 0,115 25 0,200* 0,958 25 0,371 izdelkov podjetje Y 0,097 30 0,200* 0,981 30 0,850 *. This is a lower bound of the true significance. a. Lilliefors Significance Correction Parametrični in neparametrični univariatni statistični testi 35 Tabela 28: Povprečno število slabih izdelkov v podjetju X in v podjetju Y oznaka podjetja N Mean Std. Deviation Std. Error Mean podjetje X 25 11,80 5,172 1,034 število slabih izdelkov podjetje Y 30 11,43 4,974 0,908 Tabela 29: Rezultati t-testa za neodvisna vzorca – podjetji X in Y Levene's Test for Equality of t-test for Equality of Means Variances Std. 95 % Confidence Mean Sig. Error Interval of the F Sig. t df Diffe- (2-tailed) Diffe- Difference rence rence Lower Upper število Equal slabih variances 0,000 0,991 0,267 53 0,790 0,367 1,371 -2,384 3,117 izdelkov assumed Equal variances 0,266 50,448 0,791 0,367 1,376 -2,397 3,131 not assumed V tabeli 29 z Levenovim testom enakosti varianc najprej preverimo, ali lahko predpostavimo enake variance v obeh neodvisnih vzorcih: H0: Predpostavimo enake variance. H1: Enakih varianc ne predpostavimo. Iz izpisa rezultatov Levenovega testa enakosti varianc vidimo, da je p = 0,991, torej p > 0,05, zato ničelne domneve ne zavrnemo, torej predpostavimo enake variance. V izpisu rezultatov t-testa za primerjavo povprečnih vrednosti neodvisnih vzorcev zato upoštevamo prvo vrstico izpisa. Odčitamo, da je p = 0,790, torej p > 0,05, torej ničelne domneve o enakosti povprečnih vrednosti ne zavrnemo: Povprečno število slabih izdelkov v podjetju X je enako povprečnemu številu slabih izdelkov v podjetju Y (μX = μY). Kakovost v podjetju X se torej statistično značilno ne razlikuje od kakovosti v konkurenčnem podjetju Y. 36 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA Naloga 2. Podjetje iz naloge 2 v poglavju o normalni porazdelitvi je nov izdelek uvedlo ne le na domačem tržišču A, ampak tudi na tujem tržišču B. V datoteki t-test za neodvisna vzorca_Prodaja izdelka.sav so podatki o prodaji v prvem tednu v 30 slučajno izbranih trgovinah na domačem tržišču A in o prodaji v drugih, 30 slučajno izbranih trgovinah na tujem tržišču B. V podjetju želijo ugotoviti, ali se je povprečna prodaja novega izdelka na domačem tržišču A statistično značilno razlikovala od povprečne prodaje na tujem tržišču B. a) Ugotovite, ali je podatkom o prodaji novega izdelka dopustno prirediti normalno porazdelitev. b) Utemeljite uporabo t-testa za neodvisna vzorca, če želimo preveriti, ali se je povprečna prodaja novega izdelka na domačem tržišču A statistično značilno razlikovala od povprečne prodaje na tujem tržišču B. c) Zapišite ničelno in raziskovalno domnevo. d) Ugotovite, ali se je povprečna prodaja novega izdelka na domačem tržišču A statistično značilno razlikovala od povprečne prodaje na tujem tržišči B. Odgovori in izpisi rezultatov: a) Tabela 30: Rezultati testov za preverjanje, ali je podatkom o prodaji izdelkov dopustno prilagoditi normalno porazdelitev Kolmogorov-Smirnova Shapiro-Wilk Tržišče Statistic df Sig. Statistic df Sig. Tržišče A 0,125 30 0,200* 0,964 30 0,384 Prodaja novega izdelka Tržišče B 0,109 30 0,200* 0,939 30 0,085 *. This is a lower bound of the true significance. a. Lilliefors Significance Correction b) Trgovine so iz različnih statističnih množic: trgovine iz domačega tržišča A in trgovine iz tujega tržišča B. Podatki o prodaji so numerični in dopustno jim je prilagoditi normalno porazdelitev. c) H0: Povprečna prodaja novega izdelka na domačem tržišču A je enaka kot povprečna prodaja novega izdelka na tujem tržišču B (μA = μB). H1: Povprečna prodaja novega izdelka na domačem tržišču A se statistično značilno razlikuje od povprečne prodaje novega izdelka na tujem tržišču B (μA ≠ μB). Parametrični in neparametrični univariatni statistični testi 37 d) Tabela 31: Opisna statistika neodvisnih vzorcev: domačega tržišča A in tujega tržišča B Tržišče N Mean Std. Deviation Std. Error Mean Tržišče A 30 8,67 3,336 0,609 Prodaja novega izdelka Tržišče B 30 10,40 4,116 0,751 Tabela 32: Rezultati t-testa za neodvisna vzorca – domačega tržišča A in tujega tržišča B Levene's Test for t-test for Equality of Means Equality of Variances 95 % Confidence Sig. Mean Std. Error Interval of the F Sig. t df (2-tailed) Difference Difference Difference Lower Upper Equal variances Prodaja 2,195 0,144 -1,792 58 0,078 -1,733 0,967 -3,669 0,203 assumed novega Equal variances izdelka -1,792 55,615 0,079 -1,733 0,967 -3,671 0,205 not assumed Iz izpisa rezultatov Levenovega testa enakosti varianc v tabeli 32 vidimo, da je p > 0,05 (izračunana stopnja tveganja je 0,144), torej predpostavimo enake variance. V izpisu rezultatov t-testa za primerjavo povprečnih vrednosti neodvisnih vzorcev zato upoštevamo prvo vrstico izpisa. Odčitamo, da je p > 0,05, torej ničelne domneve o enakosti povprečnih vrednosti ne zavrnemo: Povprečna prodaja novega izdelka na domačem tržišču A je enaka kot povprečna prodaja novega izdelka na tujem tržišču B (μA = μB). Ugotovimo, da se povprečna prodaja novega izdelka na domačem tržišču A statistično značilno ne razlikuje od povprečne prodaje novega izdelka na tujem tržišču B. 38 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA 3.3 Parametrični test za neodvisne vzorce: ANOVA Naloga 1. V podjetju želijo ugotoviti, kateri ukrepi za izboljšanje kakovosti so najbolj uspešni. Ukrepi za izboljšanje kakovosti so: izboljšanje dizajna, zamenjava materiala in izobraževanje delavcev. V ta namen so 25-krat preverili po 300 izdelkov in ugotavljali število slabih izdelkov v vsaki podskupini. V datoteki ANOVA_Nadzor kakovosti.sav so v prvem stolpcu podatki o številu slabih izdelkov v podjetju, v drugem stolpcu je oznaka ukrepa za izboljšanje kakovosti. Ugotoviti želimo, ali se kakovost izdelkov v podjetju statistično značilno razlikuje glede na uporabljen ukrep. V ta namen smo oblikovali domnevi: H0: Povprečno število slabih izdelkov je enako po vsakem izmed uporabljenih ukrepov za izboljšanje kakovosti (μ1 = μ2 = μ3). H1: Vsaj dve povprečni števili slabih izdelkov se statistično značilno razlikujeta glede na uporabljen ukrep za izboljšanje kakovosti. Postopek: Najprej smo preverili, da je spremenljivki število slabih izdelkov dopustno prilagoditi normalno porazdelitev. Nato za izvedbo ANOVA v izboru Analyze izberemo Compare Means, One-way ANOVA in odpre se okno One-way ANOVA, v katerem sta zapisani obe spremenljivki. Spremenljivko število slabih izdelkov [slabi_izdelki] prenesemo v okno pri Dependent List. Spremenljivko ukrepi za izboljšanje kakovosti izdelkov [ukrep] prenesemo v okno pri Factor. Kliknemo na Options, nato na Descriptive in potem Continue. Po kliku na OK dobimo izpis rezultatov. Odgovori in izpisi rezultatov: Tabela 33: Rezultati testov za preverjanje, ali je spremenljivkam za število slabih izdelkov po uporabi posameznih ukrepov (izboljšanje dizajna, zamenjava materiala in izobraževanje delavcev) dopustno prilagoditi normalno porazdelitev ukrepi za izboljšanje Kolmogorov-Smirnova Shapiro-Wilk kakovosti izdelkov Statistic df Sig. Statistic df Sig. izboljšanje dizajna 0,154 25 0,127 0,961 25 0,442 število slabih zamenjava materiala 0,089 25 0,200* 0,967 25 0,563 izdelkov izobraževanje delavcev 0,082 25 0,200* 0,971 25 0,675 *. This is a lower bound of the true significance. a. Lilliefors Significance Correction Parametrični in neparametrični univariatni statistični testi 39 Tabela 34: Opisna statistika - število slabih izdelkov po uporabi posameznih ukrepov število slabih izdelkov 95 % Confidence Interval Std. for Mean N Mean Std. Deviation Minimum Maximum Error Lower Upper Bound Bound izboljšanje 25 7,36 4,672 0,934 5,43 9,29 0 17 dizajna zamenjava 25 11,20 4,699 0,940 9,26 13,14 3 19 materiala izobraževanje 25 9,84 4,819 0,964 7,85 11,83 2 19 delavcev Total 75 9,47 4,933 0,570 8,33 10,60 0 19 Tabela 35: Rezultati analize variance število slabih izdelkov Sum of Squares df Mean Square F Sig. Between Groups 189,547 2 94,773 4,235 0,018 Within Groups 1611,120 72 22,377 Total 1800,667 74 Iz izpisa rezultatov analize variance v tabeli 35 je razvidno, da je stopnja tveganja 0,018, torej je p < 0,05, zato ničelno domnevo zavrnemo in sprejmemo raziskovalno domnevo: H1: Vsaj dve povprečni števili slabih izdelkov se statistično značilno razlikujeta glede na uporabljen ukrep za izboljšanje kakovosti. Če želimo ugotoviti, katere skupine se med seboj značilno razlikujejo, moramo opraviti dodatno analizo, ki se imenuje post hoc. Z njo primerjamo povprečja med tremi skupinami (povprečje vsake skupine primerjamo s povprečjem preostalih dveh skupin). To analizo izvedemo tako, da kliknemo Post hoc gumb v pogovornem oknu One-way ANOVA. Med vsemi možnostmi se odločimo za Tukeyevo metodo tako, da izberemo Tukey (Bastič, 2006) in dobimo izpis v tabeli 36. 40 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA Tabela 36: Rezultati post-hoc testa pri analizi variance Dependent Variable: število slabih izdelkov Tukey HSD (I) ukrepi za Mean 95 % Confidence Interval (J) ukrepi za izboljšanje izboljšanje kakovosti Difference Std. Error Sig. kakovosti izdelkov Lower Bound Upper Bound izdelkov (I-J) zamenjava materiala -3,840* 1,338 0,015 -7,04 -0,64 izboljšanje dizajna izobraževanje delavcev -2,480 1,338 0,160 -5,68 0,72 izboljšanje dizajna 3,840* 1,338 0,015 0,64 7,04 zamenjava materiala izobraževanje delavcev 1,360 1,338 0,569 -1,84 4,56 izboljšanje dizajna 2,480 1,338 0,160 -0,72 5,68 izobraževanje delavcev zamenjava materiala -1,360 1,338 0,569 -4,56 1,84 *. The mean difference is significant at the 0.05 level. Iz tabele 36 je razvidno, da se povprečno število slabih izdelkov razlikuje po ukrepih izboljšanje dizajna in zamenjava materiala, stopnja tveganja je 0,015 (p < 0,05). Parametrični in neparametrični univariatni statistični testi 41 Naloga 2. Po 50 naključno izbranih tujih turistov iz Avstrije, Italije in Nemčije smo povprašali, koliko denarja na dan nameravajo porabiti v Sloveniji. V datoteki ANOVA_Predvidena dnevna poraba tujega turista.sav so v stolpcu poraba zbrani njihoviOdgovori o predvideni povprečni dnevni porabi v Sloveniji, izraženi v EUR, v stolpcu država pa je označeno, iz katere države prihajajo. Ugotoviti želimo, ali v Sloveniji tuji turisti v povprečju različno trošijo glede na državo, iz katere prihajajo. a) Opredelite vrsto spremenljivke poraba in vrsto spremenljivke država. b) Preverite, ali je spremenljivki poraba v vsakem posameznem neodvisnem vzorcu dopustno prilagoditi normalno porazdelitev. c) Zapišite ustrezni domnevi za zgoraj opisani problem, če boste uporabili ANOVA. d) Preverite domnevi. Odgovori in izpisi rezultatov: a) Spremenljivka poraba, definirana kot »predvidena povprečna dnevna poraba tujega turista v Sloveniji, izražena v EUR« je numerična spremenljivka in temelji na razmernostni lestvici. Spremenljivka država je opisna spremenljivka in temelji na nominalni lestvici. b) Tabela 37: Rezultati testov za preverjanje, ali je spremenljivki poraba dopustno prilagoditi normalno porazdelitev Kolmogorov-Smirnova Shapiro-Wilk država Statistic df Sig. Statistic df Sig. predvidena povprečna Avstrija 0,107 50 0,200* 0,972 50 0,267 dnevna poraba tujega Italija 0,088 50 0,200* 0,983 50 0,664 turista v Sloveniji, Nemčija 0,091 50 0,200* 0,963 50 0,118 izražena v EUR *. This is a lower bound of the true significance. a. Lilliefors Significance Correction c) H0: Predvidena povprečna dnevna poraba tujih turistov v Sloveniji se glede na državo njihovega izvora ne razlikuje. H1: Vsaj dve predvideni povprečni dnevni porabi tujih turistov v Sloveniji se glede na državo njihovega izvora statistično značilno razlikujeta. 42 ZBIRKA VAJ ZA PREDMET METODE RAZISKOVANJA d) Tabela 38: Opisne statistike za predvideno dnevno porabo tujih turistov predvidena povprečna dnevna poraba tujega turista v Sloveniji, izražena v EUR 95 % Confidence Interval for Mean Std. Lower Upper N Mean Deviation Std. Error Bound Bound Minimum Maximum Avstrija 50 81,6872 26,86346 3,79907 74,0527 89,3217 30,00 135,00 Italija 50 104,9723 44,94987 6,35687 92,1977 117,7470 16,30 205,90 Nemčija 50 71,3170 27,98168 3,95721 63,3647 79,2693