Non-Parametric Statistics (Kruskal-Wallis Test) PDF

Summary

These lecture notes detail Non-parametric Statistics, focusing on the Kruskal-Wallis test for comparing multiple independent samples. They cover course contents, conditions for use, calculations, and examples.

Full Transcript

‫‪1‬‬ ‫‪Non-parametric Statistics‬‬ ‫االحصاء الالمعلمي‬ ‫الوحدة الرابعة‬ ‫‪2‬‬ ‫‪Course Contents‬‬ ‫✓‪ -1‬مقدمة ومراجعة لبعض المفاهيم األساسية‬ ‫✓‪ -2‬الطرق الالمعلمية في حالة عينة من متغير واحد أو من...

‫‪1‬‬ ‫‪Non-parametric Statistics‬‬ ‫االحصاء الالمعلمي‬ ‫الوحدة الرابعة‬ ‫‪2‬‬ ‫‪Course Contents‬‬ ‫✓‪ -1‬مقدمة ومراجعة لبعض المفاهيم األساسية‬ ‫✓‪ -2‬الطرق الالمعلمية في حالة عينة من متغير واحد أو من متغيرين‬ ‫غير مستقلين‬ ‫✓ مشكلة الموضع ‪Location Problem‬‬ ‫✓ جودة التوفيق ‪Goodness of fit‬‬ ‫✓ ‪ -3‬الطرق الالمعلمية في حالة عينتين مستقلتين‬ ‫✓ مشكلة الموضع ‪Location Problem‬‬ ‫✓ مشكلة التباين ‪dispersion Problem‬‬ ‫✓ تطابق التوزيعات ‪identical distributions‬‬ ‫✓ ‪ -4‬الطرق الالمعلمية في حالة أكثر من عينتين مستقلين‬ ‫مشكلة الموضع ‪Location Problem‬‬ ‫‪3‬‬ ‫االختبارات الالمعلمية ألكثر من‬ ‫عينتين مستقلتين‬ ‫اختبار كروسكال واليس‬ ‫)‪(Kruskal-Wallis test‬‬ ‫‪26‬‬ ‫االختبار حول معلمة الموضع في حالة أكثر من عينتين مستقلتين‬ ‫ إختبار ‪ Kruskal-Wallis‬هو إختبار ال معلمي لمقارنة أكثر من عينتين‬ ‫مستقلتين‪.‬‬ ‫ إختبار ‪ Kruskal-Wallis‬هو إمتداد إلختبار ‪Mann-Whitney‬‬ ‫المستخدم لمقارنة عينتين مستقلتين‪.‬‬ ‫ يستخدم إلختبار الفرض ما إذا كان المجتمعات (‪ K‬مجتمع) لها نفس‬ ‫مقياس الموضع‪/‬المركز بافتراض أن توزيعات المجتمعات متماثلة‬ ‫(متشابهة) (بالتالي فإن اإلختالفات مصدرها مقياس الموضع‪/‬المركز)‪.‬‬ ‫‪4‬‬ ‫‪27‬‬ ‫اختبار كروسكال ‪ -‬واليس ‪Kruskal - Wallis test‬‬ ‫المنطق لهذا اإلختبار كالتالي ‪:‬‬ ‫يتم ترتيب كل العينات معًا‪ ،‬ثم يتم حساب مجموع الرتب بكل عينة على حدة‬ ‫ ‬ ‫‪ -‬إذا كانت كل العينات تأتي من نفس المجتمع‪ ،‬فإننا نتوقع خليط من الرتب‬ ‫الصغيرة‪ ،‬والمتوسطة والكبيرة في كل عينة‪.‬‬ ‫‪ -‬أما في حالة إذا كان الفرض البديل صحيح‪ ،‬فإن الرتب )المنخفضة أو‬ ‫المرتفعة( قد تسيطر على واحدة أو أكثر من العينات‪.‬وبالتالي‪ ،‬فإن مجموع‬ ‫الرتب لعينة واحدة على األقل سوف يتضمن على رتب كبيرة مما يؤدي إلى‬ ‫قيمة أعلى إلحصاء اإلختبار‪.‬‬ ‫‪5‬‬ ‫‪6‬‬ ‫اختبار كروسكال‪-‬واليس ‪Kruskal-Wallis test‬‬ ‫شروط استخدام االختبار‪:‬‬ ‫‪.1‬العينات مستقلة عن بعضها البعض‪.‬‬ ‫‪.2‬العينات عشوائية‪.‬‬ ‫‪.3‬مستوى القياس على األقل ترتيبى‪.‬‬ ‫‪29‬‬ ‫اختبار كروسكال‪-‬واليس ‪Kruskal-Wallis test‬‬ ‫البيانات‪:‬‬ ‫‪ :Xij‬هي المشاهدة رقم ‪ j‬في العينة رقم ‪ i‬حيث ‪ i=1,2,…,k‬و‬ ‫‪. j=1,2,….,ni‬‬ ‫وبالتالي ‪:‬‬ ‫‪ N‬تمثل مجموع أحجام العينات‪ ،‬أي أن‪:‬‬ ‫‪N=n1+n2+…+nk‬‬ ‫‪7‬‬ 30 ‫واليس‬-‫خطوات اختبار كروسكال‬ ‫ تحديد الفرض العدمى والفرض البديل‬.1 H0: The k populations are identical with the same location (H0: M1 = M2 = ……= Mk ) H1: at least one population is different in location ‫ مستوي المعنوية‬.2 α = given (otherwise default = 0.05) 8 ‫‪31‬‬ ‫خطوات اختبار كروسكال‪-‬واليس‬ ‫‪.3‬إحصاء االختبار وتوزيع المعاينة‬ ‫ ترتيب العينة ال ُمجمعة (كل العينات معًا)‪.‬‬ ‫ حساب مجموع رتب كل عينة على حدة‪:‬‬ ‫‪ni‬‬ ‫) ‪Ri =  R( X ij‬‬ ‫‪j =1‬‬ ‫حيث‪:‬‬ ‫‪ i‬هي رقم العينة (‪ i=1,2,…,k‬و ‪) j=1,2,….,ni‬‬ ‫‪9‬‬ 32 ‫واليس‬-‫خطوات اختبار كروسكال‬ ‫احصاء االختبار‬ No ties or few ties (ties ≤ 2) Many ties (ties > 2) 12 k Ri2 T =[  N ( N + 1) i =1 ni ] − 3( N + 1) 1  k Ri2 N ( N + 1) 2  T = 2  −  S  i =1 ni 4  1  k ni 2 N ( N + 1) 2  where : S =  R ( X ij ) − 2  N − 1  i =1 j =1 4  Under H0, the exact distribution of T is a positive distribution whose quantiles are given by the Kruskal-Wallis table for k = 3 and ni ≤ 5. 10 33 ‫واليس‬-‫خطوات اختبار كروسكال‬ ‫ تحديد القيم(ة) الحرجة واتخاذ القرار‬.4 W1-α is from the Kruskal-Wallis table (if it is not available, we use the Chi-square table with degree of freedom = k-1) Reject H0 if: T  W1− 11 ‫‪12‬‬ ‫مثال ‪:1‬‬ ‫تممم اختيممار ثممالع مجموعممات مممن الطممالب بشممكل عشمموائي ليممتم تدريسممهم‬ ‫بمممثالع مممرف مختلفمممة للتمممدريس‪ ،‬وتمممم عقمممد امتحمممان وتسمممجيل در مممات‬ ‫االمتحان الخاصة بهم‪.‬هل تشير البيانات إلى و ود اخمتالف معنموي بمين‬ ‫در ات الطالب ؟ (‪)α = 0.01‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪3‬‬ ‫‪65‬‬ ‫‪75‬‬ ‫‪59‬‬ ‫‪87‬‬ ‫‪69‬‬ ‫‪78‬‬ ‫‪73‬‬ ‫‪83‬‬ ‫‪67‬‬ ‫‪79‬‬ ‫‪81‬‬ ‫‪62‬‬ ‫‪12‬‬ 13 :)‫ (الحل‬1 ‫مثال‬ H0: the three populations are identical with same location H1: at least one population is different in location α = 0.01 1 R 2 R 3 R 65 3 75 7 59 1 87 12 69 5 78 8 73 6 83 11 67 4 79 9 81 10 62 2 Total 30 Total 33 Total 15 R1 R2 R3 15 :)‫ (الحل‬1 ‫مثال‬ No ties 3 2 12 R T =[  i N ( N + 1) i =1 ni ] − 3( N + 1) 12  302 332 152  T =[  + +  ] − 3(13) = 3.6 12(13)  4 4 4  n1 = 4 , n 2 = 4 , n 3 = 4 W1− = W0.99 = ??? 14 15 ‫‪17‬‬ ‫مثال ‪(1‬الحل)‪:‬‬ ‫‪No ties‬‬ ‫‪12‬‬ ‫‪k‬‬ ‫‪Ri2‬‬ ‫[= ‪T‬‬ ‫‪‬‬ ‫‪N ( N + 1) i =1 ni‬‬ ‫)‪] − 3( N + 1‬‬ ‫‪12  302 332 152 ‬‬ ‫[= ‪T‬‬ ‫‪‬‬ ‫‪+‬‬ ‫‪+‬‬ ‫‪ ] − 3(13) = 3.6‬‬ ‫‪12(13)  4‬‬ ‫‪4‬‬ ‫‪4 ‬‬ ‫‪W1− = W0.99 = 7.539‬‬ ‫ال نرفض الفرض العدمي عند مستوى معنوية ‪. 0.01‬أي أنه ال يو د‬ ‫‪16‬‬ ‫دليل كافي أن توزيع الدر ات مختلف‪.‬‬ ‫‪18‬‬ ‫مثال ‪:2‬‬ ‫تم اختيار عينة عشوائية من ثالثة أنواع مختلفة من اللمبات الكهربائية‬ ‫لمعرفة الوقت الذي تظل هذه اللمبات تعمل فيه‪ ،‬فكانت النتائج كالتالي‪.‬‬ ‫هل هذه البيانات تشير إلى وجود اختالف معنوى بين أعمار اللمبات‬ ‫الكهربائية المختلفة؟‬ ‫‪A‬‬ ‫‪B‬‬ ‫‪C‬‬ ‫‪73‬‬ ‫‪84‬‬ ‫‪82‬‬ ‫‪64‬‬ ‫‪80‬‬ ‫‪79‬‬ ‫‪67‬‬ ‫‪81‬‬ ‫‪70‬‬ ‫‪62‬‬ ‫‪73‬‬ ‫‪67‬‬ ‫‪17‬‬ ‫‪70‬‬ 18 :)‫(الحل‬2 ‫مثال‬ H0: the three populations are identical with same location H1: at least one population is different in location α = 0.05 A R B R C R 73 7.5 84 13 82 12 R : Ranks 64 2 80 10 79 9 67 3.5 81 11 70 5.5 62 1 73 7.5 67 3.5 70 5.5 Total 41.5 Total 30 Total 19.5 R2 R3 R1 20 :)‫(الحل‬2 ‫مثال‬ Ties > 2 1  k Ri2 N ( N + 1) 2  T = 2  −  S  i =1 ni 4  1  19.52 41.52 302  (13)142  T=  + +  −  = 6.291 15.04  5 4 4  4  n1=5 , n2 = 4 , n3 = 4 W1− = W0.95 = ??? 19 20 ‫‪22‬‬ ‫‪Ties >2‬‬ ‫مثال ‪(2‬الحل)‪:‬‬ ‫‪1  k Ri2 N ( N + 1) 2 ‬‬ ‫‪T = 2  −‬‬ ‫‪‬‬ ‫‪S  i =1 ni‬‬ ‫‪4‬‬ ‫‪‬‬ ‫‪1 19.5 41.5 30 (13)14 ‬‬ ‫‪‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫=‪T‬‬ ‫‪‬‬ ‫‪+‬‬ ‫‪+‬‬ ‫‪−‬‬ ‫‪ = 6.291‬‬ ‫‪15.04  5‬‬ ‫‪4‬‬ ‫‪4‬‬ ‫‪4 ‬‬ ‫‪W1− = W0.95 = 5.6176‬‬ ‫‪T = 6.291  W0.95 = 5.6176‬‬ ‫نرفض الفرض العدمي عند مستوى معنوية ‪. 0.05‬أي أنه يو د دليل‬ ‫السؤال‪:‬‬ ‫كافي أن أعمار األنواع الثالثة مختلفة‪.‬‬ ‫‪21‬‬ ‫أي نوع من األنواع الثالثة هو‬ ‫مصدر االختالف‬ ‫‪22‬‬ ‫االختبارات الالمعلمية ألكثر من عينتين‬ ‫مستقلتين‬ ‫اختبار كروسكال واليس‬ ‫)‪(Kruskal-Wallis test‬‬ ‫المقارنات المتعددة (‪)Multiple comparisons‬‬ ‫‪23‬‬ ‫اختبار كروسكال‪-‬واليس‬ ‫ المقارنات المتعددة (‪)Multiple comparisons‬‬ ‫‪ −‬عند رفض الفرض العدمي (أي فى حالة و ود اختالف معنوى‬ ‫بين مجتمعين على األقل) البد من استخدم اختبار المقارنات‬ ‫المتعددة لتحديد مصدر االختالف‪.‬‬ ‫‪ −‬نقوم بتطبيق اختبار المقارنة لكل األزواج الممكنة‪:‬‬ ‫‪H0: Populations i and i/ are identical‬‬ ‫‪H1: Populations i and i/ are not identical‬‬ ‫‪23‬‬ 24 )‫واليس (المقارنات المتعددة‬-‫اختبار كروسكال‬ i ‫ يتم رفض الفرض العدمي (أي أن هناك فرف معنوى بين المجتمعين‬- :‫) إذا كان‬i’‫و‬ 1/ 2  2 N −1 − T  1 1 1/ 2 Ri Ri ' −  t S   +  ni ni ' 2 , N −k  N −k   ni ni '  In case of no ties (or few ties, ≤2): N ( N + 1) S  2 12 In case of many ties (> 2) : 1  k ni N ( N + 1) 2  S =  R ( X ij ) − 2 2  N − 1  i =1 j =1 4  ‫‪25‬‬ ‫اختبار كروسكال‪-‬واليس (المقارنات المتعددة)‬ ‫الحظ أن‪:‬‬ ‫ اذا كانت احجام العينات متساوية‪ ،‬نجد أن ‪ RHS‬قيمته ثابتة في كل‬ ‫اختبارات المقارنة‪.‬‬ ‫‪1/ 2‬‬ ‫‪ 2 N −1 − T ‬‬ ‫‪1 1‬‬ ‫‪1/ 2‬‬ ‫‪t‬‬ ‫‪S‬‬ ‫‪‬‬ ‫‪ + ‬‬ ‫‪2‬‬ ‫‪, N −k ‬‬ ‫‪N −k ‬‬ ‫‪ ni ni ' ‬‬ ‫‪26‬‬ ‫اختبار كروسكال‪-‬واليس (المقارنات المتعددة)‬ ‫الحظ أن‪:‬‬ ‫ أنه إذا كان لدينا عدد ‪ k‬من المجتمعات وقمنا بإ راء اختباربين كل‬ ‫زوج من المجتمعات على حدة فإننا سنحتاج إلى عدد ‪ K C2‬من‬ ‫االختبارات االحصائية‪.‬‬ ‫ ومن المعلوم أن كل اختبار من هذه االختبارات له احتمال خطأ من‬ ‫النوع األول ‪ α‬وبالتالي فإن احتمال الوقوع فى الخطأ من النوع‬ ‫األول اإل مالي (‪ )familywise Type I error rate‬سوف يزيد‬ ‫زيادة كبيرة‪.‬‬ ‫‪27‬‬ ‫اختبار كروسكال‪-‬واليس (المقارنات المتعددة)‬ ‫الحظ أن‪:‬‬ ‫ فى هذه الحالة هناك بعض الطرف لتعديل قيمة 𝛼 الختبار‬ ‫المقارنات المتعددة وابقاء مستوى المعنوية الكلي عند المستوى‬ ‫المحدد مسبقًا‪.‬‬ ‫‪20‬‬ ‫مثال ‪(2‬الحل)‪:‬‬ ‫‪Ties > 2‬‬ ‫‪R1=19.5 , R2 = 41.5 , R3 = 30‬‬ ‫‪n1=5 , n2 = 4 , n3 = 4‬‬ ‫‪T = 6.291  W0.95 = 5.6176‬‬ ‫نرفض الفرض العدمي عند مستوى معنوية ‪. 0.05‬أي انه يو د دليل‬ ‫كافي أن أعمار األنواع الثالثة مختلفة‪.‬‬ ‫يجب أن نبحث‬ ‫أي نوع من االنواع الثالثة هو‬ ‫مصدر االختالف‬ ‫‪28‬‬ ‫‪29‬‬ ‫مثال ‪(2‬الحل)‪:‬‬ ‫سوف يتم عقد مقارنات بين كل زوج من المجتمعات‬ 30 :)‫(الحل‬2 ‫مثال‬ We reject H0 if: 1/ 2  2 N −1 − T  1 1 1/ 2 Ri Ri ' −  t S   +  ni ni ' 2 , N − k  N −k   ni ni '  1/ 2  2 N −1 − T   1 1  1/ 2 RHS = t  S   n + n   2 , N −k  N −k   i i '  t0.025,13−3 = t0.025,10 = ???? 31 31  2 N −1 − T  1/ 2  1 1  1/ 2 :)‫(الحل‬2 ‫مثال‬ RHS = t  S   n +  2 , N −k  N −k   i ni '   Ri R LHS = − i' ni ni ' ‫االختبار‬ LHS RHS 19.5 41.5 H 0 : M1 = M 2 − = 6.475 > 5 4 H 0 : M 1 = M 3 19.5 − 30 = 3.6 < 5 4 H 0 : M 2 = M 3 41.5 − 30 = 2.875 < 32 4 4 ‫‪33‬‬ ‫مثال ‪(2‬تابع)‪:‬‬ ‫يتم رفض الفرض العدمي إذا كان ‪LHS > RHS :‬‬ ‫‪H 0 : M1 = M 2‬‬ ‫نرفض الفرض العدمى‬ ‫‪ H 0 : M 2 = M 3‬و ‪H 0 : M1 = M 3‬‬ ‫بينما ال نرفض الفرض العدمى‬ ‫أي أن هناك فرف معنوى بين متوسط المجتمع األول والمجتمع الثانى‪،‬‬ ‫وليس هناك فرف معنوى بين متوسط المجتمع األول والثالث وبين‬ ‫متوسط المجتمع الثانى والثالث‪.‬‬

Use Quizgecko on...
Browser
Browser