Summary

This document is a lecture presentation on multiple regression, a statistical modeling technique. It introduces linear regression models with multiple independent variables and discusses various aspects of the model, including the purpose, data samples, regression equation, and inferences about the population from sample data.

Full Transcript

‫סטטיסטיקה ג'‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫סטטיסטיקה ג'‬ ‫רגרסיה מרובה‬ ‫מודל הרגרסיה הליניארית‬ ‫עם מספר משתנים בלתי‪-‬תלויים (ב"ת)‬ ‫סטטיסטיקה ג'‬...

‫סטטיסטיקה ג'‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫סטטיסטיקה ג'‬ ‫רגרסיה מרובה‬ ‫מודל הרגרסיה הליניארית‬ ‫עם מספר משתנים בלתי‪-‬תלויים (ב"ת)‬ ‫סטטיסטיקה ג'‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫נושאי המצגת‬ ‫מטרת השיעור‬ ‫ ‬ ‫נתוני המדגם‬ ‫ ‬ ‫משוואת הרגרסיה המרובה‬ ‫ ‬ ‫הסקה מקו ניבוי מדגמי לקו ניבוי באוכלוסייה‬ ‫ ‬ ‫מודל הרגרסיה המרובה במונחים של ניתוח שונות‬ ‫ ‬ ‫סטטיסטיקה ג' ‪ -‬מטרת השיעור‬ ‫שיעור ‪10‬‬ ‫מטרת השיעור‬ ‫ד“ר גבריאל צור‬ ‫בשיעורים ‪ 6‬עד ‪ 9‬למדנו כי מודל הרגרסיה הליניארית מתאים יותר מניתוח שונות‬ ‫(חד‪/‬דו‪-‬כיווני) כאשר שני המשתנים (התלוי‪/‬מנובא והב"ת‪/‬מנבא) כמותיים ומשקפים‬ ‫קשר ליניארי (‪.)r‬‬ ‫מקרה זה‪ ,‬בו אנו מנבאים משתנה תלוי (למשל‪ - Y ,‬ממוצע שנה א') באמצעות‬ ‫ציוני קשר ליניארי (‪r‬‬ ‫~)‬ ‫ע"פ על‬ ‫ומתבססים‬ ‫משתנה ב"ת אחד (למשל‪ - x ,‬ציון פסיכומטרי)‬ ‫קו הרגרסיה‬ ‫‪z y r z x‬‬ ‫ביניהם ‪ -‬מכונה רגרסיה פשוטה‪.‬‬ ‫תקן‬ ‫~‬ ‫קו הרגרסיה ע"פ ציוני‬ ‫‪Y b xi  a‬‬ ‫גלם‬ ‫וטיב הניבוי ניתן להמחיש‬ ‫הקשר‬ ‫תלוי‬ ‫אתמשתנה‬‫‪Y‬‬ ‫באמצעות האיורים הבאים‪:‬‬‫(מנובא)‬ ‫שטח העיגול הכחול‬ ‫‪Y‬‬ ‫משקף את‬ ‫‪Y‬‬ ‫הפיזור‪/‬שונות של ‪Y‬‬ ‫שטח חופף‬ ‫‪r‬‬ ‫שטח חופף‬ ‫(שונות כללית של ‪.)Y‬‬ ‫משקף את טיב הקשר‬ ‫משקף את טיב הקשר‬ ‫‪r‬‬ ‫הליניארי (‪ r‬או ‪,)r2‬‬ ‫הליניארי (‪ r‬או ‪,)r2‬‬ ‫או את שונות הניבויים‪.‬‬ ‫‪x‬‬ ‫או את שונות הניבויים‪.‬‬ ‫‪x‬‬ ‫‪ X‬משתנה ב"ת‬ ‫דוגמה זו משקפת‬ ‫דוגמה זו משקפת‬ ‫(מנבא)‬ ‫קשר בינוני‪/‬חזק‬ ‫קשר בינוני‪/‬חלש‬ ‫שטח העיגול הירוק‬ ‫(שטח יחסית גדול‬ ‫(שטח יחסית קטן‬ ‫משקף את הפיזור‪/‬שונות‬ ‫מתוך ‪.)Y‬‬ ‫מתוך ‪.)Y‬‬ ‫של ‪X‬‬ ‫סטטיסטיקה ג' ‪ -‬מטרת השיעור‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫בשיעור הנוכחי נבחן סיטואציות בהן יש יותר ממשתנה ב"ת (מנבא) אחד‪.‬מצב בו יש‬ ‫שני משתנים ב"ת או יותר (למשל‪ )x1, x2, x3,… xn ,‬לניבוי המשתנה התלוי (למשל‪)Y ,‬‬ ‫~‬ ‫והניבוי מתבסס על קשרים ליניאריים בין המשתנים – מכונה רגרסיה מרובה‪.‬‬ ‫‪Y b1 x1  b2 x2  b3 x3 ...  bn xn  a‬‬ ‫לדוגמה‪:‬‬ ‫נניח כי אנו מנבאים את ממוצע שנה א' (משתנה תלוי‪/‬מנובא ‪ )Y -‬ע"פ שני משתנים‬ ‫ב"ת (מנבאים) ציון פסיכומטרי (‪ )x1‬וממוצע בגרות (‪.)x2‬את מקרה זה ניתן להציג‬ ‫~‬ ‫בנוסחה הבאה של הרגרסיה המרובה‬ ‫‪Y b1 x1  b2 x2  a‬‬ ‫ממוצע שנה א' (‪ )Y‬משתנה תלוי‬ ‫(מנובא)‬ ‫או להמחיש באיור‬ ‫שטח העיגול הכחול משקף את‬ ‫שטח חופף (‪ Y‬עם ‪)x2‬‬ ‫הפיזור‪/‬שונות של ‪( Y‬שונות כללית של ‪.)Y‬‬ ‫משקף את טיב הקשר הליניארי ) ‪r(Yx2‬‬ ‫שטח חופף (‪ Y‬עם ‪)x1‬‬ ‫בין המשתנה התלוי (‪ )Y‬לב"ת ‪.x2‬‬ ‫‪Y‬‬ ‫משקף את טיב הקשר הליניארי )‪r(Yx1‬‬ ‫) ‪r(Yx 2‬‬ ‫בין המשתנה התלוי (‪ )Y‬לב"ת ‪.x1‬‬ ‫)‪r(Yx1‬‬ ‫בגרות (‪ - )x2‬משתנה ב"ת‬ ‫פסיכומטרי (‪ - )x1‬משתנה ב"ת‬ ‫‪x2‬‬ ‫(מנבא)‬ ‫שטח העיגול הזהוב משקף את‬ ‫‪x1‬‬ ‫(מנבא)‬ ‫שטח העיגול הירוק משקף את‬ ‫הפיזור‪/‬שונות של ‪x2‬‬ ‫הפיזור‪/‬שונות של ‪x1‬‬ ‫‪ -‬תיאור נתוני המדגם‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫נתוני המדגם‬ ‫ד“ר גבריאל צור‬ ‫ראשית‪ ,‬נתבונן בנתונים תיאוריים של שלושת המשתנים הלקוחים ממדגם של ‪67‬‬ ‫תלמידי שנה ב' במחלקה מסוימת‪ ,‬אליהם נתייחס כמדגם מקרי של תלמידי המחלקה‪.‬‬ ‫‪x1 545‬‬ ‫‪x2 76‬‬ ‫‪sx1 45.2‬‬ ‫‪sx2 6.7‬‬ ‫ציון בפסיכומטרי‬ ‫ציון שנה א' (‪)Y‬‬ ‫‪y 85‬‬ ‫(‪)x1‬‬ ‫(ממוצע וס"ת)‬ ‫‪s y 5‬‬ ‫(ממוצע וס"ת)‬ ‫ציון בבגרות‬ ‫(‪)x2‬‬ ‫(ממוצע וס"ת)‬ ‫הקשר הליניארי בין‬ ‫‪r(Yx1) r(Y 1) 0.206‬‬ ‫המשתנה התלוי (‪ )Y‬לב"ת‬ ‫‪.x1‬‬ ‫הקשר הליניארי בין‬ ‫‪r(Yx 2 ) r(Y 2 ) 0.304‬‬ ‫המשתנה התלוי (‪ )Y‬לב"ת‬ ‫‪.x2‬‬ ‫הקשר הליניארי בין שני‬ ‫‪r( x1 x 2 ) r(12 ) 0.133‬‬ ‫המשתנים הב"ת ‪ x1‬ו‪.x2 -‬‬ ‫‪ -‬תיאור נתוני המדגם‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫ניתן להמחיש באיורים‪.‬‬ ‫‪r(Y 2 ) 0.304‬‬ ‫‪r(Y 1) 0.206‬‬ ‫‪r(12 ) 0.133‬‬ ‫‪Y‬‬ ‫) ‪r(Y 2‬‬ ‫)‪r(Y 1‬‬ ‫‪x2‬‬ ‫) ‪r(12‬‬ ‫‪x1‬‬ ‫הקשר הליניארי בין‬ ‫הקשר הליניארי בין שני‬ ‫הקשר הליניארי בין‬ ‫המשתנה התלוי (‪ )Y‬לב"ת‬ ‫המשתנים הב"ת ‪ x1‬ו‪.x2 -‬‬ ‫המשתנה התלוי (‪ )Y‬לב"ת‬ ‫‪.x2‬‬ ‫‪.x1‬‬ ‫‪Y‬‬ ‫‪Y‬‬ ‫‪Y‬‬ ‫) ‪r(Y 2‬‬ ‫)‪r(Y 1‬‬ ‫‪x2‬‬ ‫‪x2‬‬ ‫) ‪r(12‬‬ ‫‪x2‬‬ ‫‪x1‬‬ ‫‪x1‬‬ ‫‪x1‬‬ ‫‪ -‬תיאור נתוני המדגם‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫ניתן להציג את דיאגרמת הפיזור (באמצעות ‪ )SPSS‬של הקשר בין המשנה‬ ‫המנובא‪/‬תלוי (‪ )Y‬עם כל אחד מהמשתנים המנבאים‪/‬ב"ת בנפרד (‪.)ry2, ry1‬‬ ‫הקשר הליניארי בין‬ ‫הקשר הליניארי בין‬ ‫המשתנה התלוי (‪ )Y‬לב"ת‬ ‫המשתנה התלוי (‪ )Y‬לב"ת‬ ‫‪.x2‬‬ ‫‪.x1‬‬ ‫‪r(Y 2 ) 0.304‬‬ ‫‪r(Y 1) 0.206‬‬ ‫ממוצע שנה א'‬ ‫ממוצע שנה א'‬ ‫( ‪)Y‬‬ ‫( ‪)Y‬‬ ‫בגרות (‪)x2‬‬ ‫פסיכומטרי (‪)x1‬‬ ‫‪ -‬תיאור נתוני המדגם‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫הצורה של דיאגרמת הפיזור בין ציוני הפסיכומטרי והבגרות ביחד להצלחה בשנה א'‬ ‫היא תלת ממדית‬ ‫ממוצע שנה א'‬ ‫( ‪)Y‬‬ ‫( ‪)x‬‬ ‫ות ‪2‬‬ ‫ר‬‫ט‬‫מ‬ ‫פסיכו‬ ‫בגר‬ ‫י‬ ‫(‪)x 1‬‬ ‫‪ -‬משוואת הרגרסיה‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫משוואת הרגרסיה המרובה‬ ‫ד“ר גבריאל צור‬ ‫קיום שני משתנים ב"ת מכתיב ניבוי שאינו באמצעות קו רגרסיה מדגמי‪ ,‬אלא‬ ‫באמצעות משטח רגרסיה מדגמי שיוגדר ע"י שני החזאים‪/‬מנבאים (פסיכומטרי ‪x1‬‬ ‫ובגרות ‪.)x2‬‬ ‫~‬ ‫‪Y b1 x1  b2 x2  a‬‬ ‫~‬ ‫‪Y 0.019 x1  0.21 x2  58.64‬‬ ‫‪ -‬משוואת הרגרסיה‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫~‬ ‫ד“ר גבריאל צור‬ ‫‪Y 0.019 x1  0.21 x2  58.64‬‬ ‫דוגמה ‪1‬‬ ‫מהו ציון המנובא לממוצע שנה א' (‪ )y‬עבור סטודנט שציון הפסיכומטרי שלו הוא ‪545‬‬ ‫שלו‪x2  x‬‬ ‫הוא ‪ ,x2=76( 76‬זהה לציון‬ ‫‪2‬‬ ‫) וציון הבגרות‬ ‫‪x1  x, x‬‬ ‫זהה לציון הממוצע‬ ‫(‪1 =545‬‬ ‫‪1‬‬ ‫)?‬ ‫הממוצע‬ ‫‪x1 545‬‬ ‫~‬ ‫~‬ ‫‪x2 76‬‬ ‫‪Y 0.019 545  0.21 76  58.64 Y 85‬‬ ‫ציון מנובא ‪ -‬עבור סטודנט עם פסיכומטרי ‪ 545‬ובגרות ‪ 76‬ננבא ממוצע שנה א'‬ ‫‪.85‬‬ ‫כלומר‪ ,‬לתלמיד עם ציונים ממוצעים בשני החזאים ננבא את הציון הממוצע‬ ‫במשתנה התלוי‪.‬‬ ‫ממוצעי המדגם מופיעים בשקופית ‪.5‬‬ ‫‪ -‬משוואת הרגרסיה‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫מה המשמעות של שני מקדמי הרגרסיה במשוואת הניבוי במדגם?‬ ‫מקדם הרגרסיה במשוואת ניבוי חד משתנית (רגרסיה פשוטה) מציג את השינוי הצפוי‬ ‫במשתנה התלוי כאשר המשתנה הבלתי תלוי עולה ביחידה אחת (השיפוע של הקו)‪.‬‬ ‫במשוואת הניבוי המרובה כל אחד ממקדמי הרגרסיה קובע את השינוי הצפוי במשתנה‬ ‫התלוי – כל מקדם של חזאי (משתנה מנבא) מייצג את השינוי הצפוי במשתנה התלוי‬ ‫כאשר החזאים האחרים מוחזקים קבועים‪.‬‬ ‫למשל‪ ,‬אם ציון הפסיכומטרי (‪ )x1‬יוחזק קבוע (למשל‪ ,)545 ,‬וציון הבגרות (‪ )x2‬עולה‬ ‫ביחידה אחת (למשל‪ ,‬מ‪ 76-‬ל‪ )77-‬ממוצע שנה א' יגדל ב‪ 0.21-‬נקודות‪.‬בדומה‪ ,‬אם‬ ‫ציון הבגרות (‪ )x2‬יוחזק קבוע (למשל‪ ,)76 ,‬וציון הפסיכומטרי (‪ )x1‬עולה ביחידה אחת‬ ‫(למשל‪ ,‬מ‪ 545-‬ל‪ )546-‬ממוצע שנה א' יגדל ב‪ 0.019-‬נקודות‪.‬‬ ‫כלומר‪ ,‬מקדמי השיפוע במשוואת הניבוי נותנים מדד לקשר הייחודי שיש לכל אחד‬ ‫הקשר הליניארי הייחודי בין‬ ‫‪Y‬‬ ‫המשתנה התלוי (‪ )Y‬לב"ת‬ ‫המשתנהביןהתלוי‪.‬‬ ‫הליניארי הייחודי‬ ‫הקשר‬ ‫מהחזאים עם‬ ‫‪.x2‬‬ ‫המשתנה התלוי (‪ )Y‬לב"ת‬ ‫‪.x1‬‬ ‫‪x2‬‬ ‫‪x1‬‬ ‫‪ -‬הסקה ממדגם לאוכלוסייה‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫הסקה מקו רגרסיה מדגמי לקו הרגרסיה באוכלוסייה‬ ‫בדיקת השערות‬ ‫בבדיקת השערות דו‪-‬צדדית נבדוק את ההשערה שאין תרומה ייחודית לניבוי המשתנה‬ ‫התלוי באוכלוסייה באמצעות כל אחד משני המשתנים הבלתי תלויים‪ ,‬כאשר המשתנה‬ ‫השני מוחזק קבוע‪.‬‬ ‫במלים אחרות‪ ,‬השערת האפס הדו‪-‬צדדית טוענת שאין למשתנה מסוים תרומה‬ ‫מובהקת בניבוי המשתנה התלוי מעבר לתרומתו של המשתנה השני‪.‬‬ ‫השערה חד‪-‬צדדית תטען למקדמי רגרסיה באוכלוסייה הקטנים או שווים ל‪( 0 -‬או‬ ‫בכיוון ההפוך) והיא רלוונטית יותר בהקשר שלנו (שכן ההנחה היא שציון גבוה יותר‬ ‫בפסיכומטרי ו‪/‬או בבגרות קשור להצלחה גבוהה יותר בשנה א')‪.‬‬ ‫השערות חד‪-‬צדדיות‬ ‫סטטיסטי המבחן‬ ‫‪b  B1‬‬ ‫‪b  B1‬‬ ‫‪H 0 : B1 0‬‬ ‫(‪)df=n-1-J‬‬ ‫) ‪t( n  1 J‬‬ ‫‪ 1‬‬ ‫‪ t( n  3)  1‬‬ ‫‪ˆ b1‬‬ ‫‪ˆ b1‬‬ ‫‪=J‬מס' משתנים ב"ת‬ ‫‪H1 : B1  0‬‬ ‫סטטיסטי המבחן‬ ‫‪b2  B2‬‬ ‫‪b  B2‬‬ ‫‪H 0 : B2 0‬‬ ‫(‪)df=n-1-J‬‬ ‫‪t( n  1 J ) ‬‬ ‫‪ t( n  3)  2‬‬ ‫‪=J‬מס' משתנים ב"ת‬ ‫‪ˆ b2‬‬ ‫‪ˆ b2‬‬ ‫‪H1 : B2  0‬‬ ‫‪ -‬הסקה ממדגם לאוכלוסייה‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫~‬ ‫ד“ר גבריאל צור‬ ‫‪Y 0.019 x1  0.21 x2  58.64‬‬ ‫דוחים את השערת‬ ‫לא דוחים את השערת‬ ‫האפס‬ ‫האפס‬ ‫‪Sig=0.02/2=0.01‬‬ ‫‪Sig=0.16/2=0.08‬‬ ‫פלט התוצאות של ‪ SPSS‬מורה שכאשר מחזיקים את ציון הבגרות קבוע‪ ,‬אין לציון הפסיכומטרי‬ ‫תרומה מובהקת בניבוי ההצלחה בלימודים (‪;)sig=0.16/2=0.08‬‬ ‫לעומת זאת‪ ,‬כאשר מחזיקים את ציון הפסיכומטרי קבוע‪ ,‬יש לציון הבגרות תרומה מובהקת‬ ‫בניבוי ההצלחה בלימודים (‪.)sig=0.02/2=0.01‬‬ ‫‪ -‬הסקה ממדגם לאוכלוסייה‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫על מנת לעמוד על גודלם היחסי של התרומות הייחודיות שיש לכל אחד משני החזאים בניבוי‬ ‫המשתנה התלוי ניתן להיעזר במקדם הרגרסיה החלקי המתוקנן (שמופיע בפלט ה ‪ SPSS‬תחת‬ ‫הכותרת ‪.)Beta‬‬ ‫שני המקדמים החלקיים המתוקננים אינם מושפעים מיחידת המדידה‪ ,‬הם על אותו סולם‬ ‫מדידה של ציוני תקן‪ ,‬ניתן לעמוד על התרומה הייחודית של כל חזאי בניבוי המשתנה התלוי‬ ‫כאשר החזאי האחר מוחזק קבוע‪.‬ה ‪ Beta‬היא למעשה המתאם החלקי‪.‬‬ ‫‪Beta1 rYx1. x 2 0.168‬‬ ‫‪Beta 2 rYx 2. x1 0.282‬‬ ‫הקשר הליניארי הייחודי (‪ )beta‬בין‬ ‫‪Y‬‬ ‫המשתנה התלוי (‪ )Y‬לב"ת ‪x1‬‬ ‫הקשר הליניארי הייחודי (‪ )beta‬בין‬ ‫(פסיכומטרי)‪.‬‬ ‫המשתנה התלוי (‪ )Y‬לב"ת ‪x2‬‬ ‫(בגרות)‪.‬‬ ‫‪x2‬‬ ‫‪x1‬‬ ‫‪ -‬הסקה ממדגם לאוכלוסייה‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫המתאם החלקי הוא המתאם בין כל משתנה בלתי תלוי לבין המשתנה התלוי‪ ,‬כאשר המשתנה‬ ‫הבלתי תלוי השני מוחזק קבוע‪.‬ניתן להשוות את שני המתאמים החלקיים למתאמים הפשוטים‬ ‫ולראות שהם נמוכים יותר מהם בערכם המוחלט‪.‬‬ ‫‪Y‬‬ ‫‪x2‬‬ ‫‪x1‬‬ ‫| ‪| Beta1 rYx1. x 2 0.168 || r(Yx1) 0.206‬‬ ‫| ‪| Beta2 rYx 2. x1 0.282 || r(Yx 2 ) 0.304‬‬ ‫הערה‪ :‬הרצת רגרסיה מרובה ב ‪ SPSS‬זהה לשלבים שנלמדו למעט שלב הגדרת המשתנים‬ ‫הבלתי תלויים – בו יש להגדיר במקום משתנה בלתי תלוי אחד שני משתנים בלתי תלויים (או‬ ‫יותר)‪.‬‬ ‫‪ -‬הסקה ממדגם לאוכלוסייה‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫‪) 0.206‬‬ ‫בלימודים‪r(Y(, x1‬‬ ‫בנוסף‪ ,‬ניתן לראות כי המתאם בין הציון הפסיכומטרי לבין ההצלחה‬ ‫) הוא מובהק ‪.‬כלומר‪ ,‬ניתן להסיק כי באוכלוסייה עלייה בציון הפסיכומטרי תהיה מלווה‬ ‫בעלייה בהצלחה בלימודים‪.‬לעומת זאת‪ ,‬כאשר מחזיקים את ממוצע הבגרות קבוע‪ ,‬לא‬ ‫‪ Beta‬באוכלוסייה‪,‬‬ ‫ניתן לקבוע כי עלייה בציון הפסיכומטרי תהיה מלווה בעלייה ‪0.168‬‬ ‫בהצלחה‪1 rYx1. x 2‬‬ ‫בלימודים‬ ‫) אינו מובהק‪.‬‬ ‫כלומר המתאם החלקי (‬ ‫מתאם בין‬ ‫‪Y‬‬ ‫פסיכומטרי לממוצע‬ ‫‪1) 0.206‬‬ ‫א'‪r(Yx‬‬ ‫שנה‬ ‫מובהק‬ ‫‪x2‬‬ ‫‪Sig=0.095/2=0.0475‬‬ ‫‪x1‬‬ ‫מתאם חלקי בין‬ ‫פסיכומטרי לממוצע שנה‬ ‫‪1. x 2 ) 0.168‬‬ ‫א'‪Beta1 r(Yx‬‬ ‫‪Y‬‬ ‫אינו מובהק‬ ‫‪Sig=0.16/2=0.08‬‬ ‫‪x2‬‬ ‫‪x1‬‬ ‫‪ -‬הסקה ממדגם לאוכלוסייה‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫המתאם החלקי בריבוע‪ :‬מציג את היחס בין שונות הניבויים הייחודית של המנבא לבין‬ ‫שונות כללית‬ ‫השונות הכללית‪2.‬‬ ‫𝑆‬ ‫‪2‬‬ ‫~‬ ‫𝑆‬ ‫‪2‬‬ ‫‪2‬‬ ‫𝑆‬ ‫~‬ ‫‪𝑦 1.2‬‬ ‫𝑟‬ ‫‪2‬‬ ‫‪𝑦 2.1‬‬ ‫=‬ ‫‪𝑦 2.1‬‬ ‫𝑌‬ ‫𝑟‬ ‫‪𝑦 1.2‬‬ ‫=‬ ‫‪2‬‬ ‫𝑆‬ ‫‪2‬‬ ‫𝑦‬ ‫𝑆‬ ‫𝑦‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪Y‬‬ ‫~‬ ‫𝑆‬ ‫‪ = 𝑦 1.2‬שונות הניבויים הייחודית‬ ‫= שונות הניבויים הייחודית‬ ‫𝑆‬ ‫‪~𝑦 2.1‬‬ ‫𝑆‬ ‫‪2‬‬ ‫‪2‬‬ ‫~‬ ‫𝑆‬ ‫~ ‪𝑦 2.1‬‬ ‫‪𝑦 1.2‬‬ ‫של המנבא ‪X1‬‬ ‫של המנבא ‪X2‬‬ ‫‪x2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪x1‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫𝑆‬ ‫‪~𝑦 1.2‬‬‫𝑟=‬ ‫‪𝑦 1.2‬‬ ‫𝑆∙‬ ‫𝑦‬ ‫𝑆‬ ‫𝑟=‬ ‫‪~𝑦 1.2‬‬ ‫‪𝑦 1.2‬‬ ‫𝑆∙‬ ‫𝑦‬ ‫‪ -‬הסקה ממדגם לאוכלוסייה‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫שונות כללית‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫𝑆‬ ‫𝑟‬ ‫‪2‬‬ ‫=‬ ‫𝑆‬ ‫~‬ ‫‪𝑦 2.1‬‬ ‫𝑆‬ ‫𝑌‬ ‫𝑟‬ ‫‪2‬‬ ‫‪𝑦 1.2‬‬ ‫=‬ ‫~‬ ‫‪𝑦 1.2‬‬ ‫‪𝑦 2.1‬‬ ‫‪2‬‬ ‫𝑆‬ ‫‪2‬‬ ‫𝑦‬ ‫𝑆‬ ‫𝑦‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪Y‬‬ ‫𝑆‬ ‫‪ = ~𝑦 1.2‬שונות הניבויים הייחודית‬ ‫= שונות הניבויים הייחודית‬ ‫𝑆‬ ‫‪~𝑦 2.1‬‬ ‫𝑆‬ ‫‪2‬‬ ‫‪2‬‬ ‫~‬ ‫𝑆‬ ‫~ ‪𝑦 2.1‬‬ ‫‪𝑦 1.2‬‬ ‫של המנבא ‪X1‬‬ ‫של המנבא ‪X2‬‬ ‫‪x2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪x1‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫𝑆‬ ‫‪~𝑦 2.1‬‬‫𝑟=‬ ‫‪𝑦 2.1‬‬ ‫𝑆∙‬ ‫𝑦‬ ‫𝑆‬ ‫‪~𝑦 1.2‬‬ ‫𝑟=‬ ‫‪𝑦 1.2‬‬ ‫𝑆∙‬ ‫𝑦‬ ‫‪2‬‬ ‫~𝑆‬ ‫~𝑆‬ ‫‪2‬‬ ‫= ‪𝑟 2𝑦 1‬‬ ‫‪𝑦1‬‬ ‫= ‪𝑟 2𝑦 2‬‬ ‫‪𝑦2‬‬ ‫‪2‬‬ ‫‪Y‬‬ ‫‪Y‬‬ ‫𝑦𝑆‬ ‫‪2‬‬ ‫𝑦𝑆‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫𝑆 ∙ 𝑟= 𝑆‬ ‫‪2‬‬ ‫‪2‬‬ ‫𝑆‬ ‫‪2‬‬ ‫~‬ ‫‪𝑦2‬‬ ‫𝑆‬ ‫‪2‬‬ ‫~‬ ‫‪𝑦1‬‬ ‫𝑆 ∙ 𝑟= 𝑆‬ ‫~‬ ‫‪𝑦1‬‬ ‫‪𝑦1‬‬ ‫𝑦‬ ‫~‬ ‫‪𝑦2‬‬ ‫‪𝑦2‬‬ ‫𝑦‬ ‫‪x2‬‬ ‫‪x2‬‬ ‫‪x1‬‬ ‫‪x1‬‬ ‫‪ -‬במונחים של ניתוח שונות‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫רגרסיה מרובה במונחים של ניתוחי שונות‬ ‫בשיעור ‪ 8‬למדנו לנסח את מודל הרגרסיה הפשוטה במונחים של ניתוחי שונות‪.‬ראינו‬ ‫‪2‬‬ ‫‪2‬‬ ‫) של המשתנה התלוי‪/‬מנובא (‪ )Y‬מורכבת משני) ‪S( ~y‬‬ ‫מרכיבים‬ ‫(‬ ‫כי‪SY‬השונות הכללית‬ ‫‪2‬‬ ‫)‪.‬‬ ‫שונותושונות הטעויות (‬ ‫)‬ ‫אדיטיביים‪ S:‬שונות הניבויים (‬ ‫) ‪(e‬‬ ‫הניבויים‬ ‫שונות כללית‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫של ‪Y‬‬ ‫‪S S‬‬ ‫‪Y‬‬ ‫~(‬ ‫)‪y‬‬ ‫‪S‬‬ ‫)‪(e‬‬ ‫שונות‬ ‫הטעויות‬ ‫‪ Y‬משתנה תלוי (מנובא)‬ ‫השטח הנותר‬ ‫‪SY2‬‬ ‫שטח העיגול הכחול משקף את‬ ‫הפיזור‪/‬שונות של ‪( Y‬שונות ‪2‬כללית של ‪- Y‬‬ ‫משקף את שונות הטעויות) ‪S(e(2‬‬ ‫‪SY‬‬ ‫)‪.‬‬ ‫)‬ ‫) ‪S(e2‬‬ ‫) ‪S(2~y‬‬ ‫שטח חופף‬ ‫‪S ~y2‬‬ ‫‪SSRe g‬‬ ‫אחוז השונות‬ ‫משקף את טיב הקשר הליניארי (‪,)r2‬‬ ‫‪2‬‬ ‫‪x1‬‬ ‫‪2‬‬ ‫‪r ‬‬ ‫‪2‬‬ ‫‪‬‬ ‫‪ 100 r 2‬‬ ‫או את שונות הניבויים) ‪.) S((~y‬‬ ‫‪S‬‬ ‫‪SST‬‬ ‫המנובאת‬ ‫כמו כן‪ ,‬למדנו כי מתאם פירסון בריבוע ( ‪ )r‬משקף את טיב מודל הניבוי ‪ -‬ככל שמדד‬‫‪2‬‬ ‫‪Y‬‬ ‫הקשר מתרחק יותר מכיוון ה‪ ,0-‬טיב הניבוי גדל‪ ,‬ולהיפך‪.‬ניתן להבחין בשני מקרי‬ ‫קיצון‪ )1 :‬מצב של קשר מלא (‪ )r2=1‬בו הניבוי מדויק ‪ -‬שונות הטעויות שווה לאפס (‬ ‫) ‪SY2 S(2~y‬‬ ‫)‪.‬‬ ‫‪2‬‬ ‫) ושונות הניבויים שווה לשונות‪S( e ) 0‬‬ ‫הכללית (‬ ‫‪2‬‬ ‫‪S‬‬ ‫‪0‬‬ ‫הניבויים ) ‪~y‬שווה‬ ‫(‬ ‫‪ )2‬מצב בו אין קשר ליניארי (‪ )r2=0‬ואין יכולות ניבוי ליניארית ‪ -‬שונות‬ ‫‪2‬‬ ‫‪2‬‬ ‫)‪.‬‬ ‫‪S‬‬‫‪Y‬‬ ‫‪‬‬ ‫‪S‬‬ ‫הטעויות שווה לשונות הכללית (‬ ‫(‬ ‫)‪e‬‬ ‫) ושונות‬ ‫לאפס (‬ ‫‪ -‬במונחים של ניתוח שונות‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫‪2‬‬ ‫)‬ ‫‪SY‬‬ ‫המשתנה התלוי (‬ ‫במצב בו ישנם שני משתנים ב"ת (או יותר)‪ ,‬השונות הכללית של‬ ‫‪2‬‬ ‫‪2‬‬ ‫) ואת שונות‬ ‫הניבויים‪( S‬‬ ‫) ‪(e‬‬ ‫) ‪S( ~y‬‬ ‫להגדיר את שונות‬ ‫מתחלקת למספר רכיבים מהם ניתן‬ ‫הקשר הליניארי בין המשתנה‬ ‫השטח הנותר‬ ‫)‪.‬‬ ‫הטעויות (‬ ‫התלוי (‪ )Y‬לב"ת ‪x1‬‬ ‫(פסיכומטרי)‪.‬‬ ‫משקף את שונות הטעויות) ‪S(e(2‬‬ ‫)‬ ‫‪2‬‬ ‫‪SY2‬‬ ‫‪1 r‬‬ ‫) ‪( Y. x1 x 2‬‬ ‫) ‪S(e2‬‬ ‫‪Y‬‬ ‫או‬ ‫‪Y‬‬ ‫) ‪SY2 S(2Y~. x1 x 2 )  S(2e‬‬ ‫) ‪S(2~y‬‬ ‫‪x2‬‬ ‫שטח חופף‬ ‫‪x1‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫משקף את שונות הניבויים (‬ ‫‪x2‬‬ ‫‪x1‬‬ ‫‪S‬‬ ‫) ‪( ~y‬‬ ‫) ‪S(Y~. x1 x 2‬‬ ‫)‬ ‫הקשר הליניארי בין‬ ‫בריבוע‪r(2Y. x(1x‬‬ ‫)‪2‬‬ ‫או את המתאם המרובה‬ ‫) ‪S(2Y~. x1x 2‬‬ ‫‪SSRe g‬‬ ‫המשתנה התלוי (‪ )Y‬לב"ת‬ ‫)‬ ‫‪r‬‬ ‫‪2‬‬ ‫‪‬‬ ‫‪‬‬ ‫) ‪( Y. x1 x 2‬‬ ‫‪( x2‬בגרות)‪.‬‬ ‫‪SY2‬‬ ‫‪SST‬‬ ‫ניתוח השונות בודק את השאלה האם שני המשתנים הבלתי תלויים גם יחד – הפסיכומטרי‬ ‫והבגרות – מנבאים את ההצלחה בלימודים באופן מובהק; כלומר‪( ,‬האם משטח הרגרסיה‬ ‫מקביל לציר ‪ ? X‬או האם המתאם באוכלוסייה בין ההצלחה בלימודים לבין שני החזאים גם יחד‬ ‫גדול מ‪ ?0 -‬מתאם זה מכונה מתאם מרובה‪ ,‬והוא המתאם בין ההצלחה בלימודים לבין שני‬ ‫החזאים גם יחד (סימונו ‪( )rY.x1x2‬סימנו של המתאם המרובה יהיה תמיד חיובי)‪.‬‬ ‫‪ -‬במונחים של ניתוח שונות‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫דוגמה ‪ – 2‬מתאם מרובה (פלט ‪)SPSS‬‬ ‫‪Y‬‬ ‫המתאם המרובה – המתאם בין‬ ‫המשתנה התלוי‪ /‬מנובא (‪ - Y‬ממוצע‬ ‫שנה א') לבין שני המשתנים‬ ‫‪r(Y. x1 x 2 ) r(Y.12 ) 0.347‬‬ ‫) ‪r(Y2.12‬‬ ‫ב"ת‪/‬מנבאים‬ ‫(‪ – x1‬פסיכומטרי‪ ,‬ו‪ - x2-‬בגרות)‪.‬‬ ‫‪x2‬‬ ‫‪x1‬‬ ‫ריבוע המתאם‬ ‫‪r(2Y. x1x 2 ) 0.3472 0.120‬‬ ‫המרובה‬ ‫המתאם המרובה שווה ‪ 0.347‬והוא גבוה יותר מכל אחד מהמתאמים הפשוטים של כל‬ ‫חזאי עם ההצלחה בלימודים (‪ 0.304‬עם הבגרות ו‪ 0.206 -‬עם הפסיכומטרי)‪.‬לפיכך‪,‬‬ ‫המתאם המרובה יהיה לפחות גבוה כמו המתאם הפשוט הגבוה מבין שני המתאמים‬ ‫הפשוטים של שני החזאים עם המ"ת‪ ,‬וערכו המרבי של המתאם המרובה הוא פונקציה‬ ‫של שני המתאמים הפשוטים (כאשר המתאם בין שני החזאים – המב"ת – הוא ‪,0‬‬ ‫לסכום ריבועי שני המתאמים הפשוטים)‪r( x1 x 2 ) r(12 ) 0.‬‬ ‫‪r‬‬ ‫‪2‬‬ ‫שווה‬ ‫‪Y‬‬ ‫המרובה‬ ‫המתאם‬ ‫‪2‬‬ ‫ריבוע‬ ‫‪r‬‬‫‪(Y‬‬ ‫)‪1‬‬ ‫) ‪(Y 2‬‬ ‫המתאם‬ ‫) ‪r(2Y. x1 x 2 ) r(2Y.12 ) r(2Y 1)  r(2Y 2‬‬ ‫‪x2‬‬ ‫המרובה‬ ‫‪x1‬‬ ‫‪ -‬במונחים של ניתוח שונות‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫דוגמה ‪ – 3‬ניתוח שונות (פלט ‪)SPSS‬‬ ‫‪Y‬‬ ‫‪SSRe s‬‬ ‫‪SSRe g‬‬ ‫‪SSRe g‬‬ ‫‪196.647‬‬ ‫‪MS Re g ‬‬ ‫‪‬‬ ‫‪98.324‬‬ ‫‪df Re g‬‬ ‫‪2‬‬ ‫‪x2‬‬ ‫‪x1‬‬ ‫‪MS Re g‬‬ ‫‪98.324‬‬ ‫סטטיסטי‬ ‫‪F( k ,n  1 k ) ‬‬ ‫) ‪ F( 2,64‬‬ ‫‪4.3‬‬ ‫המבחן‬ ‫‪=k‬מס' מנבאים‬ ‫‪MS Re s‬‬ ‫‪22.445‬‬ ‫‪SS Re s 1436.481‬‬ ‫‪MS Re s ‬‬ ‫‪‬‬ ‫‪22.445‬‬ ‫‪df Re s‬‬ ‫‪64‬‬ ‫דרגות החופש של הרגרסיה הן ‪ – 2‬כמספר המשתנים הבלתי תלויים‪.‬‬ ‫הבדיקה מורה כי המתאם המרובה באוכלוסייה בין שני החזאים לבין הצלחה בלימודים‬ ‫גבוה מ‪.)sig=0.016( 0 -‬‬ ‫שימו לב‪ ,‬כי ההשערה חייבת להיות דו‪-‬צדדית (לא ניתן לחלק את ה‪ sig-‬ב‪ ,)2-‬שכן למונה יש ‪2‬‬ ‫דרגות חופש ואינו מקיים את הקשר ‪ - t2=F‬אשר מצריך דרגת חופש אחת בלבד במונה‪.‬‬ ‫‪ -‬במונחים של ניתוח שונות‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫דוגמה ‪ – 4‬ניתוח שונות (באמצעות המתאם המרובה ‪)rY.12‬‬ ‫‪SST SSRe g  SSRe s‬‬ ‫ריבוע המתאם המרובה‬ ‫‪SS Re g‬‬ ‫משקף את היחס בין‬ ‫‪r(2Y.12 ) 0.3472 0.120  r(2Y.12 ) ‬‬ ‫‪Y‬‬ ‫שונות הניבויים לשונות‬ ‫‪SST‬‬ ‫‪SSRe s‬‬ ‫הכללית‪.‬‬ ‫‪SSRe g‬‬ ‫‪MS Re g‬‬ ‫‪r2‬‬ ‫‪F( k ,n  1 k ) ‬‬ ‫‪ F( k ,n  1 k ) ‬‬ ‫‪k‬‬ ‫‪x2‬‬ ‫‪x1‬‬ ‫‪2‬‬ ‫‪MS Re s‬‬ ‫) ‪(1  r‬‬ ‫) ‪(n  1  k‬‬ ‫‪r2‬‬ ‫‪0.12‬‬ ‫תוצאה דומה לסטטיסטי מבחן‬ ‫‪F( k ,n  1 k ) ‬‬ ‫‪k‬‬ ‫) ‪ F( 2,64‬‬ ‫‪‬‬ ‫‪2‬‬ ‫‪4.3‬‬ ‫)‪(1  0.12‬‬ ‫ה‪ F-‬שחושב בשקופית‬ ‫) ‪(1  r 2‬‬ ‫הקודמת‪.‬‬ ‫) ‪(n  1  k‬‬ ‫‪64‬‬ ‫ניתוח שונות זה מקביל לזה שנלמד לגבי רגרסיה פשוטה וניתוחי שונות – שיעור ‪8‬‬ ‫(שקופיות ‪.)21-22‬‬ ‫‪ -‬במונחים של ניתוח שונות‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫) של המשתנה התלוי במדגם (‪ )Y‬ניתן לחלק ל‪ 4 -‬מרכיבים‪:‬‬ ‫‪SY2‬‬ ‫הכללית (‬ ‫את השונות‬ ‫) ‪D S(e2‬‬ ‫‪Y‬‬ ‫‪B S‬‬ ‫‪2‬‬ ‫~‬ ‫‪D‬‬ ‫) ‪A S(2Y~x1. x 2‬‬ ‫)‪(Y x 2. x1‬‬ ‫‪B‬‬ ‫‪A‬‬ ‫‪C‬‬ ‫‪x2‬‬ ‫‪x1‬‬ ‫‪ )1‬השונות במשתנה התלוי המנובאת על ידי הציון הפסיכומטרי אך אינה מנובאת על ידי‬ ‫ממוצע הבגרות – ‪A‬‬ ‫‪ )2‬השונות במשתנה התלוי המנובאת על ידי ממוצע הבגרות אך אינה מנובאת על ידי הציון‬ ‫הפסיכומטרי ‪B -‬‬ ‫‪ )3‬השונות במשתנה התלוי המנובאת גם על ידי הציון הפסיכומטרי וגם על ידי ממוצע‬ ‫הבגרות ‪C -‬‬ ‫‪ )4‬שונות הטעות (השארית) במשתנה התלוי שאינה מנובאת על ידי הציון הפסיכומטרי ולא‬ ‫‪ -‬במונחים של ניתוח שונות‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫‪2‬‬ ‫‪S‬‬ ‫השונות הכללית‬ ‫באמצעות ארבעת רכיבים אלו ניתן להגדיר מספר חלקים מתוך ‪Y‬‬ ‫‪Y‬‬ ‫שונות כללית של‬ ‫‪Y‬‬ ‫‪SY2 55 25‬‬ ‫נתון‪:‬‬ ‫‪D‬‬ ‫‪B‬‬ ‫‪A‬‬ ‫ריבוע המתאם‬ ‫‪r(2Y. x1x 2 ) 0.3472 0.120‬‬ ‫‪C‬‬ ‫המרובה‬ ‫‪x2‬‬ ‫‪x1‬‬ ‫‪ )1‬השונות שונות הציונים המנובאים על ידי הפסיכומטרי או הבגרות או שניהם היא בתרשים‬ ‫‪ A+B+C‬והיא תהיה שווה לשונות הכללית כפול פרופורציה של שונות מנובאת על ידי שני‬ ‫החזאים (מתאם מרובה בריבוע)‬ ‫‪Y‬‬ ‫‪A  B  C  S(2Y~. x1 x 2 ) r(2Y. x1 x 2 ) SY2‬‬ ‫) ‪S(2Y~. x1 x 2‬‬ ‫‪x2‬‬ ‫‪x1‬‬ ‫‪S(2Y~. x1x 2 ) 0.3472 25 3‬‬ ‫‪ -‬במונחים של ניתוח שונות‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫ניתן לחשב שונות ) ‪S(e2‬‬ ‫הניבויים~‪S(2~y ) S(2Y‬‬ ‫) ‪. x1 x 2‬‬ ‫‪ )2‬כעת שאנו יודעים מהי שונות ‪3‬‬ ‫(שארית ‪)D2 -‬‬ ‫‪2‬‬ ‫הטעויות‪2‬‬ ‫‪Y‬‬ ‫) ‪SY S( ~y )  S( e‬‬ ‫‪D‬‬ ‫שכן‪,‬‬ ‫‪B‬‬ ‫‪A‬‬ ‫‪C‬‬ ‫‪x2‬‬ ‫‪D  S(2e ) SY2  S(2~y ) S(2e ) 25  3 S(2e ) 22‬‬ ‫‪x1‬‬ ‫מכאן‪,‬‬ ‫ניתן גם לחשב כך‪,‬‬ ‫‪D  S(2e ) (1  r(2Y. x1 x 2 ) ) SY2‬‬ ‫‪S(e2 ) Y‬‬ ‫) ‪S(2Y~. x1 x 2‬‬ ‫‪S(2e ) (1  0.3472 ) 25 22‬‬ ‫‪x2‬‬ ‫‪x1‬‬ ‫‪ -‬במונחים של ניתוח שונות‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫‪ )3‬שונות הציונים המנובאים על ידי הפסיכומטרי היא בתרשים ‪ ,A+C‬והיא תהיה שווה‬ ‫לשונות הכללית כפול פרופורציה של שונות מנובאת על ידי הפסיכומטרי (‪:)1X‬‬ ‫‪Y‬‬ ‫‪D‬‬ ‫נתון‪:‬‬ ‫‪B‬‬ ‫‪A‬‬ ‫‪C‬‬ ‫שונות כללית של‬ ‫‪Y‬‬ ‫‪SY2 55 25‬‬ ‫‪x2‬‬ ‫‪x1‬‬ ‫ריבוע המתאם בין‬ ‫פסיכומטרי (‪ )x1‬לממוצע שנה‬ ‫‪r(2Yx1) 0.2062 0.042‬‬ ‫א' (‪)Y‬‬ ‫‪Y‬‬ ‫‪A  C  S(2Y~x1) r(2Yx1) SY2‬‬ ‫)‪S(2Y~x1‬‬ ‫‪x2‬‬ ‫‪S(2Y~x1) 0.2062 25 1‬‬ ‫‪x1‬‬ ‫‪ -‬במונחים של ניתוח שונות‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫‪ )4‬שונות הציונים המנובאים על ידי הבגרות היא בתרשים ‪ ,B+C‬והיא תהיה שווה‬ ‫לשונות הכללית כפול פרופורציה של שונות מנובאת על ידי הבגרות (‪:) X‬‬ ‫‪Y2‬‬ ‫‪D‬‬ ‫נתון‪:‬‬ ‫‪B‬‬ ‫‪A‬‬ ‫‪C‬‬ ‫שונות כללית של‬ ‫‪Y‬‬ ‫‪SY2 55 25‬‬ ‫‪x2‬‬ ‫‪x1‬‬ ‫ריבוע המתאם בין‬ ‫הבגרות (‪ )x2‬לממוצע שנה א'‬ ‫‪r(2Yx 2 ) 0.3042 0.092‬‬ ‫( ‪)Y‬‬ ‫‪B  C  S(2Y~x 2 ) r(2Yx 2 ) SY2‬‬ ‫‪Y‬‬ ‫) ‪S(2Y~x 2‬‬ ‫‪x2‬‬ ‫‪S(2Y~x 2 ) 0.3042 25 2.3‬‬ ‫‪x1‬‬ ‫‪ -‬במונחים של ניתוח שונות‬ ‫סטטיסטיקה ג' ‪ -‬רגרסיה מרובה‬ ‫שיעור ‪10‬‬ ‫ד“ר גבריאל צור‬ ‫‪ )5‬השונות במשתנה התלוי המנובאת על ידי שני המנבאים גם יחד היא ‪ C‬והיא תהיה‬ ‫‪Y‬‬ ‫שווה לסכום תוצאות משוואות ‪ 3‬ו ‪ 4‬פחות התוצאה ‪Y‬של משוואה ‪:1‬‬ ‫‪D‬‬ ‫‪B‬‬ ‫) ‪C ( A  C )  ( B  C )  ( A  B  C‬‬ ‫‪A‬‬ ‫‪C‬‬ ‫‪C‬‬ ‫‪x2‬‬ ‫‪x2‬‬ ‫‪C 1  2.3  3 0.3‬‬ ‫‪x1‬‬ ‫‪x1‬‬ ‫ולכן פלחי השונות המנובאים באופן ייחודי על ידי שני החזאים הם‪:‬‬ ‫‪ - A )6‬ע"י הפסיכומטרי (‪)x1‬‬ ‫‪A ( A  C )  C A 1  0.3 0.7‬‬ ‫‪ - B )7‬ע"י הבגרות (‪)x2‬‬ ‫‪B ( B  C )  C B 2.3  0.3 2‬‬ ‫ואכן תוצאה זו תואמת את העובדה שקיבלנו תרומה ייחודית מובהקת בניבוי הבגרות‬ ‫כאשר ציון הפסיכומטרי מוחזק קבוע ולעומת זאת לא קיבלנו תרומה ייחודית מובהקת‬ ‫לציון פסיכומטרי כאשר ציון הבגרות מוחזק קבוע‪.‬‬

Use Quizgecko on...
Browser
Browser