Linear Regression - PDF
Document Details
Uploaded by SurrealClarinet
University of Jordan
Ahmed Abudoush
Tags
Summary
This document discusses linear regression and its uses in statistics and data analysis. It covers core concepts like correlation and the least squares method. The examples help illustrate the application of linear regression.
Full Transcript
اﻻنحدار الخطي Linear Regression د.أحمد أبودوش قسم علم النفس ،كلية اﻵداب ،الجامعة اﻷردنية اﻻنحدار Regression هو مصطلح يستخدم في اﻹحصاء وعلم البيانات للدﻻلة على عملية تقدير العﻼقة بين...
اﻻنحدار الخطي Linear Regression د.أحمد أبودوش قسم علم النفس ،كلية اﻵداب ،الجامعة اﻷردنية اﻻنحدار Regression هو مصطلح يستخدم في اﻹحصاء وعلم البيانات للدﻻلة على عملية تقدير العﻼقة بين متغيرين أو أكثر. يستخدم اﻻنحدار لفهم كيف يؤثر تغير في متغير واحد على متغير آخر.يتم ذلك عادة ً عن طريق إيجاد خطوط أو منحنيات تقديرية تمثل العﻼقة بين هذه المتغيرات. المربعات الصغرى least squaresهي طريقة تستخدم في تحليل اﻻنحدار لتقدير معامﻼت النموذج الخطي.الهدف من نهج المربعات الصغرى هو إيجاد الخط )أو المنحنى في الحاﻻت اﻷكثر عمومية( الذي يقلل من مجموع اﻻختﻼفات التربيعية بين القيم المرصودة والمتوقعة. اﻻنحدار واﻻرتباط اﻻنحدار واﻻرتباطية هما مفاهيم مرتبطة بتحليل العﻼقات بين المتغيرات.يساعد تحليل اﻻنحدار في فهم مؤشرا على ً كيف يتغير التأثير على المتغير التابع تحت تأثير المتغير المستقل ،بينما يوفر معامل اﻻرتباط قوة واتجاه هذه العﻼقة بشكل عام. (1.اﻻرتباطية Correlation): -تقييم لقوة واتجاه العﻼقة بين اثنين من المتغيرات. -يستخدم معامل اﻻرتباط ) )correlation coefficientلقياس هذه العﻼقة ،حيث يمكن أن يكون اﻻرتباط إيجابيًا )عندما يتحرك اﻻتجاهان في نفس اﻻتجاه( أو سلبيًا )عندما يتحركا في اتجاهين معاكسين( أو غير موجود )عندما ﻻ يكون هناك ارتباط(. (2اﻻنحدار )Regression): -يركز على تحليل العﻼقة بين متغير تابع )dependent variableالمتغير الذي نحاول التنبؤ به( ومتغير أو أكثر مستقلين )independent variablesالمتغيرات التي يتم استخدامها للتنبؤ(. -يهدف إلى إيجاد نموذج رياضي يصف العﻼقة بين هذه المتغيرات. مثال لنفرض أن لدينا بيانات حول درجات الطﻼب في امتحانهم النهائي )متغير التابع( وعدد ساعات الدراسة قبل اﻻمتحان )متغير مستقل(.نريد معرفة كيف يمكننا استخدام اﻻنحدار واﻻرتباط لفهم العﻼقة بين هاتين المتغيرتين. .1اﻻنحدار: -نستخدم تحليل اﻻنحدار ﻹيجاد نموذج رياضي يصف كيف يتغير متوسط درجات الطﻼب بنا ًء على عدد ساعات الدراسة. -قد يكون النموذج الرياضي عبارة عن خط يمثل العﻼقة بين الدرجات وعدد ساعات الدراسة.على سبيل المثال ،يمكن أن يكون النموذج" :درجات = )عدد ساعات الدراسة × وزن اﻻنحدار( +الثابت". .2اﻻرتباط: -نستخدم معامل اﻻرتباط لتحديد قوة واتجاه العﻼقة بين درجات الطﻼب وعدد ساعات الدراسة. -إذا كان معامل اﻻرتباط إيجابيًا قويًا ،فهذا يعني أن زيادة في عدد ساعات الدراسة تتزامن مع زيادة في درجات الطﻼب بشكل قوي.في حالة اﻻرتباط السلبي ،تكون العﻼقة عكسية ،حيث زيادة في عدد ساعات الدراسة تتزامن مع انخفاض في درجات الطﻼب. عدد ساعات الدراسة ][6 ,12 ,3 ,8 ,5 درجات الطﻼب [78 ,88 ,60 ,92 ,75] : نريد اﻵن استخدام تحليل اﻻنحدار لفهم كيف يمكننا توقع درجات الطﻼب باستناد إلى عدد ساعات الدراسة. .1اﻻنحدار: -نحتاج إلى حساب وزن اﻻنحدار والثابت في نموذج اﻻنحدار.يمكن استخدام أسلوب اﻷصغر مربع لحساب هذه القيم. -فلنفترض أن النموذج الذي حصلنا عليه هو :الدرجة المتوقعة = )عدد ساعات الدراسة *50+ (7 لنفترض أن طالبًا جديدًا قضى 10ساعات في الدراسة ،يمكننا حساب الدرجات المتوقعة: )120=50+(10*7 هناك أنواع مختلفة من تحليل اﻻنحدار ،ومن بينها: .1اﻻنحدار الخطي *Linear Regression -يفترض وجود عﻼقة خطية بين المتغيرات. -الهدف هو العثور على خط يمثل بشكل جيد العﻼقة بين المتغير المستقل والتابع. .2اﻻنحدار غير الخطي Non-linear Regression -يستخدم عندما ﻻ تكون العﻼقة بين المتغيرات خطية. -يمكن استخدام وظائف غير خطية للتنبؤ بالقيم. .3اﻻنحدار المتعدد Multiple Regression -يتم استخدامه عندما يكون هناك أكثر من متغير مستقل يؤثر على المتغير التابع. -يسمح بتحليل التأثير المتزامن لعدة متغيرات. .4انحدار التسلسل الزمني Time Series Regression -يستخدم عند التعامل مع البيانات التي تعتمد على الزمن ،مثل البيانات الزمنية. 5 (5اﻻنحدار اللوجستي Logistic regression هو نوع من تحليل اﻻنحدار المستخدم للتنبؤ باحتمال وقوع حدث ما.يتم استخدامه بشكل شائع عندما يكون المتغير التابع ثنائيا )فئتان( ،مثل 0أو ، 1نعم أو ﻻ ،صواب أو خطأ. يستخدم نموذج اﻻنحدار اللوجستي الدالة اللوجستية )الدالة السيني( لنمذجة احتمال الحدث كدالة لمتغير مستقل واحد أو أكثر. تضمن الوظيفة اللوجستية أن اﻻحتماﻻت المتوقعة تقع بين 0و .1يستخدم اﻻنحدار اللوجستي على نطاق واسع في مشاكل التصنيف ،مثل اكتشاف البريد العشوائي spam detectionوالتشخيص الطبي وغيرها. تطبيق عملي على إيجاد قيمة اﻻنحدار الخطي بين متغيرين مستقل وتابع باستخدام RStudio Call: lm(formula = (درجات_الطﻼب ~ عدد_ساعات_الدراسة Residuals: 1 2 3 4 5 1.885 9.744 -7.021 -6.444 1.838 Coefficients: Estimate Std. Error t value Pr(>|t|) تفسير النتائج (Intercept) 57.880. 0.0803 2.601 1.172 8.736 6.626 0.0070 ** 3.047 عدد_ساعات_الدراسة --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 8.014 on 3 degrees of freedom Multiple R-squared: 0.6928, Adjusted R-squared: 0.5904 F-statistic: 6.765 on 1 and 3 DF, p-value: 0.08031 مثال تطبيقي على عملية إحصاء وصفي: إذا كان هناك مجموعة من المشاركين في دراسة تجريبية لقياس أثر استخدام تدريب اﻻسترجاع قبل النوم على التحصيل الدراسي لدرجات من 30عﻼمة. .1حدد الفرضيات المستخدمة ﻻيجاد نتائج اﻷثر إحصائيا ً علما ً بأن القياس لمستوى التحصيل تم قبل وبعد تطبيق التدريب. أوجد النتائج الوصفية لمقاييس النزعة المركزية والتشتت .2 الممكنة مع التعليل ،علما ً بأن عدد المشاركين هو 50والوسط الحسابي هو ) 23تعطى القراءات الخام أو يُطلب تكوينها( أوجد ناتج التحليل اﻻحصائي باستخدام RStudio .3 فسر النتائج ذاكرا ً عﻼقتها بالفرضيات .4