Summary

This document discusses linear regression and its uses in statistics and data analysis. It covers core concepts like correlation and the least squares method. The examples help illustrate the application of linear regression.

Full Transcript

‫اﻻنحدار الخطي‬ ‫‪Linear Regression‬‬ ‫د‪.‬أحمد أبودوش‬ ‫قسم علم النفس‪ ،‬كلية اﻵداب‪ ،‬الجامعة اﻷردنية‬ ‫اﻻنحدار ‪Regression‬‬ ‫ هو مصطلح يستخدم في اﻹحصاء وعلم البيانات للدﻻلة على عملية تقدير العﻼقة بين‬...

‫اﻻنحدار الخطي‬ ‫‪Linear Regression‬‬ ‫د‪.‬أحمد أبودوش‬ ‫قسم علم النفس‪ ،‬كلية اﻵداب‪ ،‬الجامعة اﻷردنية‬ ‫اﻻنحدار ‪Regression‬‬ ‫ هو مصطلح يستخدم في اﻹحصاء وعلم البيانات للدﻻلة على عملية تقدير العﻼقة بين‬ ‫متغيرين أو أكثر‪.‬‬ ‫ يستخدم اﻻنحدار لفهم كيف يؤثر تغير في متغير واحد على متغير آخر‪.‬يتم ذلك عادة ً عن‬ ‫طريق إيجاد خطوط أو منحنيات تقديرية تمثل العﻼقة بين هذه المتغيرات‪.‬‬ ‫ المربعات الصغرى ‪ least squares‬هي طريقة تستخدم في تحليل اﻻنحدار لتقدير‬ ‫معامﻼت النموذج الخطي‪.‬الهدف من نهج المربعات الصغرى هو إيجاد الخط )أو المنحنى‬ ‫في الحاﻻت اﻷكثر عمومية( الذي يقلل من مجموع اﻻختﻼفات التربيعية بين القيم‬ ‫المرصودة والمتوقعة‪.‬‬ ‫اﻻنحدار واﻻرتباط‬ ‫ اﻻنحدار واﻻرتباطية هما مفاهيم مرتبطة بتحليل العﻼقات بين المتغيرات‪.‬يساعد تحليل اﻻنحدار في فهم‬ ‫مؤشرا على‬ ‫ً‬ ‫كيف يتغير التأثير على المتغير التابع تحت تأثير المتغير المستقل‪ ،‬بينما يوفر معامل اﻻرتباط‬ ‫قوة واتجاه هذه العﻼقة بشكل عام‪.‬‬ ‫‪ (1.‬اﻻرتباطية ‪Correlation):‬‬ ‫‪ -‬تقييم لقوة واتجاه العﻼقة بين اثنين من المتغيرات‪.‬‬ ‫‪ -‬يستخدم معامل اﻻرتباط ) )‪correlation coefficient‬لقياس هذه العﻼقة‪ ،‬حيث يمكن أن يكون اﻻرتباط‬ ‫إيجابيًا )عندما يتحرك اﻻتجاهان في نفس اﻻتجاه( أو سلبيًا )عندما يتحركا في اتجاهين معاكسين( أو غير‬ ‫موجود )عندما ﻻ يكون هناك ارتباط(‪.‬‬ ‫ ‪ (2‬اﻻنحدار )‪Regression):‬‬ ‫ ‪ -‬يركز على تحليل العﻼقة بين متغير تابع ‪)dependent variable‬المتغير الذي نحاول التنبؤ به(‬ ‫ومتغير أو أكثر مستقلين ‪)independent variables‬المتغيرات التي يتم استخدامها للتنبؤ(‪.‬‬ ‫ ‪ -‬يهدف إلى إيجاد نموذج رياضي يصف العﻼقة بين هذه المتغيرات‪.‬‬ ‫مثال‬ ‫ لنفرض أن لدينا بيانات حول درجات الطﻼب في امتحانهم النهائي )متغير التابع( وعدد ساعات الدراسة قبل اﻻمتحان )متغير‬ ‫مستقل(‪.‬نريد معرفة كيف يمكننا استخدام اﻻنحدار واﻻرتباط لفهم العﻼقة بين هاتين المتغيرتين‪.‬‬ ‫ ‪.1‬اﻻنحدار‪:‬‬ ‫ ‪ -‬نستخدم تحليل اﻻنحدار ﻹيجاد نموذج رياضي يصف كيف يتغير متوسط درجات الطﻼب بنا ًء على عدد ساعات الدراسة‪.‬‬ ‫ ‪ -‬قد يكون النموذج الرياضي عبارة عن خط يمثل العﻼقة بين الدرجات وعدد ساعات الدراسة‪.‬على سبيل المثال‪ ،‬يمكن أن‬ ‫يكون النموذج‪" :‬درجات = )عدد ساعات الدراسة × وزن اﻻنحدار( ‪ +‬الثابت‪".‬‬ ‫ ‪.2‬اﻻرتباط‪:‬‬ ‫ ‪ -‬نستخدم معامل اﻻرتباط لتحديد قوة واتجاه العﻼقة بين درجات الطﻼب وعدد ساعات الدراسة‪.‬‬ ‫ ‪ -‬إذا كان معامل اﻻرتباط إيجابيًا قويًا‪ ،‬فهذا يعني أن زيادة في عدد ساعات الدراسة تتزامن مع زيادة في درجات الطﻼب‬ ‫بشكل قوي‪.‬في حالة اﻻرتباط السلبي‪ ،‬تكون العﻼقة عكسية‪ ،‬حيث زيادة في عدد ساعات الدراسة تتزامن مع انخفاض في‬ ‫درجات الطﻼب‪.‬‬ ‫ عدد ساعات الدراسة ]‪[6 ,12 ,3 ,8 ,5‬‬ ‫ درجات الطﻼب ‪[78 ,88 ,60 ,92 ,75] :‬‬ ‫ نريد اﻵن استخدام تحليل اﻻنحدار لفهم كيف يمكننا توقع درجات الطﻼب باستناد إلى عدد ساعات الدراسة‪.‬‬ ‫‪.1‬اﻻنحدار‪:‬‬ ‫ ‬ ‫‪ -‬نحتاج إلى حساب وزن اﻻنحدار والثابت في نموذج اﻻنحدار‪.‬يمكن استخدام أسلوب اﻷصغر مربع لحساب هذه القيم‪.‬‬ ‫ ‬ ‫‪ -‬فلنفترض أن النموذج الذي حصلنا عليه هو‪ :‬الدرجة المتوقعة = )عدد ساعات الدراسة *‪50+ (7‬‬ ‫ ‬ ‫لنفترض أن طالبًا جديدًا قضى ‪ 10‬ساعات في الدراسة‪ ،‬يمكننا حساب الدرجات المتوقعة‪:‬‬ ‫ ‬ ‫ )‪120=50+(10*7‬‬ ‫هناك أنواع مختلفة من تحليل اﻻنحدار‪ ،‬ومن بينها‪:‬‬ ‫‪.1‬اﻻنحدار الخطي ‪*Linear Regression‬‬ ‫‪ -‬يفترض وجود عﻼقة خطية بين المتغيرات‪.‬‬ ‫‪ -‬الهدف هو العثور على خط يمثل بشكل جيد العﻼقة بين المتغير المستقل والتابع‪.‬‬ ‫‪.2‬اﻻنحدار غير الخطي ‪Non-linear Regression‬‬ ‫‪ -‬يستخدم عندما ﻻ تكون العﻼقة بين المتغيرات خطية‪.‬‬ ‫‪ -‬يمكن استخدام وظائف غير خطية للتنبؤ بالقيم‪.‬‬ ‫ ‪.3‬اﻻنحدار المتعدد ‪Multiple Regression‬‬ ‫ ‪ -‬يتم استخدامه عندما يكون هناك أكثر من متغير مستقل يؤثر على المتغير التابع‪.‬‬ ‫ ‪ -‬يسمح بتحليل التأثير المتزامن لعدة متغيرات‪.‬‬ ‫ ‪.4‬انحدار التسلسل الزمني ‪Time Series Regression‬‬ ‫ ‪ -‬يستخدم عند التعامل مع البيانات التي تعتمد على الزمن‪ ،‬مثل البيانات الزمنية‪.‬‬ ‫ ‪5‬‬ ‫‪ (5‬اﻻنحدار اللوجستي ‪Logistic regression‬‬ ‫ هو نوع من تحليل اﻻنحدار المستخدم للتنبؤ باحتمال وقوع حدث ما‪.‬يتم استخدامه بشكل‬ ‫شائع عندما يكون المتغير التابع ثنائيا )فئتان( ‪ ،‬مثل ‪ 0‬أو ‪ ، 1‬نعم أو ﻻ ‪ ،‬صواب أو خطأ‪.‬‬ ‫يستخدم نموذج اﻻنحدار اللوجستي الدالة اللوجستية )الدالة السيني( لنمذجة احتمال الحدث‬ ‫كدالة لمتغير مستقل واحد أو أكثر‪.‬‬ ‫ تضمن الوظيفة اللوجستية أن اﻻحتماﻻت المتوقعة تقع بين ‪ 0‬و ‪.1‬يستخدم اﻻنحدار‬ ‫اللوجستي على نطاق واسع في مشاكل التصنيف ‪ ،‬مثل اكتشاف البريد العشوائي ‪spam‬‬ ‫‪ detection‬والتشخيص الطبي وغيرها‪.‬‬ ‫تطبيق عملي على إيجاد قيمة اﻻنحدار الخطي بين متغيرين مستقل وتابع باستخدام ‪RStudio‬‬ Call: lm(formula = (‫درجات_الطﻼب ~ عدد_ساعات_الدراسة‬ Residuals: 1 2 3 4 5 1.885 9.744 -7.021 -6.444 1.838 Coefficients: Estimate Std. Error t value Pr(>|t|) ‫تفسير النتائج‬ (Intercept) 57.880. 0.0803 2.601 1.172 8.736 6.626 0.0070 ** 3.047 ‫عدد_ساعات_الدراسة‬ --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 8.014 on 3 degrees of freedom Multiple R-squared: 0.6928, Adjusted R-squared: 0.5904 F-statistic: 6.765 on 1 and 3 DF, p-value: 0.08031 ‫مثال تطبيقي على عملية إحصاء‬ ‫وصفي‪:‬‬ ‫ إذا كان هناك مجموعة من المشاركين في دراسة تجريبية لقياس‬ ‫أثر استخدام تدريب اﻻسترجاع قبل النوم على التحصيل‬ ‫الدراسي لدرجات من ‪ 30‬عﻼمة‪.‬‬ ‫‪.1‬حدد الفرضيات المستخدمة ﻻيجاد نتائج اﻷثر إحصائيا ً علما ً‬ ‫بأن القياس لمستوى التحصيل تم قبل وبعد تطبيق التدريب‪.‬‬ ‫أوجد النتائج الوصفية لمقاييس النزعة المركزية والتشتت‬ ‫‪.2‬‬ ‫الممكنة مع التعليل‪ ،‬علما ً بأن عدد المشاركين هو ‪ 50‬والوسط‬ ‫الحسابي هو ‪) 23‬تعطى القراءات الخام أو يُطلب تكوينها(‬ ‫أوجد ناتج التحليل اﻻحصائي باستخدام ‪RStudio‬‬ ‫‪.3‬‬ ‫فسر النتائج ذاكرا ً عﻼقتها بالفرضيات‬ ‫‪.4‬‬

Use Quizgecko on...
Browser
Browser