آمار - جلسه 2 PDF
Document Details
Uploaded by ExcellentFir
Tags
Summary
این سند خلاصه ای از جلسه دوم آمار است. مباحثی مانند تعریف و کاربرد علم آمار، انواع متغیرها و مقیاس های اندازه گیری(nominal, ordinal, interval, ratio) در آن بررسی شده است. همچنین، مفهوم داده خام (data) و کاربردهای آن توضیح داده شده است.
Full Transcript
جلسه دوم آمار خالصه ای از جلسه قبل تعریف آمار علمی است که به جمع آوری دیتا میپردازد ،وقتی انبوهی از دیتا در اختیارمان قرار میگیرد باید بتوانیم آن را پاالیش و ویرایش کنیم و آماده...
جلسه دوم آمار خالصه ای از جلسه قبل تعریف آمار علمی است که به جمع آوری دیتا میپردازد ،وقتی انبوهی از دیتا در اختیارمان قرار میگیرد باید بتوانیم آن را پاالیش و ویرایش کنیم و آماده سازی کنیم برای توصیف و تجزیه و تحیل و تفسیر داده ها .بنابراین آمار علم جمع آوری داده هاست که پس از خالصه سازی به توصیف و تحلیل و تفسیر داده ها می پردازد ،جامعه آماری را معرفی کردیم ،واحد آماری و نمونه آماری را مطرح کردیم.حجم جامعه و حجم نمونه و نمادهایی که برایش مطرح بود را گفتیم و سپس پرداختیم به اینکه برای این جامعه آماری چه چیزی مورد سنجش قرار میدهیم ؟ ویژگی هایی که از یک واحد آماری به واحد آماری دیگر تغسیر میکند را به عنوان متغیر گفتیم و بعد راجع به انواع متغیرها صحبت کردیم. متغیرها در دو دسته کمی ( )quantitativeو کیفی ( )qualitativeتقسیم میشوند.کمی ها ممکنه ( continuousپیوسته) باشند یا گسسته باشند.کیفی ها را خیلی راغب نیستیم به اجزای کوچکتری تقسیم بندی کنیم ولی تقسیم بندی دیگری در دهه 1940توسط روانشناسان مطرح شد و این بود که این دسته بندی که االن تعریف کردیم برای کمی-کیفی خیلی اوقات ممکن است مبنای سنجش ما به گونه ای باشد که نیاز باشد تقسیم بندی جدیدی داشته باشیم و بر این اساس دسته بندی nominal,ordinal,intervalو ratioرا گفتیم. Nominalمدل سنجش داده هاست.این تقسیم بندی که ما داریم میگوییم اسمش را گذاشتند مقیاس اندازه گیری یعنی یک متغیر ممکن است حتی خودش کمی باشد ولی الگوی اندازه گیری تون چگونه است؟ یا ممکن است ماهیتا خودش عددی باشد ولی اومدیم categorizeکردیم و بر این اساس 4دسته بندی داریم. Nominalحالتی است که فقط گزینه های مستقل دارد.میتواند عدد یا برچسب ( )labelباشد ،مثال نام شهرستان ولی اگر صحبت از مساحت شهرستان باشد،ویژگی دیگری را باید بسنجیم.نام شهرستان ،شغل افراد ،گروه خونی ،رنگ لباس متغیرهایی هستند که فقط در حد نام گذاری اند.برای ویژگی هایی که شما دارید ثبت میکنید ،امکان مقایسه وجود ندارد ولی اگر بگوییم سطح سواد ،شدت بیماری ،میزان رضایت آن وقت شما عالوه بر گزینه های مستقل ،امکان مقایسه هم برای این ویژگی هایی که مد نظر ماست وجود دارد پس ما میتوانیم بین آن ها مقایسه کنیم .برای مثال برای سطح سواد ( ابتدایی ،راهنمایی ،تحصیالت عالی ) میگوییم تحصیالتش یبیشتر یا کمتر است.اگر میزان رضایت مندی را به همین گونه گزارش کنیم میگوییم بسیار راضی ،راضی ،نسبتا راضی ،ناراضی ،بسیار ناراضی یا میتوانیم میزان رضایت را نمره ای معرفی کنیم و از 0تا 20نمره بدیم آن وقت مقیاس اندازه گیری ما یک levelباالتر می رود و میتوانیم بگوییم چقدر بیشتر است.وقتی میگوییم پاسخمان بسیار راضی ،راضی و ...است فقط بهتر و بدتر در آن تعریف میشود اما وقتی عدد داریم می توانیم بگوییم چند واحد.اما یک اشکال کار در اینجا این است که این ارزشیابی و سنجش ما نمیتواند مبنای مقایسه نسبی بین آدم ها باشد.نمی توانیم بگوییم کسی که میزان رضایتش را 18گزارش کرده میزان رضایت این فرد 2برابر کسی است که 9گزارش کرده است این اتفاق نیفتد ولی متغیرهایی هم داریم که این نسبت درونش رعایت میشود کسی که 18ساله است 2برابر کسی است که 9ساله است. |Page1 دیتا ( داده ) چیست؟ دیتا یا داده خام ،مجموعه ای از مقادیر یا حالت های یک یا چند متغیر است.مثال از چند نفر سوال بپرسیم :فاصله محل زندگی تا محل کار چقدر است که مقادیر مختلفی دارد و از همین افراد گروه خونی شان بپرسیم و میزان رضایتشان از درس این مجموعه ای که جمع آوری میشود را میگوییم دیتا اما اگر برحسب فاصله محل زندگی تا محل کار مرتب سازی ( ) sortingکنیم ،این دیتا در واقع از حالت داده خارج شده و امکان مقایسه و تحلیل داده وجود دارد. کاربرد علم آمار: برنامه ریزی،ارزیابی وضعیت جامعه ،پیش بینی پیامد های مختلف از روی داده های موجود که آن داده ها میتواند متغیر مستقل باشد.مثال اگر امروز یک تکنیک جدید جراحی برای چاقی مطرح شود ( تکنیک های مختلفی وجود دارد ) ما میخواهیم ببینیم که این تکنیک از نظر پیامد، عوارض ،ماندگاری وضعیت طبیعی ،از نظر میزان کاهش وزن و....در مقایسه با دیگر روش ها چگونه است.غیر از بحث های فنی و تخصصی که باید متخصصان کمک کنند اما اگر خودمان بخواهیم تصمیم بگیریم که کدام تکنیک بهتر است باید با استناد به شواهد موجود یعنی یا باید خودمان researchانجام دهیم و شواهد تولید کنیم و یا اینکه شواهد موجود را بررسی کنیم.در هر صورت وقتی دارید بررسی میکنید مهم ترین موضوعی که در اینجا مطرح می شود این است که مثال فرض کنید مطالعه ای انجام دادین با 2تکنیک.با یک تکنیک از 100نفری که عمل جراحی با روش Aقرار گرفتن 70 ،نفر وضعیت بهبودیشان با آن شاخص هایی که ما داشتیم مناسب تشخیص داده شد. در گروه دوم ،مثال 72نفر ،پیش فرض ما هم این است که تخصیص تصادفی انجام شده ،سوگیری یا بایاس یا " اوری بی" بسیار ناچیز است و نتایج هم به مقدار زیادی تعمیم پذیری دارد.حاال می خوایم بدونیم با این 2واحد اختالف ،میشه نتیجه گیری کنیم؟ که برای پاسخ به این سوال به استناد تکنیک های آماری شما میتوانید قضاوت کنید.امروزه داریم از up to dateبر بالین بیمار به عنوان یک قاعده تصمیم گیری استفاده می کنیم.شواهد علمی موجود در up to dateاینقدر شواهد قابل اعتمادی است که پزشک می تواند بگوید با استناد به این مقاله بهتر است که از این دارو و تکنیک استفاده کنیم.این جواب و اثر بخشی بهتری میدهد اما خود این مقاالت یقینا پاسخ ها را بر مبنای شواهد بر دیتا بهش می رسند و برای اینکه بتوانیم از دیتا در تصمیم گیری شما استفاده کنید اینکه بگویید کدام روش بهتر است و confidence intervalآن چگونه است باز هم بکار گیری آمار کامال واضح است یک مثال عمومی تر موضوعی است که در بحث estimationمطرح می شود مثال میگوییم مقادیر مرجع برای LDLدر یک بازه مشخص است و برای مثال برای 70( FBSتا ) 110و 120به باال borderlineمحسوب می شود و cut offبرای تشخیص دیابت نوع دو است و علمی که باعث می شود ما به این اعداد برسیم ،آمار است و ممکن است که این کارها نیاز به تشخیص دقیق تری داشته باشد و قطعی نیست. وقتی از جامعه ،نمونه ( ) sampleبرای مثال 300نفر انتخاب کردیم به عنوان نمونه ،حاال چه چیزی را درباره ی این 300نفر میخوایم گزارش کنیم؟ مثال Odds ratioو...را گزارش می کنیم.چیزی را که از یک نمونه گزارش می کنیم را شاخص می گویند ولی چیزی را که از جامعه استخراج کند یا به جامعه تعمیم دهند ،به آن ،پارامتر می گویند.مثال جامعه آماری من دانشجویان دانشگاه هستند و متوسط قد را در نمونه 300نفری حساب کردیم.در این نمونه 300نفری میانگین می شود شاخص یا میانه مصرف کالری روزانه در یک نمونه 300 |Page2 نفری که این هم شاخص محسوب می شود.اما اگر جامعه آماری کل افراد باشد و برای همه حساب کرده باشیم می شود پارامتر.اینم بدونیم که از شاخص برای تخمین پارامتر استفاده می شود. ** آمار همیشه جواب دقیق نمی دهد و اساسا مقاالت هم به همین گونه اند. ** میزان اعتماد پذیری به تکست بسیار باالست برخالف مقاله ( پردازش داده ها از طریق آمار توصیفی ). ما در توصیف داده ها ،از ایزارهایی مثل جداول،نمودار ها و شاخص ها ( مرکزی یا پراکندگی ) استفاده میکنیم.دو نوع جدول داریم ،جدول توزیع فراوانی و جدول گزارشی.جدول گزارشی آن هایی است که در پایان نامه ها ،مقاالت از آن استفاده میکنیم.در واقع سعی می کند خالصه تر باشد و بتواند جامع تر پوشش دهد. جدول توزیع فراوانی با این نگاه که به جوانب مختلف می پردازد ولی به 1متغیر و معموال در حوزه های دانشی و در کالس مطرح می شود.هدف ما انتقال مطلب است.ما یک بحث مهمی داریم تحت عنوان distributionو می گویند الگوی پخش این متغیر چگونه است؟ distributionرا در نمودار خیلی بهتر می توانیم ببینیم و پس بهتر می فهمیم.در جداول هم می شود دید ولی نمودار خیلی به ما کمک می کند.اینا در انتقال مطلب کمک می کنند. ** از نظر دقت و مقادیر ،جدول دقیق تر است ولی نمودار برای مخاطبین جذاب تر است و پیام را سریع تر و ساده تر منتقل می کند.پس شاخص ها خیلی خالصه اند. *جداول و به خصوص نمودارها ،پیام رو سریعتر منتقل می کنند. *بین جداول گزارشی و جداول توزیع فراوانی ،باز جداول گزارشی انتقال پیام رو سریعتر انجام میدهند. نمونه ای از جدول توزیع فراوانی ( گروه خونی ) درصد فراوانی نسبی فراوانی چوب خط گروه خونی 22 % 28 = 0.28 22 A 77 % 24 0.24 19 B % 15 0.15 12 AB % 31 0.31 24 O 100 1 77 جمع |Page3 اگر متغیر یک متغیر کیفی ،اسمی یا رتبه ای باشد فقط چوب خط و فراوانی و فراوانی نسبی و درصد را داریم (.ولی در کل میتونیم فراوانی تجمعی ،فراوانی تجمعی نسبی؛ و فراوانی نسبی درصدی هم داشته باشیم) چوب خط برای شمارش ساده تر رسم می شود مثال وقتی می خواهیم برای کالسی نماینده انتخب کنیم پای تابلو چوب خط می کشند. اگر به جای گروه خونی ،نمره درس یا مدت مطالعه باشد ،فراوانی تجمعی هم اضافه می شود.در گروه خونی ،جمع پذیری معنی نمی دهد. خب حاال مثالی هم می زنیم که فراوانی تجمعی ،و فراوانی تجمعی نسبی و فراوانی تجمعی نسبی درصدی رو هم بشه براش نوشت: فراوانی تجمعی ،جمع نداره.ولی خود فراوانی ،آخر ستونش جمع هم داره که شد .85 فراوانی تجمعی نسبی این جوری بدست میاد :مثال برای 0مسکن که 12نفر بودند ،میشه 12تقسیم بر .85و برای 1یا 0مسکن هم میشه 26تقسیم بر 85و به همین ترتیب تا پایین. یه مشکلی هم ممکنه واقعا بوجود بیاد اینکه بعضی افراد تعداد مسکن های خورده شده را شاید واقعا به خاطر نیاورند.برای همین، اگر مثال کل نمونه 90،نفر باشند اون وقت این جا در جدول باال ،ما باید 5نفر رو missingیا نامشخص در نظر بگیریم یعنی نمی دونیم براشون تعداد مسکن رو.پس ما اون وقت دو جور درصد رو میشه براشون حساب کنیمvalid -2percent-1 : .percent اگر متغیر هایی که سنجیده می شوند ،متغیر های دسته بندی شده باشند مثال هموگلبین ،قند خون و...و یا فشار خون سیستولیک باشد ،پس اطالعات هم باید دسته بندی شوند. |Page4 حاال این سوال پیش می آید که چگونه این دسته بندی باید صورت گیرد؟(برای فشار خون سیستول) خب 10تا 10تا میایم انجام میدیم 2 :نوع دسته بندی وجود دارد: الگوی دسته الگوی دسته بندی2 بندی1 99-90 100-90 دسته 1 109-100 110-100 دسته 2 119-110 120-110 دسته 3 129-120 130-120 دسته 4 139-130 140-130 دسته 5 149-140 150-140 دسته 6 159-150 160-150 دسته 7 169-160 170-160 دسته 8 179-170 180-170 دسته 9 در مورد دسته بندی ،1حد باالی دسته اول ،در حد پایین دسته ی دوم تکرار شده است ،پس می توان گفت کسی که دقیقا 100باشه در دسته دوم ( بازه )110-100و کسی که دقیقا 110باشه ،در دسته ی سوم (بازه )120- 110قرار میگیرد.و درواقع ،آن هایی که در همسایگی 100هستند ،مثال ، 99.9در دسته اول قرار می گیرند. در مورد دسته بندی ،2به آن می گویند :دسته بندی با الگوی گرد کردن.یعنی مقادیر گرد شده اند.چون مثال برای 99.2باید در دسته ی اول درنظر بگیریم ولی از 99.5تا 99.9و اینا ،به باال گرد می کنیم و 10در نظر میگیریم و به دسته ی 109-100تعلق می گیرند.پس چون گرد می کنیم ،در اصل جدول این طوری است ( :اما خب در متن ها این طوری نباید نوشت و همان ...110-100 /99-90می نویسند:). یعنی در الگوی دسته بندی گرد کردن ،دقیقا 99.5می افتد در دسته دوم: دسته 1 90-99.5 دسته 2 99.5-109.5 (از 99.5تا 100اگر عددی مد نظر باشد در دسته 2در نظر گرفته می شود). |Page5 *روش های پردازش اطالعات )1جدول توزیع فراوانی←محدودیت(a :تک متغیره است (bخیلی به اجزا می پردازد(محاسبه فراوانی نسبی و تجمعی و درصدی و ).... اما در پایان نامه ها و مقاالت اطالعات مختصر می شوند و تمام فراوانی ها محاسبه نمی شوند.مثال: )2جداول گزارشی ( شکل سمت راست)= جداولی که یک متغیر2 ، یا حتی بیشتر از 2متغیر داریم برای توصیفش برای اینکه مخاطب بداند آن چیزی که در جدول ذکر شده ،در متن به کجا ارجاع پیدا می کند ،باید جدول شماره داشته باشد.چون ما گزارش مان را فقط نباید در جدول خالصه بنویسیم ،بلکه توضیحات کامل آن جدول باید در متن مقاله ما باشد. همچنین ،جدول گزارشی باید گویای اطالعاتِ درون خودش باشد.بنابراین جدول باید عنوان داشته باشد. یعنی اگر خواستی یک جدول فقط برای مخاطب بیاوری ،آن فرد از جدول به تنهایی حتی اگر متنی در توصیف جدول در کار نباشد ،بتواند مفهوم و هدف مورد نظر را دریابد. حاال جدول گزارش مثال زده شده(در مورد سن) چطوری باید دسته بندی اش صورت گیرد؟ .1با توجه به ماهیت داده ها -1 :نقطه شروع و پایان دسته و -2طول دسته ها -3و تعداد دسته ها تعیین می شود. (مثال فردی در بازه سن 30-35نداشته باشیم خب شروع بازه را عوض می کنیم) ( یا اصال گاهی اصال نمی خواهیم طول دسته ها یکسان باشد ،بلکه اول 5تا 5تا باشد و بعد 10تایی بره جلو ...پس همه اینها را براساس ماهیت داده ها تعیین می کنیم) .2خبرگی و با تجربگی ما (در جدول نویسی) اگر برای اولین بار دارید در مورد داده ای قضاوت می کنید ،توصیه می شود که ببینید منابع موجود و مقاالت مرتبط با چه الگویی این طبقه بندی را انجام می دهند.دلیلش هم این است که در بخش discussionدر مقاله و پایان نامه ،باید نتایج مطالعات خودمون رو با نتایج مطالعات دیگران مقایسه کنیم.پس برای مقایسه پذیر بودن ،باید از الگوهای یکسانی استفاده کرده باشیم.پس بهتر است از الگوهای رایج و متداول در مقاالت استفاده کنیم ،اما اگر مقاالت مشابه نبود و نمی شد مقایسه کرد ،در قسمت ، discussionباید میانگین ها را با هم مقایسه کرد. پس در جداول مان ،باید تعداد -درصد -جمعِ سطری و ستونی داشته باشیم تا به ما کمک کند تعداد چه قدر است. یک سوال :مقیاس اندازه گیری گروه سنی با الگوی جدول زیر ،چیست؟ |Page6 جواب :اگر سن را داشتیم و درواقع با مقدار سر و کا رداشتیم ،ان وقت نسبی ( )ratioمی شد ،اما این جا بر اساس الگوی نگارشی که نوشتیم ،مقیاس اندازه گیری ما ،رتبه ای یا ordinalاست.اسمی نیست چون ویژگی کمتر بیشتر را دارد.اما چون نمی دانیم جوان چه قدر بیشتر است همان رتبه ای می شود. حاال مقیاس اندازه گیری مدت مکالمه ratio ،است.چون عالوه بر بیشتر یا کمتر بودن ،می توانم بگویم هر کدام چقدر بیشتر از دیگری است.اما در ای شیوه نگارش ما در شکل باال ،که رده بندی دسته بندی داره interval ،هست.چون میایم نماینده ی هر دسته را پیدا می کنیم مثال نماینده گروه اول( بازه 60 )120-0و نماینده گروه دوم (بازه 180 )240 – 120است ،و پس به اندازه 120واحد ،گروه دوم از گروه اول بیشتر است. اما این را االن درحالتی تونستیم بگیم که چون الگوی دسته بندی داریم.اما اگر مقدار واقعی بود ،اون وقت کسی مقدار مکالمه اش وقتی 0 بود یعنی نداره ،به معنای عدم وجود ،صفر به معنای فقدان وضعیت است که پس آن موقع ratioمیشد. حاال اگر جدول گزارش 2متغیره بود( مثل همین جدول باالیی) ،باید برای درصد 5 ،را بر چه عددی تقسیم کنیم؟ |Page7 جواب :باید به 75تقسیم کنیم.چون عنوان جدول داره میگه «بر حسب گروه سنی»؛ و با توجه به این عنوان ما باید برای هر گروه سنی را جداگانه حساب کنیم. 5 غلط است .و باید حساب کرد از کل کسانی که مثال حاال اگر عنوان عوض شود به :درصدِ گروه سنی برحسب مدت مکالمه ، ،این جا 75 مدت مکالمه شان بین 0تا 120دقیقه است ،چند درصد از اینها ،به عنوان مثال کودک اند.پس: درصد می تواند برحسب عنوان ،سطری باشد ،یا ستونی باشد ،یا totalباشد. اگر عنوان به این صورت بود که :درصد گروه سنی «و » مدت مکالمه ،این جا باید نسبت به totalسنجیده میشد. *** )3نمودار ها :راحت تر کردن انتقال پیام ولی غیردقیق اند. ✓ دایره ای ( /)pie chartمیله ای( >=)Bar chartاین دو نمودار ،برای توصیف یک متغیر مناسب اند.مثال( :نوع بیماری زمینه ای) (سابقه بیماری زمینه ای مثل پرفشاری خون و...دارد یا نه)=> پس برای یک متغیرِ اسمی یا رتبه ای ،بنا به سلیقه ی خود ،از نمودار میله ای یا دایره ای استفاده می کنیم.همچنین اگر دو متغیر داشته باشیم و هردو اسمی یا هر دو رتبه ای یا یکی اسمی و دیگری رتبه ای بود ،در این شرایط bar chartبهتر است.چون می خواهیم مقایسه کنیم.مثال :مقایسه نوع بیماری زمینه ای بین آن هایی که جراحی قلب انجام داده اند و آن هایی که دیابت دارند.یا مثال مقایسه گروه خونی بین دانشجوهای پزشکی با دانشجوهای مهندسی. نمونه ای از :bar chart ✓ پلی گون /هیستوگرام => اگر اطالعات دسته بندی شده باشد« ،هیستوگرام »بهتر است.نمونه ای از هیستوگرام: |Page8 هیستوگرام برای مشخص کردن توزیع نرمال و در shapeخیلی کمک کننده است.در هیستوگرام ،اطالعات روی محور افقی دسته بندی شده اند.ممکن است دسته ها مساوی یا نامساوی باشند.مثال برای طول دسته های یکسان :گزارش هموگلوبین: مثال هیستوگرام برای داده هایی با طول دسته های نابرابر: وقتی که طول دسته ها نابرابرند( به خصوص در مطالعات اپیدمیولوژیک این اتفاق زیاد می افتد) ،باید عالوه بر فراوانی = ،)fi(frequencyاز چگالی ( )di()densityهم استفاده کنیم. مثال برای دسته بندی نامساوی :بررسی مرگ و میر برای کودکان زیر 1سال -کودکان 1تا 5سال 5 -تا 15سال 15 -تا 35 سال....-اما وقتی به سنین باالی 60می رسد 5 ،سال 5سال زیاد می شود ،یعنی 60تا 65 -65تا 70 -70تا ...75 یا هنگامی که برای غربالگری دیابت نوع ، 2شیوع آن در سنین زیر 20سال خیلی کم تر است ،پس ناچاریم برای بازه های سنی متفاوتی گزارش کنیم. در چنین حالتی (طول دسته ها نابرابر) ،مساحتِ یک ستونِ هیستوگرام ،برابر است با فراوانی. برای محاسبه ی چگالی در سه ردیف اول جدول صفحه بعد: |Page9 باید 4را تقسیم یر ،1و 12را هم تقسیم بر ( 1طول دسته) کنیم 7.را باید تقسیم بر 0.2کنیم (.طول دسته از 6تا 6.2هست) مثال بعدی برای محاسبه چگالی: برای ردیف اول :فراوانی که 25است را تقسیم بر طول دسته ( )10می کنیم. (**گرچه از 100تا 109نوشته شده ،اما طول دسته را ما 10درنظر می گیریم و در محاسبه استفاده می کنیم). برای ردیف دوم 34 :تقسیم بر 10 ردیف سوم 45:تقسیم بر طول دسته (()20که از 119.5تا 139.5است) همانطور که در شکل زیر می بینید ،نوشته شده No. of individuals/unitیعنی تقسیم بر واحد.که اگر تقسیمات خیلی کوچک بودند برای اینکه نمودار شکیل تر شود ،می توانیم این No. of individual/unitرا Kبرابر نیز بکنیم: مثال رو به رو :نمودار «پلی گون»: | P a g e 10 اگر یک متغیر عددی ( که مقدار دارد) داشته باشیم ،و اگر گسسته بود ( مثل شکل زیر) ،نمودار پلی گون را می توان برایش رسم کرد. *یک متغیر عددی گسسته را با پلی گون نمایش می دهیم. *یک متغیر اگر دسته بندی شده باشد ،از هیستوگرام استفاده می کنیم. * اما اگر یه دونه دسته بندی شده باشد ،مثل فشار خون ،نبض ،هماتوکریت ،گلبولهای سفید ،RBC ،اگر بخواهبم ابن ها را با یک متغیر دوحالتی دیگر ،مثال در آن هایی که مبتال به کووید 19هستند و در آن هایی که مبتال به کووید 19نیستند ،مقایسه کنیم ،پس کیفی است؛ در این جا نیز باید از پلی گون استفاده کنیم.یعنی دو حالتی است و در دو الینِ متفاوت باید ارائه بدهیم. ✓ پراکنش( ، )scatteredباکس پالت >نمودار پراکنش( :)scattered diagramبرای بیان رابطه خطی بین دو متغیر. درآمار ،دو مفهوم regressionو correlationداریم correlation ،در بحث رابطه خطی خیلی مهم است.مثال: اگر در این شکل ،خط را کنار بگذاریم ،و فقط نقاط را ببینیم ( افقی=وزن اولیه ،عمودی= وزن از دست رفته)( مثال در بررسی نتیجه ی یک رژیم غذایی بعد زا مثال 2ماه) ،نقاط نشان می دهند مثال کسی که 35سال سن دازد ،یک کیلو وزن کم کرد ،و کسی که 50ساله است دو کیلو ،و متوجه می شویم این نقاط دارند یک الگوریتم ،یک ارتباط ،یک الگو را نشان می دهند.اگر بدون خط باشد ،می گوییم نمودار نقطه ای یا پراکنش یا scattered diagramاست که رابطه خطی را نشان می دهد. البته این ارتباط ،می تواند الگوهای متعددی داشته باشد؛ مثال ها در صفحه بعد: | P a g e 11 →در این شکل ،ضریب همبستگی کامل است چون همه نقاط کامال روی یک خط قرار دارند. هم چنین رابطه می تواند معکوس باشد: انواع دیگری هم می تواند باشد ،مثال رابطه ی معکوس و ناقص: ممکن است هیچ رابطه ای هم با هم نداشته باشند ،که اصطالحا به آن النه کبوتری می گویند: *نمودار باکس پالت یک نمودار جعبه ای است که بعد از توضیح میانه در جلسه بعد تدریس خواهد شد. *** ویس به تکست :زهرا برغمدی -رومینا عاطفی نژاد تایپ :گلسامصلحی -مسعود شورمیج ادیت :کوثرکیائی | P a g e 12