آمار - جلسه 2 PDF

Summary

این سند خلاصه ای از جلسه دوم آمار است. مباحثی مانند تعریف و کاربرد علم آمار، انواع متغیرها و مقیاس های اندازه گیری(nominal, ordinal, interval, ratio) در آن بررسی شده است. همچنین، مفهوم داده خام (data) و کاربردهای آن توضیح داده شده است.

Full Transcript

‫جلسه دوم آمار‬ ‫خالصه ای از جلسه قبل‬ ‫تعریف آمار علمی است که به جمع آوری دیتا میپردازد ‪ ،‬وقتی انبوهی از دیتا در اختیارمان قرار میگیرد باید بتوانیم آن را پاالیش و ویرایش‬ ‫کنیم و آماده...

‫جلسه دوم آمار‬ ‫خالصه ای از جلسه قبل‬ ‫تعریف آمار علمی است که به جمع آوری دیتا میپردازد ‪ ،‬وقتی انبوهی از دیتا در اختیارمان قرار میگیرد باید بتوانیم آن را پاالیش و ویرایش‬ ‫کنیم و آماده سازی کنیم برای توصیف و تجزیه و تحیل و تفسیر داده ها ‪.‬بنابراین آمار علم جمع آوری داده هاست که پس از خالصه سازی به‬ ‫توصیف و تحلیل و تفسیر داده ها می پردازد‪ ،‬جامعه آماری را معرفی کردیم‪ ،‬واحد آماری و نمونه آماری را مطرح کردیم‪.‬حجم جامعه و حجم‬ ‫نمونه و نمادهایی که برایش مطرح بود را گفتیم و سپس پرداختیم به اینکه برای این جامعه آماری چه چیزی مورد سنجش قرار میدهیم ؟‬ ‫ویژگی هایی که از یک واحد آماری به واحد آماری دیگر تغسیر میکند را به عنوان متغیر گفتیم و بعد راجع به انواع متغیرها صحبت کردیم‪.‬‬ ‫متغیرها در دو دسته کمی ( ‪ )quantitative‬و کیفی (‪ )qualitative‬تقسیم میشوند‪.‬کمی ها ممکنه ‪( continuous‬پیوسته) باشند یا‬ ‫گسسته باشند‪.‬کیفی ها را خیلی راغب نیستیم به اجزای کوچکتری تقسیم بندی کنیم ولی تقسیم بندی دیگری در دهه ‪ 1940‬توسط‬ ‫روانشناسان مطرح شد و این بود که این دسته بندی که االن تعریف کردیم برای کمی‪-‬کیفی خیلی اوقات ممکن است مبنای سنجش ما به‬ ‫گونه ای باشد که نیاز باشد تقسیم بندی جدیدی داشته باشیم و بر این اساس دسته بندی ‪ nominal,ordinal,interval‬و ‪ ratio‬را‬ ‫گفتیم‪.‬‬ ‫‪ Nominal‬مدل سنجش داده هاست‪.‬این تقسیم بندی که ما داریم میگوییم اسمش را گذاشتند مقیاس اندازه گیری یعنی یک متغیر ممکن‬ ‫است حتی خودش کمی باشد ولی الگوی اندازه گیری تون چگونه است؟ یا ممکن است ماهیتا خودش عددی باشد ولی اومدیم‬ ‫‪ categorize‬کردیم و بر این اساس ‪ 4‬دسته بندی داریم‪.‬‬ ‫‪ Nominal‬حالتی است که فقط گزینه های مستقل دارد‪.‬میتواند عدد یا برچسب ( ‪ )label‬باشد‪ ،‬مثال نام شهرستان ولی اگر صحبت از‬ ‫مساحت شهرستان باشد‪،‬ویژگی دیگری را باید بسنجیم‪.‬نام شهرستان‪ ،‬شغل افراد‪ ،‬گروه خونی‪ ،‬رنگ لباس متغیرهایی هستند که فقط در حد نام‬ ‫گذاری اند‪.‬برای ویژگی هایی که شما دارید ثبت میکنید ‪ ،‬امکان مقایسه وجود ندارد ولی اگر بگوییم سطح سواد ‪ ،‬شدت بیماری ‪ ،‬میزان‬ ‫رضایت آن وقت شما عالوه بر گزینه های مستقل ‪ ،‬امکان مقایسه هم برای این ویژگی هایی که مد نظر ماست وجود دارد پس ما میتوانیم بین‬ ‫آن ها مقایسه کنیم ‪.‬برای مثال برای سطح سواد ( ابتدایی‪ ،‬راهنمایی ‪ ،‬تحصیالت عالی ) میگوییم تحصیالتش یبیشتر یا کمتر است‪.‬اگر میزان‬ ‫رضایت مندی را به همین گونه گزارش کنیم میگوییم بسیار راضی‪ ،‬راضی‪ ،‬نسبتا راضی‪ ،‬ناراضی ‪ ،‬بسیار ناراضی یا میتوانیم میزان رضایت را‬ ‫نمره ای معرفی کنیم و از ‪ 0‬تا ‪ 20‬نمره بدیم آن وقت مقیاس اندازه گیری ما یک ‪ level‬باالتر می رود و میتوانیم بگوییم چقدر بیشتر‬ ‫است‪.‬وقتی میگوییم پاسخمان بسیار راضی ‪ ،‬راضی و ‪...‬است فقط بهتر و بدتر در آن تعریف میشود اما وقتی عدد داریم می توانیم بگوییم چند‬ ‫واحد‪.‬اما یک اشکال کار در اینجا این است که این ارزشیابی و سنجش ما نمیتواند مبنای مقایسه نسبی بین آدم ها باشد‪.‬نمی توانیم بگوییم‬ ‫کسی که میزان رضایتش را ‪ 18‬گزارش کرده میزان رضایت این فرد ‪ 2‬برابر کسی است که ‪ 9‬گزارش کرده است این اتفاق نیفتد ولی‬ ‫متغیرهایی هم داریم که این نسبت درونش رعایت میشود کسی که ‪ 18‬ساله است‪ 2‬برابر کسی است که ‪ 9‬ساله است‪.‬‬ ‫‪|Page1‬‬ ‫دیتا ( داده ) چیست؟‬ ‫دیتا یا داده خام‪ ،‬مجموعه ای از مقادیر یا حالت های یک یا چند متغیر است‪.‬مثال از چند نفر سوال بپرسیم ‪ :‬فاصله محل زندگی تا محل کار‬ ‫چقدر است که مقادیر مختلفی دارد و از همین افراد گروه خونی شان بپرسیم و میزان رضایتشان از درس این مجموعه ای که جمع آوری‬ ‫میشود را میگوییم دیتا اما اگر برحسب فاصله محل زندگی تا محل کار مرتب سازی (‪ ) sorting‬کنیم ‪ ،‬این دیتا در واقع از حالت داده‬ ‫خارج شده و امکان مقایسه و تحلیل داده وجود دارد‪.‬‬ ‫کاربرد علم آمار‪:‬‬ ‫برنامه ریزی‪،‬ارزیابی وضعیت جامعه‪ ،‬پیش بینی پیامد های مختلف از روی داده های موجود که آن داده ها میتواند متغیر مستقل باشد‪.‬مثال اگر‬ ‫امروز یک تکنیک جدید جراحی برای چاقی مطرح شود ( تکنیک های مختلفی وجود دارد ) ما میخواهیم ببینیم که این تکنیک از نظر پیامد‪،‬‬ ‫عوارض ‪ ،‬ماندگاری وضعیت طبیعی ‪ ،‬از نظر میزان کاهش وزن و‪....‬در مقایسه با دیگر روش ها چگونه است‪.‬غیر از بحث های فنی و‬ ‫تخصصی که باید متخصصان کمک کنند اما اگر خودمان بخواهیم تصمیم بگیریم که کدام تکنیک بهتر است باید با استناد به شواهد موجود‬ ‫یعنی یا باید خودمان ‪ research‬انجام دهیم و شواهد تولید کنیم و یا اینکه شواهد موجود را بررسی کنیم‪.‬در هر صورت وقتی دارید بررسی‬ ‫میکنید مهم ترین موضوعی که در اینجا مطرح می شود این است که مثال فرض کنید مطالعه ای انجام دادین با ‪ 2‬تکنیک‪.‬با یک تکنیک از‬ ‫‪ 100‬نفری که عمل جراحی با روش ‪ A‬قرار گرفتن ‪ 70 ،‬نفر وضعیت بهبودیشان با آن شاخص هایی که ما داشتیم مناسب تشخیص داده شد‪.‬‬ ‫در گروه دوم‪ ،‬مثال ‪ 72‬نفر ‪ ،‬پیش فرض ما هم این است که تخصیص تصادفی انجام شده‪ ،‬سوگیری یا بایاس یا " اوری بی" بسیار ناچیز است‬ ‫و نتایج هم به مقدار زیادی تعمیم پذیری دارد‪.‬حاال می خوایم بدونیم با این ‪ 2‬واحد اختالف‪ ،‬میشه نتیجه گیری کنیم؟ که برای پاسخ به این‬ ‫سوال به استناد تکنیک های آماری شما میتوانید قضاوت کنید‪.‬امروزه داریم از ‪ up to date‬بر بالین بیمار به عنوان یک قاعده تصمیم‬ ‫گیری استفاده می کنیم‪.‬شواهد علمی موجود در‪ up to date‬اینقدر شواهد قابل اعتمادی است که پزشک می تواند بگوید با استناد به این‬ ‫مقاله بهتر است که از این دارو و تکنیک استفاده کنیم‪.‬این جواب و اثر بخشی بهتری میدهد اما خود این مقاالت یقینا پاسخ ها را بر مبنای‬ ‫شواهد بر دیتا بهش می رسند و برای اینکه بتوانیم از دیتا در تصمیم گیری شما استفاده کنید اینکه بگویید کدام روش بهتر است و‬ ‫‪ confidence interval‬آن چگونه است باز هم بکار گیری آمار کامال واضح است یک مثال عمومی تر موضوعی است که در بحث‬ ‫‪ estimation‬مطرح می شود مثال میگوییم مقادیر مرجع برای ‪ LDL‬در یک بازه مشخص است و برای مثال برای ‪ 70( FBS‬تا ‪ ) 110‬و‬ ‫‪ 120‬به باال ‪ borderline‬محسوب می شود و ‪ cut off‬برای تشخیص دیابت نوع دو است و علمی که باعث می شود ما به این اعداد‬ ‫برسیم‪ ،‬آمار است و ممکن است که این کارها نیاز به تشخیص دقیق تری داشته باشد و قطعی نیست‪.‬‬ ‫وقتی از جامعه ‪ ،‬نمونه ( ‪ ) sample‬برای مثال ‪ 300‬نفر انتخاب کردیم به عنوان نمونه ‪ ،‬حاال چه چیزی را درباره ی این ‪ 300‬نفر میخوایم‬ ‫گزارش کنیم؟ مثال ‪ Odds ratio‬و‪...‬را گزارش می کنیم‪.‬چیزی را که از یک نمونه گزارش می کنیم را شاخص می گویند ولی چیزی را‬ ‫که از جامعه استخراج کند یا به جامعه تعمیم دهند‪ ،‬به آن‪ ،‬پارامتر می گویند‪.‬مثال جامعه آماری من دانشجویان دانشگاه هستند و متوسط قد را‬ ‫در نمونه ‪ 300‬نفری حساب کردیم‪.‬در این نمونه ‪ 300‬نفری میانگین می شود شاخص یا میانه مصرف کالری روزانه در یک نمونه ‪300‬‬ ‫‪|Page2‬‬ ‫نفری که این هم شاخص محسوب می شود‪.‬اما اگر جامعه آماری کل افراد باشد و برای همه حساب کرده باشیم می شود پارامتر‪.‬اینم بدونیم‬ ‫که از شاخص برای تخمین پارامتر استفاده می شود‪.‬‬ ‫** آمار همیشه جواب دقیق نمی دهد و اساسا مقاالت هم به همین گونه اند‪.‬‬ ‫** میزان اعتماد پذیری به تکست بسیار باالست برخالف مقاله ( پردازش داده ها از طریق آمار توصیفی )‪.‬‬ ‫ما در توصیف داده ها‪ ،‬از ایزارهایی مثل جداول‪،‬نمودار ها و‬ ‫شاخص ها ( مرکزی یا پراکندگی ) استفاده میکنیم‪.‬دو نوع جدول‬ ‫داریم‪ ،‬جدول توزیع فراوانی و جدول گزارشی‪.‬جدول گزارشی آن‬ ‫هایی است که در پایان نامه ها ‪ ،‬مقاالت از آن استفاده میکنیم‪.‬در‬ ‫واقع سعی می کند خالصه تر باشد و بتواند جامع تر پوشش دهد‪.‬‬ ‫جدول توزیع فراوانی با این نگاه که به جوانب مختلف می پردازد‬ ‫ولی به ‪ 1‬متغیر و معموال در حوزه های دانشی و در کالس مطرح‬ ‫می شود‪.‬هدف ما انتقال مطلب است‪.‬ما یک بحث مهمی داریم‬ ‫تحت عنوان ‪ distribution‬و می گویند الگوی پخش این متغیر چگونه است؟ ‪ distribution‬را در نمودار خیلی بهتر می توانیم‬ ‫ببینیم و پس بهتر می فهمیم‪.‬در جداول هم می شود دید ولی نمودار خیلی به ما کمک می کند‪.‬اینا در انتقال مطلب کمک می کنند‪.‬‬ ‫** از نظر دقت و مقادیر‪ ،‬جدول دقیق تر است ولی نمودار برای مخاطبین جذاب تر است و پیام را سریع تر و ساده تر منتقل می کند‪.‬پس‬ ‫شاخص ها خیلی خالصه اند‪.‬‬ ‫*جداول و به خصوص نمودارها‪ ،‬پیام رو سریعتر منتقل می کنند‪.‬‬ ‫*بین جداول گزارشی و جداول توزیع فراوانی‪ ،‬باز جداول گزارشی انتقال پیام رو سریعتر انجام میدهند‪.‬‬ ‫نمونه ای از جدول توزیع فراوانی ( گروه خونی )‬ ‫درصد‬ ‫فراوانی نسبی‬ ‫فراوانی‬ ‫چوب خط‬ ‫گروه خونی‬ ‫‪22‬‬ ‫‪% 28‬‬ ‫‪= 0.28‬‬ ‫‪22‬‬ ‫‪A‬‬ ‫‪77‬‬ ‫‪% 24‬‬ ‫‪0.24‬‬ ‫‪19‬‬ ‫‪B‬‬ ‫‪% 15‬‬ ‫‪0.15‬‬ ‫‪12‬‬ ‫‪AB‬‬ ‫‪% 31‬‬ ‫‪0.31‬‬ ‫‪24‬‬ ‫‪O‬‬ ‫‪100‬‬ ‫‪1‬‬ ‫‪77‬‬ ‫جمع‬ ‫‪|Page3‬‬ ‫اگر متغیر یک متغیر کیفی ‪ ،‬اسمی یا رتبه ای باشد فقط چوب خط و فراوانی و فراوانی نسبی و درصد را داریم‪ (.‬ولی در کل میتونیم فراوانی‬ ‫تجمعی‪ ،‬فراوانی تجمعی نسبی؛ و فراوانی نسبی درصدی هم داشته باشیم)‬ ‫چوب خط برای شمارش ساده تر رسم می شود مثال وقتی می خواهیم برای کالسی نماینده انتخب کنیم پای تابلو چوب خط می کشند‪.‬‬ ‫اگر به جای گروه خونی ‪ ،‬نمره درس یا مدت مطالعه باشد‪ ،‬فراوانی تجمعی هم اضافه می شود‪.‬در گروه خونی ‪ ،‬جمع پذیری معنی نمی دهد‪.‬‬ ‫خب حاال مثالی هم می زنیم که فراوانی تجمعی‪ ،‬و فراوانی تجمعی نسبی و فراوانی تجمعی نسبی درصدی رو هم بشه براش نوشت‪:‬‬ ‫فراوانی تجمعی‪ ،‬جمع نداره‪.‬ولی خود فراوانی‪ ،‬آخر ستونش جمع هم داره که شد ‪.85‬‬ ‫فراوانی تجمعی نسبی این جوری بدست میاد‪ :‬مثال برای ‪ 0‬مسکن که ‪ 12‬نفر بودند‪ ،‬میشه ‪ 12‬تقسیم بر ‪.85‬و برای ‪ 1‬یا ‪0‬مسکن هم میشه‬ ‫‪ 26‬تقسیم بر ‪ 85‬و به همین ترتیب تا پایین‪.‬‬ ‫ یه مشکلی هم ممکنه واقعا بوجود بیاد اینکه بعضی افراد تعداد مسکن های خورده شده را شاید واقعا به خاطر نیاورند‪.‬برای همین‪،‬‬ ‫اگر مثال کل نمونه‪ 90،‬نفر باشند اون وقت این جا در جدول باال‪ ،‬ما باید ‪ 5‬نفر رو ‪ missing‬یا نامشخص در نظر بگیریم یعنی نمی‬ ‫دونیم براشون تعداد مسکن رو‪.‬پس ما اون وقت دو جور درصد رو میشه براشون حساب کنیم‪valid -2percent-1 :‬‬ ‫‪.percent‬‬ ‫اگر متغیر هایی که سنجیده می شوند‪ ،‬متغیر های دسته بندی شده باشند مثال هموگلبین‪ ،‬قند خون و‪...‬و یا فشار خون سیستولیک‬ ‫باشد‪ ،‬پس اطالعات هم باید دسته بندی شوند‪.‬‬ ‫‪|Page4‬‬ ‫حاال این سوال پیش می آید که چگونه این دسته بندی باید صورت گیرد؟(برای فشار خون سیستول) خب ‪ 10‬تا ‪ 10‬تا میایم انجام‬ ‫میدیم‪ 2 :‬نوع دسته بندی وجود دارد‪:‬‬ ‫الگوی دسته‬ ‫الگوی دسته‬ ‫بندی‪2‬‬ ‫بندی‪1‬‬ ‫‪99-90‬‬ ‫‪100-90‬‬ ‫دسته ‪1‬‬ ‫‪109-100‬‬ ‫‪110-100‬‬ ‫دسته ‪2‬‬ ‫‪119-110‬‬ ‫‪120-110‬‬ ‫دسته ‪3‬‬ ‫‪129-120‬‬ ‫‪130-120‬‬ ‫دسته ‪4‬‬ ‫‪139-130‬‬ ‫‪140-130‬‬ ‫دسته ‪5‬‬ ‫‪149-140‬‬ ‫‪150-140‬‬ ‫دسته ‪6‬‬ ‫‪159-150‬‬ ‫‪160-150‬‬ ‫دسته ‪7‬‬ ‫‪169-160‬‬ ‫‪170-160‬‬ ‫دسته ‪8‬‬ ‫‪179-170‬‬ ‫‪180-170‬‬ ‫دسته ‪9‬‬ ‫در مورد دسته بندی ‪ ،1‬حد باالی دسته اول‪ ،‬در حد پایین دسته ی دوم تکرار شده است‪ ،‬پس می توان گفت کسی که دقیقا ‪ 100‬باشه در دسته‬ ‫دوم ( بازه ‪ )110-100‬و کسی که دقیقا ‪ 110‬باشه‪ ،‬در دسته ی سوم (بازه ‪ )120- 110‬قرار میگیرد‪.‬و درواقع‪ ،‬آن هایی که در‬ ‫همسایگی ‪ 100‬هستند‪ ،‬مثال ‪ ، 99.9‬در دسته اول قرار می گیرند‪.‬‬ ‫در مورد دسته بندی ‪ ،2‬به آن می گویند‪ :‬دسته بندی با الگوی گرد کردن‪.‬یعنی مقادیر گرد شده اند‪.‬چون مثال برای ‪ 99.2‬باید در دسته ی‬ ‫اول درنظر بگیریم ولی از ‪ 99.5‬تا ‪ 99.9‬و اینا‪ ،‬به باال گرد می کنیم و ‪ 10‬در نظر میگیریم و به دسته ی ‪ 109-100‬تعلق می گیرند‪.‬پس‬ ‫چون گرد می کنیم‪ ،‬در اصل جدول این طوری است‪ ( :‬اما خب در متن ها این طوری نباید نوشت و همان ‪...110-100 /99-90‬می‬ ‫نویسند‪:).‬‬ ‫یعنی در الگوی دسته بندی گرد کردن ‪ ،‬دقیقا‪ 99.5‬می افتد در دسته دوم‪:‬‬ ‫دسته ‪1‬‬ ‫‪90-99.5‬‬ ‫دسته ‪2‬‬ ‫‪99.5-109.5‬‬ ‫(از ‪ 99.5‬تا ‪ 100‬اگر عددی مد نظر باشد در دسته ‪ 2‬در نظر گرفته می شود‪).‬‬ ‫‪|Page5‬‬ ‫*روش های پردازش اطالعات‬ ‫‪ )1‬جدول توزیع فراوانی←محدودیت‪(a :‬تک متغیره است ‪(b‬خیلی به اجزا می پردازد(محاسبه فراوانی نسبی و تجمعی و درصدی و‪ )....‬‬ ‫اما در پایان نامه ها و مقاالت اطالعات مختصر می شوند و تمام فراوانی ها محاسبه نمی شوند‪.‬مثال‪:‬‬ ‫‪ )2‬جداول گزارشی ( شکل سمت راست)= جداولی که یک متغیر‪2 ،‬‬ ‫یا حتی بیشتر از ‪ 2‬متغیر داریم برای توصیفش‬ ‫برای اینکه مخاطب بداند آن چیزی که در جدول ذکر شده‪ ،‬در متن به‬ ‫کجا ارجاع پیدا می کند‪ ،‬باید جدول شماره داشته باشد‪.‬چون ما‬ ‫گزارش مان را فقط نباید در جدول خالصه بنویسیم‪ ،‬بلکه توضیحات‬ ‫کامل آن جدول باید در متن مقاله ما باشد‪.‬‬ ‫همچنین‪ ،‬جدول گزارشی باید گویای اطالعاتِ درون خودش باشد‪.‬بنابراین جدول باید عنوان داشته باشد‪.‬‬ ‫یعنی اگر خواستی یک جدول فقط برای مخاطب بیاوری‪ ،‬آن فرد از جدول به تنهایی حتی اگر متنی در توصیف جدول در کار نباشد‪ ،‬بتواند‬ ‫مفهوم و هدف مورد نظر را دریابد‪.‬‬ ‫حاال جدول گزارش مثال زده شده(در مورد سن) چطوری باید دسته بندی اش صورت گیرد؟‬ ‫‪.1‬با توجه به ماهیت داده ها‪ -1 :‬نقطه شروع و پایان دسته و ‪ -2‬طول دسته ها ‪ -3‬و تعداد دسته ها تعیین می شود‪.‬‬ ‫(مثال فردی در بازه سن ‪ 30-35‬نداشته باشیم خب شروع بازه را عوض می کنیم) ( یا اصال گاهی اصال نمی خواهیم طول دسته ها‬ ‫یکسان باشد‪ ،‬بلکه اول ‪ 5‬تا ‪ 5‬تا باشد و بعد ‪ 10‬تایی بره جلو ‪...‬پس همه اینها را براساس ماهیت داده ها تعیین می کنیم)‬ ‫‪.2‬خبرگی و با تجربگی ما (در جدول نویسی)‬ ‫اگر برای اولین بار دارید در مورد داده ای قضاوت می کنید‪ ،‬توصیه می شود که ببینید منابع موجود و مقاالت مرتبط با چه الگویی این طبقه‬ ‫بندی را انجام می دهند‪.‬دلیلش هم این است که در بخش ‪ discussion‬در مقاله و پایان نامه‪ ،‬باید نتایج مطالعات خودمون رو با نتایج‬ ‫مطالعات دیگران مقایسه کنیم‪.‬پس برای مقایسه پذیر بودن‪ ،‬باید از الگوهای یکسانی استفاده کرده باشیم‪.‬پس بهتر است از الگوهای رایج و‬ ‫متداول در مقاالت استفاده کنیم‪ ،‬اما اگر مقاالت مشابه نبود و نمی شد مقایسه کرد‪ ،‬در قسمت ‪ ، discussion‬باید میانگین ها را با هم‬ ‫مقایسه کرد‪.‬‬ ‫پس در جداول مان‪ ،‬باید تعداد‪ -‬درصد‪ -‬جمعِ سطری و ستونی داشته باشیم تا به ما کمک کند تعداد چه قدر است‪.‬‬ ‫یک سوال‪ :‬مقیاس اندازه گیری گروه سنی با الگوی جدول زیر‪ ،‬چیست؟‬ ‫‪|Page6‬‬ ‫جواب‪ :‬اگر سن را داشتیم و درواقع با مقدار سر و کا رداشتیم‪ ،‬ان وقت نسبی (‪ )ratio‬می شد‪ ،‬اما این جا بر اساس الگوی نگارشی که‬ ‫نوشتیم‪ ،‬مقیاس اندازه گیری ما‪ ،‬رتبه ای یا ‪ ordinal‬است‪.‬اسمی نیست چون ویژگی کمتر بیشتر را دارد‪.‬اما چون نمی دانیم جوان چه قدر‬ ‫بیشتر است همان رتبه ای می شود‪.‬‬ ‫حاال مقیاس اندازه گیری مدت مکالمه‪ ratio ،‬است‪.‬چون عالوه بر بیشتر یا کمتر بودن‪ ،‬می توانم بگویم هر کدام چقدر بیشتر از دیگری‬ ‫است‪.‬اما در ای شیوه نگارش ما در شکل باال‪ ،‬که رده بندی دسته بندی داره‪ interval ،‬هست‪.‬چون میایم نماینده ی هر دسته را پیدا می‬ ‫کنیم مثال نماینده گروه اول( بازه ‪ 60 )120-0‬و نماینده گروه دوم (بازه ‪ 180 )240 – 120‬است‪ ،‬و پس به اندازه ‪ 120‬واحد‪ ،‬گروه‬ ‫دوم از گروه اول بیشتر است‪.‬‬ ‫اما این را االن درحالتی تونستیم بگیم که چون الگوی دسته بندی داریم‪.‬اما اگر مقدار واقعی بود‪ ،‬اون وقت کسی مقدار مکالمه اش وقتی ‪0‬‬ ‫بود یعنی نداره‪ ،‬به معنای عدم وجود‪ ،‬صفر به معنای فقدان وضعیت است که پس آن موقع ‪ ratio‬میشد‪.‬‬ ‫حاال اگر جدول گزارش ‪ 2‬متغیره بود( مثل همین جدول باالیی)‪ ،‬باید برای درصد‪ 5 ،‬را بر چه عددی تقسیم کنیم؟‬ ‫‪|Page7‬‬ ‫جواب‪ :‬باید به ‪ 75‬تقسیم کنیم‪.‬چون عنوان جدول داره میگه «بر حسب گروه سنی»؛ و با توجه به این عنوان ما باید برای هر گروه سنی را‬ ‫جداگانه حساب کنیم‪.‬‬ ‫‪5‬‬ ‫غلط است ‪.‬و باید حساب کرد از کل کسانی که مثال‬ ‫حاال اگر عنوان عوض شود به‪ :‬درصدِ گروه سنی برحسب مدت مکالمه‪ ، ،‬این جا‬ ‫‪75‬‬ ‫مدت مکالمه شان بین ‪ 0‬تا ‪ 120‬دقیقه است‪ ،‬چند درصد از اینها‪ ،‬به عنوان مثال کودک اند‪.‬پس‪:‬‬ ‫ درصد می تواند برحسب عنوان ‪ ،‬سطری باشد‪ ،‬یا ستونی باشد‪ ،‬یا ‪ total‬باشد‪.‬‬ ‫اگر عنوان به این صورت بود که‪ :‬درصد گروه سنی «و » مدت مکالمه‪ ،‬این جا باید نسبت به ‪ total‬سنجیده میشد‪.‬‬ ‫***‬ ‫‪ )3‬نمودار ها‪ :‬راحت تر کردن انتقال پیام ولی غیردقیق اند‪.‬‬ ‫✓ دایره ای ( ‪ /)pie chart‬میله ای( ‪ >=)Bar chart‬این دو نمودار‪ ،‬برای توصیف یک متغیر مناسب اند‪.‬مثال‪( :‬نوع بیماری‬ ‫زمینه ای) (سابقه بیماری زمینه ای مثل پرفشاری خون و‪...‬دارد یا نه)=> پس برای یک متغیرِ اسمی یا رتبه ای‪ ،‬بنا به سلیقه ی‬ ‫خود‪ ،‬از نمودار میله ای یا دایره ای استفاده می کنیم‪.‬همچنین اگر دو متغیر داشته باشیم و هردو اسمی یا هر دو رتبه ای یا یکی‬ ‫اسمی و دیگری رتبه ای بود‪ ،‬در این شرایط ‪ bar chart‬بهتر است‪.‬چون می خواهیم مقایسه کنیم‪.‬مثال‪ :‬مقایسه نوع بیماری زمینه‬ ‫ای بین آن هایی که جراحی قلب انجام داده اند و آن هایی که دیابت دارند‪.‬یا مثال مقایسه گروه خونی بین دانشجوهای پزشکی با‬ ‫دانشجوهای مهندسی‪.‬‬ ‫نمونه ای از ‪:bar chart‬‬ ‫✓ پلی گون ‪ /‬هیستوگرام =>‬ ‫اگر اطالعات دسته بندی شده باشد‪« ،‬هیستوگرام »بهتر است‪.‬نمونه ای از هیستوگرام‪:‬‬ ‫‪|Page8‬‬ ‫هیستوگرام برای مشخص کردن توزیع نرمال و در ‪ shape‬خیلی کمک کننده است‪.‬در هیستوگرام‪ ،‬اطالعات روی محور افقی‬ ‫دسته بندی شده اند‪.‬ممکن است دسته ها مساوی یا نامساوی باشند‪.‬مثال برای طول دسته های یکسان‪ :‬گزارش هموگلوبین‪:‬‬ ‫مثال هیستوگرام برای داده هایی با طول دسته های نابرابر‪:‬‬ ‫وقتی که طول دسته ها نابرابرند( به خصوص در مطالعات اپیدمیولوژیک این اتفاق زیاد می افتد)‪ ،‬باید عالوه بر فراوانی =‬ ‫‪ ،)fi(frequency‬از چگالی (‪ )di()density‬هم استفاده کنیم‪.‬‬ ‫مثال برای دسته بندی نامساوی‪ :‬بررسی مرگ و میر برای کودکان زیر ‪ 1‬سال‪ -‬کودکان ‪ 1‬تا ‪ 5‬سال‪ 5 -‬تا ‪ 15‬سال‪ 15 -‬تا ‪35‬‬ ‫سال‪....-‬اما وقتی به سنین باالی ‪ 60‬می رسد‪ 5 ،‬سال ‪ 5‬سال زیاد می شود‪ ،‬یعنی ‪ 60‬تا‪ 65 -65‬تا ‪ 70 -70‬تا ‪...75‬‬ ‫یا هنگامی که برای غربالگری دیابت نوع ‪ ، 2‬شیوع آن در سنین زیر ‪ 20‬سال خیلی کم تر است‪ ،‬پس ناچاریم برای بازه های سنی‬ ‫متفاوتی گزارش کنیم‪.‬‬ ‫در چنین حالتی (طول دسته ها نابرابر) ‪ ،‬مساحتِ یک ستونِ هیستوگرام‪ ،‬برابر است با فراوانی‪.‬‬ ‫برای محاسبه ی چگالی در سه ردیف اول جدول صفحه بعد‪:‬‬ ‫‪|Page9‬‬ ‫باید ‪ 4‬را تقسیم یر ‪ ،1‬و ‪ 12‬را هم تقسیم بر ‪ ( 1‬طول‬ ‫دسته) کنیم‪ 7.‬را باید تقسیم بر ‪ 0.2‬کنیم‪ (.‬طول دسته از‬ ‫‪ 6‬تا ‪ 6.2‬هست)‬ ‫مثال بعدی برای محاسبه چگالی‪:‬‬ ‫برای ردیف اول‪ :‬فراوانی که ‪ 25‬است را تقسیم بر طول دسته ( ‪ )10‬می کنیم‪.‬‬ ‫(**گرچه از ‪ 100‬تا ‪ 109‬نوشته شده‪ ،‬اما طول دسته را ما ‪ 10‬درنظر می گیریم‬ ‫و در محاسبه استفاده می کنیم‪).‬‬ ‫برای ردیف دوم‪ 34 :‬تقسیم بر ‪10‬‬ ‫ردیف سوم‪ 45:‬تقسیم بر طول دسته (‪()20‬که از ‪ 119.5‬تا ‪ 139.5‬است)‬ ‫همانطور که در شکل زیر می بینید‪ ،‬نوشته شده ‪ No. of individuals/unit‬یعنی تقسیم بر واحد‪.‬که اگر تقسیمات خیلی‬ ‫کوچک بودند برای اینکه نمودار شکیل تر شود‪ ،‬می توانیم این ‪ No. of individual/unit‬را ‪ K‬برابر نیز بکنیم‪:‬‬ ‫مثال رو به رو‪ :‬نمودار «پلی گون»‪:‬‬ ‫‪| P a g e 10‬‬ ‫اگر یک متغیر عددی ( که مقدار دارد) داشته باشیم‪ ،‬و اگر گسسته بود ( مثل شکل زیر)‪ ،‬نمودار پلی گون را می توان برایش رسم‬ ‫کرد‪.‬‬ ‫*یک متغیر عددی گسسته را با پلی گون نمایش می دهیم‪.‬‬ ‫*یک متغیر اگر دسته بندی شده باشد‪ ،‬از هیستوگرام استفاده می کنیم‪.‬‬ ‫* اما اگر یه دونه دسته بندی شده باشد‪ ،‬مثل فشار خون‪ ،‬نبض ‪ ،‬هماتوکریت‪ ،‬گلبولهای سفید‪ ،RBC ،‬اگر بخواهبم ابن ها را با یک‬ ‫متغیر دوحالتی دیگر‪ ،‬مثال در آن هایی که مبتال به کووید‪ 19‬هستند و در آن هایی که مبتال به کووید‪ 19‬نیستند‪ ،‬مقایسه کنیم‪ ،‬پس‬ ‫کیفی است؛ در این جا نیز باید از پلی گون استفاده کنیم‪.‬یعنی دو حالتی است و در دو الینِ متفاوت باید ارائه بدهیم‪.‬‬ ‫✓ پراکنش( ‪ ، )scattered‬باکس پالت‬ ‫>نمودار پراکنش(‪ :)scattered diagram‬برای بیان رابطه خطی بین دو متغیر‪.‬‬ ‫درآمار‪ ،‬دو مفهوم ‪ regression‬و ‪ correlation‬داریم‪ correlation ،‬در بحث رابطه خطی خیلی مهم است‪.‬مثال‪:‬‬ ‫اگر در این شکل‪ ،‬خط را کنار بگذاریم‪ ،‬و فقط نقاط را ببینیم‬ ‫( افقی=وزن اولیه‪ ،‬عمودی= وزن از دست رفته)( مثال در بررسی‬ ‫نتیجه ی یک رژیم غذایی بعد زا مثال ‪ 2‬ماه) ‪ ،‬نقاط نشان می دهند‬ ‫مثال کسی که ‪ 35‬سال سن دازد‪ ،‬یک کیلو وزن کم کرد‪ ،‬و کسی که‬ ‫‪ 50‬ساله است دو کیلو‪ ،‬و متوجه می شویم این نقاط دارند یک‬ ‫الگوریتم ‪ ،‬یک ارتباط‪ ،‬یک الگو را نشان می دهند‪.‬اگر بدون خط‬ ‫باشد‪ ،‬می گوییم نمودار نقطه ای یا پراکنش یا ‪scattered‬‬ ‫‪ diagram‬است که رابطه خطی را نشان می دهد‪.‬‬ ‫البته این ارتباط‪ ،‬می تواند الگوهای متعددی داشته باشد؛ مثال ها در صفحه بعد‪:‬‬ ‫‪| P a g e 11‬‬ ‫→در این شکل‪ ،‬ضریب همبستگی‬ ‫کامل است چون همه نقاط کامال‬ ‫روی یک خط قرار دارند‪.‬‬ ‫هم چنین رابطه می تواند معکوس باشد‪:‬‬ ‫انواع دیگری هم می تواند باشد‪ ،‬مثال رابطه ی معکوس و ناقص‪:‬‬ ‫ممکن است هیچ رابطه ای هم با هم نداشته باشند‪ ،‬که اصطالحا به آن النه کبوتری می گویند‪:‬‬ ‫*نمودار باکس پالت یک نمودار جعبه ای است که بعد از توضیح میانه در جلسه بعد تدریس خواهد شد‪.‬‬ ‫***‬ ‫ویس به تکست‪ :‬زهرا برغمدی‪ -‬رومینا عاطفی نژاد‬ ‫تایپ‪ :‬گلسامصلحی‪ -‬مسعود شورمیج‬ ‫ادیت ‪ :‬کوثرکیائی‬ ‫‪| P a g e 12‬‬

Use Quizgecko on...
Browser
Browser