Probability and Statistics PDF
Document Details
Uploaded by CorrectHeliotrope6479
มหาวิทยาลัยราชภัฏเชียงราย
ธนัชยศ จําปาหวาย
Tags
Summary
This document is a set of notes on probability and statistics. It covers topics such as descriptive statistics, probability, random variables, and distributions. It's for a mathematics course at a university.
Full Transcript
ความน่าจะเป็ นและสถิติ Probability and Statistics สาขาวิชาคณิตศาสตร์ คณะครุ ศาสตร์ มหาวิทยาลัยราชภัฏสวนสุนันทา MAC ความน่าจะเป็ นและสถิติ Probability and Statistics ผูช้ ่วยศาสตราจารย์ ด...
ความน่าจะเป็ นและสถิติ Probability and Statistics สาขาวิชาคณิตศาสตร์ คณะครุ ศาสตร์ มหาวิทยาลัยราชภัฏสวนสุนันทา MAC ความน่าจะเป็ นและสถิติ Probability and Statistics ผูช้ ่วยศาสตราจารย์ ดร.ธนัชยศ จําปาหวาย สาขาวิชาคณิตศาสตร์ คณะครุศาสตร์ มหาวิทยาลัยราชภัฏสวนสุนนั ทา เอกสารประกอบการสอนวิชาความน่าจะเป็ นและสถิติ ปี การศึกษา / สารบัญ ความรู้พนฐานเกี ื ยวกับสถิติ. ความหมายของสถิติ.............................. ข้อมูลทางสถิติ................................. การแจกแจงความถี.............................. ฮิสโทแกรม.................................. แผนภาพต้น-ใบ................................ แผนภาพจุด................................. การวิเคราะห์ข้อมูลเบืองต้น. การวัดแน้วโน้มสูศ่ นู ย์กลาง.......................... การวัดตําแหน่งของข้อมูลเชิงปริมาณ..................... การวัดการกระจาย............................. ความน่าจะเป็ น. ปริภมู ิตวั อย่าง................................. การนับจุดตัวอย่าง............................... ความน่าจะเป็ น................................ ความน่าจะเป็ นแบบมีเงือนไข......................... กฎของเบย์................................. ตัวแปรสุ่ม. นิยามของตัวแปรสุม่.............................. การแจกแจงความน่าจะเป็ นไม่ตอ่ เนือง.................... การแจกแจงความน่าจะเป็ นต่อเนือง...................... การแจกแจงความน่าจะเป็ นร่วมกัน...................... การคาดคะเนทางคณิตศาสตร์......................... ความแปรปรวนของตัวแปรสุม่........................ การแจกแจงความน่าจะเป็ นไม่ต่อเนือง. การแจกแจงยูนิฟอร์ม............................. การแจกแจงแบร์นลู ลี............................ ก ข สารบัญ. การแจกแจงทวินาม.............................. การแจกแจงเรขาคณิต............................. การแจกแจงทวินามลบ............................ การแจกแจงพหุนาม.............................. การแจกแจงไฮเพอร์จีออเมตริก........................ การแจกแจงปั วส์ซง............................. การแจกแจงความน่าจะเป็ นต่อเนือง. การแจกแจงยูนิฟอร์ม............................. การแจกแจงปกติ............................... การแจกแจงไคสแควร์............................. การแจกแจงที................................. การแจกแจงเอฟ............................... การสุ่มตัวอย่าง. ทฤษฎีการสุม่ ตัวอย่าง............................. การแจกแจงของค่าเฉลียเลขคณิตของตัวอย่าง................ การแจกแจงสัดส่วนของตัวอย่าง....................... การแจกแจงค่าสถิติอืน ๆ.......................... การประมาณค่า. ชนิดของการประมาณค่า........................... การประมาณค่าเฉลียประชากร........................ การประมาณค่าสัดส่วน............................ การประมาณค่าความแปรปรวน....................... การทดสอบสมมติฐาน. สมมติฐานสถิติ ความผิดพลาด และการทดสอบ............... การทดสอบสมมติฐานเกียวกับพารามิเตอร์.................. การทดสอบสมมติฐานเกียวกับค่าเฉลียประชากร............... การทดสอบสมมติฐานเกียวกับความแปรปรวนประชากร........... การทดสอบสมมติฐานเกียวกับสัดส่วนประชากร............... การทดสอบความเป็ นอิสระต่อกัน...................... การถดถอยเชิงเส้นและสหสัมพันธ์. การถดถอยเชิงเส้น.............................. การถดถอยเชิงเส้นเชิงเดียว.......................... ช่วงความเชือมันและการทดสอบสมมติฐาน.................. สหสัมพันธ์................................. บทที ความรู้พนฐานเกี ื ยวกับสถิติ สถิติเกียวข้องกับชีวิตประจําวันเราอยูเ่ สมอไม่วา่ ทางตรงหรือทางอ้อม เช่น แม่ตอ้ งทราบปริมาณ การทานอาหารของครอบครัวในแต่ละมือเพือทีจะได้ทาํ เตรียมอาหารได้เพียงพอกับคนในครอบครัว หรือการจดจําเวลาทีเราเดินทางจากบ้านไปยังมหาวิทยาลัยในช่วงภาวะการต่าง ๆ เพือทีจะได้นาํ ข้อมูลทีมีใช้ในการจัดการเดินทางในครังถัดไป ให้มีประสิทธิภาพมากขึน เป็ นต้น จะเห็นได้วา่ สถิติ มี ความสําคัญในการแก้ปัญหาและพัฒนากระบวนการบางอย่างให้ดียิงขึน ในหัวข้อนี จะกล่าวถึง ความรูพ้ ืนฐานเกียวกับสถิติทีควรทราบ ก่อนจะศึกษาในรายละเอียดอืน ๆ ในบทถัดไป. ความหมายของสถิติ คําว่า สถิติ ตรงกับคําในภาษาอังกฤษ Statistics ซึงเป็ นคําทีแปลมาจากศัพท์ Statistik ในภาษา เยอรมัน ซึงคิดค้นขึนโดย Got fried Ache wall (ค.ศ. - ) เป็ นคําทีมีรากศัพท์เดียวกับคํา ว่า “State” ซึงแปลว่า “รัฐ” มีความหมายถึงข้อมูลหรือข่าวสาร ซึงเป็ นประโยชน์ตอ่ การบริหารงาน ของรัฐในด้านต่าง ๆ แต่ในปั จจุบนั มี นกั วิชาการให้ความหมายของคําว่าสถิติไว้หลายความหมาย เช่น. สถิติหมายถึงตัวเลขทีแสดงข้อเท็จจริงเกียวกับเรืองใดเรืองหนึง เช่น สถิติทีแสดงปริมาณนําฝนในกรุงเทพมหานครในเดือนมกราคม พ.ศ. สถิติอบุ ตั ิเหตุทีเกิดในประเทศไทย พ.ศ. สถิตินกั เรียนทีมาสายของโรงเรียนแห่งหนึงในปี การศึกษา. สถิติ หมายถึง ค่าตัว เลขที คํานวณได้จากข้อมูล กลุม่ ตัวอย่าง ค่าที คํานวณได้ออกมานันเรียก ว่า ค่าสถิติ เช่น ค่าเฉลียเลขคณิต ค่ามัธยฐาน ค่าฐานนิยม และค่าส่วนเบียงเบนมาตรฐาน เป็ นต้น. สถิติ หมายถึง ศาสตร์ที ว่า ด้วยการเก็บ รวมรวมข้อมูล การนํา เสนอข้อมูล และการวิเคราะห์ ข้อมูล จากความหมายของสถิติ จะเห็น ว่าการตัดสิน ใจด้านต่าง ๆ ไม่ วา่ จะเป็ น องค์กรของรัฐ หรือ เอกชน หรือ หน่วยงานต่าง ๆ จําเป็ น ต้องใช้ขอ้ มูล ทางสถิติ เข้า มาช่วยในการตัดสิน ใจเพือให้การ บทที. ความรู พ้ นฐานเกี ื ยวกับสถิติ ตัดสิน ใจนันถูก ต้องมากยิงขึน เช่น สาขาวิชาคณิตศาสตร์ของมหาวิทยาลัย แห่ง หนึง ต้องการจะ เพิมอาจารย์ในสาขา จะพิจารณาจากอัตราจํานวนอาจารย์ตอ่ นักศึกษาตามเกณฑ์สาํ นักงานคณะ กรรมการอุดมศึกษา (สกอ.) คือ : นันคืออาจารย์ คน ต่อนักศึกษา คน จากข้อมูลของสาขา พบว่ามีอตั ราส่วน : ดังนัน สาขาวิชาต้องเพิมอาจารย์ในสาขาให้ได้สดั ส่วนตามเกณฑ์มาตรฐาน เป็ นต้น สถิติแบ่งออกเป็ น ประเภทคือ สถิติเชิงพรรณา และ สถิติเชิงอนุมาน ซึงจะกล่าวรายละเอียด ในหัวข้อการวิเคราะห์ขอ้ มูล. ข้อมูลทางสถิติ ข้อมูล (Data) คือ สิงที แสดงถึง ลักษณะของข้อ เท็จ จริง เกียวกับ บุคคล สิงของหรือ เหตุการณ์ ในรูปแบบของตัวเลข ภาพ ตัวอักษร และสัญลักษณ์ตา่ ง ๆ ซึงอาจเป็ นตัวเลขหรือไม่ก็ได้ และต้อง จํานวนมากพอทีจะแสดงลักษณะของเรืองนันได้ เช่น อายุ นําหนัก ความสูง รายได้ เพศ ระดับการ ศึกษา อาชีพ เป็ นต้น ข้อมูลทีเก็บรวบรวมมาได้เรียกว่า ข้อมูลดิบ (raw data) จากนันจะนําข้อมูล ไปวิเคราะห์และประมวลผลต่อไป ซึงจะเรียกว่า สารสนเทศ (Information) ดังนันสารสนเทศหมาย ถึง ข้อมูลได้ผา่ นการเปลียนแปลงหรือมีการประมวลผลหรือวิเคราะห์สรุปผลด้วยวิธีการต่าง ๆ แสดงตัวอย่างดังนี ตารางที. : ตัวอย่างข้อมูลดิบและสารสนเทศ ข้อมูลดิบ สารสนเทศ - คะแนนนักเรียนในห้อง - นักเรียนส่วนใหญ่ในห้องนีมีคะแนนสูงกว่าเกณฑ์ - รายได้ของครูในพืนที กทม. - ครูในพืนที กทม. มีรายได้เฉลีย , ต่อเดือน - จํานวนพายุทีผัดผ่านประเทศไทย - โดยเฉลียแล้วพายุจะผัดผ่านประเทศไทยปี ละ ครัง - จํานวนคนทีกดไลค์เฟสบุค - คนทีกดไลค์เพจแมทโคตรส่วนใหญ่มีอายุชว่ ง - ปี ข้อมูลทีนํามาวิเคราะห์ประกอบด้วยข้อมูลหลายประเภท อาจพิจารณาตามลักษณะต่าง ๆ ดังนี แบ่งตามลักษณะของข้อมูล. ข้อมูล เชิง ปริมาณ (Quantitative data) คือ ข้อมูล ที วัด ค่า ได้วา่ มากหรือ น้อย จึง แสดงเป็ น ตัวเลข เช่น รายได้ นําหนัก ส่วนสูง คะแนนสอบ อายุ เป็ นต้น แบ่งออกเป็ น แบบคือ. ข้อมูล แบบไม่ ต่อ เนือง (Discrete data) หมายถึง ข้อมูล ที มี คา่ เป็ น จํานวนเต็ม หรือ จํานวนนับ. ข้อมูล แบบต่อ เนือง (Continunous data) หมายถึง ข้อมูล ที มี คา่ ได้ ทกุ ค่า ในช่วงที กําหนดทีมีความหมาย แสดงตัวอย่างดังนี.. ข้อมูลทางสถิติ ตารางที. : ตัวอย่างข้อมูลแบบไม่ตอ่ เนืองและข้อมูลแบบต่อเนือง ข้อมูลแบบไม่ตอ่ เนือง ข้อมูลแบบต่อเนือง - จํานวนใข่ไก่ในตะกร้า - นําหนักของไข่ไก่ ฟอง - จํานวนเด็กในห้องเรียน - ส่วนสูงของนักเรียน - จํานวนพายุทีผัดผ่านในฤดูกาลหนึง - ความเร็วลม - จํานวนคนทีกดไลค์เฟสบุค - อุณหภูมิของนํา. ข้อมูลเชิงคุณภาพ (Qualitative data) หรือข้อมูลจําแนกประเภท (Categorical data) หรือ บางครังเรียกว่า ข้อมูล เชิง กลุม่ เป็ น ข้อมูล ที ไม่ สามารถระบุ คา่ ได้วา่ มากหรือ น้อย มัก จะเป็ น ข้อความ เช่น ระดับการศึกษา การนับถือศาสนา เพศ เป็ นต้น แบ่งตามแหล่งทีมาของข้อมูล. ข้อมูลปฐมภูมิ (Primary data) คือข้อมูลทีเก็บรวบรวมด้วยตัวเองหรือจากแหล่งทีให้ขอ้ มูล โดยตรง เช่น การทดลอง การสอบถาม การทําสํามะโน การสัมภาษณ์ เป็ นต้น ข้อมูลปฐมภูมิ จะเป็ นข้อมูลทีมีรายละเอียดตรงตามทีผูใ้ ช้ตอ้ งการ อาจเสียเวลาและค่าใช้จา่ ยมาก และเป็ น ข้อมูลยังไม่ทาํ การวิเคราะห์. ข้อมูล ทุตยิ ภูมิ (Secondary data) คือ ข้อมูล ที รวบรวมได้จากแหล่ง อืนที มี ผู้รวบรวมไว้ให้ เช่น รายงานต่าง ๆ ของหน่วยราชการหรือเอกชน เป็ นต้น ผูใ้ ช้ขอ้ มูลเพียงนําข้อมูลมาใช้เท่านัน จึงประหยัดทังเวลาและค่าใช้จา่ ย ดังนันข้อมูลทตุยภูมิคือข้อมูลทีทําการวิเคราะห์เบืองต้นมา แล้ว การนําข้อมูลชนิดนีมาใช้อาจมีรายละเอียดไม่เพียงพอ หรือไม่ตรงตามต้องการ ดังนันผู้ ใช้อาจไม่ทราบถึงข้อผิดพลาดของข้อมูล จึงควรระมัดระวังในการใช้ แสดงตัวอย่างดังนี ตารางที. : ตัวอย่างข้อมูลปฐมภูมิและข้อมูลทุติยภูมิ ข้อมูลปฐมภูมิ ข้อมูลทุติยภูมิ - คะแนนทีได้จากการสอบถามเพือน ๆ ในห้อง - คะแนนทีได้จากการบันทึกของครูผสู้ อน - อุณหภูมิของสารต่าง ๆ ทีได้จากทดลอง - ค่าความชืนในอากาศทีได้จากเว็ปไซค์ - จํานวนนักเรียนทีมาสายในแต่ละวัน ของกรมอุตนุ ิยมวิทยา จากการสังเกตหน้าโรงเรียน - นําหนักของผูส้ งู วัยใน กทม. ทีได้จากสํานัก สถิติแห่งชาติ หากต้องการทราบข้อมูล ทางสถิติ บางอย่าง เช่น รายได้ ของคนไทย สิงแรกที ต้องทํา คือ การ สํารวจหรือเก็บข้อมูลของรายได้ของคนไทย จะเรียกคนไทยทุกคนว่า ประชากร (Population) ของ การสํารวจในครังนี ถ้าสนใจนําหนักของนักเรียนในกรุงเทพมหานคร ประชากรคือ นักเรียนทุกคนใน กรุงเทพมหานคร ดัง นันประชากรในทางสถิติ จงึ มี ความหมายกว้างกว่า ความคํา ว่า ประชากรโดย ทัวไป ดังจะนิยามดังนี บทที. ความรู พ้ นฐานเกี ื ยวกับสถิติ บทนิยาม.. ประชากร คือเซตของค่าสังเกตทังหมดในการทดลอง หรือในการสํารวจทางสถิติ จํานวนของค่าสังเกตทังหมดของประชากร คือตัวเลขทีบอกขนาดของประชากร เช่นสํารวจคะแนน สอบวิชาคณิตศาสตร์ของนักเรียนชัน ม. ของโรงเรียนแห่งหนึงทีมีจาํ นวนทังหมด คน จะได้ ว่าขนาดของประชากรในการสํารวจครังนีคือ ประชากรอาจแบ่งตามขนาดได้ ชนิดคือ. ประชากรทีมีจาํ นวนแน่นอน (Finite population) เช่น จํานวนรถโดยสารประจําทางในกรุง เกพมหานคร จํานวนนักศึกษาสาขาวิชาคณิตศาสตร์ คณะครุศาสตร์ มหาวิทยาลัย ราชภัฏ สวนสุนนั ทา เป็ นต้น. ประชากรทีมีจาํ นวนอนันต์ (Infinite population) เช่น จํานวนข้าวทีเก็บเกียวได้ในปี หนึง ๆ และจํานวนครังทีทอดลูกเต๋าจนได้แต้ม เป็ นต้น จะห็ นว่า การเก็บ รวบรวมข้อมูล ทุก หน่วยในประชากรที มี ขนาดใหญ่ อาจเกิด ความยุง่ ยาก ใช้ เวลามากและค่าใช้จา่ ยสูง ผูว้ ิจยั อาจเก็บข้อมูลบางส่วนของประชากร ซึงจะเรียกว่า ตัวอย่าง (Sample) เช่น ต้องการหาอายุเฉลียของประชากรไทย ประชากรคือคนไทยทุกคน ตัวอย่างคือคนไทยบางส่วน ทีถูกเลือกเป็ นตัวอย่าง หรือนิยามได้ดงั นี บทนิยาม.. ตัวอย่าง คือเซตย่อยของประชากรทีไม่ใช่เซตว่าง การเก็บ รวบรวมข้อมูล เพือนํา มาวิเคราะห์ อาจประกอบด้วยข้อมูล ปฐมภูมิ และข้อมูล ทุติย ภูมิ โดยข้อมูลที ได้อาจเป็ นข้อมูลเชิงปริมาณ และเชิงคุณภาพ ในกรณี การใช้ขอ้ มูลปฐมภูมิหน่วยงาน จะเป็ นผูเ้ ก็บข้อมูล ซึงมีวิธีเก็บรวบรวม วิธีดงั นี. การเก็บรวบรวมข้อมูลจากทะเบียนหรือการบันทึก คือ การจดบันทึก หรือ งานทะเบียนของหน่วยงาน หรือ องค์กรต่าง ๆ เช่น การบันทึก จํานวน นักเรียนทีมาเรียนในแต่ละวัน ของโรงเรียนแห่งหนึง การบันทึกข้อมูลผูม้ ารักษาในโรงพยาบาล แห่ง หนึง เช่น อายุ เพศ และหมู่เลือด เป็ นต้น ห้างสรรพสินค้า จํา บันทึก ยอดขายของสินค้า แต่ละแผนกทุกวัน. การเก็บรวมรวมข้อมูลโดยการสํารวจ ทําได้ แบบคือ. การทําสํามะโน (Census) คือข้อมูลทีเก็บรวบรวมข้อมูลทุก ๆ หน่วยของประชากร. การสํารวจด้วยตัวอย่าง (Sample survey) คือการเก็บข้อมูลบางหน่วยทีเลือกมาเป็ น ตัวแทนจากทุก ๆ หน่วยของประชากร. การเก็บรวบรวมข้อมูลโดยการทดลอง ในบางครังเรืองที เราสนใจไม่ สามารถทําการสํารวจได้ แต่ ตอ้ งเก็บ ข้อมูล โดยทําการทดลอง เช่น เปรียบเทียบการสอนวิชาคณิตศาสตร์เรืองจํานวนเต็ม รูป แบบ หรือ ศึกษาผลสัมฤทธิ ของวิชาคณิตศาสตร์เรืองพืนที ผิว และปริมาตรของนักเรียนชัน ม. โรงเรียนแห่ง หนึงโดยใช้ สือประสมร่วมกับโปรแกรม GeoGebra การเก็บรวบรวมข้อมูลทําได้หลายแบบ เช่น.. ข้อมูลทางสถิติ. การสัมภาษณ์ (Interview) การส่งพนักงานไปสัมภาษณ์หน่วยต่าง ๆ ในประชากรหรือตัวอย่าง พนักงานจะเป็ นผูจ้ ดบันทึก คําตอบในแบบสอบถาม. การส่งไปรณีย ์ (Mail) การส่งแบบสอบถามทางไปรษณียไ์ ปให้ผตู้ อบแบบสอบถามทีถูกเลือก เมือผูต้ อบแบบสอบถาม แล้วให้สง่ คืนมาทางไปรษณีย ์. การทอดแบบ การนําแบบสอบถามไปให้ผตู้ อบ แล้วนัดมารับแบบสอบถามคืน. โทรศัพท์ พนักงานใช้โทรศัพท์ไปสอบถามผูต้ อบ หรือผูท้ ีถูกเลือกเป็ นตัวอย่าง. การชัง ตวง วัด หรือนับ การศึกษาข้อมูล บางเรืองที ต้องการตัวเลขที แน่นอน เช่น นําหนัก ของเด็ก แรกเกิด ขนาดขแง แปลงเพราะปลูก จึงต้อง ชัง ตวง วัด หรือนับ จึงจะได้ขอ้ มูลทีถูกต้อง. การสังเกต การเก็บรวบรวมข้อมูลทีพนักงานสนามต้องไปสังเกตการณ์ในปฏิกิรยิ าต่าง ๆ ส่วนใหญ่ วิธีนี จะใช้เมือไม่สามารถใช้วิธีอืนได้ เช่นการสังเกตความพอใจในรสชาติของกาแฟยีห้อหนึง การ สังเกตความพึงพอใจต่อการจัดการเรียนการสอนของวิชาหนึง เป็ นต้น หลังจากการเก็บรวบรวมข้อมูล จะต้องทําการวิเคราะห์ขอ้ มูลเพือนําไปสรุปผล การวิเคราะห์ ข้อมูลอาจแบ่งออกเป็ น ชนิดคือ การวิเคราะห์ขอ้ มูลเบืองต้น และการวิเคราะห์ขอ้ มูลขันสูง. การวิเคราะห์ขอ้ มูลเบืองต้นหรือเรียกว่า สถิติเชิงพรรณา (Descriptive Statistics) เป็ นการ วิเคราะห์ขนต้ ั น ที มุง่ วิเคราะห์เพือหาลักษณะกว้าง ๆ ของข้อมูล ชุด นัน ซึงข้อ สรุป และผลที ได้จะพรรณนาลักษณะหรือแจกแจงข้อมูลตามที ได้รวบรวมมาเท่านัน มักนําเสนอในรูปของ ตาราง แผนภาพ แผนภูมิ ร้อยละ เปอร์เซ็นไทล์ การแจกแจงความถี การหาค่าเฉลีย เป็ นต้น จะกล่าวในบทที. การวิเคราะห์ขอ้ มูลขันสูงหรือเรียกว่า สถิตเิ ชิงอนุมาน (Inferential Statistics) เป็ นการวิเคราะห์ ข้อมูลทีเก็บรวบรวมได้จากตัวอย่างเพืออ้างอิงไปถึงข้อมูลทังหมดหรือประชากร การวิเคราะห์ ในขันนี ได้แก่ การประมาณค่า การทดสอบสมมติฐาน การวิเคราะห์ความแปรปรวน เป็ นต้น จะกล่าวในบทที - การนําเสนอข้อมูลสถิติแบ่งออกเป็ น แบบ. การนําเสนอข้อมูลสถิติโดยปราศจากแบบแผน (Informal Presentation) การนําเสนอข้อมูลสถิติเป็ นบทความ การนําเสนอข้อมูลสถิติเป็ นบทความกึงตาราง. การนําเสนอข้อมูลสถิติโดยมีแบบแผน (Formal Presentation) บทที. ความรู พ้ นฐานเกี ื ยวกับสถิติ การเสนอข้อมูลสถิติดว้ ยตาราง (Tabular Presentation) การเสนอข้อมูลสถิติดว้ ยกราฟและรูป (Graphic Presentation). การแจกแจงความถี ในการเก็บ รวบรวมคะแนนหรือ ข้อมูล ต่าง ๆ ที ได้จากการวัด เพือให้มี การจัด ระเบียบเตรียม ข้อมูลจัดให้เป็ นหมวดหมู่ โดยการทําให้แปลความหรือนําไปใช้ได้งา่ ย เช่น การเรียงข้อมูลจากมาก ไปหาน้อยหรือน้อยไปหามาก การทําตารางแจกแจงความถี การเขียนแผนภาพต้นใบ เป็ นต้น การสร้างตารางแจกแจงความถีของข้อมูลเชิงปริมาณสิงแรกคือจํานวนชันของ การตัดสินใจว่า ควรมีจาํ นวนชันเท่าใดขึนอยูก่ บั จํานวนข้อมูล ไม่ควรมีนอ้ ยเกินไปหรือมากเกินไป อย่างไรก็ตามโดย ทัวไปจะมี อย่างน้อย ชัน แต่ไม่เกิน ชัน กรณี ทีข้อมูลมี การกระจายมาก ๆ ควรกําหนดชันให้ น้อยเพือไม่ให้บางชันไม่มีขอ้ มูลตกอยู่ในชันนัน และในกรณี ทีไม่ทราบว่าจะกําหนดจํานวนชันเป็ น เท่าใด ให้ k แทนจํานวนชัน อาจใช้สตู รคํานวณดังนี k = 1 + 3.3ℓogN เมือ N เป็ นจํานวนข้อมูลทังหมด ตัวอย่างการคํานวณจํานวนชันแสดงดังตารางต่อไปนี ตารางที. : ตัวอย่างจํานวนชันเมือทราบจํานวนข้อมูล จํานวนข้อมูล (N ) จํานวนชัน (k) จํานวนข้อมูล (N ) จํานวนชัน (k) 10 5 45 7 15 5 50 7 20 6 60 7 25 6 70 8 30 6 80 8 35 7 90 8 40 7 100 8 ต่อไปคือองค์ประกอบของการสร้างตารางแจกแจงความถี. พิสัย (Range) คือผลต่างระหว่างข้อมูลทีมีคา่ มากสุดและค่าน้อยสุด เขียนแทนด้วย R นัน คือ R= ค่าสูงสุด − ค่าตําสุด ถ้าข้อมูลมี N ประกอบไปด้วย X1, X2, X3,..., XN กําหนดให้ Xmax = ค่าสูงสุดของข้อมูล = max{X1 , X2 , X3 ,..., XN } Xmin = ค่าตําสุดของข้อมูล = min{X1 , X2 , X3 ,..., XN } จะได้วา่ R = Xmax − Xmin.. การแจกแจงความถี. อันตรภาคชัน (Class interval) คือช่วงคะแนนของแต่ละชันทีกําหนด ความกว้างของอันตรภาค ชัน เขียนแทนด้วย I I= พิสยั = R จํานวนชัน k โดยที I เป็ น จํานวนเต็มบวก กรณี ทีไม่เป็ นจํานวนเต็มให้ใช้จาํ นวนเต็มใกล้สดุ ทีมากกว่าค่า นัน เช่น. ให้ใช้ และ. ให้ใช้ เป็ นต้น หมายเหตุ ในกรณีทีผูส้ ร้างตารางกําหนดความกว้างชันไว้ก่อน จะหาจํานวนชันได้จาก R k= I โดยที k เป็ นจํานวนเต็มบวก ถ้าไม่เป็ นจํานวนเต็มอาศัยหลักการเดียวกับการหา I. ขีดจํากัดชัน (Class limit) การคํานวณขีดจํากัดล่างของชันแรก (ชันทีมีคา่ ตําสุด) ครอบคลุม ข้อมูลทีมีคา่ ตําสุด และขีดจํากัดบนของชันสุดท้าย (ชันทีมีคา่ สูงสุด) ครอบคลุมข้อมูลทีมีคา่ มากสุด อาจใช้สตู รได้ดงั นี Ik − R ขีดจํากัดล่างของชันแรก = Xmin − 2 และปั ดเศษให้มีลกั ษณะเหมือนข้อมูลจริง ดังนัน ขีดจํากัดบนของชันแรก = ขีดจํากัดล่างของชันแรก +I −1. ขอบเขตจํากัดชัน (Class boundary) การหาขอบเขตชันจะกําหนดให้ขอบเขตชันมีจาํ นวน หลักหลังจุดทศนิยมมากกว่าค่าของข้อมูลจริงอยูห่ นึงหลักเสมอ โดยคํานวนได้จาก ขอบเขตจํากัดชัน = ขีดจํากัดบนของชัน + ขีดจํากัดล่างของชันถัดไป 2 มักใช้ Ui แทนขอบเขตจํากัดบนของชันที i และ Li แทนขอบเขตจํากัดล่างของชันที i ถ้า ทุก ๆ ชันความกว้างเท่ากันคือ I จะได้วา่ I = Ui − Li. ค่ากึงกลางชัน (Midpoint) คือข้อมูลทีอยู่ตรงกลางชันนัน มักใช้ xi แทนจุดกึงกลางของชัน ที i หาได้จาก Li + Ui xi = 2. ความถี (Frequency) คือจํานวนทีแสดงว่าค่าทีเป็ นไปได้แต่ละค่าทีเกิดกีครัง มักใช้ fi แทน ความถีของชันที i หมายถึงจํานวนค่าทีเป็ นไปได้ของชันที i บทที. ความรู พ้ นฐานเกี ื ยวกับสถิติ ตัวอย่าง.. คะแนนสอบย่อยวิชาแคลคูลสั ของนักศึกษาจํานวน 20 คน แสดงดังนี 1 1 1 2 5 8 9 10 10 11 11 12 13 14 15 16 17 18 18 18 จงสร้างตารางแจกแจงความถีของข้อมูลชุดนี. จํานวน ชัน. ไม่ได้กาํ หนดจํานวนชัน.. การแจกแจงความถี. กําหนดความกว้างแต่ละชันเท่ากับ บทที. ความรู พ้ นฐานเกี ื ยวกับสถิติ ตัวอย่าง.. อุณหภูมิ (หน่วยองศาเซลเซียส) ของสสารทัง 30 ชนิด แสดงดังนี 0.5 0.8 1.5 1.6 1.8 1.9 2.0 2.1 2.3 2.5 2.7 3.0 3.3 3.4 3.4 3.5 3.7 3.8 3.9 3.9 4.0 4.0 4.1 4.2 4.2 4.3 4.5 4.8 4.9 5.0 จงสร้างตารางแจกแจงความถีของข้อมูลชุดนี.. การแจกแจงความถี ข้อสังเกตในการกําหนดจํานวนและความกว้างของอันตรภาคชัน. ความกว้างของแต่ละอันตรภาคชันไม่ จาํ เป็ น ต้องเท่า กัน ขึนอยู่ กบั วัตถุประสงค์ของการใช้ ข้อมูล. ค่าทีสังเกตได้บางค่าอาจต่างไปจากค่าอืนมาก เช่น ในการสอบครังหนึงมีผสู้ อบได้ คะแนน ในขณะทีคนอืน ได้คะแนน มากกว่า คะแนน ควรกําหนดอันตรภาคชันแรกเป็ นอันตรภาค ชันเปิ ด (Open-Ended Class Interval) ดังตัวอย่าง ตารางแสดงจํานวนผูป้ ่ วยของโรงพยาบาล แห่งหนึง จําแนกตามระยะเวลาป่ วย เป็ นดังนี ระยะเวลาป่ วย (วัน) จํานวนผูป้ ่ วย (คน) น้อยกว่า 7 วัน 444, 250 7 − 14 51, 210 15 − 30 24, 105 31 − 60 17, 220 61 − 90 34, 550 มากกว่า 90 วัน 11, 150 รวม 182, 485 จากตัวอย่างนี จะเห็นได้ชดั ว่าความกว้างของแต่ละอันตรภาคชันไม่เท่ากัน และมี อนั ตรภาค ชันเปิ ด. การกําหนดจํานวนอันตรภาคชันในการสร้างตารางแจกแจงความถีไม่มีกฎเกณฑ์แน่นอนตายตัว ขึนอยู่กบั ลักษณะการกระจายของข้อมูลรายละเอียดของข้อมูลทีต้องการทราบด้วย เช่น ถ้า ค่าทีสังเกตได้มีความแตกต่างกันมากมักจะกําหนดให้มีอนั ตรภาคชันน้อย เพือไม่ให้มีอนั ตรภาค ชันที มี ความถี เป็ น ศูนย์หรือ หากต้องการทราบรายละเอียดของข้อมูล อย่างละเอียดก็ ควรกํา หนดให้มีจาํ นวนอันตรภาคชันมาก บทที. ความรู พ้ นฐานเกี ื ยวกับสถิติ. ฮิสโทแกรม ฮิสโทแกรม (Histogram) คือกราฟทีแสดงถึงการกระจายของข้อมูล มีลกั ษณะเป็ นรูปสีเหลียม มุมฉากวางเรียงติดต่อกันบนแกนนอนโดยมีแกนนอนแทนค่าของตัวแปร ความกว้างของรูปสีเหลียม มุมฉากแทนความกว้างของอันตรภาคชัน ความสูงของรูปสีเหลียมมุมฉากจะแสดงความถี รู ปหลายเหลียมความถี (Frequency Polygon) คือรูปกราฟหลายเหลียมทีเกิดจากการโยงจุด กึงกลางของยอดแท่งของสีเหลียมของฮิสโทแกรมด้วยเส้นตรง หรือแผนภูมิเส้นทีแสดงความถีของ คะแนนแต่ละชัน โดยเพิมฮิสโทแกรมอีก ชันคือชันตําสุดและชันสูงสุดมีคา่ ความถีเท่ากับ ตัวอย่าง.. จากข้อมูลนําหนักของเด็กระดับชันประถมศึกษาของโรงเรียนแห่งหนึง แสดงตาราง แจกแจงความถีดังนี นําหนัก จํานวนคน ขอบเขตจํากัดล่าง−ขอบเขตจํากัดบน ค่ากึงกลาง 10 − 19 1 20 − 29 4 30 − 39 9 40 − 49 12 50 − 59 9 60 − 69 4 70 − 79 1 จงเขียนแผนภาพฮิสโทแกรมและรูปหลายเหลียมความถี ความถี 14 12 10 8 6 4 2 0 นําหนัก.. ฮิสโทแกรม ตัวอย่าง.. นําหนักของนักเรียนชันอนุบาลของโรงเรียนแห่งหนึง เมือนําไปสร้างตารางแจงแจง ความถีทีมีความกว้างเท่ากันทุกชันคือ โดยมีขีดจํากัดล่างชันแรก กิโลกรัม สร้างได้ทงหมด ั ชัน เรียงจากน้อยไปมาก โดยมี จาํ นวนนักเรียนแต่ละชัน , , , , ตามลําดับ จงสร้างฮิสโทแกรม ของข้อมูลชุดนี บทที. ความรู พ้ นฐานเกี ื ยวกับสถิติ ตัวอย่าง.. ข้อมูล เวลา (นาที) ที ใช้ในการเดินทางมาโรงเรียนกับจํานวนนักเรียนแสดงด้วยรูป หลายเหลียมความถีดังนี ความถี (คน) 20 16 12 8 4 0 เวลา (นาที) 5 10 15 20 25 30 35 40. จงหาจํานวนชันและความกว้างของอันตรภาคชัน. จงหาจํานวนนักเรียนในโรงเรียนแห่งนี. นักเรียนทีใช้เวลาเดินทางมาโรงเรียนน้อยกว่า นาทีมีกีเปอร์เซ็นต์.. ฮิสโทแกรม บางครังเมือสร้างรูป หลายเหลียมความถี แล้ว สามารถปรับ เส้น โค้ง ความถี ให้ เรียบได้ เรียกว่า เส้น โค้ง ความถี (Frequency curve) ซึงจะแสดงถึง ลักษณะข้อมูล เส้น โค้ง ความถี อาจอยู่ ในรูป แบบต่าง ๆ ดังนี เช่น ความถี (คน) 20 16 12 8 4 0 เวลา (นาที) 5 10 15 20 25 30 35 40 รูปที. : รูปแบบต่าง ๆ ของเส้นโค้งความถี เบ้ทางซ้าย สมมาตร เบ้ทางขวา (Left-Skewed) (Symmetric) (Right-Skewed) รูปตัว J รูปตัว J กลับข้าง รูปตัว U (J-Shaped) (Reverse J-Shaped ) (U-Shaped) ยูนิฟอร์ม ทวิฐานนิยม พหุฐานนิยม (Uniform) (Bimodal) (Multimodal) บทที. ความรู พ้ นฐานเกี ื ยวกับสถิติ ความถีสะสม (Cumulative frequency) คือผลรวมความถีของอันตรภาคชันนันกับความถีของ ทุก ๆ อันตรภาคชันที อยู่ตากว่ ํ า หรือ สูง กว่า อย่างใดอย่างหนึง มัก ใช้ Fi แทนความถี สะสมของ ชันที i ความถีสัมพัทธ์ (Relative frequency) คือความถีของอันตรภาคชันนันหารด้วยผลรวมของ ความถีทังหมด ความถีสะสมสัมพัทธ์ (Cumulative relative frequency) คือผลรวมความถีสะสม ของอันตรภาคชันนันกับความถีสะสมของทุก ๆ อันตรภาคชันทีอยู่ตากว่ ํ าหรือสูงกว่าอย่างใดอย่าง หนึง หรืออาจบอกในรูปร้อยละหรือเปอร์เซ็นต์เมือคูณด้วย ตัวอย่าง.. ข้อมูลชุดหนึงแสดงตารางแจกแจงความถีดังนี คะแนน ความถี (คน) 6 − 10 3 11 − 15 5 16 − 20 15 21 − 25 10 26 − 30 7 จากตารางแจกแจงความถีจงหาความถีสะสม ความถีสัมพัทธ์ และร้อยละความถีสะสมสัมพัทธ์ คะแนน ความถี (คน) ความถีสะสม ความถีสะสมสัมพัทธ์ ร้อยละความถีสะสมสัมพัทธ์ 6 − 10 4 11 − 15 5 16 − 20 10 21 − 25 8 26 − 30 3 ตัวอย่าง.. ข้อมูลชุดหนึงมีบางส่วนถูกนําเสนอในตารางต่อไปนี อันตรภาคชัน ความถี ความถีสะสม ความถีสัมพัทธ์ 2− 6 7 − 11 11 0.2 12 − 16 14 17 − 21 6 0.3 จงเติมตารางให้สมบูรณ์.. ฮิสโทแกรม เส้น โค้งความถีสะสม (Cumulative frequency curve) หรือเส้นโค้งโอจีฟ (Ogive curve) เป็ นโค้งทีแสดงความถีสะสมของข้อมูลตังแต่คา่ ตําสุดถึงค่าสูงสุด หลักการเขียนเส้นโค้งของความถี สะสมทําได้ดงั นี. ให้แกนนอนเป็ นคะแนน และแกนตังเป็ นความถีสะสม. หาตําแหน่งของจุด (ขอบเขตจํากัดบน, ความถี สะสม) ของอันตรภาคชันแต่ละชันทีไม่ใช่ชนั แรก โดยชันแรกให้ใช้จดุ (ขอบเขตจํากัดล่างชันแรก, ). ลากเส้นเชือมแต่ละจุดทีติดกัน แล้วปรับโค้งให้เรียบ ตัวอย่าง.. จงสร้างเส้นโค้งความถีสะสมของข้อมูลจากตารางแจกแจงความถีนี นําหนัก (กิโลกรัม) ความถี (คน) ความถีสะสม ขอบล่าง−ขอบบน 11 − 20 4 21 − 30 6 31 − 40 10 41 − 50 20 51 − 60 10 61 − 70 6 71 − 80 4 ความถีสะสม 70 60 50 40 30 20 10 0 10.5 20.5 30.5 40.5 50.5 60.5 70.5 80.5 90.5 นําหนัก บทที. ความรู พ้ นฐานเกี ื ยวกับสถิติ ตัวอย่าง.. ข้อมูลอายุของชุมชนแห่งหนึง แสดงด้วยเส้นโค้งโอจีพดังนี จํานวนคนสะสม (คน) 40 35 30 25 20 15 10 5 0 อายุ (ปี ) 5 10 15 20 25 30 35 จงหาช่วงอายุทีมีจาํ นวนคนสูงสุด (ความถีสูงสุด) และจงประมาณอายุของคนลําดับที เมือ เรียงอายุจากน้อยไปมาก.. แผนภาพต้น-ใบ. แผนภาพต้น-ใบ ในการจัดข้อมูลทีมีอยู่ให้เป็ นกลุม่ ๆ เพือความสะดวกในการนําไปวิเคราะห์ขอ้ มูลอาจทําได้โดย ใช้ตารางแจกแจงความถี และใช้กราฟ เช่น การสร้างฮิสโทแกรม จะเห็นว่าวิธีดงั กล่าวอาจทําให้ไม่ สามารถบอกได้วา่ ข้อมูลทีมีอยูม่ ีคา่ ใดบ้าง เนืองจากได้จดั แบ่งข้อมูลทีมีอยูเ่ ป็ นช่วง ๆ การจัดข้อมูลเป็ นกลุม่ มีอีกวิธีหนึงคือการสร้างแผนภาพเพือแจกแจงความถีและวิเคราะห์ขอ้ มูล เบืองต้นไปพร้อมกันคือ แผนภาพต้น-ใบ (stem and leaf diagram) ซึงทําได้ดงั ตัวอย่างต่อไปนี ตัวอย่าง.. นําหนักของนักเรียนในโรงเรียนแห่งหนึงจํานวน 20 คน ดังนี 34 35 36 38 39 39 40 40 41 42 42 43 44 45 46 50 51 51 52 54 ตัวอย่าง.. คะแนนของวิชาคณิตศาสตร์และฟิ สกิ ส์ของนักเรียนในโรงเรียนแห่งหนึงจํานวน 20 คน ดังนี วิชาคณิตศาสตร์ 12 15 16 22 23 24 26 30 31 33 33 35 35 39 40 41 42 44 44 45 วิชาฟิ สกิ ส์ 10 11 15 19 20 21 21 23 25 27 29 32 35 35 36 37 38 40 45 49 บทที. ความรู พ้ นฐานเกี ื ยวกับสถิติ. แผนภาพจุด แผนภาพจุด (Dot Plot) เป็ นรูปแบบหนึงของการนําเสนอข้อมูลเชิงปริมาณทีทําได้ไม่ยาก โดย จะเขียนจุด แทนข้อมูล แต่ละตัว ไว้เหนือ เส้น ในแนวนอนที มี สเกลให้ตรงกับ ตําแหน่ง ที แสดงค่า ของ ข้อมูลนัน แผนภาพจุดช่วยให้เห็นภาพรวมของข้อมูลได้รวดเร็วกว่าการพิจารณาจากข้อมูลโดยตรง โดยเฉพาะอย่างยิงเมือสนใจจะพิจารณาลักษณะของข้อมูลว่ามีการกระจายมากน้อยเพียงใด ตัวอย่าง.. จงสร้างภาพจุดของคะแนนสอบย่อยวิชาแคลคูลสั ทีมีคะแนนดังต่อไปนี 0 1 2 3 4 5 6 7 8 9 10 ตัวอย่าง.. จากการสํารวจวันเกิดของนักเรียนในห้องเรียนหนึง ปรากฎดังนี ลําดับที วันเกิด ลําดับที วันเกิด ลําดับที วันเกิด อาทิตย์ เสาร์ ศุกร์ จันทร์ ศุกร์ จันทร์ อาทิตย์ อาทิตย์ อาทิตย์ อังคาร พฤหัสบดี ศุกร์ พุธ พฤหัสบดี พฤหัสบดี จงสร้างภาพจุดแสดงวันเกิดของนักเรียนในห้องนี อาทิตย์ จันทร์ อังคาร พุธ พฤหัสบดี ศุกร์ เสาร์.. แผนภาพจุด แบบฝึ กหัดบทที. ความหมายของคําว่าสถิติทีเหมาะสมทีสุดสําหรับคุณคือความหมายใด เพราะเหตุใด. จงยกตัวอย่างประโยชน์ของสถิติในงานด้านต่าง ๆ มาอย่างน้อย ด้าน พร้อมเหตุผลประกอบ. จงยกตัวอย่างข้อมูลแบบต่อเนือง ตัวอย่าง. จงบอกข้อดี และข้อเสีย ของข้อมูลปฐมภูมิและข้อมูลทุติยภูมิ. จงยกตัวอย่างการเก็บข้อมูลทีจําเป็ นต้องใช้ การทําสํามะโน มาอย่างน้อย ตัวอย่าง. จงบอกข้อดี และข้อเสีย ของการสํามะโน และการสํารวจด้วยตัวอย่าง. จงยกตัวอย่างการเก็บข้อมูลทียังไม่ได้กล่าวถึงในบทนี. จงบอกข้อแตกต่างระหว่างสถิติเชิงพรรณา และสถิติเชิงอนุมาน. คะแนนจากการสอบวิชาคณิตศาสตร์ของนักเรียน 60 คน ซึงมี คะแนนเต็ม 30 คะแนน เป็ น ดังนี 28 22 20 17 16 25 18 22 28 17 19 22 22 21 19 28 26 21 18 24 21 24 22 20 22 24 28 16 23 22 17 28 24 27 23 22 22 29 16 20 21 21 26 27 28 27 27 25 23 24 25 24 22 25 21 24 28 16 23 22 จากข้อมูลข้างต้นจงสร้างตารางแจกแจงความถีจํานวน 5 ชัน พร้อมทังแสดงข้อมูลด้วยฮิสโท แกรม รูปหลายเหลียมความถี และเส้นโค้งโอจีพ. จงเติมตารางให้สมบูรณ์ คะแนน ความถี (คน) ความถีสะสม ร้อยละความถีสัมพัทธ์ จุดกึงกลางชัน 11 − 20 20 21 − 30 120 31 − 40 25 41 − 50 80 50 55.5 61 − 70 390 71 − 80 10 บทที. ความรู พ้ นฐานเกี ื ยวกับสถิติ. ข้อมูลคะแนนสอบวิชาสถิติ ของนักเรียน คน ดังนี 72 83 82 92 70 91 71 33 42 51 55 75 38 40 75 49 53 41 86 89 51 57 66 92 38 96 85 93 60 75 55 48 85 85 54 56. จงสร้างตารางแจกแจงความถี ความถีสะสม ความถีสัมพัทธ์ และความถีสะสมสัมพัทธ์ ทีมีอนั ตรภาคชันเป็ น 30 − 39, 40 − 49, 50 − 59, 60 − 69, 70 − 79, 80 − 89, 90 − 99. จงหาร้อยละของจํานวนนักเรียนทีได้คะแนนระหว่าง 70 − 79 คะแนน. จงหาจํานวนนักเรียนทีได้คะแนนมากกว่า คะแนน. จงหาร้อยละของนักเรียนทีได้คะแนนน้อยกว่าหรือเท่ากับ คะแนน. ข้อมูลคะแนนเก็บวิชาคณิตศาสตร์ของนักเรียนห้องหนึง แสดงด้วยเส้นโค้งโอจีพดังนี จํานวนคนสะสม (คน) 40 35 30 25 20 15 10 5 0 คะแนน 5 10 15 20 25 30 35. จงหาช่วงคะแนนทีมีจาํ นวนคนสูงสุด (ความถีสูงสุด). จงประมาณคะแนนของคนลําดับที เมือเรียงคะแนนจากมากไปน้อย. นักเรียนทีได้คะแนนมากกว่า คะแนน ประมาณกีเปอร์เซ็นต์. จงเขียนแผนภาพต้น-ใบ ของข้อมูลต่อไปนี 44 52 46 59 104 101 46 55 43 60 66 48 54 56 100 109 74 84 49 70 44 59 88 84 40 79 71 104 49 101. จงสร้างแผนภาพต้น-ใบ ของข้อมูล การสํารวจนัก เรียนในการนํา เงิน ติดตัว มาโรงเรียนกลุม่ หนึงจํานวน 40 คน 100 150 200 160 150 140 160 180 150 170 200 180 125 140 170 190 150 120 150 140 180 190 150 130 180 140 140 160 190 160 180 190 140 120 130 110 190 160 170 130.. แผนภาพจุด. ราคาปิ ด (บาท) ของหุน้ BTS ของ บริษัท บีทีเอส กรุป๊ โฮลดิงส์ จํากัด (มหาชน) ย้อนหลัง วัน นับจากวันที เมษายน (ข้อมูลจากตลาดหลักทรัพย์แห่งประเทศไทย) ดังนี.............................. จงสร้างแผนภาพต้น-ใบ โดยใช้ทศนิยม ตําแหน่งเป็ นต้น และทศนิยมหลักที เป็ นใบ เช่น. | แทนราคาปิ ด. บาท. แผนภาพต้น-ใบทีกําหนดให้แสดงค่าทีนักเรียน คนประมาณความสูงของเสาธงของโรงเรียน โดยที | แทนความสูง. เมตร. มีนกั เรียนทังหมดกีคนทีประมาณความสูงเสาธงมากกว่า เมตร. ถ้าเสาธงสูง เมตร มีนกั เรียนร้อยละเท่าใดทีประมาณผิดพลาดเกิน ±20 เซนติเมตร. จงเขียนแผนภาพต้น-ใบ ของข้อมูลต่อไปนี ข้อมูลชุด A 61 63 74 84 95 67 71 77 88 92 62 98 68 65 81 74 77 69 96 60 ข้อมูลชุด B 62 63 70 98 74 64 62 65 82 84 90 60 63 72 73 75 69 67 85 97. จากการสํารวจเดือนเกิดของนักเรียนในห้องเรียนหนึง ปรากฎดังนี เลขที เดือนเกิด เลขที เดือนเกิด เลขที เดือนเกิด เลขที เดือนเกิด สิงหาคม พฤษภาคม ธันวาคม พฤศจิกายน มกราคม สิงหาคม ธันวาคม เมษายน พฤษภาคม กันยายน มีนาคม มีนาคม ธันวาคม ตุลาคม สิงหาคม มิถนุ ายน กรกฎาคม มิถนุ ายน สิงหาคม เมษายน จงสร้างภาพจุดแสดงเดือนเกิดของนักเรียนในห้องนี บทที. ความรู พ้ นฐานเกี ื ยวกับสถิติ. จากการสํารวจภูมิลาํ เนาของผูป้ ่ วยโควิด- แสดงเป็ นแผนภาพจุดดังนี โดย แทนจํานวน คน ภาคเหนือ ภาคอีสาน ภาคกลาง ภาคใต้ ภาคตะวันออก. จํานวนผูป้ ่ วยทีสํารวจในครังนีมีจาํ นวนกีคน. จํานวนผูป้ ่ วยทีมาจากภาคกลางสูงกว่าภาคเหนือคิดเป็ นกีเปอร์เซ็นต์. ถ้าผูป้ ่ วยในการสํารวจครังนีมีภมู ิลาํ เนาในกรุงเทพฯ % ของผูป้ ่ วยมีภมู ิลาํ เนาในภาค กลาง แล้วผูป้ ่ วยมีภมู ิลาํ เนาในกรุงเทพฯ คิดเป็ นกีเปอร์เซ็นต์ของการสํารวจครังนี บทที การวิเคราะห์ข้อมูลเบืองต้น การใช้ประโยชน์จากสถิตินนในเบื ั องต้นคือการนําข้อมูลทีมีมาวิเคราะห์เพืออธิบายลักษณะของ ข้อมูลชุดนัน ๆ เช่นการนําคะแนนสอบในห้องมาหาค่าเฉลียได้เป็ น จากคะแนนเต็ม นันอาจ แปลความได้วา่ นักเรียนส่วนใหญ่ในห้องนีมีคะแนนสูง ดังนันการวิเคราะห์ขอ้ มูลเบืองต้นจึงมีความ สําคัญในการแปลความหมายของข้อมูล เพือนําไปใช้ประโยชน์ตอ่ ไป. การวัดแน้วโน้มสู่ศูนย์กลาง การวัด แน้ว โน้ม สู่ศนู ย์กลาง เป็ นการคํานวณค่า กลางของข้อมูล ซึง คือ ค่าที ใช้เป็ น ตัวแทนของ ข้อมูล บอกถึงลักษณะของข้อมูล ทําให้ผูใ้ ช้สามารถทราบถึงการแจกแจงข้อมูลว่าเป็ นอย่างไร เพือ ความสะดวกในการสรุปเกียวกับข้อมูลนัน ๆ ซึงจะช่วยทําให้เกิดการวิเคราะห์ขอ้ มูลถูกต้องขึน การหาค่ากลางของข้อมูลมีหลายวิธี แต่ละวิธีมีขอ้ ดีและข้อเสีย และมีความเหมาะสมในการนํา ไปใช้ไม่เหมือนกัน ขึนอยู่กบั ลักษณะข้อมูลและวัตถุประสงค์ของผูใ้ ช้ขอ้ มูลนัน ค่ากลางทีสําคัญมี 3 ชนิดดังนี ค่าเฉลีย (Mean) มัธยฐาน (Median) และ ฐานนิยม (Mode) ในหั ∑ วข้อ นี จะกล่าวถึง การบวกของข้อมูล ดัง นันเริมต้น ด้วยสัญลักษณ์แทนการบวกที เรียก ว่าซิกมา (sigma) นิยามโดย ∑ n xi = x1 + x2 + x3 + · · · + xn i=1 มีสมบัติเบืองต้นดังนี เมือ c เป็ นค่าคงตัว ∑ n ∑ n ∑ n (ก) c = cn (ค) cxi = c xi i=1 i=1 i=1 ∑ n ∑ m ∑ n ∑ n ∑ n ∑ n (ข) xi = xi + xi เมือ m < n (ง) (xi ± yi ) = xi ± yi i=1 i=1 i=m+1 i=1 i=1 i=1 และมีผลบวกทีสําคัญดังนี บทที. การวิเคราะห์ขอ้ มูลเบืองต้น ∑ n n(n + 1). i = 1 + 2 + 3 + ··· + n = 2 สูตรของเกาส์ (Gauss' formula) i=1 ∑ n n(n + 1)(2n + 1). i2 = 12 + 22 + 32 + · · · + n2 = 6 i=1 ∑ n [ ]2 n(n + 1). i = 1 + 2 + 3 + ··· + n = 3 3 3 3 3 2 i=1. ค่าเฉลีย (Mean) ค่าเฉลีย คือค่าทีได้จากการเฉลียข้อมูลทังหมดซึงคํานวณได้หลายแบบ แบ่งออกเป็ น ชนิดหลัก ๆ ซึงแต่ละค่าเหมาะกับข้อมูลแต่ชนิดแตกต่างกัน. ค่าเฉลียเลขคณิต (Arithematic mean). ค่าเฉลียเรขาคณิต (Geometric mean). ค่าเฉลียฮาร์โมนิก (Hamonic mean) บทนิยาม.. ข้อมูลเชิงปริมาณชุดหนึงประกอบด้วยข้อมูลทังหมด X1 , X2 , X3 ,..., XN ค่าเฉลียเลขคณิตของประชากร เขียนแทนด้วย µ หาได้จาก ∑ N Xi ∑ X1 + X2 + X3 + · · · + XN Xi µ= N = i=1 N เขียนได้ยอ่ ๆ คือ µ= N เมือ N แทนขนาดของประชากร และเมือเลือกตัวอย่างขนาด n จากประชากร ได้ขอ้ มูลดังนี x1 , x2 , x3 ,..., xn ค่าเฉลียเลขคณิตของตัวอย่าง เขียนแทนด้วย X หาได้จาก ∑ n xi ∑ x1 + x2 + x3 + · · · + xn xi X= n = i=1 n เขียนได้ยอ่ ๆ คือ X= n ค่า เฉลียเลขคณิต เหมาะที จะนํา มาใช้เป็ น ค่า กลางของข้อมูล เมือข้อ มูล นันๆ ไม่มี คา่ ใดค่า หนึง ซึงสูงหรือตํากว่าค่าอืน ๆ ทีเหลืออย่างผิดปกติ ค่าเฉลียเลขคณิตเป็ นค่าเฉลียทีนิยมใช้มากทีสุดใน กลุม่ ค่าเฉลียทังหมด บางครังอาจเรียกสัน ๆ ว่า ค่าเฉลีย การหาค่าเฉลียของอายุคนไทย ถ้าขณะนี มี คนไทย ล้านคน นันคือ N = 67 ล้าน และ Xi อายุของคนไทยคนที i เมือ i = 1, 2,..., 67 ล้าน ในทางปฏิบตั ิทาํ ได้ยาก เราอาจทําได้โดยการเลือก ตัวอย่างมา คน นันคือ n = 100 คนแทนขนาดของตัวอย่าง เพือคํานวณหาอายุเฉลีย และใน บทที จะกล่าวถึงการยอมรับว่าค่าเฉลียจากตัวอย่างทีได้เหมาะสมทีจะเป็ นค่าเฉลียของประชากร หรือไม่.. การวัดแน้วโน้มสูศ่ ูนย์กลาง ตัวอย่าง.. ราคาปิ ด (บาท) ของหุน้ AOT ของ บริษัท ท่าอากาศยานไทย จํากัด (มหาชน) ย้อน หลัง วัน นับจากวันที มีนาคม (ข้อมูลจากตลาดหลักทรัพย์แห่งประเทศไทย) ดังนี........... จงหาค่าเฉลียเลขคณิตของประชากร. จงหาค่า เฉลียเลขคณิต ของตัวอย่าง เมือสุม่ มา วัน ประกอบด้วย. ,. ,. ,. ตัวอย่าง.. โรงงานแห่งหนึงผลิตหน้ากากอนามัยทีใช้ปอ้ งกันโรคโควิด- ผลิตสินค้าใส่กล่อง ๆ ละ ชิน ถ้าวันนีผลิตได้ , กล่อง และมีการสุม่ ตัวอย่างสินค้ามาตรวจคุณภาพ กล่อง พบว่าสินค้าบกพร่องต่อกล่อง , , , , , , , , และ ชิน จงหา. ร้อยละของสินค้าทีบกพร่อง. จํานวนสินค้าบกพร่องทีเกิดจากผลิตในวันนี บทที. การวิเคราะห์ขอ้ มูลเบืองต้น ∑ 10 ตัวอย่าง.. ข้อมูลของประชากรชุดหนึง ประกอบด้วย x1 , x2 , x3 ,..., x10 ซึง x2i = 100 i=1 ∑ 10 และ (xi − 4)2 = 20 จงหาค่าเฉลียของข้อมูลชุดนี i=1 ตัวอย่าง.. ในการสอบวิชาสถิติ ของเด็ก ห้องหนึง ค่า เฉลียเลขคณิต ของเด็ก ห้องนี เท่ากับ 53 คะแนน แต่จากการตรวจสอบพบว่า ข้อมูล นักเรียนสองคนยัง ไม่ ได้ตรวจ เมือตรวจเสร็จ ปรากฎว่า ค่าเฉลียเลขคณิตของเด็กห้องนีเป็ น 55 คะแนน และผลรวมของคะแนนสอบเพิมขึนอีก 180 คะแนน จํานวนนักเรียนห้องนีเท่ากับเท่าใด.. การวัดแน้วโน้มสูศ่ ูนย์กลาง ตัวอย่าง.. จงหาค่าเฉลียเลขคณิตของข้อมูล x1 , x2 , x3 ,..., x100 เมือ n2 เมือ n เป็ นจํานวนคี xn = 2n เมือ n เป็ นจํานวนคู่ บทที. การวิเคราะห์ขอ้ มูลเบืองต้น ทฤษฎีบท.. ข้อมูล x1 , x2 , x3 ,..., xn ให้ A เป็ นค่าคงที และ di = xi − A เมือ i = 1, 2, 3,..., n ถ้า D เป็ นค่าเฉลียเลขคณิตของ d1, d2, d3,..., dn และ X เป็ นค่าเฉลียเลขคณิตของ x1, x2, x3,..., xn แล้ว X =D+A ข้อสังเกต เห็นได้ชดั ว่าถ้า A=X แล้ว D=0 ตัวอย่าง.. จงหาค่าเฉลียเลขคณิตของข้อมูล , , , , , โดยใช้ A = 10.. การวัดแน้วโน้มสูศ่ ูนย์กลาง บทนิยาม.. ค่าเฉลียเลขคณิตสําหรับข้อมูลทีจัดกลุ่ม ข้อมูลเชิงปริมาณชุดหนึงมีขนาดประชากร N มีการแจงแจงความถี k ชัน แล้วค่าเฉลียเลขคณิตของ ประชากรเมือทราบค่าข้อมูลทุกค่าของประชากร ∑ k fi X i ∑ fi Xi µ= i=1 = ∑ ∑k fi fi i=1 Xi คือค่ากึงกลางของชันที i fi คือความถีของชันที i ∑ N คือขนาดของประชากร หรือ N = fi ∑ กรณีทีทราบข้อมูลบางหน่วย n คือขนาดตัวอย่างซึง n = fi จะได้วา่ ∑ fi x i X= ∑ fi ตัวอย่าง.. นักเรียนกลุม่ หนึงจํานวน 10 คนมีอายุดงั นี , , , , , , , , , ปี. จงหาอายุเฉลียของนักเรียนกลุม่ นีโดยใช้ขอ้ มูลดิบ. จงหาค่าเฉลียเลขคณิตของอายุของนักเรียนกลุม่ นีโดยใช้ตารางแจกแจงความถีทีกําหนดให้ อายุ (ปี ) ความถี (fi) ค่ากึงกลางชัน (xi) fi xi 7− 9 10 − 12 13 − 15 16 − 18 รวม บทที. การวิเคราะห์ขอ้ มูลเบืองต้น ตัวอย่าง.. ในการทดสอบความถนัด ของนักเรียนกลุม่ หนึง มี ตารางแจกแจงความถี ของผล การสอบดังนี ช่วงคะแนน ความถี (คน) 0− 4 4 5− 9 5 10 − 14 x 15 − 19 7 ถ้าค่าเฉลียเลขคณิตของคะแนนสอบเท่ากับ 11 แล้วนักเรียนทีได้คะแนนในช่วง 5 − 14 คะแนน มี จํานวนคิดเป็ นร้อยละของนักเรียนกลุม่ นีเท่ากับเท่าใด.. การวัดแน้วโน้มสูศ่ ูนย์กลาง ทฤษฎีบท.. ข้อมูลเชิงปริมาณชุดหนึงมีขนาดประชากร N มีการแจงแจงความถี k ชัน แล้ว ค่า เฉลียเลขคณิต ของประชากรเมือทราบค่า ข้อมูล ทุก ค่า ของประชากร และ A เป็ น ค่า คงตัว ซึง di = Xi − A เมือ i = 1, 2,..., k และ ∑ k fi di i=1 D= N แล้วค่าเฉลียเลขคณิตคือ X = D + A Xi คือค่ากึงกลางของชันที i fi คือความถีของชันที i กรณีทีทราบข้อมูลบางหน่วย n คือขนาดตัวอย่าง เมือ di = xi − A จะได้วา่ ∑ fi d i X =A+ n ตัวอย่าง.. คะแนนวิชาคณิตศาสตร์ของนักเรียนในชันเรียนทีมีนกั เรียน 30 เป็ นดังนี คะแนน ความถี (fi) 1− 5 5 6 − 10 8 11 − 15 15 16 − 20 2 จงหาค่าเฉลียเลขคณิตของคะแนนของนักเรียนในชันนีโดยใช้ A = 12 คะแนน ความถี (fi) ค่ากึงกลางชัน (xi) di = xi − 8 fi di 1− 5 5 6 − 10 8 11 − 15 15 16 − 20 2 รวม บทที. การวิเคราะห์ขอ้ มูลเบืองต้น ทฤษฎีบท.. สําหรับข้อมูลเชิงปริมาณชุดหนึง เมือเพิมอีกหนึงค่าซึงเท่ากับค่าเฉลียเลขคณิต ของกลุม่ นี จงแสดงว่าค่าเฉลียเลขคณิตใหม่จะไม่เปลียนแปลง ∑ n ทฤษฎีบท.. ข้อมูล x1 , x2 , x3 ,..., xn มีคา่ เฉลียเลขคณิตคือ µ แล้ว (xi − µ) = 0 i=1 ตัวอย่าง.. ข้อมูลชุดหนึงประกอบด้วย x1 , x2 , x3 ,..., x10 มีคา่ เฉลียเลขคณิตเท่ากับ µ ซึง ∑ 10 ∑ 10 xi = 70 และ (xi − 4)2 = 150 i=1 i=1 ∑ 10 จงหา (xi − µ)2 i=1.. การวัดแน้วโน้มสูศ่ ูนย์กลาง จากข้อมูล 2, 3, 3, 5, 7 ค่าเฉลียเลขคณิตเท่ากับ µ = 2 + 3 + 35 + 5 + 7 = 4 จะได้วา่ คะแนน (xi) (xi − 2)2 (xi − 3)2 (xi − µ)2 (xi − 5)2 (xi − 6)2 2 3 3 5 7 รวม ∑ 5 กําหนดให้ y = (xi − x)2 เมือ x = 2, 3, 4, 5, 6 นําไปเขียนกราฟแล้วลากเส้นไประห?