C3 Mô tả và Trình bày dữ liệu PDF
Document Details
Can Tho University
Nguyễn Duy Sang
Tags
Summary
This document details data processing and statistics. It presents methods for describing and displaying data, including tables, charts, and summary statistics. The content is from a course offered at Cantho University.
Full Transcript
XỬ LÝ SỐ LIỆU THỐNG KÊ (Data processing and statistics) SG391 https://elearning.ctu.edu.vn/course/view.php?id=2575 Nguyễn Duy Sang [email protected] 1 BM...
XỬ LÝ SỐ LIỆU THỐNG KÊ (Data processing and statistics) SG391 https://elearning.ctu.edu.vn/course/view.php?id=2575 Nguyễn Duy Sang [email protected] 1 BM SP Tin học Chương 3 Mô tả và trình bày dữ liệu Nguyễn Duy Sang 2 BM SP Tin học 3. Mô tả và trình bày dữ liệu 3.1 Một số xử lý trên biến 3.2 Mô tả và trình bày dữ liệu bằng bảng 3.3 Mô tả và trình bày dữ liệu bằng đồ thị 3.4 Mô tả và trình bày dữ liệu bằng tổng hợp thống kê 3 3.1 Một số xử lý trên biến Nghiên cứu viên lấy thông tin từ mỗi cá thể trong mẫu để trả lời cho các câu hỏi cần kiểm tra. Mỗi phần dữ liệu đó được gọi là một biến. Trên thực tế, dữ liệu thu thập được trình bày trong một bảng tham chiếu chéo các cá thể với các biến khác nhau, đây là bước đầu tiên trong thống kê mô tả. 4 3.1 Một số xử lý trên biến Biến định lượng (tuổi, điểm): còn được gọi là biến số là một biến thể hiện một phép đo dưới dạng một số nguyên hoặc một số thực. Biến định tính (giới tính, xếp loại của lớp học, phạm trù xã hội học, thể loại): là một biến thể hiện một trạng thái trực tiếp, như trường hợp với các biến giới tính, nghề nghiệp. Chúng được thể hiện bằng phương thức. Biến giới tính có hai phương thức [F, M]. Khi một biến định tính có hai phương thức, nó được gọi là lưỡng phân; nếu nó có nhiều hơn hai, nó được gọi là đa phân. 5 3.1 Một số xử lý trên biến Biến ngẫu nhiên: khi mẫu với một biến được lấy ngẫu nhiên, ta không thể biết trước kết quả thu được, chỉ biết được xác suất biến đó sẽ có giá trị đó, biến này được xem là một biến ngẫu nhiên. Biến phụ thuộc/độc lập: việc biểu diễn kết quả dữ liệu có thể tồn tại liên kết giữa hai hoặc nhiều biến quan sát trên một mẫu. Chẳng hạn, liên kết giữa tuổi và bộ nhớ ngắn hạn, hoặc là giữa chiều cao và cân nặng của các cá thể trong một mẫu. – Hai biến độc lập khi một trong hai biến bị thay đổi nó không có tác dụng đối với biến kia. – Ngược lại, hai biến phụ thuộc khi một trong hai biến 6 thay đổi nó có tác dụng đối với biến kia. 3.1 Một số xử lý trên biến Bảng trình bày trong một bảng tham chiếu chéo các cá thể với các biến khác nhau được gọi là bảng Bảng cá thể/biến số, được biểu diễn dưới dạng thông tin/biến [I/V] [Information /Variables] ở Bảng 1 7 Bảng 1. Thông tin/biến về n học sinh trong một lớp học Học sinh Giới tính Tuổi Cấp độ toán Nghề nghiệp của … học phụ huynh 1 F 12 10 Nông dân 2 M 14 13 Nhân viên … … … … … I 12 16 Công nhân … … … … … n-1 F 14 18 Nhân viên N F 13 8 Nông dân 8 3.2 Mô tả và trình bày dữ liệu bằng bảng Bảng dữ liệu thô: thu được khi thu thập số liệu thường rất khó đọc Bảng tổng thể: kiểm đếm số lượng cá thể trong mỗi phương thức, giúp dễ dàng giải thích các biến định tính hoặc định lượng Bảng dự phòng: là các bảng mà có sự tham chiếu chéo tổng thể của hai biến. Trong mỗi ô, tại giao điểm của hai phương thức của các biến là tổng thể của các cá thể đồng thời cũng thuộc cả hai phương thức của từng biến đó. 9 Bảng 2. Bảng số liệu thu được từ một công ty kinh doanh trong lĩnh vực giáo dục Mức lương Trình STT Giới tính (USD) độ ……. ……. ……. 1 M 1550 A ……. ……. ……. 2 F 1250 A 3 F 2200 C 4 M 1250 A 5 M 1550 A 6 M 2500 B ……. ……. ……. 7 F 1480 A 8 F 2100 C 9 M 1900 B 10 F 2990 C 11 M 2850 D 12 F 1420 A ……. ……. ……. 13 F 2250 C 14 M 3200 D 15 M 2900 D 16 F 1300 A 17 F 1600 B ……. ……. ……. 18 F 2550 C 19 M 1230 A 20 M 3800 D 21 M 2600 C 22 F 1700 B 23 M 2000 B ……. ……. ……. 24 F 2600 C 25 F 1350 B 26 M 1400 B 27 M 2100 B 28 M 2300 B 29 F 1260 A ……. ……. ……. 30 M 2450 C 31 M 2400 C 2800 32 M D 10 Bảng 3. Bảng tổng thể trình độ học vấn từ một công ty kinh doanh giáo dục Trình độ A B C D Tổng Tổng thể 9 9 9 5 32 28,125 28,125 28,125 15,625 % 100 11 Bảng 4. Bảng dự phòng giới tính / mức lương từ một công ty kinh doanh giáo dục I II III IV V VI Tổng M 3 2 3 2 3 5 18 F 6 2 1 2 2 1 14 Tổng 9 4 4 4 5 6 32 12 3.3 Mô tả và trình bày dữ liệu bằng đồ thị Biểu đồ được dùng để trình bày dữ liệu chứa trong các bảng, giúp các dữ liệu dễ đọc và tạo nên tính thẩm mỹ. Với dữ liệu ở Bảng 3, Bảng 4, ta có thể vẽ các đồ thị, biểu đồ biểu diễn bằng MS Excel. 13 3.3 Mô tả và trình bày dữ liệu bằng đồ thị 30 25 20 15 10 5 0 A B C D Tổng thể % 14 3.3 Mô tả và trình bày dữ liệu bằng đồ thị 10 9 8 7 6 5 4 3 2 1 0 I II III IV V VI M F Tổng 15 3.4 Mô tả và trình bày dữ liệu bằng tổng hợp thống kê Mục tiêu của thống kê mô tả là làm cho người dùng có thể hiểu được các dữ liệu. Các dữ liệu này được xử lý và phân tích bằng cách sử dụng các phương pháp khác nhau (bảng cụ thể, đồ thị, đường cong, công cụ toán học). Ngoài việc trình bày các số liệu đơn giản, các dữ liệu phải cho phép người xem nhận xét về các kết quả đó, đưa ra các giả thuyết và thậm chí đưa ra kết luận liên quan đến dữ liệu hoặc 16 mẫu nghiên cứu. Chân thành cảm ơn! 17