Chương III: Phân tích đa tương ứng (MCA)
23 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Total Inertia phụ thuộc vào yếu tố nào trong phân tích MCA?

  • Độ chính xác của dữ liệu
  • Số lượng biến (correct)
  • Mối quan hệ giữa các biến
  • Số lượng thuộc tính (correct)

Đóng góp của thuộc tính nào vào Total Inertia được xem là lớn?

  • Nếu thuộc tính đó tương quan chặt chẽ với biến
  • Nếu thuộc tính đó là thuộc tính chính
  • Nếu thuộc tính đó có tần số thấp (correct)
  • Nếu thuộc tính đó có tần số cao

Quy tắc nào được sử dụng để xác định số lượng trục trong MCA?

  • Giữ lại các TPC với tần số lớn
  • Giữ lại các TPC có eigenvalues nhỏ hơn 1
  • Giữ lại các TPC có eigenvalues lớn hơn 1/J (correct)
  • Giữ lại tất cả các TPC

Khi nào nên thiết kế số thuộc tính của mỗi câu hỏi trong bảng hỏi là như nhau?

<p>Để biến có nhiều PATL đóng góp lớn vào TI (D)</p> Signup and view all the answers

Biểu diễn kết quả của MCA trên không gian 2 chiều thường thực hiện theo cách nào?

<p>Theo hướng mô tả mối liên hệ giữa quan sát và các thuộc tính (A)</p> Signup and view all the answers

Indicator Matrix sử dụng để xử lý dữ liệu như thế nào?

<p>Để tổ chức dữ liệu thành ma trận thông số (A)</p> Signup and view all the answers

Trong Indicator Matrix, mỗi cá thể chỉ được chọn duy nhất một PATL có nghĩa là gì?

<p>Mỗi cá thể chỉ được chọn một câu trả lời duy nhất (B)</p> Signup and view all the answers

Các cột trong Indicator Matrix đại diện cho điều gì?

<p>Các biến Dummy (0-1) (B)</p> Signup and view all the answers

Một ví dụ về biến trong Indicator Matrix là gì?

<p>D604a_3 (D)</p> Signup and view all the answers

Mục đích sử dụng ma trận Burt trong phân tích là gì?

<p>Để tổ chức dữ liệu dưới dạng tóm tắt (C)</p> Signup and view all the answers

Lý do tại sao không nên thiết kế câu hỏi nhiều lựa chọn trong MCA là gì?

<p>Sẽ gây khó khăn cho việc phân tích (A)</p> Signup and view all the answers

Biến Dummy trong Indicator Matrix giúp thể hiện điều gì?

<p>Phân loại các đối tượng vào các nhóm (B)</p> Signup and view all the answers

Các biến trong Indicator Matrix có thể là gì?

<p>Các lựa chọn khác nhau của một câu hỏi (D)</p> Signup and view all the answers

Tổng số thuộc tính trong bảng dữ liệu gốc là bao nhiêu?

<p>7 (C)</p> Signup and view all the answers

Trong ma trận chỉ số, tổng số giá trị cho ID 1 là bao nhiêu?

<p>3 (D)</p> Signup and view all the answers

Ký hiệu nào đại diện cho phần trăm theo dòng trong phân tích MCA?

<p>Xijk/J (D)</p> Signup and view all the answers

Giá trị tổng của ma trận chỉ số cho 4 ID là bao nhiêu?

<p>12 (C)</p> Signup and view all the answers

Trong bảng % theo cột, tổng số giá trị cho X2 là bao nhiêu?

<p>1 (B)</p> Signup and view all the answers

Khi phân tích MCA, ký hiệu njk đại diện cho điều gì?

<p>Tổng số ID (C)</p> Signup and view all the answers

Ma trận chỉ số đại diện cho mối quan hệ giữa các biến X1, X2, X3 và ID như thế nào?

<p>Chỉ ra tần suất của từng biến cho mỗi ID. (A)</p> Signup and view all the answers

Những giá trị nào trong bảng % theo dòng đại diện cho tổng số cho từng ID?

<p>Xijk/J (A)</p> Signup and view all the answers

Giá trị tổng của X31 cho 4 ID là bao nhiêu?

<p>2 (C)</p> Signup and view all the answers

Tổng giá trị của ma trận chỉ số là bao nhiêu?

<p>12 (D)</p> Signup and view all the answers

Flashcards

Ma trận thông số (Indicator Matrix)

Một bảng dữ liệu biểu diễn các lựa chọn cho từng biến, với mỗi quan sát chỉ chọn một lựa chọn duy nhất.

Ma trận Burt

Một ma trận được tạo ra bằng cách tính tần suất xuất hiện của các cặp lựa chọn khác nhau từ các biến.

Biến Dummy (0-1)

Biến chỉ nhận giá trị 0 hoặc 1. Dùng để biểu diễn sự lựa chọn có hoặc không.

MCA (Multiple Correspondence Analysis)

Một kỹ thuật phân tích thống kê để phân tích mối quan hệ giữa nhiều biến phân loại.

Signup and view all the flashcards

Dữ liệu thường được xử lý dưới dạng...

Ma trận thông số (Indicator Matrix) hoặc ma trận Burt.

Signup and view all the flashcards

Quan sát (observation)

Một cá thể hoặc một trường hợp được khảo sát.

Signup and view all the flashcards

Biến phân loại (categorical variable)

Biến có các giá trị thuộc các nhóm phân loại, ví dụ: có/không, nam/nữ.

Signup and view all the flashcards

Không được thiết kế câu hỏi nhiều lựa chọn khi áp dụng MCA

Mỗi quan sát chỉ được chọn duy nhất một lựa chọn trên một biến.

Signup and view all the flashcards

Inertia toàn phần (TI)

Tổng ảnh hưởng của tất cả các thuộc tính và biến lên kết quả của MCA. Nó không phụ thuộc vào mối liên hệ giữa các biến.

Signup and view all the flashcards

Đóng góp của 1 thuộc tính vào TI

Càng nhiều lựa chọn cho 1 thuộc tính, đóng góp của nó vào TI càng nhỏ. Đây là vì số lựa chọn nhiều sẽ làm giảm khả năng tập trung vào 1 lựa chọn cụ thể.

Signup and view all the flashcards

Đóng góp của 1 biến vào TI

Càng nhiều thuộc tính (lựa chọn) cho 1 biến, đóng góp của nó vào TI càng lớn. Điều này là do số lựa chọn nhiều cho phép phân biệt rõ ràng hơn các quan sát trên biến đó.

Signup and view all the flashcards

Số trục được giữ lại trong MCA

Sử dụng quy tắc: giữ lại các trục có giá trị Eigenvalue lớn hơn 1/J (trung bình của các giá trị Eigenvalue).

Signup and view all the flashcards

Biểu diễn kết quả của MCA

Kết quả của MCA được thể hiện bằng biểu đồ biplot. Biểu đồ này thể hiện mối liên hệ giữa các quan sát và thuộc tính.

Signup and view all the flashcards

Tổng số thuộc tính (K)

Tổng của các thuộc tính riêng lẻ trong một bộ dữ liệu. Được tính bằng tổng của K1, K2 và K3.

Signup and view all the flashcards

Ma trận chỉ báo (Indicator matrix)

Một bảng thể hiện tần suất của mỗi giá trị thuộc tính liên quan đến mỗi chủ thể hoặc quan sát. xijk là một phần tử của ma trận.

Signup and view all the flashcards

xijk

Một phần tử trong ma trận chỉ báo thể hiện tần suất của một giá trị cụ thể của biến trong một quan sát.

Signup and view all the flashcards

Bảng % theo dòng (row profiles)

Bảng thể hiện tỉ lệ phần trăm của từng giá trị thuộc tính (xijk) trên tổng số giá trị của một quan sát (J).

Signup and view all the flashcards

Bảng % theo cột (column profiles)

Bảng thể hiện tỉ lệ phần trăm của từng giá trị thuộc tính trên tổng số quan sát của từng thuộc tính. xijk / nij.

Signup and view all the flashcards

Total Inertia

Một chỉ số trong phân tích thống kê, đặc biệt trong phương pháp phân tích thành phần chính (MCA), dùng để đo lường sự phân tán của dữ liệu trên không gian.

Signup and view all the flashcards

MCA

Phân tích thành phần chính (Multiple Correspondence Analysis) là một kỹ thuật thống kê dùng để phân tích mối quan hệ giữa các biến định tính và định lượng.

Signup and view all the flashcards

CA

Phân tích tương quan (Correspondence Analysis)

Signup and view all the flashcards

njk/nJ

Tỷ lệ của quan sát cụ thể (njk) so với tổng số quan sát (nJ).

Signup and view all the flashcards

xijk/J

Tỉ lệ của tần suất xuất hiện giá trị j của thuộc tính i của chủ thể k so với tổng tổng giá trị J.

Signup and view all the flashcards

Study Notes

Chương III: Phân tích đa tương ứng (MCA)

  • MCA là một phần mở rộng của phân tích tương quan (CA).
  • Mục đích của MCA là phân tích bảng dữ liệu có n quan sát và J biến định tính.
  • Có thể chuyển đổi dữ liệu định lượng thành định tính để áp dụng MCA.

Tác dụng của MCA

  • Tính các chỉ số để lượng hóa các khái niệm trừu tượng.
  • Tạo ra các biến mới từ các chỉ báo (indicators).
  • Trực quan hóa kết quả phân tích bằng hình ảnh.
  • Có thể bổ sung thêm các phần tử (đặc điểm của quan sát) lên đồ thị.

Dữ liệu trong MCA

  • Giả sử có n quan sát và J biến định tính.
  • Mỗi biến có thể có nhiều thuộc tính (k).
  • Ma trận dữ liệu có kích thước n x J.
  • Mục tiêu là rút gọn dữ liệu thành không gian ít chiều hơn mà vẫn giữ được thông tin.

Ví dụ về dữ liệu

  • Ví dụ về câu hỏi trong bộ phiếu hỏi quản lý hành chính và dịch vụ công.
  • Các câu hỏi có thể lựa chọn "Đúng", "Không đúng" hoặc "Không rõ".
  • Dữ liệu được thể hiện dưới dạng ma trận (Indicator Matrix/Complete Disjunctive Table) hoặc ma trận Burt.
  • Biến Dummy (0-1) được sử dụng để thể hiện sự lựa chọn.

Lưu ý về dữ liệu

  • Mỗi quan sát chỉ được chọn duy nhất một thuộc tính trong mỗi biến.
  • Sử dụng các biến Dummy (0-1) để thể hiện sự lựa chọn.

MCA: Kỹ thuật

  • Áp dụng CA trên ma trận thông số (Indicator matrix).
  • Hoặc áp dụng CA trên ma trận Burt.

Ví dụ 1

  • Số quan sát (n) là 4.
  • Số biến (J) là 3.
  • Ví dụ về các biến: xe máy, cơ giới hóa, trâu/bò.
  • Mỗi biến có nhiều thuộc tính (K1, K2, K3).

Indicator matrix

  • Biểu diễn dữ liệu dưới dạng ma trận thông số (Indicator matrix).
  • Các cột là các biến Dummy (0-1).

Các kí hiệu trong MCA

  • Chỉ rõ các tham chiếu đến số lượng quan sát và số lượng thuộc tính

Tổng số thuộc tính

  • Tính tổng số thuộc tính bằng cách cộng số thuộc tính của từng biến.

Ma trận Burt

  • Ma trận Burt được sử dụng để phân tích dữ liệu.
  • Trong ma trận Burt, các row profiles và column profiles giống nhau.

Áp dụng MCA cho VD1

  • Áp dụng MCA trên các biến X1, X2, X3.

Bảng % theo dòng (row profiles)

  • Thể hiện tỷ lệ phần trăm của từng thuộc tính trong mỗi quan sát.
  • Dữ liệu được thể hiện dưới dạng tỷ lệ phần trăm của quan sát.

Bảng % theo cột (column profiles)

  • Thể hiện tỷ lệ phần trăm của từng quan sát cho mỗi thuộc tính.
  • Dữ liệu được thể hiện dưới dạng tỷ lệ phần trăm của thuộc tính.

Total Inertia

  • Tổng năng lượng trong phân tích MCA.
  • Giá trị này phụ thuộc vào số lượng thuộc tính và biến, không phụ thuộc vào mối liên hệ giữa các biến.

Đóng góp vào Total Inertia

  • Đóng góp của thuộc tính k của biến j vào TI.
  • Đóng góp của 1 biến vào TI.

Xác định số lượng trục được giữ lại

  • Qui tắc giữ lại các TPC có EIGENVALUES lớn hơn 1/J. (1/J là giá trị trung bình của eigenvalues)

Biểu diễn kết quả trên đồ thị

  • Biểu diễn kết quả của MCA trên đồ thị 2 chiều (Biplot).
  • Các quan sát và các thuộc tính được biểu diễn trên cùng một đồ thị.

MCA với ma trận Burt

  • Khi nào nên sử dụng CA với ma trận Burt?
  • Khi cỡ mẫu lớn, không thể đọc kết quả theo hướng liên hệ giữa quan sát và thuộc tính.
  • Khi chỉ quan tâm đến thuộc tính, không quan tâm đến quan sát.
  • Row và column profiles giống nhau khi sử dụng CA với ma trận Burt.

Lưu ý khác biệt giữa PCA và MCA

  • PCA sử dụng các giả định về dữ liệu khoảng cách.
  • MCA không có các giả định đó.
  • MCA là phương pháp phi tuyến tính, trong khi PCA là phương pháp tuyến tính.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

Description

Chương này trình bày về phân tích đa tương ứng (MCA), một kỹ thuật dùng để phân tích bảng dữ liệu với nhiều biến định tính. Nó cho phép chuyển đổi dữ liệu định lượng thành định tính và trực quan hóa kết quả phân tích. Đọc kỹ các ứng dụng và đặc điểm của dữ liệu trong MCA để hiểu rõ hơn về tác dụng và cách thức hoạt động của phương pháp này.

More Like This

Use Quizgecko on...
Browser
Browser