Chương III: Phân tích đa tương ứng (MCA)
23 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Total Inertia phụ thuộc vào yếu tố nào trong phân tích MCA?

  • Độ chính xác của dữ liệu
  • Số lượng biến (correct)
  • Mối quan hệ giữa các biến
  • Số lượng thuộc tính (correct)
  • Đóng góp của thuộc tính nào vào Total Inertia được xem là lớn?

  • Nếu thuộc tính đó tương quan chặt chẽ với biến
  • Nếu thuộc tính đó là thuộc tính chính
  • Nếu thuộc tính đó có tần số thấp (correct)
  • Nếu thuộc tính đó có tần số cao
  • Quy tắc nào được sử dụng để xác định số lượng trục trong MCA?

  • Giữ lại các TPC với tần số lớn
  • Giữ lại các TPC có eigenvalues nhỏ hơn 1
  • Giữ lại các TPC có eigenvalues lớn hơn 1/J (correct)
  • Giữ lại tất cả các TPC
  • Khi nào nên thiết kế số thuộc tính của mỗi câu hỏi trong bảng hỏi là như nhau?

    <p>Để biến có nhiều PATL đóng góp lớn vào TI</p> Signup and view all the answers

    Biểu diễn kết quả của MCA trên không gian 2 chiều thường thực hiện theo cách nào?

    <p>Theo hướng mô tả mối liên hệ giữa quan sát và các thuộc tính</p> Signup and view all the answers

    Indicator Matrix sử dụng để xử lý dữ liệu như thế nào?

    <p>Để tổ chức dữ liệu thành ma trận thông số</p> Signup and view all the answers

    Trong Indicator Matrix, mỗi cá thể chỉ được chọn duy nhất một PATL có nghĩa là gì?

    <p>Mỗi cá thể chỉ được chọn một câu trả lời duy nhất</p> Signup and view all the answers

    Các cột trong Indicator Matrix đại diện cho điều gì?

    <p>Các biến Dummy (0-1)</p> Signup and view all the answers

    Một ví dụ về biến trong Indicator Matrix là gì?

    <p>D604a_3</p> Signup and view all the answers

    Mục đích sử dụng ma trận Burt trong phân tích là gì?

    <p>Để tổ chức dữ liệu dưới dạng tóm tắt</p> Signup and view all the answers

    Lý do tại sao không nên thiết kế câu hỏi nhiều lựa chọn trong MCA là gì?

    <p>Sẽ gây khó khăn cho việc phân tích</p> Signup and view all the answers

    Biến Dummy trong Indicator Matrix giúp thể hiện điều gì?

    <p>Phân loại các đối tượng vào các nhóm</p> Signup and view all the answers

    Các biến trong Indicator Matrix có thể là gì?

    <p>Các lựa chọn khác nhau của một câu hỏi</p> Signup and view all the answers

    Tổng số thuộc tính trong bảng dữ liệu gốc là bao nhiêu?

    <p>7</p> Signup and view all the answers

    Trong ma trận chỉ số, tổng số giá trị cho ID 1 là bao nhiêu?

    <p>3</p> Signup and view all the answers

    Ký hiệu nào đại diện cho phần trăm theo dòng trong phân tích MCA?

    <p>Xijk/J</p> Signup and view all the answers

    Giá trị tổng của ma trận chỉ số cho 4 ID là bao nhiêu?

    <p>12</p> Signup and view all the answers

    Trong bảng % theo cột, tổng số giá trị cho X2 là bao nhiêu?

    <p>1</p> Signup and view all the answers

    Khi phân tích MCA, ký hiệu njk đại diện cho điều gì?

    <p>Tổng số ID</p> Signup and view all the answers

    Ma trận chỉ số đại diện cho mối quan hệ giữa các biến X1, X2, X3 và ID như thế nào?

    <p>Chỉ ra tần suất của từng biến cho mỗi ID.</p> Signup and view all the answers

    Những giá trị nào trong bảng % theo dòng đại diện cho tổng số cho từng ID?

    <p>Xijk/J</p> Signup and view all the answers

    Giá trị tổng của X31 cho 4 ID là bao nhiêu?

    <p>2</p> Signup and view all the answers

    Tổng giá trị của ma trận chỉ số là bao nhiêu?

    <p>12</p> Signup and view all the answers

    Study Notes

    Chương III: Phân tích đa tương ứng (MCA)

    • MCA là một phần mở rộng của phân tích tương quan (CA).
    • Mục đích của MCA là phân tích bảng dữ liệu có n quan sát và J biến định tính.
    • Có thể chuyển đổi dữ liệu định lượng thành định tính để áp dụng MCA.

    Tác dụng của MCA

    • Tính các chỉ số để lượng hóa các khái niệm trừu tượng.
    • Tạo ra các biến mới từ các chỉ báo (indicators).
    • Trực quan hóa kết quả phân tích bằng hình ảnh.
    • Có thể bổ sung thêm các phần tử (đặc điểm của quan sát) lên đồ thị.

    Dữ liệu trong MCA

    • Giả sử có n quan sát và J biến định tính.
    • Mỗi biến có thể có nhiều thuộc tính (k).
    • Ma trận dữ liệu có kích thước n x J.
    • Mục tiêu là rút gọn dữ liệu thành không gian ít chiều hơn mà vẫn giữ được thông tin.

    Ví dụ về dữ liệu

    • Ví dụ về câu hỏi trong bộ phiếu hỏi quản lý hành chính và dịch vụ công.
    • Các câu hỏi có thể lựa chọn "Đúng", "Không đúng" hoặc "Không rõ".
    • Dữ liệu được thể hiện dưới dạng ma trận (Indicator Matrix/Complete Disjunctive Table) hoặc ma trận Burt.
    • Biến Dummy (0-1) được sử dụng để thể hiện sự lựa chọn.

    Lưu ý về dữ liệu

    • Mỗi quan sát chỉ được chọn duy nhất một thuộc tính trong mỗi biến.
    • Sử dụng các biến Dummy (0-1) để thể hiện sự lựa chọn.

    MCA: Kỹ thuật

    • Áp dụng CA trên ma trận thông số (Indicator matrix).
    • Hoặc áp dụng CA trên ma trận Burt.

    Ví dụ 1

    • Số quan sát (n) là 4.
    • Số biến (J) là 3.
    • Ví dụ về các biến: xe máy, cơ giới hóa, trâu/bò.
    • Mỗi biến có nhiều thuộc tính (K1, K2, K3).

    Indicator matrix

    • Biểu diễn dữ liệu dưới dạng ma trận thông số (Indicator matrix).
    • Các cột là các biến Dummy (0-1).

    Các kí hiệu trong MCA

    • Chỉ rõ các tham chiếu đến số lượng quan sát và số lượng thuộc tính

    Tổng số thuộc tính

    • Tính tổng số thuộc tính bằng cách cộng số thuộc tính của từng biến.

    Ma trận Burt

    • Ma trận Burt được sử dụng để phân tích dữ liệu.
    • Trong ma trận Burt, các row profiles và column profiles giống nhau.

    Áp dụng MCA cho VD1

    • Áp dụng MCA trên các biến X1, X2, X3.

    Bảng % theo dòng (row profiles)

    • Thể hiện tỷ lệ phần trăm của từng thuộc tính trong mỗi quan sát.
    • Dữ liệu được thể hiện dưới dạng tỷ lệ phần trăm của quan sát.

    Bảng % theo cột (column profiles)

    • Thể hiện tỷ lệ phần trăm của từng quan sát cho mỗi thuộc tính.
    • Dữ liệu được thể hiện dưới dạng tỷ lệ phần trăm của thuộc tính.

    Total Inertia

    • Tổng năng lượng trong phân tích MCA.
    • Giá trị này phụ thuộc vào số lượng thuộc tính và biến, không phụ thuộc vào mối liên hệ giữa các biến.

    Đóng góp vào Total Inertia

    • Đóng góp của thuộc tính k của biến j vào TI.
    • Đóng góp của 1 biến vào TI.

    Xác định số lượng trục được giữ lại

    • Qui tắc giữ lại các TPC có EIGENVALUES lớn hơn 1/J. (1/J là giá trị trung bình của eigenvalues)

    Biểu diễn kết quả trên đồ thị

    • Biểu diễn kết quả của MCA trên đồ thị 2 chiều (Biplot).
    • Các quan sát và các thuộc tính được biểu diễn trên cùng một đồ thị.

    MCA với ma trận Burt

    • Khi nào nên sử dụng CA với ma trận Burt?
    • Khi cỡ mẫu lớn, không thể đọc kết quả theo hướng liên hệ giữa quan sát và thuộc tính.
    • Khi chỉ quan tâm đến thuộc tính, không quan tâm đến quan sát.
    • Row và column profiles giống nhau khi sử dụng CA với ma trận Burt.

    Lưu ý khác biệt giữa PCA và MCA

    • PCA sử dụng các giả định về dữ liệu khoảng cách.
    • MCA không có các giả định đó.
    • MCA là phương pháp phi tuyến tính, trong khi PCA là phương pháp tuyến tính.

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Related Documents

    Description

    Chương này trình bày về phân tích đa tương ứng (MCA), một kỹ thuật dùng để phân tích bảng dữ liệu với nhiều biến định tính. Nó cho phép chuyển đổi dữ liệu định lượng thành định tính và trực quan hóa kết quả phân tích. Đọc kỹ các ứng dụng và đặc điểm của dữ liệu trong MCA để hiểu rõ hơn về tác dụng và cách thức hoạt động của phương pháp này.

    More Like This

    Use Quizgecko on...
    Browser
    Browser