Decision Tree Homework
36 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

의사 결정 트리를Construction할 때, 노드의 모든 레코드가 동일한 타겟 값을 가지고 있다면?

  • 이번 노드를 리프 노드로 한다 (correct)
  • 다음 레벨의 트리를 생성
  • 노드를 나누는 것을 중단
  • 자식 노드를 생성
  • 의사 결정 트리를 구성하는 데 사용되는 조건은 무엇입니까?

  • 의사 결정 트리의 높이
  • 노드의 엔트로피
  • 인FORMATION_GAIN (correct)
  • 노드의 깊이
  • 의사 결정 트리를 구성하는 데 필요한 데이터의 형식은 무엇입니까?

  • 연속형
  • 숫자형
  • 문자형
  • 범주형 (correct)
  • 의사 결정 트리의 노드 분할 결정은 무엇에 의존합니까?

    <p>information gain</p> Signup and view all the answers

    의사 결정 트리를 사용하여 새로운 고객의 마케팅 결과를 예측할 때 필요한 정보는 무엇입니까?

    <p>거주지, 주택 형태, 소득, 이전 고객 여부</p> Signup and view all the answers

    의사 결정 트리를 구성하는 데 필요한 homework는 무엇입니까?

    <p>모든 것</p> Signup and view all the answers

    한정의 시성재이 세사의 주소의 더스에 다운에서의 정의의 더스에?

    <p>어지의</p> Signup and view all the answers

    ?에 80원어지의 세사의의 더스에에서의?

    <p>YES</p> Signup and view all the answers

    한정의 시성재이의 세사의의 주소의 더스에?

    <p>Married</p> Signup and view all the answers

    세사의의 더스에에서의 어지의의언?

    <p>&gt; 80K</p> Signup and view all the answers

    한정의 시성재이의 세사의의 주소의 더스에?

    <p>36</p> Signup and view all the answers

    어지의의 더스에에서의의 세사의의?

    <p>Refund</p> Signup and view all the answers

    탐색 트리의 최적의 속성을 선택하는 기준은 무엇입니까?

    <p>정보 이득</p> Signup and view all the answers

    트리 인덕션 프로세스는 언제 멈출까요?

    <p>gain이 일정 수준에 도달할 때</p> Signup and view all the answers

    어트리뷰트를 나누는 방법은 무엇입니까?

    <p>다중 분할</p> Signup and view all the answers

    명목 어트리뷰트를 나누는 방법은 무엇입니까?

    <p>다중 분할</p> Signup and view all the answers

    순서 어트리뷰트를 나누는 방법은 무엇입니까?

    <p>이진분할</p> Signup and view all the answers

    Tree Induction의 Key Issues는 무엇입니까?

    <p>어트리뷰트 선택, 분할 방법, 크리테리아</p> Signup and view all the answers

    어트리뷰트에 따라 분할 방법이 결정되는 이유는 무엇입니까?

    <p>어트리뷰트의 유형</p> Signup and view all the answers

    트리 인덕션 프로세스를 수행하는 방법은 무엇입니까?

    <p>어트리뷰트 선택, 분할, 크리테리아 확인</p> Signup and view all the answers

    노벨 장르 루트 노드의 엔트로피는 무엇입니까?

    <p>0.98</p> Signup and view all the answers

    왼쪽 자식 노드의 엔트로피를 계산하는 방법은 무엇입니까?

    <p>-(.67<em>log(0.67) + 0.33</em>log(0.33))</p> Signup and view all the answers

    인포메이션 게인 계산식은 무엇입니까?

    <p>0.98 - (4<em>entropyleft-child + 3</em>entropyright-child)/7</p> Signup and view all the answers

    왼쪽 자식 노드와오른쪽 자식 노드의 샘플 수는 각각 얼마입니까?

    <p>4, 3</p> Signup and view all the answers

    노벨리스트와 노벨 장르 속성 중에서 인포메이션 게인이 더 큰 것은 무엇입니까?

    <p>노벨리스트</p> Signup and view all the answers

    엔트로피 루트는 무엇을 의미합니까?

    <p>불확실성</p> Signup and view all the answers

    노벨리스트 속성에서의 엔트로피는 얼마입니까?

    <p>0.81</p> Signup and view all the answers

    노벨 장르 루트 노드의 엔트로피를 계산하는 방법은 무엇입니까?

    <p>-(.5<em>log(0.5) + 0.5</em>log(0.5))</p> Signup and view all the answers

    20%의 모든 데이터를 테스트에 사용하고, 나머지를 훈련 데이터로 사용하려면 'test_size'를 어떻게 설정해야 합니까?

    <p>0.2</p> Signup and view all the answers

    랜덤 시드가 1로 설정된 이유는 무엇입니까?

    <p>매번 같은 결과를 얻을 수 있도록 합니다.</p> Signup and view all the answers

    스트라티파이 매개변수가 y로 설정된 이유는 무엇입니까?

    <p>y 변수의 프로포션을 나타내는 데 사용됩니다.</p> Signup and view all the answers

    KNN 분류기에서 n_neighbors 매개변수의 값이 3으로 설정된 이유는 무엇입니까?

    <p>가장 가까운 3개의 이웃을 고려하는 데 사용됩니다.</p> Signup and view all the answers

    KNN 분류기의 정확도를 확인하는 방법은 무엇입니까?

    <p>knn.score(X_test, y_test)</p> Signup and view all the answers

    KNN 알고리즘을 사용하여 새로운 고객의 티셔츠 사이즈를 예측하는 방법은 무엇입니까?

    <p>knn.predict(new_customer)</p> Signup and view all the answers

    K-nearest neighbors 알고리즘에서 k를 3으로 설정하는 이유는 무엇입니까?

    <p>가장 가까운 3개의 이웃을 고려하는 데 사용됩니다.</p> Signup and view all the answers

    데이터셋에서 새로운 고객의 티셔츠 사이즈를 예측하는 방법은 무엇입니까?

    <p>k-nearest neighbors 알고리즘을 사용하여 예측합니다.</p> Signup and view all the answers

    Study Notes

    의사 결정 트리 (Decision Tree)

    • 의사 결정 트리 알고리즘: 트리 구조를 사용하여 예측 모델을 생성하는 알고리즘
    • 목표: 입력 데이터를 분류하거나 예측하는 모델을 생성
    • 종료 조건: 모든 노드가純葉 노드가 될 때까지 반복

    의사 결정 트리 구축

    • 트리 구축 프로세스:
      • 루트 노드 선택
      • 자식 노드 분할
      • 분할 계속 반복
    • 분할 조건: 정보 가인 (Information Gain) 또는 엔트로피 (Entropy) 계산

    정보 가인 (Information Gain)

    • 정보 가인: 노드가 분할될 때 얻는 정보의 양
    • 정보 가인 계산: 엔트로피 - (분할 노드의 엔트로피 * 가중치)
    • 의사 결정 트리 알고리즘에서는 정보 가인이 가장 큰 노드를 선택

    엔트로피 (Entropy)

    • 엔트로피: 노드의 불확실성 또는 hỗn잡도
    • 엔트로피 계산: - (클래스의 확률 * 로그(클래스의 확률))

    예측 모델 평가

    • 모델의 정확도: 테스트 데이터에 대한 모델의 예측 결과
    • 정확도 평가: 모델의 예측 결과와 실제 결과를 비교

    K-최근 이웃 알고리즘 (K-Nearest Neighbors)

    • K-최근 이웃 알고리즘: 주변에 있는 데이터 점수를 고려하여 예측 모델을 생성하는 알고리즘
    • K-최근 이웃 알고리즘의 예측: 주변에 있는 데이터 점수 중에서 가장 가까운 점수를 택함

    예습 실습

    • 의사 결정 트리 알고리즘을 사용하여 마케팅 캠페인의 예측 모델을 생성
    • K-최근 이웃 알고리즘을 사용하여 티셔츠 사이즈의 예측 모델을 생성

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Description

    This quiz covers the decision tree algorithm, including stopping conditions and node splitting. Test your understanding of decision trees with this homework quiz!

    More Like This

    Use Quizgecko on...
    Browser
    Browser