Decision Tree Homework

AdvancedNavy avatar
AdvancedNavy
·
·
Download

Start Quiz

Study Flashcards

36 Questions

의사 결정 트리를Construction할 때, 노드의 모든 레코드가 동일한 타겟 값을 가지고 있다면?

이번 노드를 리프 노드로 한다

의사 결정 트리를 구성하는 데 사용되는 조건은 무엇입니까?

인FORMATION_GAIN

의사 결정 트리를 구성하는 데 필요한 데이터의 형식은 무엇입니까?

범주형

의사 결정 트리의 노드 분할 결정은 무엇에 의존합니까?

information gain

의사 결정 트리를 사용하여 새로운 고객의 마케팅 결과를 예측할 때 필요한 정보는 무엇입니까?

거주지, 주택 형태, 소득, 이전 고객 여부

의사 결정 트리를 구성하는 데 필요한 homework는 무엇입니까?

모든 것

한정의 시성재이 세사의 주소의 더스에 다운에서의 정의의 더스에?

어지의

?에 80원어지의 세사의의 더스에에서의?

YES

한정의 시성재이의 세사의의 주소의 더스에?

Married

세사의의 더스에에서의 어지의의언?

> 80K

한정의 시성재이의 세사의의 주소의 더스에?

36

어지의의 더스에에서의의 세사의의?

Refund

탐색 트리의 최적의 속성을 선택하는 기준은 무엇입니까?

정보 이득

트리 인덕션 프로세스는 언제 멈출까요?

gain이 일정 수준에 도달할 때

어트리뷰트를 나누는 방법은 무엇입니까?

다중 분할

명목 어트리뷰트를 나누는 방법은 무엇입니까?

다중 분할

순서 어트리뷰트를 나누는 방법은 무엇입니까?

이진분할

Tree Induction의 Key Issues는 무엇입니까?

어트리뷰트 선택, 분할 방법, 크리테리아

어트리뷰트에 따라 분할 방법이 결정되는 이유는 무엇입니까?

어트리뷰트의 유형

트리 인덕션 프로세스를 수행하는 방법은 무엇입니까?

어트리뷰트 선택, 분할, 크리테리아 확인

노벨 장르 루트 노드의 엔트로피는 무엇입니까?

0.98

왼쪽 자식 노드의 엔트로피를 계산하는 방법은 무엇입니까?

-(.67log(0.67) + 0.33log(0.33))

인포메이션 게인 계산식은 무엇입니까?

0.98 - (4entropyleft-child + 3entropyright-child)/7

왼쪽 자식 노드와오른쪽 자식 노드의 샘플 수는 각각 얼마입니까?

4, 3

노벨리스트와 노벨 장르 속성 중에서 인포메이션 게인이 더 큰 것은 무엇입니까?

노벨리스트

엔트로피 루트는 무엇을 의미합니까?

불확실성

노벨리스트 속성에서의 엔트로피는 얼마입니까?

0.81

노벨 장르 루트 노드의 엔트로피를 계산하는 방법은 무엇입니까?

-(.5log(0.5) + 0.5log(0.5))

20%의 모든 데이터를 테스트에 사용하고, 나머지를 훈련 데이터로 사용하려면 'test_size'를 어떻게 설정해야 합니까?

0.2

랜덤 시드가 1로 설정된 이유는 무엇입니까?

매번 같은 결과를 얻을 수 있도록 합니다.

스트라티파이 매개변수가 y로 설정된 이유는 무엇입니까?

y 변수의 프로포션을 나타내는 데 사용됩니다.

KNN 분류기에서 n_neighbors 매개변수의 값이 3으로 설정된 이유는 무엇입니까?

가장 가까운 3개의 이웃을 고려하는 데 사용됩니다.

KNN 분류기의 정확도를 확인하는 방법은 무엇입니까?

knn.score(X_test, y_test)

KNN 알고리즘을 사용하여 새로운 고객의 티셔츠 사이즈를 예측하는 방법은 무엇입니까?

knn.predict(new_customer)

K-nearest neighbors 알고리즘에서 k를 3으로 설정하는 이유는 무엇입니까?

가장 가까운 3개의 이웃을 고려하는 데 사용됩니다.

데이터셋에서 새로운 고객의 티셔츠 사이즈를 예측하는 방법은 무엇입니까?

k-nearest neighbors 알고리즘을 사용하여 예측합니다.

Study Notes

의사 결정 트리 (Decision Tree)

  • 의사 결정 트리 알고리즘: 트리 구조를 사용하여 예측 모델을 생성하는 알고리즘
  • 목표: 입력 데이터를 분류하거나 예측하는 모델을 생성
  • 종료 조건: 모든 노드가純葉 노드가 될 때까지 반복

의사 결정 트리 구축

  • 트리 구축 프로세스:
    • 루트 노드 선택
    • 자식 노드 분할
    • 분할 계속 반복
  • 분할 조건: 정보 가인 (Information Gain) 또는 엔트로피 (Entropy) 계산

정보 가인 (Information Gain)

  • 정보 가인: 노드가 분할될 때 얻는 정보의 양
  • 정보 가인 계산: 엔트로피 - (분할 노드의 엔트로피 * 가중치)
  • 의사 결정 트리 알고리즘에서는 정보 가인이 가장 큰 노드를 선택

엔트로피 (Entropy)

  • 엔트로피: 노드의 불확실성 또는 hỗn잡도
  • 엔트로피 계산: - (클래스의 확률 * 로그(클래스의 확률))

예측 모델 평가

  • 모델의 정확도: 테스트 데이터에 대한 모델의 예측 결과
  • 정확도 평가: 모델의 예측 결과와 실제 결과를 비교

K-최근 이웃 알고리즘 (K-Nearest Neighbors)

  • K-최근 이웃 알고리즘: 주변에 있는 데이터 점수를 고려하여 예측 모델을 생성하는 알고리즘
  • K-최근 이웃 알고리즘의 예측: 주변에 있는 데이터 점수 중에서 가장 가까운 점수를 택함

예습 실습

  • 의사 결정 트리 알고리즘을 사용하여 마케팅 캠페인의 예측 모델을 생성
  • K-최근 이웃 알고리즘을 사용하여 티셔츠 사이즈의 예측 모델을 생성

This quiz covers the decision tree algorithm, including stopping conditions and node splitting. Test your understanding of decision trees with this homework quiz!

Make Your Own Quizzes and Flashcards

Convert your notes into interactive study material.

Get started for free

More Quizzes Like This

Machine Learning Algorithms Quiz
10 questions
Decision Trees in Machine Learning
18 questions
Use Quizgecko on...
Browser
Browser