Questions and Answers
Qu'est-ce qu'un arbre de décision?
Quel est le nom du nœud initial au début d'un arbre de décision?
Quels sont les nœuds qui résultent du fractionnement des nœuds racines dans un arbre de décision?
Quel est le nom des nœuds où une division ultérieure n'est pas possible dans un arbre de décision?
Signup and view all the answers
Qu'est-ce qu'un branch ou sous-arbre dans un arbre de décision?
Signup and view all the answers
Quels sont les sous-nœuds qui émergent d'un nœud parent dans un arbre de décision?
Signup and view all the answers
Quel est le but principal de l'élagage dans les arbres de décision?
Signup and view all the answers
Quel est le nom de la méthode qui consiste à élaguer l'arbre avant qu'il n'atteigne sa profondeur maximale?
Signup and view all the answers
Quel est le paramètre qui permet de limiter la profondeur maximale de l'arbre de décision?
Signup and view all the answers
Quelle est la formule utilisée pour mesurer l'impureté d'un nœud dans un arbre de décision?
Signup and view all the answers
Quel est le but de la méthode de post-pruning?
Signup and view all the answers
Quel est le nom de la mesure qui évalue l'incertitude d'un ensemble de données?
Signup and view all the answers
Quel est le critère utilisé en pratique pour mesurer l'impureté d'un nœud dans un arbre de décision ?
Signup and view all the answers
Quel est le problème lié à la sensibilité lors de la recherche du meilleur split pour chaque caractéristique ?
Signup and view all the answers
Qu'est-ce que l'entropie mesure dans un arbre de décision ?
Signup and view all the answers
Quel est le but du pruning dans un arbre de décision ?
Signup and view all the answers
Quelle est la différence clé entre l'entropie et l'indice de Gini ?
Signup and view all the answers
Quels sont les deux types de pruning dans un arbre de décision ?
Signup and view all the answers
Quel est le type d'algorithme utilisé par les arbres de décision?
Signup and view all the answers
Quel est le nom du nœud qui divise en sous-nœuds?
Signup and view all the answers
Quel est le résultat final d'un arbre de décision?
Signup and view all the answers
Qu'est-ce que représente une branche dans un arbre de décision?
Signup and view all the answers
Quel est le but principal d'un arbre de décision?
Signup and view all the answers
Quel type de tâche peut être résolue par un arbre de décision?
Signup and view all the answers
Quelle est la principale utilisation des arbres de décision?
Signup and view all the answers
Quel est l'avantage des arbres de décision?
Signup and view all the answers
Quel est le problème lié à la structure des arbres de décision?
Signup and view all the answers
Quel est le nom des nœuds qui résultent du fractionnement des nœuds racines dans un arbre de décision?
Signup and view all the answers
Quel est le rôle des feuilles dans un arbre de décision?
Signup and view all the answers
Quel est le but des arbres de décision dans les compétitions Kaggle?
Signup and view all the answers
Quel est le problème que peut créer l'optimisation lors des classes déséquilibrées?
Signup and view all the answers
Quel est l'avantage de mettre un poids plus important aux éléments de la classe minoritaire?
Signup and view all the answers
Qu'est-ce que les variables en haut de l'arbre de décision reflètent?
Signup and view all the answers
Quel est le problème lié à la présence de nombreux arbres profonds dans un modèle d'arbre de décision?
Signup and view all the answers
Quel est le but de la méthode Random Forest?
Signup and view all the answers
Quel est l'avantage de l'utilisation du calcul en parallèle dans les arbres de décision?
Signup and view all the answers
Quel est le critère qui prend en compte le nombre d'échantillons dans une feuille?
Signup and view all the answers
Quel type de features peut gérer un arbre de décision en plus des numériques?
Signup and view all the answers
Quel est le problème lié à la recherche du meilleur split pour chaque caractéristique?
Signup and view all the answers
Pourquoi est-il important de trouver le meilleur seuil pour les features?
Signup and view all the answers
Quel est le but de mixer les différents critères dans un arbre de décision?
Signup and view all the answers
Quel est le problème lié à avoir énormément de features?
Signup and view all the answers
Pourquoi est-il important d'éviter le sur-apprentissage dans un arbre de décision?
Signup and view all the answers
Quel est l'avantage de l'indice de Gini par rapport à l'entropie?
Signup and view all the answers
Quel est le nom de la méthode qui consiste à prendre un seul seuil aléatoire pour chaque caractéristique?
Signup and view all the answers
Quel est le but de la méthode de pré-pruning?
Signup and view all the answers
Quel est le problème lié à la recherche du meilleur split pour chaque caractéristique?
Signup and view all the answers
Quel est le critère utilisé pour décider si un split est utile dans un arbre de décision?
Signup and view all the answers
Study Notes
Amélioration des performances de l'arbre de décision
- L'élagage permet d'améliorer les performances de l'arbre de décision en supprimant les nœuds ou sous-nœuds qui ne sont pas significatifs.
- Il supprime également les branches qui ont une très faible importance.
Méthodes d'élagage
- Il existe deux façons de tailler : Pre-pruning (Pré-taillage) et Post-pruning (Post-élagage).
- Pre-pruning : nous pouvons arrêter la croissance de l'arbre plus tôt, ce qui signifie que nous pouvons élaguer/supprimer/couper un nœud s'il a peu d'importance lors de la croissance de l'arbre.
- Post-pruning : une fois que notre arbre a atteint sa profondeur, nous pouvons commencer à tailler les nœuds en fonction de leur importance.
Paramètres pour limiter la croissance
- max_depth : Limiter la profondeur max de l'arbre.
- min_samples_split : Limiter le nombre de sample avant de faire un split.
- min_samples_leaf : Après un split, il doit y avoir plus de min_samples_leaf dans chaque feuille.
Post-pruning
- Réduire l'arbre a posteriori en utilisant la loss entropy/gini avec le nombre de nœud terminaux et un paramètre de régularisation.
- Supprime ensuite les nœuds qui ne changent que peu le score de classification.
Arbre de décision
- Un arbre de décision est un algorithme d'apprentissage supervisé.
- Les arbres de décision sont utilisés pour les tâches de classification et de régression, fournissant des modèles faciles à comprendre.
- Ils ont une structure arborescente hiérarchique de nœuds.
Terminologie
- Nœud racine/sommet : nœud initial au début d'un arbre de décision.
- Nœuds de décision : Nœuds résultant du fractionnement (split) des nœuds racines.
- Nœuds feuilles ou terminaux : nœuds où une division ultérieure n'est pas possible, indiquant la classification ou le résultat final.
- Branch or Sub tree (Sous-arbre) : sous-section d'un arbre de décision.
- Nœud parent et enfants : Un nœud divisé en sous-nœuds est appelé nœud parent, et les sous-nœuds qui en émergent sont appelés nœuds enfants (ou fils).
Trouver le meilleur split
- Idée simple : Faire des intervalles.
- Idée maligne et plus rapide : Prendre les seuils endroits il y a une alternance des deux classes.
- Idée encore plus simple : Prendre un seuil aléatoire.
Sortie multiple
- Chaque feuille stocke k valeurs au lieu de 2 (nombre de classes).
- Changement du critère pour tenir compte de k classes.
Critères de classification
- Loss de classification.
- Entropy.
- Index de Gini (pureté).
Sur-apprentissage
- Le sur-apprentissage risque d'être encore plus présent avec l'arbre de décision.
- Deux méthodes de pruning pour éviter le sur-apprentissage : Pre-pruning et Post-pruning.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Description
Découvrez les différents types d'élagage pour améliorer les performances des arbres de décision, notamment le pré-taillage et le post-élagage.