Algorithme de classification K-NN pour l'analyse d'iris

EasiestRhyme avatar
EasiestRhyme
·
·
Download

Start Quiz

Study Flashcards

10 Questions

Quel est le nombre de mesures classées dans la base de données d'iris?

150

Quelle est la méthode utilisée pour répartir les données en deux parties?

Méthode de randomisation

Quelle est la fonction qui renvoie la liste des éléments distincts dans une liste?

Fonction classe

Quel est le nombre de plus proches voisins utilisés pour la prédiction?

5

Quel est le nom de la matrice utilisée pour afficher les résultats de la prédiction?

Matrice de confusion

Quel est le nombre de voisins qui permet d'obtenir le meilleur taux de réussite?

K = 5

Quel est le pourcentage de réussite obtenu avec K = 5?

95%

Quel est le modèle de classification utilisé pour l'intelligence artificielle?

Modèle de classification cannibale

Quel est l'intervalle de valeurs de K pour lequel l'efficacité de l'algorithme est la meilleure?

Entre 7 et 16

Quel est le pourcentage d'efficacité du modèle après modification de la valeur de K?

93,3%

Study Notes

Here is a summary of the text in French, using detailed bullet points:

• L'algorithme utilise une base de données d'iris qui contient 150 mesures classées en 50 de chaque variété.

• La base de données a 4 dimensions : longueur sépale, largeur sépale, longueur pétales, largeur pétales.

• L'apprentissage est supervisé, ce qui signifie que les données sont étiquetées.

• Les données sont réparties aléatoirement en 2 parties : 80% pour l'entraînement et 20% pour la validation.

• La méthode utilisée pour répartir les données est la méthode de randomisation.

• La fonction distance est utilisée pour calculer la distance entre deux points dans un espace de dimension N.

• La fonction classe renvoie la liste des éléments distincts dans une liste.

• La fonction dominante renvoie l'élément le plus fréquent dans une liste.

• La fonction cannelle prend un argument K et renvoie l'étiquette dominante pour les K plus proches voisins d'une nouvelle observation.

• La fonction est testée avec un élément de la base de données et le résultat est comparé à la valeur attendue.

• La prédiction est réalisée en appelant la fonction cannelle avec K = 5 et la nouvelle observation.

• La valeur attendue est comparée à la prédiction pour vérifier si l'algorithme est performant.

• La suite de la question 7 consiste à récupérer toutes les prédictions sur le test et à calculer l'efficacité de l'algorithme.

• La matrice de confusion est utilisée pour afficher les résultats de la prédiction.

• La question 8 consiste à afficher la matrice de confusion et à estimer l'efficacité de l'algorithme.

• La dernière question consiste à étudier l'influence de la valeur de K sur l'efficacité de l'algorithme.

• La courbe montrant l'évolution du taux de réussite en fonction de K est tracée.

• L'algorithme est testé pour différentes valeurs de K, de 5 à 25, et le taux de réussite est calculé pour chaque valeur.

• Le résultat montre que l'efficacité de l'algorithme est meilleure pour un petit nombre de voisins (K = 5 ou 6).- La meilleure zone pour choisir la valeur de cas est comprise entre 7 et 16.

  • Avec K = 5, on obtient le meilleur taux de réussite de l'attitude, prédire le bon résultat de projet à 95%.
  • Le modèle de classification cannibale est utilisé pour l'intelligence artificielle.
  • La bibliothèque ou le paquet utilisé est trop important pour l'intelligence artificielle.
  • L'évaluation du modèle permet de donner l'efficacité, avec une efficacité de 90% dans cet exemple.
  • La modification de la valeur de cas peut affecter l'efficacité, par exemple, passer de 90% à 93,3%.
  • La prédiction peut être représentée de manière évidente avec le modèle rédex.
  • La longueur et la capitale peuvent être utilisées pour donner des exemples, par exemple, 0,2.
  • Le modèle peut être utilisé avec une efficacité de 80% après avoir dit modèle.pv.

Ce quiz aborde l'utilisation d'un algorithme de classification K-NN pour analyser une base de données d'iris. Il couvre les étapes de l'apprentissage supervisé, la répartition des données, la fonction de distance et la fonction de classe. Il évalue également l'efficacité de l'algorithme en fonction de la valeur de K.

Make Your Own Quizzes and Flashcards

Convert your notes into interactive study material.

Get started for free
Use Quizgecko on...
Browser
Browser