Algorithme K-means Présentation PDF
Document Details
Uploaded by ExultantRegionalism9526
Université Hassan II, École Supérieure de Technologie - Casablanca
2024
Ait Elfaria Doha, Mansouri Madiha, Mme. Benchachoua
Tags
Summary
Ce document présente l'algorithme K-means, un algorithme de clustering en apprentissage automatique. Il explique la théorie, les avantages et les limites de l'algorithme ainsi que des exemples d'application dans différents domaines comme la détection d'anomalies ou la segmentation de clients. Le document est un support de cours ou de présentation.
Full Transcript
Université Hassan 2 école supérieure de technologie-Casablanca ALGORITHME K-MEANS Réalisé par: AIT ELFARIA DOHA Mme. BENGHACHOUA MANSOURI MADIHA 2024-2025 :PLAN:...
Université Hassan 2 école supérieure de technologie-Casablanca ALGORITHME K-MEANS Réalisé par: AIT ELFARIA DOHA Mme. BENGHACHOUA MANSOURI MADIHA 2024-2025 :PLAN: 1 LE CLUSTERING 2 L’ALGORITHME K-MEANS 3 AVANTAGES ET LIMITES DE K-MEANS 4 EXEMPLES D’APPLICATION 5 CONCLUSION Le clustering : 1 Définitio Objectif et types n Le clustering consiste à regrouper des données en fonction de leurs similitudes. Le clustering : 1 Définition Objectif et types Objectif Types : : Clustering Hiérarchique Crée une hiérarchie de clusters sous forme d'un Exploration des arbre (dendrogramme). Deux approches : données Agglomératif : Fusion progressive des clusters. Simplification des Divisif : Division itérative en clusters plus données petits. Clustering Partitionnel Regroupe les données en un nombre prédéfini de clusters (à plat). Exemple : K-Means, qui sépare les données en fonction de leur proximité aux centroides. L’algorithme k-means : 2 Définitio Principe de n fonctionnement Divise les données en K clusters prédéfinis. Chaque point appartient exactement à un cluster. Utilise souvent une mesure de distance, comme la distance euclidienne, pour définir les clusters. L’algorithme k-means : 2 Définition Principe de fonctionnement Initialisation : Choix aléatoire des centres (centroids).. Affectation : Assignation des points aux clusters les plus proches.. Mise à jour : Recalcul des centres en prenant la moyenne des points dans chaque cluster. Itération : Répéter jusqu'à convergence (les centres ne changent plus). Avantages et limites de k-means : 3 Avantages de k- Limites de k- means means Simplicité Facile à comprendre et à implémenter Rapidité Algorithme rapide pour petites et moyennes bases de données. Efficacité Adapté aux clusters compacts et bien séparés, avec des résultats clairs et interprétables. Divers Applications Avantages et limites de k-means : 3 Avantages de k- Limites de k- means means Sensibilité à la valeur initiale des centres : Une mauvaise initialisation peut conduire à un mauvais minimum local. Solution : Utiliser K-Means++ pour une meilleure initialisation. Besoin de fixer K à l'avance : L'utilisateur doit estimer le nombre de clusters (K). Sensible aux outliers : Les valeurs aberrantes déplacent les centres et affectent la qualité du clustering. Ne gère pas bien les clusters non sphériques : Mauvaise séparation pour des clusters de formes ou densités variées. Convergence parfois lente : Peut nécessiter de nombreuses itérations pour converger avec des données complexes. Exemples d’application de k-means : 4 Exemple 1 Exemple 2 Exemple 3 Détection d'anomalies : But : Identifier des points de données qui ne ressemblent pas aux autres dans un ensemble de données. Exemple : Dans une banque : détecter des transactions inhabituelles qui pourraient indiquer une fraude. En maintenance : repérer des machines dont les données de capteurs montrent des comportements anormaux. Avantage : Précision accrue dans l'identification des anomalies, ce qui permet d'agir rapidement. Visuel à utiliser : Un graphique avec des clusters bien définis et un point éloigné représentant un outlier (anomalie). Exemples d’application de k-means : 4 Exemple 1 Exemple 2 Exemple 3 Détection d'anomalies : Exemples d’application de k-means : 4 Exemple 1 Exemple 2 Exemple 3 Segmentation de clients (Marketing) : But : Diviser les clients en groupes selon leurs comportements ou préférences. Exemple : Dans une entreprise, regrouper les clients en fonction de leurs habitudes d'achat, comme : Acheteurs fréquents vs occasionnels. Préférences pour des produits spécifiques (ex : mode, électronique). Avantage : Meilleure allocation des ressources publicitaires. Visuel à utiliser : Un graphique avec trois clusters (faible, moyen, élevé) en fonction des axes "fréquence" et "montant". Exemples d’application de k-means : 4 Exemple 1 Exemple 2 Exemple 3 Compression d’images : But : Réduire la taille des images tout en maintenant leur qualité. Comment cela fonctionne : Les couleurs de chaque pixel sont regroupées en clusters (valeurs RGB similaires). Chaque cluster est remplacé par son centre, réduisant ainsi le nombre de couleurs utilisées dans l'image. Exemple : Une image avec 16 millions de couleurs peut être réduite à une palette de 256 couleurs sans perdre beaucoup de détails visuels. Avantage : Réduction de la taille des fichiers pour un stockage ou une transmission efficace. Visuel à utiliser : Une image avant et après compression, montrant une réduction des couleurs tout en gardant les formes. Exemples d’application de k-means : 4 Exemple 1 Exemple 2 Exemple 3 Compression d’images : CONCLUSION MERCI POUR VOTRE ATTENTION