Algorithme K-Means PDF
Document Details
Uploaded by FavorableNephrite2630
École supérieure de technologie de Casablanca
2024
Université Hassan 2
AIT ELFARIA DOHA MANSOURI MADIHA
Tags
Summary
This document is a presentation on the k-means algorithm, explaining its purpose, working principles, advantages, disadvantages, and applications. It's designed for an undergraduate-level audience at the école supérieure de technologie-Casablanca.
Full Transcript
Université Hassan 2 école supérieure de technologie-Casablanca ALGORITHME K-MEANS Réalisé par: AIT ELFARIA DOHA Mme. BENGHACHOUA MANSOURI MADIHA 2024-2025 :PLAN:...
Université Hassan 2 école supérieure de technologie-Casablanca ALGORITHME K-MEANS Réalisé par: AIT ELFARIA DOHA Mme. BENGHACHOUA MANSOURI MADIHA 2024-2025 :PLAN: 1 LE CLUSTERING 2 L’ALGORITHME K-MEANS 3 AVANTAGES ET LIMITES DE K-MEANS 4 EXEMPLES D’APPLICATION 5 CONCLUSION 1 Le clustering : Définition Objectif et types Le clustering consiste à regrouper des données en fonction de leurs similitudes. 1 Le clustering : Définition Objectif et types Objectif : Types : ✔ Clustering Hiérarchique Crée une hiérarchie de clusters sous forme d'un arbre (dendrogramme). ✔ Exploration des données Deux approches : Agglomératif : Fusion progressive des clusters. Divisif : Division itérative en clusters plus petits. ✔ Simplification des données ✔ Clustering Partitionnel Regroupe les données en un nombre prédéfini de clusters (à plat). Exemple : K-Means, qui sépare les données en fonction de leur proximité aux centroides. 2 L’algorithme k-means : Définition Principe de fonctionnement Divise les données en K clusters prédéfinis. Chaque point appartient exactement à un cluster. Utilise souvent une mesure de distance, comme la distance euclidienne, pour définir les clusters. 2 L’algorithme k-means : Définition Principe de fonctionnement ▪ Initialisation : Choix aléatoire des centres (centroids).. ▪ Affectation : Assignation des points aux clusters les plus proches.. ▪ Mise à jour : Recalcul des centres en prenant la moyenne des points dans chaque cluster. ▪ Itération : Répéter jusqu'à convergence (les centres ne changent plus). 3 Avantages et limites de k-means : Avantages de k-means Limites de k-means Simplicité Facile à comprendre et à implémenter Rapidité Algorithme rapide pour petites et moyennes bases de données. Efficacité Adapté aux clusters compacts et bien séparés, avec des résultats clairs et interprétables. Divers Applications 3 Avantages et limites de k-means : Avantages de k-means Limites de k-means Sensibilité à la valeur initiale des centres : Une mauvaise initialisation peut conduire à un mauvais minimum local. Solution : Utiliser K-Means++ pour une meilleure initialisation. Besoin de fixer K à l'avance : L'utilisateur doit estimer le nombre de clusters (K). Sensible aux outliers : Les valeurs aberrantes déplacent les centres et affectent la qualité du clustering. Ne gère pas bien les clusters non sphériques : Mauvaise séparation pour des clusters de formes ou densités variées. Convergence parfois lente : Peut nécessiter de nombreuses itérations pour converger avec des données complexes. 4 Exemples d’application de k-means : Exemple 1 Exemple 2 Exemple 3 Détection d'anomalies : But : Identifier des points de données qui ne ressemblent pas aux autres dans un ensemble de données. Exemple : Dans une banque : détecter des transactions inhabituelles qui pourraient indiquer une fraude. En maintenance : repérer des machines dont les données de capteurs montrent des comportements anormaux. Avantage : Précision accrue dans l'identification des anomalies, ce qui permet d'agir rapidement. Visuel à utiliser : Un graphique avec des clusters bien définis et un point éloigné représentant un outlier (anomalie). 4 Exemples d’application de k-means : Exemple 1 Exemple 2 Exemple 3 Détection d'anomalies : 4 Exemples d’application de k-means : Exemple 1 Exemple 2 Exemple 3 Segmentation de clients (Marketing) : But : Diviser les clients en groupes selon leurs comportements ou préférences. Exemple : Dans une entreprise, regrouper les clients en fonction de leurs habitudes d'achat, comme : Acheteurs fréquents vs occasionnels. Préférences pour des produits spécifiques (ex : mode, électronique). Avantage : Meilleure allocation des ressources publicitaires. Visuel à utiliser : Un graphique avec trois clusters (faible, moyen, élevé) en fonction des axes "fréquence" et "montant". 4 Exemples d’application de k-means : Exemple 1 Exemple 2 Exemple 3 Compression d’images : But : Réduire la taille des images tout en maintenant leur qualité. Comment cela fonctionne : Les couleurs de chaque pixel sont regroupées en clusters (valeurs RGB similaires). Chaque cluster est remplacé par son centre, réduisant ainsi le nombre de couleurs utilisées dans l'image. Exemple : Une image avec 16 millions de couleurs peut être réduite à une palette de 256 couleurs sans perdre beaucoup de détails visuels. Avantage : Réduction de la taille des fichiers pour un stockage ou une transmission efficace. Visuel à utiliser : Une image avant et après compression, montrant une réduction des couleurs tout en gardant les formes. 4 Exemples d’application de k-means : Exemple 1 Exemple 2 Exemple 3 Compression d’images : CONCLUSION MERCI POUR VOTRE ATTENTION