Document Details

FavorableNephrite2630

Uploaded by FavorableNephrite2630

École supérieure de technologie de Casablanca

2024

Université Hassan 2

AIT ELFARIA DOHA MANSOURI MADIHA

Tags

algorithme K-Means clustering machine learning data analysis

Summary

This document is a presentation on the k-means algorithm, explaining its purpose, working principles, advantages, disadvantages, and applications. It's designed for an undergraduate-level audience at the école supérieure de technologie-Casablanca.

Full Transcript

Université Hassan 2 école supérieure de technologie-Casablanca ALGORITHME K-MEANS Réalisé par: AIT ELFARIA DOHA Mme. BENGHACHOUA MANSOURI MADIHA 2024-2025 :PLAN:...

UniversitĂ© Hassan 2 Ă©cole supĂ©rieure de technologie-Casablanca ALGORITHME K-MEANS RĂ©alisĂ© par: AIT ELFARIA DOHA Mme. BENGHACHOUA MANSOURI MADIHA 2024-2025 :PLAN: 1 LE CLUSTERING 2 L’ALGORITHME K-MEANS 3 AVANTAGES ET LIMITES DE K-MEANS 4 EXEMPLES D’APPLICATION 5 CONCLUSION 1 Le clustering : DĂ©finition Objectif et types Le clustering consiste Ă  regrouper des donnĂ©es en fonction de leurs similitudes. 1 Le clustering : DĂ©finition Objectif et types Objectif : Types : ✔ Clustering HiĂ©rarchique CrĂ©e une hiĂ©rarchie de clusters sous forme d'un arbre (dendrogramme). ✔ Exploration des donnĂ©es Deux approches : AgglomĂ©ratif : Fusion progressive des clusters. Divisif : Division itĂ©rative en clusters plus petits. ✔ Simplification des donnĂ©es ✔ Clustering Partitionnel Regroupe les donnĂ©es en un nombre prĂ©dĂ©fini de clusters (Ă  plat). Exemple : K-Means, qui sĂ©pare les donnĂ©es en fonction de leur proximitĂ© aux centroides. 2 L’algorithme k-means : DĂ©finition Principe de fonctionnement Divise les donnĂ©es en K clusters prĂ©dĂ©finis. Chaque point appartient exactement Ă  un cluster. Utilise souvent une mesure de distance, comme la distance euclidienne, pour dĂ©finir les clusters. 2 L’algorithme k-means : DĂ©finition Principe de fonctionnement â–ª Initialisation : Choix alĂ©atoire des centres (centroids).. â–ª Affectation : Assignation des points aux clusters les plus proches.. â–ª Mise Ă  jour : Recalcul des centres en prenant la moyenne des points dans chaque cluster. â–ª ItĂ©ration : RĂ©pĂ©ter jusqu'Ă  convergence (les centres ne changent plus). 3 Avantages et limites de k-means : Avantages de k-means Limites de k-means SimplicitĂ© Facile Ă  comprendre et Ă  implĂ©menter RapiditĂ© Algorithme rapide pour petites et moyennes bases de donnĂ©es. EfficacitĂ© AdaptĂ© aux clusters compacts et bien sĂ©parĂ©s, avec des rĂ©sultats clairs et interprĂ©tables. Divers Applications 3 Avantages et limites de k-means : Avantages de k-means Limites de k-means SensibilitĂ© Ă  la valeur initiale des centres : Une mauvaise initialisation peut conduire Ă  un mauvais minimum local. Solution : Utiliser K-Means++ pour une meilleure initialisation. Besoin de fixer K Ă  l'avance : L'utilisateur doit estimer le nombre de clusters (K). Sensible aux outliers : Les valeurs aberrantes dĂ©placent les centres et affectent la qualitĂ© du clustering. Ne gère pas bien les clusters non sphĂ©riques : Mauvaise sĂ©paration pour des clusters de formes ou densitĂ©s variĂ©es. Convergence parfois lente : Peut nĂ©cessiter de nombreuses itĂ©rations pour converger avec des donnĂ©es complexes. 4 Exemples d’application de k-means : Exemple 1 Exemple 2 Exemple 3 DĂ©tection d'anomalies : But : Identifier des points de donnĂ©es qui ne ressemblent pas aux autres dans un ensemble de donnĂ©es. Exemple : Dans une banque : dĂ©tecter des transactions inhabituelles qui pourraient indiquer une fraude. En maintenance : repĂ©rer des machines dont les donnĂ©es de capteurs montrent des comportements anormaux. Avantage : PrĂ©cision accrue dans l'identification des anomalies, ce qui permet d'agir rapidement. Visuel Ă  utiliser : Un graphique avec des clusters bien dĂ©finis et un point Ă©loignĂ© reprĂ©sentant un outlier (anomalie). 4 Exemples d’application de k-means : Exemple 1 Exemple 2 Exemple 3 DĂ©tection d'anomalies : 4 Exemples d’application de k-means : Exemple 1 Exemple 2 Exemple 3 Segmentation de clients (Marketing) : But : Diviser les clients en groupes selon leurs comportements ou prĂ©fĂ©rences. Exemple : Dans une entreprise, regrouper les clients en fonction de leurs habitudes d'achat, comme : Acheteurs frĂ©quents vs occasionnels. PrĂ©fĂ©rences pour des produits spĂ©cifiques (ex : mode, Ă©lectronique). Avantage : Meilleure allocation des ressources publicitaires. Visuel Ă  utiliser : Un graphique avec trois clusters (faible, moyen, Ă©levĂ©) en fonction des axes "frĂ©quence" et "montant". 4 Exemples d’application de k-means : Exemple 1 Exemple 2 Exemple 3 Compression d’images : But : RĂ©duire la taille des images tout en maintenant leur qualitĂ©. Comment cela fonctionne : Les couleurs de chaque pixel sont regroupĂ©es en clusters (valeurs RGB similaires). Chaque cluster est remplacĂ© par son centre, rĂ©duisant ainsi le nombre de couleurs utilisĂ©es dans l'image. Exemple : Une image avec 16 millions de couleurs peut Ăªtre rĂ©duite Ă  une palette de 256 couleurs sans perdre beaucoup de dĂ©tails visuels. Avantage : RĂ©duction de la taille des fichiers pour un stockage ou une transmission efficace. Visuel Ă  utiliser : Une image avant et après compression, montrant une rĂ©duction des couleurs tout en gardant les formes. 4 Exemples d’application de k-means : Exemple 1 Exemple 2 Exemple 3 Compression d’images : CONCLUSION MERCI POUR VOTRE ATTENTION