Summary

This document discusses unsupervised machine learning, focusing on the clustering technique. It details the concept of clustering, its application to various data types, and different approaches to the clustering problem.

Full Transcript

Apprentissage non supervise Le Clustering Clustering La Classification est un apprentissage supervisé. La supervision est faite en nommant les classes des instances d’apprentissage. Le Clustering est un apprentissage non supervisé. Il n’y a pas une connais...

Apprentissage non supervise Le Clustering Clustering La Classification est un apprentissage supervisé. La supervision est faite en nommant les classes des instances d’apprentissage. Le Clustering est un apprentissage non supervisé. Il n’y a pas une connaissance apriori des classes. L’algorithme de clustering nécessite une affectation de chaque instance à un groupe ou classe (cluster) de telle façon que tous les objets d’un même groupe sont plus semblables que les autres. Clustering Trouver des groupes (classes) d’objets tels que chaque objet d’un groupe est similaire qu’un autre objet du même groupe et différent des autres objets des autres groupes Clustering L’objectif est de trouver un groupement le plus naturel possible des instances. - A l’intérieur d’un groupe: Maximiser la similarité entre instances. - Entre les groupes: Minimiser la similarité entre les instances. Distances Distances Inter-classes Intra- sont classes sont maximisées minimisées Clustering Par exemple, soit l’ensemble de figures suivant: Un algorithme de clustering peut trouver les clusters suivants: Bien que certaines figures différentes coexistent dans un cluster. Le problème du Clustering : regroupement Etant donnée une base de données D={t1,t2,…,tn} de tuples et une valeur entière k, le Clustering est de définir une application f:D🡒 {1,..,k} où chaque ti est affecté à un seul cluster (groupe ou classe) Kj, 1

Use Quizgecko on...
Browser
Browser