AFC et AFCM - Méthodes Statistiques PDF

Summary

Ce document présente les méthodes statistiques AFC et AFCM. L'AFC analyse les relations entre deux variables qualitatives, tandis que l'AFCM examine les relations entre plusieurs variables qualitatives. Ces techniques sont utilisées pour segmenter des populations et identifier des associations entre différentes variables.

Full Transcript

AFC **1. Définition :** L'AFC est une méthode exploratoire utilisée pour analyser des relations entre deux variables qualitatives. Elle repose sur un tableau de contingence et permet de rechercher des **correspondances** entre les modalités des variables (lignes et colonnes). **2. Particularités...

AFC **1. Définition :** L'AFC est une méthode exploratoire utilisée pour analyser des relations entre deux variables qualitatives. Elle repose sur un tableau de contingence et permet de rechercher des **correspondances** entre les modalités des variables (lignes et colonnes). **2. Particularités :** - L'AFC peut être appliquée même lorsque le **test du khi-deux** n\'indique pas de relation significative entre les variables (p-valeur \> 0,05). - Les modalités bien représentées sont celles qui s'éloignent du **point de gravité** dans la représentation graphique. **3. Étapes de l\'AFC :** 1. **Analyse du tableau de contingence :** - Le tableau de contingence contient les fréquences croisées des modalités des deux variables qualitatives (par exemple, effectifs entre régions et produits préférés). 2. **Test du khi-deux :** - Ce test est utilisé pour vérifier si une relation existe entre les variables. - Si le test est significatif (p \< 0,05), il y a une association probable. Sinon, l'AFC peut encore révéler des tendances faibles. 3. **Calcul des valeurs propres et pourcentage d'inertie :** - Les **valeurs propres** mesurent l'inertie expliquée par chaque axe factoriel. - Le pourcentage d'inertie indique combien de variation est capturée par chaque axe. 4. **Recherche des correspondances :** - Identifier les associations entre : - **Modalités lignes** : catégories d'une variable. - **Modalités colonnes** : catégories de l'autre variable. 5. **Représentation graphique des profils lignes et colonnes :** - Les **profils lignes** (proportions dans chaque ligne) et les **profils colonnes** (proportions dans chaque colonne) sont projetés dans un espace factoriel. 6. **Représentation simultanée et interprétation :** - Les modalités lignes et colonnes sont représentées dans un même plan. - L'interprétation se fait en fonction : - **Des coordonnées** : Plus les coordonnées d\'une modalité sont élevées, plus elle est importante. - **De l'angle** : Les modalités proches en angle ou distance sont associées. 7. **Lecture des résultats du logiciel :** - Les graphiques et les tableaux produits par le logiciel (comme SPSS ou R) permettent une interprétation visuelle et quantitative. **4. Règles et limites :** 1. **Effet de Godman :** - L'AFC ne peut pas être appliquée si une des variables a **moins de 3 modalités**. 2. **Nombre de solutions :** - Le nombre d'axes factoriels est égal au minimum entre : - Nombre de lignes−1\\text{Nombre de lignes} - 1Nombre de lignes−1 - Nombre de colonnes−1\\text{Nombre de colonnes} - 1Nombre de colonnes−1 **5. Interprétation des résultats :** - Les modalités proches sur le graphique sont fortement associées. - Les modalités éloignées du **point de gravité** (centre du graphique) sont bien représentées dans le plan factoriel. - Les modalités avec des **coordonnées élevées** sur les axes principaux expliquent une partie importante de l'inertie et sont donc significatives. AFCM **AFCM : Analyse Factorielle des Correspondances Multiples** **Définition :\ **L'AFCM est une méthode statistique qui permet d'étudier les relations entre **plusieurs variables qualitatives**. Elle aide à segmenter les individus d'une population et à leur attribuer des modalités, tout en expliquant chaque groupe avec les modalités associées. **1. Conditions d\'application** - Applicable lorsque l\'on travaille avec **plusieurs variables qualitatives**. - Les réponses aux questions doivent être **qualitatives**, c'est-à-dire qu'elles ne peuvent pas être des numéros (par exemple, un code postal ou une note). Si elles sont numériques, on leur attribue des modalités (ex. : âge → jeunes, adultes, seniors). **2. Notations et Concepts** - **P** représente le **nombre total de modalités**. - **S** représente le **nombre de variables qualitatives**. - Le **nombre de solutions** (axes factoriels) est égal à : Nombre de solutions=P−S\\text{Nombre de solutions} = P - SNombre de solutions=P−S **3. But de l'AFCM** - **Segmenter la population étudiée** en groupes distincts selon leurs caractéristiques. - **Attribuer des modalités** aux individus pour caractériser chaque groupe. - Représenter graphiquement les relations entre individus et modalités dans un espace factoriel. **4. Démarche de l'AFCM** 1. **Tableau de données brut :** - Contient les données initiales des réponses aux questions (ex. : réponses à un questionnaire). 2. **Tableau de codage condensé :** - Simplification des données pour regrouper les réponses similaires sous des modalités communes. 3. **Tableau disjonctif complet :** - Chaque modalité devient une colonne. Les individus sont en ligne. - Les réponses sont codées en **1** (présent) ou **0** (absent). - -------------- ----------------- ----------------- ---------------- ----------------- ----------------- **Individu** **Sexe\_Homme** **Sexe\_Femme** **Âge\_Jeune** **Âge\_Adulte** **Âge\_Senior** 1 1 0 1 0 0 2 0 1 0 1 0 -------------- ----------------- ----------------- ---------------- ----------------- ----------------- **5. Types de questions possibles** - **Oui/Non :** Codées comme des modalités binaires (ex. : Fumeur : Oui/Non). - **Échelle de Likert :** Convertie en modalités qualitatives (ex. : Satisfaction : Très satisfait/Satisfait/Neutre). **Remarque importante :** - Si une question a **deux possibilités de réponse**, elle est directement une variable (ex. : Sexe : Homme/Femme). - Si une question a **plusieurs possibilités de réponse**, les réponses deviennent des variables (ex. : Couleur préférée → Couleur\_Bleu, Couleur\_Rouge, Couleur\_Vert). **6. Représentation graphique** - **Individus au centre des modalités :\ **Les individus sont projetés dans l'espace factoriel proche des modalités qui les caractérisent. - **Modalités au centre des individus :\ **Les modalités sont situées au milieu des individus qui partagent ces caractéristiques. **Interprétation des résultats :** - Les points proches sur le graphique (individus ou modalités) sont liés ou similaires. - Les individus situés à proximité d'une modalité sont caractérisés par celle-ci. **7. Points clés sur le tableau disjonctif complet** - Les **sommes des colonnes** (effectifs des modalités) sont significatives. - Les **codes utilisés** dans le tableau ne le sont pas directement, ils servent juste à construire les profils lignes et colonnes. **8. Exemple pratique** **Étude : Profil de clients dans un supermarché** - **Variables qualitatives** : - Sexe (Homme/Femme) - Âge (Jeune/Adulte/Senior) - Fréquence d'achat (Rarement/Souvent/Très souvent) - Produit préféré (Alimentaire/Électronique/Vêtements) - **Résultats possibles** : - Les jeunes achètent souvent des vêtements. - Les seniors préfèrent les produits alimentaires. - Les femmes achètent fréquemment des articles alimentaires. **9. Avantages de l'AFCM** 1. Permet d\'analyser **plusieurs variables qualitatives simultanément**. 2. Facilite l\'identification des **groupes-types** dans la population. 3. Donne une représentation visuelle des relations complexes dans les données qualitatives.

Use Quizgecko on...
Browser
Browser