Analyse de données: Trois étapes clés PDF
Document Details
Tags
Related
Summary
Ce document décrit les trois étapes clés de l'analyse de données: la phase descriptive, l'analyse bivariée, et la modélisation. La phase descriptive analyse le comportement d'une seule variable pour identifier les fragilités potentielles des données. Les analyses bivariées déterminent l'existence et la force d'une relation entre variables. La modélisation enfin réunit les variables explicatives afin de prédire l'effet d'un phénomène.
Full Transcript
Il y a **trois étapes** à respecter dans l'analyse de données. - L'analyse commence par une phase **descriptive** (statistiques de licence) qui s'appuie sur l'étude du comportement d'une seule variable. Cette analyse univariée permet de repérer **d'éventuelles fragilités dans la base*...
Il y a **trois étapes** à respecter dans l'analyse de données. - L'analyse commence par une phase **descriptive** (statistiques de licence) qui s'appuie sur l'étude du comportement d'une seule variable. Cette analyse univariée permet de repérer **d'éventuelles fragilités dans la base** de données en pointant les individus qui donnent des réponses marginales, les incohérences de codage, les non-réponses... Elle est utilisée ensuite pour **caractériser une situation** à travers des études de fréquences ou de moyennes, des graphiques et pour analyser la variété des profils. Enfin, elle correspond à une phase de réflexion où s'amorcent **les hypothèses** qui justifient une analyse de données. - La **validité de ces hypothèses** sera étudiée lors des **analyses bivariées** (deux variables en jeu) qui mobilisent les **statistiques inférentielles** vérifiant l'existence d'une **relation** entre variables et mesurant la **force** de cette relation. - La dernière étape est la **modélisation** qui réunit dans une **même équation** toutes les **variables explicatives** d'un phénomène afin de déterminer celles qui peuvent agir sur ce phénomène, **indépendamment de la relation** que ces variables explicatives peuvent avoir **entre elles**. Cette étape de l'analyse de données permet de faire des **préconisation**s en repérant les variables les plus influentes pour agir sur le phénomène. La modélisation, appelée aussi statistique décisionnelle, apporte des éléments de réponse au pilotage de politiques publiques en éducation.