Summary

Ce document présente les concepts statistiques de base. Il aborde les variables, l'inférence, les tests d'hypothèses et les lois de probabilité. Les notions clés incluent l'analyse des données, les distributions, et l'interprétation des résultats.

Full Transcript

**Variables** - ***Caractéristique qui peut prendre différentes valeurs ou modalités*** (varie ; âge, sexe...) - Modalité / valeur **possible** = recouvre toutes modalités/valeurs qui pourraient être observées (p.ex 0 à 120 ans) - Modalité / valeur **observée** = celles dans étude (...

**Variables** - ***Caractéristique qui peut prendre différentes valeurs ou modalités*** (varie ; âge, sexe...) - Modalité / valeur **possible** = recouvre toutes modalités/valeurs qui pourraient être observées (p.ex 0 à 120 ans) - Modalité / valeur **observée** = celles dans étude (p.ex moyenne ; 20 ans) - **Observation :** valeur/modalité *observée* pour **1 participant** - Types de variables : 1. **Qualitative** (non-métrique) ou **Catégorique **: classée en catégories / modalités - **Variables nominales **: pas ordre logique (p.ex couleur, sexe) - **Variables ordinales **: ordonnées (p.ex niveau satisfaction) 2. **Quantitative** (métrique) ou **numériques **: ont des valeurs numériques - **Variables discrètes **: nb [max] de valeurs possibles - **Variables continues **: nb [infini] valeurs possibles - *Différentes analyse statistiques selon type variables* **!** si modalité **« autre »** ou **« ne sait pas »** : casse structure de échelle → dans questionnaires, modalité différente que autres = devient nominal, pour faire statistique enlève ces personnes II. **Inférence** - **Inférence **: tirer conclusions pour la population depuis échantillon - **Échantillon **: partie de population [sélectionnée et interrogée] - **Paramètre **: [inconnue] dans population (ce qu'on veut estimer), noté avec **lettre grecque** - **Estimation **: [valeur obtenue] dans échantillon (résultat), notée avec **lettre latine** ou grecque + \^ - Pour **estimer paramètres inconnus **: analyser données dans population (moyenne, proportion, variance) - En estimant paramètres d'une population depuis échantillon (= lors inférence), il y a un **risque d'erreur** - **Erreur échantillonnage **: écart entre vraie proportion et celle obtenue dans échantillon [Exemple :] Tirer pile ou face Proba 50% avoir pile (A) =\> P(A) = 0.5 (**paramètre**, ! proba pas lettre grecque) Lancer 20x pièce et obtient 11x pile =\> p = 11/20 = 0.55 (**estimation**) III. **Test d'Hypothèse** - ***Méthode pour tester affirmation / question de recherche*** [Exemple :] Effet MC Question : Est-ce que MC A a -- effets secondaires que B ? Étude : Recevoir MC A ou B Résultat : nb effets secondaires 1. ***Hypothèse nulle (H0)* :** se passe rien (pas effet, différence, notée en **lettre grecque**) 2. ***Hypothèse alternative (H1)* :** se passe quelque chose (effet, différence, **lettre grecque**) - **Bilatérale :** dit juste qu'il y a une [différence] (+ souvent) - **Unilatérale :** dit quel meilleur (µ~A~ \> µ~B ~; B meilleur car -- effets secondaires) ***!! On ne peut pas accepter une hypothèse, seulement la rejeter*** - Pour accepter hypothèse : pas assez preuves (difficile) - Pour rejeter hypothèse : direct preuves suffisantes (facile) [Exemple :] Couleur des cygnes Hypothèse : tous cygnes sont blancs Si cherche cygnes blancs : confirmation (peut confirmer avec bcp) Si cherche cygnes noirs : réfutation (peut réfuter avec 1) ***!! On peut tester que hypothèse nulle*** Car plusieurs hypothèses alternatives \> pas possibles toutes tester ![](media/image3.png) **!! sur échantillon peut pas conclure pour population \> peut pas rejeter H0** → doit faire + loin IV. **Lois de Probabilité** - ***Décrit comment proba sont distribuées sur tous résultats possibles d'une variable*** - Différentes lois : - **Loi uniforme discrète **: Jet dé à 6 faces - **Loi de Bernouilli **: jet de pièce - **Loi binomiale **: 3 jets de pièce A. ![](media/image5.png)**Loi Normale** - Loi de probabilité **continue** - **Loi normale centrée réduite :** - Toute loi normale peut être centrée-réduite : - Propriétés de la loi normale : - **Aire sous courbe **: calculer avec tables ou R ![](media/image8.png) B. **Théorème Central Limite** - **Addition de variables indépendantes suit une loi normale** [Exemple :] Loi Uniforme Continue Choisir point au hasard sur ligne de 0 à 1, n = nb essais → **distribution normale des moyennes même si distribution des variables pas normale** ![](media/image10.png) C. **P-Value** - **Proba d'avoir résultat autant ou + extrême que si H0 est vraie** - En statistiques on utilise **distributions théoriques** (loi normale, student...) pour [modéliser la distribution] de la variable sous H0 [Exemple :] Taille joueurs basket H~0~ : µ~basket~ = 177 (population générale) H~1~ : µ~basket~ \> 177 (taille joueurs, hypothèse unilatérale) - Distribution de taille dans population : **X ∼ N (177, 7)** - ![](media/image12.png)Échantillon de joueurs de basket : m = 182 - Résultat : **24%** chances avoir valeur 182 ou + si H0 est vraie - Si veut être dans 5% : m = 188.5cm

Use Quizgecko on...
Browser
Browser