Podcast
Questions and Answers
Que mesure l'erreur standard en statistique ? (Sélectionnez tout ce qui s'applique)
Que mesure l'erreur standard en statistique ? (Sélectionnez tout ce qui s'applique)
Laquelle des affirmations suivantes concernant l'erreur standard de la moyenne (SEM) est correcte ?
Laquelle des affirmations suivantes concernant l'erreur standard de la moyenne (SEM) est correcte ?
Quel pourcentage de personnes ont obtenu une note qui se situe en dessous de z = -1,00 lors d’un examen de philosophie (M = 90,00, ÉT = 10,00) ?
Quel pourcentage de personnes ont obtenu une note qui se situe en dessous de z = -1,00 lors d’un examen de philosophie (M = 90,00, ÉT = 10,00) ?
16 %
Que signifie la signification statistique dans le contexte des tests d'hypothèses ?
Que signifie la signification statistique dans le contexte des tests d'hypothèses ?
Signup and view all the answers
Que représente l'expression "degrés de liberté" dans le contexte des tests d'hypothèses statistiques ?
Que représente l'expression "degrés de liberté" dans le contexte des tests d'hypothèses statistiques ?
Signup and view all the answers
Quel est l’intervalle des écarts pour les observations d’un échantillon si la moyenne est 2 et il y a des observations x1 = 1 et x2 = 2 ?
Quel est l’intervalle des écarts pour les observations d’un échantillon si la moyenne est 2 et il y a des observations x1 = 1 et x2 = 2 ?
Signup and view all the answers
Pourquoi la variance de la population est-elle calculée en utilisant /N ?
Pourquoi la variance de la population est-elle calculée en utilisant /N ?
Signup and view all the answers
Un échantillon qui n’est pas indépendant doit être inclus dans le calcul de la variance.
Un échantillon qui n’est pas indépendant doit être inclus dans le calcul de la variance.
Signup and view all the answers
Quelle hypothèse est rejetée si la moyenne d'un échantillon est très différente de la moyenne de la population?
Quelle hypothèse est rejetée si la moyenne d'un échantillon est très différente de la moyenne de la population?
Signup and view all the answers
La vérification de l’hypothèse se fait à travers un ensemble de _____ qui permettent de vérifier si l’hypothèse alternative est vraie.
La vérification de l’hypothèse se fait à travers un ensemble de _____ qui permettent de vérifier si l’hypothèse alternative est vraie.
Signup and view all the answers
Quelle est la règle d'inférence concernant le rejet de H0 ?
Quelle est la règle d'inférence concernant le rejet de H0 ?
Signup and view all the answers
Qu'est-ce que l'erreur type de la moyenne (s Χ)?
Qu'est-ce que l'erreur type de la moyenne (s Χ)?
Signup and view all the answers
Qu'est-ce qu'une erreur de type I ?
Qu'est-ce qu'une erreur de type I ?
Signup and view all the answers
La signification statistique est une notion arbitraire.
La signification statistique est une notion arbitraire.
Signup and view all the answers
Quelle est la conclusion sur H0 si nous ne pouvons pas le rejeter ?
Quelle est la conclusion sur H0 si nous ne pouvons pas le rejeter ?
Signup and view all the answers
La règle décisionnelle indique que nous rejetons H0 lorsque la différence Χ - µ est « bien plus grande » que l'erreur type de la _____.
La règle décisionnelle indique que nous rejetons H0 lorsque la différence Χ - µ est « bien plus grande » que l'erreur type de la _____.
Signup and view all the answers
Comment calculer l'intervalle de confiance (IC)?
Comment calculer l'intervalle de confiance (IC)?
Signup and view all the answers
Quels concepts sont au cœur de la méthode scientifique ?
Quels concepts sont au cœur de la méthode scientifique ?
Signup and view all the answers
Il est requis que l’échantillon soit parfaitement normalement distribué pour effectuer une inférence.
Il est requis que l’échantillon soit parfaitement normalement distribué pour effectuer une inférence.
Signup and view all the answers
Quelle est la probabilité de faire une erreur de type I (rejet incorrect de H0) si le seuil alpha est fixé à 5 %?
Quelle est la probabilité de faire une erreur de type I (rejet incorrect de H0) si le seuil alpha est fixé à 5 %?
Signup and view all the answers
Dans une classe de 60 étudiants, la moyenne du premier examen intra est de 65% et l'écart-type de 15. Quel est le nombre d'élèves ayant obtenu des scores entre 50 et 65%?
Dans une classe de 60 étudiants, la moyenne du premier examen intra est de 65% et l'écart-type de 15. Quel est le nombre d'élèves ayant obtenu des scores entre 50 et 65%?
Signup and view all the answers
Qu'est-ce que l'inférence statistique?
Qu'est-ce que l'inférence statistique?
Signup and view all the answers
Quelles sont les caractéristiques d'une population?
Quelles sont les caractéristiques d'une population?
Signup and view all the answers
Il est quasi impossible de mesurer une population dans bien des cas en raison de :
Il est quasi impossible de mesurer une population dans bien des cas en raison de :
Signup and view all the answers
Les statistiques sont utilisées pour décrire les caractéristiques d'un échantillon uniquement.
Les statistiques sont utilisées pour décrire les caractéristiques d'un échantillon uniquement.
Signup and view all the answers
Quelle durabilité ont les paramètres statistiques?
Quelle durabilité ont les paramètres statistiques?
Signup and view all the answers
Quel est le rôle de l'échantillon dans l'inférence statistique?
Quel est le rôle de l'échantillon dans l'inférence statistique?
Signup and view all the answers
Associez les termes suivants aux bonnes descriptions:
Associez les termes suivants aux bonnes descriptions:
Signup and view all the answers
La division pour le calcul de la variance d'un échantillon se fait par ______.
La division pour le calcul de la variance d'un échantillon se fait par ______.
Signup and view all the answers
Dans une classe de 60 étudiants, la moyenne du premier examen intra est de 65% et l’écart-type de 15. Combien d'élèves ont obtenu des scores entre 50 et 65%?
Dans une classe de 60 étudiants, la moyenne du premier examen intra est de 65% et l’écart-type de 15. Combien d'élèves ont obtenu des scores entre 50 et 65%?
Signup and view all the answers
Qu'est-ce que l'inférence statistique?
Qu'est-ce que l'inférence statistique?
Signup and view all the answers
Quelle est la différence entre un paramètre et une statistique?
Quelle est la différence entre un paramètre et une statistique?
Signup and view all the answers
Qu'est-ce qu'un échantillon aléatoire?
Qu'est-ce qu'un échantillon aléatoire?
Signup and view all the answers
Quels sont les types d'échantillons aléatoires mentionnés?
Quels sont les types d'échantillons aléatoires mentionnés?
Signup and view all the answers
Que mesure l'erreur standard en statistique ?
Que mesure l'erreur standard en statistique ?
Signup and view all the answers
Laquelle des affirmations suivantes concernant l'erreur standard de la moyenne (SEM) est correcte ?
Laquelle des affirmations suivantes concernant l'erreur standard de la moyenne (SEM) est correcte ?
Signup and view all the answers
Lors d’un examen de philosophie, quel pourcentage de personnes ont obtenu une note qui se situe en dessous de z = -1,00 ?
Lors d’un examen de philosophie, quel pourcentage de personnes ont obtenu une note qui se situe en dessous de z = -1,00 ?
Signup and view all the answers
Que signifie la signification statistique dans le contexte des tests d'hypothèses ?
Que signifie la signification statistique dans le contexte des tests d'hypothèses ?
Signup and view all the answers
Quels sont les résultats possibles d'un échantillon dans le cadre du rejet d'H0?
Quels sont les résultats possibles d'un échantillon dans le cadre du rejet d'H0?
Signup and view all the answers
Quelle est la signification des erreurs d'inférence?
Quelle est la signification des erreurs d'inférence?
Signup and view all the answers
L'intervalle de confiance est calculé comme 𝛸 ± z * s𝜲, où z est la _____ de l'intervalle de confiance.
L'intervalle de confiance est calculé comme 𝛸 ± z * s𝜲, où z est la _____ de l'intervalle de confiance.
Signup and view all the answers
La distribution des échantillons provenant d'une population non normale restera normale.
La distribution des échantillons provenant d'une population non normale restera normale.
Signup and view all the answers
Lorsque l'échantillon appartient à la population, que peut-on conclure?
Lorsque l'échantillon appartient à la population, que peut-on conclure?
Signup and view all the answers
Quel est le risque d'erreur alpha généralement accepté en statistique?
Quel est le risque d'erreur alpha généralement accepté en statistique?
Signup and view all the answers
Associez les termes suivants avec leur définition:
Associez les termes suivants avec leur définition:
Signup and view all the answers
Que représente l'expression "degrés de liberté" dans le contexte des tests d'hypothèses statistiques ?
Que représente l'expression "degrés de liberté" dans le contexte des tests d'hypothèses statistiques ?
Signup and view all the answers
Il y a toujours un risque de 32 % que les échantillons ne soient pas situés à 𝛸 ± 1 s𝜲.
Il y a toujours un risque de 32 % que les échantillons ne soient pas situés à 𝛸 ± 1 s𝜲.
Signup and view all the answers
Pourquoi la variance de la population est-elle calculée à partir de $\sigma^2/N$ ?
Pourquoi la variance de la population est-elle calculée à partir de $\sigma^2/N$ ?
Signup and view all the answers
Quand rejetons-nous H0?
Quand rejetons-nous H0?
Signup and view all the answers
Si on rejette l'hypothèse nulle (H0), cela prouve nécessairement que l'hypothèse alternative (H1) est vraie.
Si on rejette l'hypothèse nulle (H0), cela prouve nécessairement que l'hypothèse alternative (H1) est vraie.
Signup and view all the answers
Quelle est l'erreur de type I ?
Quelle est l'erreur de type I ?
Signup and view all the answers
Quelle est l'erreur de type II ?
Quelle est l'erreur de type II ?
Signup and view all the answers
Associez les hypothèses avec leur signification :
Associez les hypothèses avec leur signification :
Signup and view all the answers
Quelle est la relation entre l’échantillon et la population en termes d'inférence statistique ?
Quelle est la relation entre l’échantillon et la population en termes d'inférence statistique ?
Signup and view all the answers
Study Notes
Le Concept d’Inférence Statistique
- L’inférence statistique permet de tirer des conclusions sur une population à partir d’un échantillon.
- La population est l’ensemble des individus ou entités que l’on souhaite étudier.
- L’échantillon est une partie de la population que l’on observe et mesure.
- Les paramètres sont les caractéristiques d’une population (ex. : moyenne, variance).
- Les statistiques sont les caractéristiques d’un échantillon (ex. : moyenne, variance).
- L’inférence consiste à « estimer » les paramètres de la population à partir des statistiques de l’échantillon, avec une probabilité d’erreur.
- La représentativité de l’échantillon est essentielle pour que l’inférence soit valide.
L’Échantillon Représentatif
- Un échantillon représentatif est un échantillon dont les caractéristiques sont similaires à celles de la population.
- La randomisation est une technique pour obtenir un échantillon représentatif lorsqu’on ne connaît pas les paramètres de la population.
- Un échantillon aléatoire simple donne à chaque membre de la population une chance égale d'être choisi.
- Un échantillon aléatoire stratifié garantit une représentation des différentes caractéristiques de la population.
Taille de l’Échantillon et Représentativité
- Plus la taille de l’échantillon est grande, plus il a de chances d’être représentatif.
- Plus l’échantillon est grand, plus les statistiques se rapprochent des paramètres.
Degrés de Liberté
-
Le concept de degrés de liberté (d.l.) intervient dans le calcul de la variance et l’écart-type d’un échantillon.
-
La division par n-1 dans le calcul de la variance et l’écart-type d’un échantillon permet de corriger un biais d’inférence en « exagérant » légèrement la variance de l’échantillon.
-
La division par n-1 permet d’obtenir un meilleur estimé de la variance de la population à partir de la variance de l’échantillon.
-
Le calcul de s² (et s ) et de s² (et s) n’est pas identique : la division, pour les échantillons se fait par n -1.
-
n - 1 = les degrés de liberté (d.l.).### Théorie, hypothèses et vérification
-
La méthode scientifique repose sur trois concepts clés: la théorie, l'hypothèse alternative et l'hypothèse nulle, ainsi que la vérification de l'hypothèse.
-
La théorie est une représentation de la réalité.
-
L'hypothèse alternative (H1) prédit que la manipulation ou l'expérimentation aura un effet.
-
L'hypothèse nulle (H0) est l'inverse de H1, elle soutient que la théorie ou la prédiction est fausse.
-
La vérification de l'hypothèse (NHTS) est un ensemble de procédures logiques permettant de vérifier si l'hypothèse alternative est vraie ou si l'hypothèse nulle est fausse.
L'hypothèse alternative
- L'hypothèse alternative (H1) prédit que quelque chose est vrai dans la population.
- Par exemple, "les gens insatisfaits sont plus souvent absents du travail."
- L'hypothèse est vérifiée à l'aide d'échantillons et d'inférences car il est impossible d'accéder à toute la population.
Premier exemple (Appartenance à la population)
- H1: L'attitude envers les statistiques est plus positive pour les étudiants du PSY 1004 A que pour l'ensemble du département.
- On connaît l'attitude moyenne des étudiants du département (µ) et la distribution normale de l'attitude.
- On mesure l'attitude moyenne des étudiants du PSY 1004 A (𝛸).
- H1: 𝛸 ≠ µ ; H0: 𝛸 = µ
- Si 𝛸 ≠ µ, nous rejetons H0 et acceptons H1, ce qui signifie que les étudiants du PSY 1004 A ne font pas partie de la même population que les étudiants du département, ils constituent une autre population.
Second exemple
- H1: l'habileté statistique diffère pour les hommes et les femmes.
- H0: l'habileté statistique ne diffère pas pour les hommes et les femmes, elle est similaire.
- H1: µ notesF ≠ µ notesH ; H0: µ notesF = µ notesH
- On teste un échantillon de femmes et un échantillon d'hommes, chacun étant représentatif de la population qui est normalement distribuée.
- Si les moyennes des deux échantillons (𝛸) sont différentes, elles ne peuvent pas toutes deux provenir de la même population, on rejette H0.
- Si les moyennes des deux échantillons sont identiques, il n'y a pas de base pour croire qu'ils proviennent de deux populations différentes, on ne rejette pas H0.
La signification statistique
- La signification statistique porte directement sur la relation entre l'échantillon et la population.
- Lorsqu'on trouve une corrélation "statistiquement significative" entre x et y, on infère qu'il y a de faibles chances que la corrélation x et y au niveau de la population soit en réalité nulle.
- Lorsqu'on trouve une différence "statistiquement significative" entre la performance scolaire des filles et des garçons, on infère qu'il y a de faibles chances qu'au niveau de la population la différence entre les filles et les garçons soit nulle.
- Il s'agit d'inférences, l'erreur est possible.
Logique du jeu d'hypothèse H1 vs H0
- Si H1 prédit qu'il y aura une différence ou une corrélation, H0 prédit qu'il n'y aura pas de différence ou de corrélation.
- Si on rejette l'hypothèse nulle (elle est "fausse"), l'inverse doit nécessairement être vrai.
- Le rejet de H0 mène à "l'acceptation" de H1.
- Le non-rejet de H0 ne signifie pas nécessairement que H1 est fausse.
Le rejet de H0 "prouve" H1: exemple
- H1: il y a des missiles nucléaires en Iran.
- H0: il n'y a pas de missiles nucléaires en Iran.
- On en trouve un, il est alors faux de dire qu'il n'y en a pas et on rejette H0.
- Le rejet de H0 implique nécessairement l'acceptation de H1.
Le non-rejet de H0 ne prouve pas que H1 est fausse: exemple
- H1: il y a des missiles nucléaires en Iran
- H0: il n'y a pas de missiles nucléaires en Iran.
- On fouille toutes les villes et on n'en trouve pas.
- Cela ne prouve pas que les missiles n'existent pas, car ils pourraient être mieux cachés.
Quatre principaux concepts d'inférence
- Si H0 est rejetée, H1 est nécessairement vraie.
- Si H0 n'est pas rejetée, il n'y a pas de preuve confirmant H1, mais H1 n'est pas nécessairement fausse.
- On ne peut jamais prouver qu'une H1 est fausse à partir d'un échantillon.
- Pour prouver que quelque chose n'existe pas, il faut examiner la population complète, ce qui est généralement irréalisable.
Postulat de l'inférence (rappel)
- On présume que le ou les échantillons sont aléatoirement extraits de populations normalement distribuées.
- L'échantillon n'a pas besoin d'être parfaitement normalement distribué, mais il doit être aléatoirement extrait.
Sommaire de la logique de l'inférence
- Les hypothèses sont vérifiées à l'aide d'échantillons et servent à tirer une inférence au sujet de la population.
- Les échantillons sont aléatoirement tirés de populations.
- Lorsqu'on rejette l'hypothèse nulle, on conclut que l'échantillon ne proviendrait probablement pas de cette population (ou que deux échantillons proviennent de populations différentes).
- Lorsqu'on ne rejette pas H0, on conclut qu'il n'y a pas de preuves que l'échantillon ne provienne pas de cette population (ou que deux échantillons proviennent de populations différentes).
Principe de base en inférence
- La population, normalement distribuée, ne peut avoir qu'une seule moyenne (µ) et 𝛸 est le meilleur estimé de µ.
- Si les valeurs 𝛸 des deux échantillons A et B diffèrent, les deux échantillons ne proviennent pas d'une seule population.
- H1: les échantillons ne proviennent pas de la même population.
- H0: les échantillons proviennent de la même population.
Une nuance s'impose
- On dit que l'échantillon ne provient pas de cette population lorsque 𝛸 ≠ µ.
- Deux échantillons ayant des 𝛸 différentes ne peuvent pas provenir de la même population.
- Il faut toutefois prendre en compte l'erreur d'échantillonnage.
La fluctuation des échantillons aléatoires
- Il est très probable que deux échantillons de la même taille, extraits de la même population, aient des 𝛸 numériquement différentes.
- De même, n'importe quel échantillon extrait aléatoirement d'une population n'aura pas nécessairement la même 𝛸 que celle de sa population.
La fluctuation (exemple)
- Dans une classe de 160 étudiants, la moyenne à l'examen est µ = 70.
- Nous souhaitons estimer µ à partir d'un échantillon aléatoire de 5 étudiants.
- La valeur 𝛸 pour cet échantillon peut varier (70, 74, 0, 100, etc.).
- Deux échantillons de 5 étudiants n'auront pas la même 𝛸.
- Selon le principe de base de l'inférence, ils ne proviennent pas de la même population, mais cela est faux, les deux échantillons sont extraits de la même population.
L'erreur d'échantillonnage et l'erreur-type de la moyenne
- L'erreur d'échantillonnage: la fluctuation naturelle entre les échantillons tirés de la même population.
- L'erreur type de la moyenne: la fluctuation naturelle entre les 𝛸 des échantillons tirés de la même population.
- L'erreur d'échantillonnage et l'erreur type de la moyenne se réfèrent au même principe.
Principe d'inférence nuancé
- On suppose que l'on peut chiffrer l'erreur type de la moyenne.
- L'erreur-type: jusqu'à quel point peut-on tolérer qu'une moyenne d'échantillon soit différente d'une moyenne de population ?
- Nouvelle règle d'inférence: on rejette H0 lorsque la différence entre la moyenne des échantillons (ou entre 𝜲 et µ) est plus grande que l'erreur-type de la moyenne.
L'inférence en résumé
- L'inférence implique une conclusion au sujet de la population à partir d'un échantillon.
- Elle exige la formulation de H1 et de H0.
- Elle se réduit à la décision: H1 ou H0.
- La décision H1 vs H0 dépend de la différence entre 𝛸 et µ ou entre les 𝛸 de plusieurs échantillons.
- Il faut prendre en considération l'erreur type de la moyenne.
- On rejette H0 si la différence entre les moyennes est plus grande que l'erreur type de la moyenne.
Et finalement: les erreurs d'inférence
- L'inférence consiste à conclure H1 ou H0.
- En rejetant H0, on dit que les échantillons ne proviennent probablement pas de la même population.
- Lorsqu'on ne rejette pas H0, on ne peut pas inférer avec certitude que les échantillons ne proviennent pas de la même population.
- Ces décisions se basent sur des probabilités, la conclusion pourrait être fausse.
- Une conclusion fausse est une erreur, une erreur d'inférence.
Erreurs de type I
- Conclure qu'un phénomène existe alors qu'il n'existe pas est une erreur de type I (alpha).
- Conclure qu'il existe une différence entre deux moyennes, un lien entre deux variables (etc.) alors qu'en réalité il n'existe pas de différence ou de lien.
- Conclure à tort au rejet de H0.
- Il s'agit d'un "faux positif"
Erreurs de type II
- Conclure qu'un phénomène n'existe pas alors qu'il existe est une erreur de type II (bêta).
- Conclure qu'il n'existe pas de différence entre deux moyennes, aucun lien entre deux variables (etc.) alors qu'en réalité la différence ou le lien existe.
- Conclure à tort au non-rejet de H0.
- Il s'agit d'un "faux négatif."
Exemples d'erreurs de type I et de type II
- Vous établissez un diagnostic auprès d'un client de votre clinique.
- H1: le client a une dépression majeure.
- H0: le client n'est pas en dépression.
- Vous établissez le diagnostic de dépression.
- Il est réellement dépressif: diagnostic juste.
- Il a réellement autre chose (bipolaire): mauvais diagnostic, erreur de type I.
- Vous établissez un diagnostic de bipolarité.
- Il est réellement bipolaire: bonne conclusion.
- Il est réellement dépressif: mauvais diagnostic, erreur de type II.
La mécanique d'inférence statistique
-
𝛸 (la valeur de la moyenne de l'échantillon) et µ (la moyenne de la population).### Postulat de l'inférence
-
On suppose que les échantillons sont tirés aléatoirement de populations normalement distribuées.
-
L'échantillon n'a pas besoin d'être parfaitement normalement distribué, mais il doit être tiré aléatoirement.
-
La symétrie et l'aplatissement ne doivent pas être trop élevés.
Démonstration : La moyenne des 𝛸 échantillons = µ
- La moyenne des moyennes des échantillons est égale à la moyenne de la population (µ).
Remarques importantes
- Les échantillons sont tous tirés de la même population.
- Les observations des échantillons diffèrent en raison de l'erreur d'échantillonnage.
- Les moyennes des échantillons diffèrent en raison de l'erreur type des moyennes.
- Ces variations sont dues à la randomisation.
Estimation de la taille de la fluctuation des 𝛸
- On imagine tirer tous les échantillons de taille identique d'une population.
- On calcule la moyenne de chaque échantillon.
- On calcule la différence moyenne (typique) entre les moyennes des échantillons.
- Ce calcul produit un chiffre qui spécifie le degré de fluctuation entre les 𝛸.
- Cela ressemble à un écart-type, mais au niveau des échantillons et non de la distribution.
s 𝛸 : La différence « typique » entre les 𝛸 et µ
- Il faut calculer la somme des différences entre les 𝛸 et µ.
- Cette somme est toujours égale à zéro.
- Pour éliminer ce problème, on met chaque différence au carré et on fait la somme de ces différences.
- La division par K (le nombre d'échantillons) produit la variance des moyennes des échantillons.
- La racine carrée de la variance produit l'écart-type des 𝛸 autour de µ.
- C'est l'erreur type de la moyenne (s 𝛸).
L'erreur-type de la moyenne
- L'erreur type de la moyenne (s 𝛸) est la fluctuation "typique" ou "habituelle" entre les moyennes des échantillons provenant de la même population.
- Si on connaissait toutes les moyennes de tous les échantillons, il serait facile de calculer s 𝛸.
- Mais on n'a jamais tous les échantillons.
- Alors, comment déterminer s 𝛸 ?
Donc…
- On connait toujours la taille (n) de l'échantillon.
- Lorsque la variance de la population (s² et s) est connue, la différence typique probable entre 𝛸 et µ peut être estimée.
- Mais on a un problème ! On ne connait presque jamais s² ou s.
- L'axiome statistique peut nous aider : s est le meilleur estimé de s.
- On peut donc utiliser s.
Le calcul de s𝛸
- s𝛸 : l'erreur-type de 𝛸 (de l'échantillon 1).
- 𝛸(76,31) diffèrera de µ, en moyenne par ± 2,39 points.
𝛸 et s𝛸 pour l'estimation de µ
- Règle décisionnelle : l'échantillon n'appartient PAS à cette population (rejet de H0) si la différence entre 𝛸 et µ est plus grande que s𝛸.
En d'autres mots…
- Il faut créer l'intervalle de confiance (± s𝛸) à partir de la moyenne de l'échantillon. Si µ est inclus dans l'intervalle, il faut accepter H0. L'échantillon appartient à la population, il n'est pas si différent de µ. Si µ est à l'extérieur de l'intervalle, il faut accepter H1. L'échantillon est trop différent de µ. Il doit appartenir à une autre population.
Comprendre l'IC et l'inférence
- Puisque la distribution des moyennes des échantillons est normale, 68,26 % des échantillons auront des moyennes situées dans la zone ±1 s𝛸. Il y a donc environ deux chances sur trois que 𝛸 se trouve à ±1 s𝛸.
Comprendre l'IC et l'inférence (suite)
- 68,26 % des échantillons auront des moyennes situées dans la zone ±1 s𝛸. (p = 0,68 que µ est entre 𝛸 ± 1 s𝛸).
- Non rejet de H0 si µ se situe entre 𝛸 ± 1 s𝛸 (impossible de conclure que l'échantillon provient d'une autre population).
- Rejet de H0 si µ ne se situe pas entre 𝛸 ± 1 s𝛸 (l'échantillon provient d'une autre population).
Comprendre l'IC et l'inférence (suite)
- IC68 % = 𝛸 ± 1 * s𝛸
L'IC et l'erreur d'inférence
- IC68 %= 𝛸 ± 1 * s𝛸
Les différents IC et le risque d'erreur
- La distribution des échantillons aléatoirement extraits d'une population étant normale, 68,26 % (environ 2/3) des échantillons se trouveront a ± 1 s𝛸. Mais environ 32 % des échantillons extraits de cette population ne sont pas situés a 𝛸 ± 1 s𝛸.
- Cette règle produit un risque d'erreur d'environ 32 %. Pourquoi ? Parce que 32 % des 𝛸 seront à l'extérieur de l'IC. Il y a trop de risque de se tromper !
Augmentation de l'IC, baisse du risque d'erreur
- IC95 %= 𝛸 ± 1,96 * s𝛸
- Pour réduire davantage le risque : nous savons que 99 % des échantillons se situent entre 𝛸 ± 2,58 s𝛸.
Calcul de l'intervalle de confiance (IC)
- IC = 𝛸 ± z s𝛸
- 𝛸 = la moyenne de l'échantillon
- s𝛸 = l'erreur type de la moyenne
- z = la taille de l'intervalle de confiance : il réfère au nombre de s𝛸 qui vont être utilisés pour établir les bornes. Le plus souvent oublié. En général, nous utilisons z = 1,96 (p < 0,05) ; 2,58 (p < 0,01) et à l'occasion z = 3,1 (p < 0,001).
Comprendre l'IC et l'inférence (suite)
- Il y a environ 95 % des chances que l'échantillon tiré aléatoirement se retrouve dans la zone ±2 s𝛸. Si 𝛸 arrive réellement à l'une des deux extrémités de la courbe, que se passe-t-il ?
IC et l'inférence H1 VS H0
- Il faut établir un IC autour de la valeur connue de l'échantillon. Si la moyenne de l'échantillon tombe à l'intérieur de l'IC, cela veut dire que la différence 𝛸 - µ pourrait être « causée » par l'erreur d'échantillonnage. Si cela est le cas, nous ne pouvons pas rejeter H0. Si la moyenne de l'échantillon tombe à l'extérieur de l'IC, la différence 𝛸 - µ n'est pas causé par l'erreur d'échantillonnage. Nous rejetons H0.
Rejet de H0 : Signification statistique
- Signification statistique : conclusion que l'échantillon ne provient probablement pas de cette population (ou réponse à une autre question : lien, prédiction, etc.). Cette conclusion est avancée seulement lorsque le risque qu'elle soit fausse est faible : erreur d'inférence de type I (erreur a). Cette conclusion est déclarée, minimalement, lorsque le risque d'une erreur est en deçà ou égale à 5 % (a ≤ 0,05). Lorsqu'il est important de rejeter H0 seulement si le risque d'erreur alpha est très faible, nous faisons appel à un seuil alpha plus petit : (a = 0,01 ou même a = 0,001). Attention : les seuils a sont arbitraires et reflètent un consensus (en psychologie).
Rejet de H0 et le risque d'une erreur alpha.
- Il faut rejeter H0 lorsque µ se trouve à l'extérieur des bornes de l'IC = 𝛸 ± z s𝛸.
- Les bornes de l'IC sont déterminées à l'aide d'un z et de s𝛸. Lorsque les bornes de l'IC sont étroites (proches l'une de l'autre) il est plus probable que µ se trouvera à l'extérieur. A l'inverse lorsque les bornes de l'IC sont larges, il est moins probable que µ se trouve à l'extérieur.
La signification statistique est arbitraire
- Le choix de p ≤ 0,05 pour définir la signification statistique (minimale) est une convention pratique aidant la décision : H1 ou H0. Il n'existe aucun rationnel mathématique qui détermine cette valeur. C'est plutôt le risque à prendre qui compte. Le rejet de H0 est fait en acceptant un risque d'erreur d'inférence (0,05 ; 0,01 ; 0,001). Tout dépend du degré d'importance de la décision à prendre ! VS
Lorsqu'il y a erreur d'inférence…
- Puisqu'il y a seulement 2,5 % de chances de se tromper (environ) en disant que la 𝛸 de l'échantillon appartient à une autre population (en blanc), nous prenons ce risque. Lorsque toutefois, 𝛸 appartient réellement à la population, ce risque a joué contre nous et nous avons commis une erreur d'inférence.
- Le 5 % arbitraire tient compte des deux extrémités de la courbe.
La signification statistique et les erreurs d'inférence
-
Exemples d'erreurs alpha (type I ; faux positif):
- Conclure que l'échantillon ne provient pas de cette population (H1) alors qu'il lui appartient en réalité (H0).
- Conclure que le médicament est efficace (H1) alors, qu'en réalité il est inefficace.
- Établir un lien entre deux variables à partir d'un échantillon (H1) alors que ce lien n'existe pas dans la population ou en réalité (H0).
-
Exemples d'erreurs bêta (type II ; faux négatif):
- Conclure que l'échantillon provient de cette population (H0) alors qu'il ne lui appartient pas en réalité (H1).
- Conclure que le médicament est inefficace (H0), alors qu'en réalité il est efficace (H1).
- Conclure qu'il n'existe pas de lien entre deux variables à partir d'un échantillon (H0) alors que ce lien existe (H1).
Comment réduire le risque d'une erreur alpha ?
- Erreur alpha : Conclure au rejet de H0 alors qu'en réalité cela est faux. Il faut accroitre les bornes de l'IC.
- En augmentant l'erreur-type de la moyenne (s𝛸).
- En choisissant un seuil alpha plus petit (0,01 plutôt que 0,05).
- En réduisant le nombre d'observations n.
Comment réduire le risque d'une erreur bêta ?
- Erreur bêta : conclure au non-rejet de H0 alors qu'en réalité cela est faux. Il faut réduire les bornes de l'IC.
- En réduisant l'erreur-type de la moyenne (s𝛸).
- En choisissant un seuil alpha plus grand (0,05 plutôt que 0,01).
- En augmentant le nombre d'observations n.
Réduire le risque alpha ou beta ?
- Le choix entre la réduction de l'erreur de type I ou l'erreur de type II dépend totalement du risque d'erreur que l'on désire minimiser. Si fondamentalement, la conséquence de faire une erreur de type II est plus grave que la conséquence d'une erreur de type I, réduisons l'erreur beta (et vice-versa). Voyons deux exemples.
Réduire le risque d'une erreur beta ?
- Un médicament "guérit" le SIDA. En fonction des différences individuelles, le médicament guérit seulement 1 % des patients (taille de l'effet = petite). Si nous utilisons un petit n dans notre étude, il est peu probable que nous allons conclure H1, car le médicament ne peut pas guérir beaucoup de gens. Il est plus probable de conclure H0. Le médicament ne sera pas mis sur le marché. Mais guérir 1 % des patients d'une maladie aussi grave est important dans ce cas. Donc nous serions mieux de nous servir de grands échantillons, pour vérifier si réellement 1 % des gens sont guéris et d'éviter une erreur de type II. Avec un grand n, nous concluons à la signification statistique et le médicament est mis sur le marché.
Réduire le risque d'une erreur alpha ?
- Un médicament "guérit" le rhume. En fonction de différences individuelles, le médicament guérit seulement 1 % des patients. Si nous utilisons un très grand n dans notre étude, il est fort probable de conclure le rejet H0. Le médicament sera mis sur le marché. Mais guérir seulement 1 % des patients n'est pas important dans ce cas. Le rhume n'est pas mortel, alors donner le médicament à tous serait une perte de ressources. Si nous utilisons un petit n dans notre étude, il est peu probable de conclure au rejet de H0. Le médicament ne sera pas mis sur le marché.
Questions type examen QCM
- Que mesure l'erreur standard en statistique ?
- La variabilité de la moyenne de l'échantillon.
Questions type examen QCM
- Laquelle des affirmations suivantes concernant l'erreur standard de la moyenne (SEM) est correcte ?
- L'erreur standard diminue lorsque la taille de l'échantillon augmente.
Questions type examen QCM
- Lors d’un examen de philosophie, on a constaté que les résultats étaient distribués normalement (M = 90,00, ÉT = 10,00). Quel pourcentage de personnes ont obtenu une note qui se situe en dessous de z = -1,00 :
- 16 %
Questions type examen QCM
- Que signifie la signification statistique dans le contexte des tests d'hypothèses ?
- La probabilité qu'un effet observé ne soit pas dû au hasard.
### Concepts d'Inférence Statistique
-
L' inférence statistique permet de tirer des conclusions sur une population à partir d'un échantillon.
-
La population est l'ensemble complet des personnes/entités que l'on souhaite étudier, tandis que l'échantillon est une partie de cette population.
-
Un paramètre est une caractéristique de la population, tandis qu'une statistique est une caractéristique d'un échantillon.
-
L'inférence statistique vise à estimer les paramètres de la population à partir des statistiques de l'échantillon.
-
L'estimé des paramètres de la population réalisé à partir de statistiques présume que l'échantillon est représentatif de la population.
-
L'échantillon représentatif ressemble à la population en termes de caractéristiques.
-
L'échantillon aléatoire assure la représentativité d'un échantillon; chaque individu de la population a une chance égale d'être choisi, indépendamment des autres individus.
-
Un échantillon aléatoire simple garantit une chance égale de sélection pour chaque individu.
-
Un échantillon aléatoire stratifié divise la population en sous-groupes (strates) en fonction de caractéristiques connues et prélève un échantillon aléatoire au sein de chaque strate.
-
Un échantillon par grappes prélève un échantillon de groupes (clusters) plutôt que d'individus, où chaque groupe est un sous-ensemble représentatif de la population.
-
Plus l'échantillon est important, plus il a de chances d'être représentatif, ce qui permet une meilleure estimation des paramètres de la population.
-
L'erreur statistique ou d'échantillonnage est la différence entre la valeur d'un paramètre de la population et la valeur d'une statistique de l'échantillon.
-
Une grande taille d'échantillon réduit l'erreur statistique.
-
La variance d'un groupe est calculée à partir de la somme des différences au carré entre chaque observation et la moyenne, divisée par le nombre d'observations.
-
Les degrés de liberté (d.l.) prennent en compte le nombre d'observations indépendantes dans un échantillon.
-
Lorsque l'on travaille avec un échantillon, la variance est calculée en divisant la somme des différences au carré par (n - 1) pour tenir compte des degrés de liberté.
-
La division par (n - 1) corrige le biais d'inférence, résultant en une meilleure estimation de la variance de la population.
-
La formule de la variance de l'échantillon est s² = S(X-𝛸)² / (n-1).
-
La formule de la variance de la population est σ² = S(X- µ)² / N.
-
La formule de l'écart-type de l'échantillon est s = S(X-𝛸)² / (n-1).
-
La formule de l'écart-type de la population est σ = S(X- µ)² / N.
-
Les d.l. sont le nombre d'observations indépendantes dans un échantillon.
-
La correction des d.l. est importante lorsque l'on travaille avec de petits échantillons et permet de minimiser le biais d'inférence.
-
La taille de l'échantillon et les d.l. ont un impact sur la précision de l'inférence statistique.### Concepts clés de la méthode scientifique
-
La méthode scientifique repose sur trois concepts centraux : la théorie, l'hypothèse et la vérification.
-
La théorie représente la réalité.
-
Une hypothèse alternative propose que la manipulation ou l'expérimentation aura un effet.
-
L'hypothèse nulle représente l'inverse de l'hypothèse alternative, suggérant que la théorie ou la prédiction est erronée.
-
La vérification de l'hypothèse utilise des procédures logiques pour déterminer si l'hypothèse alternative est vraie ou si l'hypothèse nulle est fausse.
### L'hypothèse alternative (H1)
- L'hypothèse alternative prédit que quelque chose est vrai dans la population.
- L'hypothèse est vérifiée par l'entremise d'échantillons et d'inférences.
- L'hypothèse alternative implique l'existence d'une corrélation (un lien) entre les variables ou une différence entre les groupes.
### Exemple d'hypothèse alternative
- L'attitude envers les statistiques est plus positive chez les étudiants de PSY 1004 A que chez ceux du département en entier.
- H1: 𝛸 ≠ µ ; H0 : 𝛸 = µ
- Si la moyenne de l'attitude (𝛸) des étudiants de PSY 1004 A diffère de la moyenne du département (µ), nous refusons H0.
- L'échantillon des étudiants de PSY 1004 A ne fait pas partie de la même population que les étudiants « normaux » du département.
### Erreur d'échantillonnage et l'erreur type de la moyenne
- Deux échantillons extraits de la même population ne sont pas nécessairement composés des mêmes observations.
- La moyenne des échantillons extraits de la même population n'est pas nécessairement numériquement la même.
- L'erreur d'échantillonnage et l'erreur type de la moyenne réfèrent au même principe : la fluctuation naturelle entre les 𝛸 des échantillons tirés de la même population.
### Rejet de H0
- L'inférence scientifique consiste à décider s'il est possible de rejeter l'hypothèse nulle (H0).
- Nous rejetons H0 lorsque la différence entre la moyenne de l'échantillon (𝛸) et la moyenne de la population (µ) est beaucoup plus importante que l'erreur type de la moyenne.
- La distribution normale permet de calculer l'erreur type de la moyenne et de définir une limite pour considérer la différence comme significative.
### Erreurs d’inférence
- Une erreur de type I (alpha) se produit lorsque nous concluons qu'un phénomène existe alors qu'il n’existe pas (faux positif).
- Une erreur de type II (bêta) se produit lorsque nous concluons qu'un phénomène n'existe pas alors qu’il existe (faux négatif).
### Conclusion
- La méthode scientifique ne permet jamais de conclure avec certitude qu'un phénomène n'existe pas.
- L'inférence scientifique est basée sur la probabilité et non pas sur la certitude, ce qui rend possible les erreurs d'inférence.
Postulat de l’inférence
- Nous présumons que les échantillons sont aléatoires et proviennent de populations ayant une distribution normale. La distribution de l'échantillon ne doit pas être parfaitement normale mais doit être aléatoire.
Démonstration : La moyenne des x-échantillons = µ
- Nous pouvons calculer la moyenne (x) de chaque échantillon possible.
- La moyenne de toutes les moyennes des échantillons (x) est égale à la moyenne de la population (µ).
Remarques importantes
- Les échantillons sont tous tirés de la même population.
- Les observations dans chaque échantillon diffèrent en raison de l'erreur d'échantillonnage.
- Les moyennes de chaque échantillon diffèrent en raison de l'erreur type de la moyenne.
- La variation des moyennes est due à la randomisation.
Estimation de la taille de la fluctuation
- Nous pouvons calculer la différence moyenne ("typique") entre les moyennes d'échantillons.
- Cette valeur mesure le degré de fluctuation entre les moyennes des échantillons.
s x : La différence "typique" entre les x et µ
- La somme des différences (x-µ) est toujours nulle.
- Pour enlever ce problème, nous mettons chaque différence au carré (x-µ)² puis nous les additionnons.
- La division par K (nombre d'échantillons) produit la variance des moyennes d'échantillons.
- La racine carrée de la variance des moyennes d'échantillons donne l'écart type des moyennes (s x). C'est l'erreur type de la moyenne.
L'erreur-type de la moyenne
- L'erreur type de la moyenne (s x) est une mesure de la fluctuation "typique" ou "habituelle" qui existe entre les moyennes d'échantillons provenant de la même population.
- Il est difficile de calculer s x car nous n'obtenons jamais tous les échantillons possibles.
Le calcul de s x
- L'axiome statistique nous aide à estimer s x.
- L'écart type de l'échantillon (s) est la meilleure estimation de l'écart type de la population (σ).
- Nous pouvons donc utiliser s pour calculer s x.
x et s x pour l'estimation de µ
- Une règle décisionnelle est utilisée pour décider si un échantillon appartient à la population ou non.
- Si la différence entre la moyenne de l'échantillon (x) et la moyenne de la population (µ) est supérieure à l'erreur type de la moyenne (s x), nous rejetons l'hypothèse nulle (H0), ce qui signifie que l'échantillon ne provient pas de la population.
Comprendre l'intervalle de confiance (IC) et l'inférence
- La distribution des moyennes d'échantillons est normale.
- Environ 68,26% des échantillons auront une moyenne qui se situe à ±1 s x de la moyenne de la population.
- L'intervalle de confiance à 68% est calculé en additionnant et en soustrayant 1 s x de la moyenne de l'échantillon.
- Si la moyenne de la population (µ) se trouve à l'intérieur de l'intervalle de confiance à 68%, nous ne rejetons pas H0. Si µ se trouve à l'extérieur, nous rejetons H0.
- Nous pouvons faire une erreur d'inférence en concluant que l'échantillon ne provient pas de la population (rejet de H0) même si l'échantillon provient de la population.
L'IC et l'erreur d'inférence
- Nous pouvons ajuster la taille de l'intervalle de confiance pour modifier le risque de faire une erreur.
- L'intervalle de confiance à 95% est calculé en additionnant et en soustrayant 1,96 s x de la moyenne de l'échantillon.
- L'intervalle de confiance à 99% est calculé en additionnant et en soustrayant 2,58 s x de la moyenne de l'échantillon.
Calcul de l'intervalle de confiance (IC)
- L'intervalle de confiance est calculé en utilisant la formule suivante : IC = x ± z s x, où x est la moyenne de l'échantillon, s x est l'erreur type de la moyenne et z est la taille de l'intervalle de confiance.
L'IC et l'inférence H1 vs H0
- Nous établissons un intervalle de confiance autour de la moyenne de l'échantillon.
- Si la moyenne de la population (µ) se trouve à l'intérieur de l'intervalle de confiance, nous ne rejetons pas H0.
- Si µ se trouve à l'extérieur de l'intervalle de confiance, nous rejetons H0.
Rejet de H0: Signification statistique
- La signification statistique est utilisée pour conclure que l'échantillon ne provient probablement pas de la population (ou une autre question comme la prédiction ou le lien).
- Cette conclusion est généralement faite lorsque le risque d'être incorrect est faible (erreur d'inférence de type I).
- Le rejet de H0 est considéré significatif lorsque le risque d'erreur alpha est inférieur à 0,05 (p<0,05).
- Un seuil alpha plus petit (0,01 ou 0,001) est utilisé pour obtenir un risque d'erreur alpha plus faible et un rejet de H0 plus solide.
Rejet de H0 et le risque d'erreur alpha
- Un seuil alpha faible réduit la probabilité de faire une erreur d'inférence de type I.
- La taille de l'intervalle de confiance joue un rôle dans le rejet de H0.
- Un intervalle de confiance plus étroit est plus susceptible de rejeter H0, tandis qu'un intervalle de confiance plus large a moins de chances de rejeter H0.
- L'intervalle de confiance peut être modifié en changeant l'erreur type de la moyenne (s x).
La signification statistique est arbitraire
- Le choix de p ≤ 0,05 pour définir la signification statistique (la plus faible) est une convention pratique.
- Elle n'est pas basée sur des principes mathématiques rigoureux.
Lorsqu'il y a erreur d'inférence
- Il y a un risque de faire une erreur (erreur d'inférence de type I) en concluant que l'échantillon ne provient pas de la population.
- Ce risque de faire une erreur d'inférence est pris lorsque la moyenne de la population (µ) se trouve à l'extérieur de l'intervalle de confiance.
La signification statistique et les erreurs d'inférence
- Les erreurs d'inférence de type I (faux positif) sont généralement signalées dans les exemples suivants :
- L'échantillon ne provient pas de la population (H1) alors qu'en réalité il lui appartient (H0).
- Le médicament est efficace (H1) alors qu'en réalité il est inefficace.
- Il existe un lien entre deux variables dans l'échantillon (H1) alors qu'il n'en existe pas dans la population.
La signification statistique et les erreurs d'inférence (Suite)
- Les exemples d'erreurs d'inférence de type II (faux négatif) sont les suivants :
- L'échantillon provient de la population (H0) alors qu'en réalité il ne lui appartient pas (H1).
- Le médicament est inefficace (H0) alors qu'en réalité il est efficace (H1).
- Il n'existe pas de lien entre deux variables dans l'échantillon (H0) alors qu'il en existe dans la population.
Comment réduire le risque d'une erreur alpha ?
- L'erreur alpha est commise lorsque nous rejetons H0 alors qu'en réalité ce n'est pas correct.
- Le risque d'erreur alpha peut être réduit en augmentant la taille de l'intervalle de confiance.
- Cela peut être fait en augmentant l'erreur type de la moyenne (s x), en utilisant un seuil alpha plus petit (0,01 au lieu de 0,05) ou en diminuant la taille de l'échantillon (n).
Comment réduire le risque d'une erreur bêta ?
- L'erreur bêta est commise lorsque H0 n'est pas rejetée, alors qu'en réalité ce n'est pas correct.
- Le risque d'erreur bêta peut être réduit en diminuant la taille de l'intervalle de confiance.
- Cela peut être fait en diminuant l'erreur type de la moyenne (s x), en utilisant un seuil alpha plus grand (0,05 au lieu de 0,01) ou en augmentant la taille de l'échantillon (n).
Réduire le risque alpha ou bêta ?
- Le choix entre la réduction du risque d'une erreur de type I ou d'une erreur de type II dépend de quelle erreur est la plus grave.
Réduire le risque d'une erreur bêta ?
- Un médicament qui guérit le SIDA est un exemple de situation où une erreur de type II serait très grave.
- Si nous concluons que le médicament est inefficace (H0) alors qu'en réalité il est efficace (H1), nous manquerions une chance de sauver des vies.
- Dans ce cas, nous devrions utiliser une taille d'échantillon plus grande pour réduire le risque d'une erreur de type II.
Réduire le risque d'une erreur alpha ?
- Un médicament qui guérit seulement le rhume est un exemple de situation où une erreur de type I serait plus grave.
- Si nous concluons que le médicament est efficace (H1) alors qu'en réalité il ne l'est pas (H0), nous pourrions gaspiller des ressources.
- Dans ce cas, nous devrions utiliser une taille d'échantillon plus petite pour réduire le risque d'une erreur de type I.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Related Documents
Description
Ce quiz explore le concept d'inférence statistique et l'importance des échantillons représentatifs. Apprenez à distinguer entre population et échantillon, ainsi que les paramètres et statistiques essentielles. Testez vos connaissances sur la randomisation et l'estimation des paramètres.