Avant même de prélever l'échantillon, on doit
déterminer
la probabilité maximale acceptable de commettre une erreur de type I
Ce niveau de risque, appelé seuil de signification du test, est noté par la lettre α
Plus les conséquences du rejet erroné de
l'hypothèse nulle sont graves, plus α doit être petit
Traditionnellement, est fixé à 0,05 ou 0,01
Note: c'est à cette probabilité que les gens réfèrent
lorsqu'ils disent:
«... mon test statistique est significatif à 5%»
C'est aussi à cette étape qu'on doit se questionner
sur la taille nécessaire de l'échantillon
Rappelons seulement que plus n est grand, plus l'erreur type est petite
Par conséquent, la taille de l'échantillon détermine la
puissance du test
d'hypothèse, i.e. sa capacité de détecter une
différence réelle
{En d'autres termes, la taille de l'échantillon est inversement reliée
à la probabilité de commettre une erreur de type II
Le choix de cette distribution de référence permet de
définir si la valeur calculée
de l'estimateur est probable, si l'on s'en tient à l'hypothèse nulle
C'est lorsque la valeur calculée est jugée très peu probable qu'on
décide
de rejeter l'hypothèse nulle parce que la distribution d'échantillonnage
des estimateurs que celle-ci suppose ne semble pas appropriée
Pour les cas présentés dans la suite de la partie 8 du cours,
on utilisera la distribution normale et la distribution t
Cependant, il convient de souligner qu'il existe des tests d'hypothèse
dont les distributions de probabilités sont différentes
Par exemple, lorsqu'on doit comparer plusieurs pourcentages échantillonnaux,
on utilise la distribution du χ2 (9e
partie du cours)
De même, si on fait des rapports de variances, la distribution de
référence
est la distribution F de Fischer (11e partie du cours)
Ainsi, lorsque la distribution d'échantillonnage est normale,
on utilise la table des Z pour déterminer la valeur critique
correspondant au seuil de signification désiré
Par exemple, si α = 0,05, cela signifie que
l'hypothèse nulle sera rejetée
si la différence entre l'estimateur et le paramètre supposé n'a
qu'une
probabilité de 0,05 ou moins de se produire lorsque H0 est vraie
Dans les cas d'une moyenne échantillonnale, il s'agit de déterminer la zone
pour
laquelle la différence entre
et
μHo, exprimée en unités standard (Z), n'a qu'une
faible probabilité de se produire (5% ou moins)
Mais la différence peut être positive ou négative
On doit donc partager la probabilité d'erreur, i.e. α, en
deux parties
égales de chaque côté de la distribution, donc α/2 = 0,025
Il reste donc une aire de 0,475 (0,5 - 0,025) de chaque côté de
μHo,
ce qui correspond à une valeur Z de 1,96
Par conséquent, si la moyenne
diffère de plus de 1,96 erreur type
de la valeur hypothétique μHo, il est justifié de rejeter
l'hypothèse nulle,
mais ceci, avec un risque d'erreur de 5% (car α = 0,05)
Évidemment, dans cette situation, la valeur Z critique
dépendra du seuil de signification fixé à l'étape 2
Par exemple, si on fixe α à 0,01, il faut trouver le Z
délimitant une aire de
0,5 - α/2 = 0,5 - 0,005 = 0,495
ce qui correspond à une valeur de 2,58
Graphiquement, on a donc la figure suivante
Définitions
Une différence significative est un différence entre l'estimateur
(e.g.
) et la
valeur supposée du paramètre (e.g. μHo) qui mène
au rejet de l'hypothèse nulle
La région de rejet (ou région critique) de l'hypothèse
nulle est constituée du ou
des intervalles de valeurs à l'intérieur desquels il est jugé fort
improbable
(selon α) que l'indice statistique se situe si H0 est
vraie
La région d'acceptation est tout simplement
la région complémentaire de la région de rejet
Cette règle doit stipuler la conclusion appropriée qui sera
tirée
selon ce qu'indiquent les résultats échantillonnaux
De façon générale, la règle de décision est
formulée de la façon suivante:
Maintenir H0 si la valeur de l'indice statistique
se situe dans la région d'acceptation
ou
Rejeter H0 si la valeur de l'indice statistique
se situe dans la région de rejet
Dans le cas d'une moyenne échantillonnale issue d'une distribution
d'échantillonnage normale, on dira plus spécifiquement:
Maintenir H0 si
se situe dans la
région
d'acceptation construite autour de ![]()
ou
Rejeter H0 si
se situe dans la
région
de rejet construite autour de
Par exemple, dans le cas d'une moyenne,
on doit déterminer
et
et calculer le rapport critique

qui exprime, en unités standard, la différence entre
la moyenne échantillonnale et la valeur présumée du paramètre
° Étape 2: Choisir le seuil de signification du test
° Étape 3: Déterminer la distribution pour effectuer le test
° Étape 4: Définir la région critique
° Étape 5: Établir la règle de décision
° Étape 6: Faire les calculs nécessaires
° Étape 7: Prendre la décision
Dans l'exemple du QI des psychologues, on aurait la situation suivante
(où l'on accomplirait séquentiellement chacune des étapes
susmentionnées)