ÉTAPES D'UN TEST D'HYPOTHÈSE

ÉTAPE 1: FORMULER L'HYPOTHÈSE NULLE
ET L'HYPOTHÈSE ALTERNATIVE

C'est ce que nous avons vu ci-dessus
Cette étape est cruciale
(la valeur du paramètre posée par l'hypothèse est notée par l'indice H0, e.g. μHo)

ÉTAPE 2: CHOISIR LE SEUIL DE SIGNIFICATION DU TEST
(ainsi que l'effectif échantillonnal)

Lorsque la valeur véritable du paramètre de la population est celle proposée par
l'hypothèse nulle, on sait que la probabilité d'observer une différence entre
l'estimateur et la valeur hypothétique devient plus petite à mesure que la différence
s'accroît, i.e. il est très improbable d'observer une grande différence

Avant même de prélever l'échantillon, on doit déterminer
la probabilité maximale acceptable de commettre une erreur de type I

Ce niveau de risque, appelé seuil de signification du test, est noté par la lettre α

Plus les conséquences du rejet erroné de
l'hypothèse nulle sont graves, plus α doit être petit

Traditionnellement, est fixé à 0,05 ou 0,01

Note: c'est à cette probabilité que les gens réfèrent lorsqu'ils disent:
«... mon test statistique est significatif à 5%»

C'est aussi à cette étape qu'on doit se questionner
sur la taille nécessaire de l'échantillon
Rappelons seulement que plus n est grand, plus l'erreur type est petite
Par conséquent, la taille de l'échantillon détermine la puissance du test
d'hypothèse, i.e. sa capacité de détecter une différence réelle
{En d'autres termes, la taille de l'échantillon est inversement reliée
à la probabilité de commettre une erreur de type II

ÉTAPE 3: DÉTERMINER LA DISTRIBUTION
POUR EFFECTUER LE TEST

Selon le type d'indice statistique choisi pour estimer le paramètre,
on aura divers types de distribution de probabilités

Le choix de cette distribution de référence permet de définir si la valeur calculée
de l'estimateur est probable, si l'on s'en tient à l'hypothèse nulle

C'est lorsque la valeur calculée est jugée très peu probable qu'on décide
de rejeter l'hypothèse nulle parce que la distribution d'échantillonnage
des estimateurs que celle-ci suppose ne semble pas appropriée

Pour les cas présentés dans la suite de la partie 8 du cours,
on utilisera la distribution normale et la distribution t

Cependant, il convient de souligner qu'il existe des tests d'hypothèse
dont les distributions de probabilités sont différentes
Par exemple, lorsqu'on doit comparer plusieurs pourcentages échantillonnaux,
on utilise la distribution du χ2 (9e partie du cours)
De même, si on fait des rapports de variances, la distribution de référence
est la distribution F de Fischer (11e partie du cours)

ÉTAPE 4: DÉFINIR LA RÉGION CRITIQUE

Ayant déterminé le seuil de signification et la distribution de probabilités
pertinente, il faut définir ce que l'on entend par une différence significative

Ainsi, lorsque la distribution d'échantillonnage est normale,
on utilise la table des Z pour déterminer la valeur critique
correspondant au seuil de signification désiré

Par exemple, si α = 0,05, cela signifie que l'hypothèse nulle sera rejetée
si la différence entre l'estimateur et le paramètre supposé n'a qu'une
probabilité de 0,05 ou moins de se produire lorsque H0 est vraie

Dans les cas d'une moyenne échantillonnale, il s'agit de déterminer la zone pour
laquelle la différence entre et μHo, exprimée en unités standard (Z), n'a qu'une
faible probabilité de se produire (5% ou moins)

Mais la différence peut être positive ou négative
On doit donc partager la probabilité d'erreur, i.e. α, en deux parties
égales de chaque côté de la distribution, donc α/2 = 0,025

Il reste donc une aire de 0,475 (0,5 - 0,025) de chaque côté de μHo,
ce qui correspond à une valeur Z de 1,96

Par conséquent, si la moyenne diffère de plus de 1,96 erreur type
de la valeur hypothétique μHo, il est justifié de rejeter l'hypothèse nulle,
mais ceci, avec un risque d'erreur de 5% (car α = 0,05)

Évidemment, dans cette situation, la valeur Z critique
dépendra du seuil de signification fixé à l'étape 2
Par exemple, si on fixe α à 0,01, il faut trouver le Z délimitant une aire de
0,5 - α/2 = 0,5 - 0,005 = 0,495
ce qui correspond à une valeur de 2,58

Graphiquement, on a donc la figure suivante

Définitions

Une différence significative est un différence entre l'estimateur (e.g. ) et la
valeur supposée du paramètre (e.g. μHo) qui mène au rejet de l'hypothèse nulle

La région de rejet (ou région critique) de l'hypothèse nulle est constituée du ou
des intervalles de valeurs à l'intérieur desquels il est jugé fort improbable
(selon α) que l'indice statistique se situe si H0 est vraie

La région d'acceptation est tout simplement
la région complémentaire de la région de rejet

ÉTAPE 5: ÉTABLIR LA RÈGLE DE DÉCISION

Il faut énoncer clairement et a priori la règle de décision

Cette règle doit stipuler la conclusion appropriée qui sera tirée
selon ce qu'indiquent les résultats échantillonnaux

De façon générale, la règle de décision est formulée de la façon suivante:
Maintenir H0 si la valeur de l'indice statistique
se situe dans la région d'acceptation
ou
Rejeter H0 si la valeur de l'indice statistique
se situe dans la région de rejet

Dans le cas d'une moyenne échantillonnale issue d'une distribution
d'échantillonnage normale, on dira plus spécifiquement:
Maintenir H0 si se situe dans la région
d'acceptation construite autour de
ou
Rejeter H0 si se situe dans la région
de rejet construite autour de

ÉTAPE 6: FAIRE LES CALCULS NÉCESSAIRES

Une fois établies toutes les règles du test d'hypothèse,
on doit prélever un échantillon et calculer la valeur de l'indice
statistique qui permet d'estimer le paramètre concerné

Par exemple, dans le cas d'une moyenne,
on doit déterminer et et calculer le rapport critique

qui exprime, en unités standard, la différence entre
la moyenne échantillonnale et la valeur présumée du paramètre

ÉTAPE 7: PRENDRE LA DÉCISION

En analysant la valeur de l'indice statistique obtenu à l'étape 6
à la lumière des règles établies à l'étape 5, on prend la décision pertinente
i.e. rejeter H0 si la valeur de l'indice est dans la région de rejet et, évidemment,
maintenir H0 si la valeur de l'indice est dans la région d'acceptation

EN RÉSUMÉ

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative

° Étape 2: Choisir le seuil de signification du test

° Étape 3: Déterminer la distribution pour effectuer le test

° Étape 4: Définir la région critique

° Étape 5: Établir la règle de décision

° Étape 6: Faire les calculs nécessaires

° Étape 7: Prendre la décision

Dans l'exemple du QI des psychologues, on aurait la situation suivante
(où l'on accomplirait séquentiellement chacune des étapes susmentionnées)

Suite >TEST BILATÉRAL vs TEST UNILATÉTRAL