Supposons que l'on demande à un certain nombre d'étudiants/es de trois
modules
de l'université s'ils/elles désirent prendre un cours de statistiques à la
prochaine
session. On veut savoir, au seuil de 5%, si le pourcentage de gens qui songent à
s'inscrire est identique dans chaque module. Les résultats obtenus,
présentés sous
forme de tableau de contingences, sont les suivants
| MODULE RÉPONSE |
Psychologie | Administration | Mathématiques | Total |
| Oui | 30 | 32 | 25 | 87 |
| Non | 60 | 80 | 40 | 180 |
| Total | 90 | 112 | 65 | 267 |
Voici comment réaliser le test d'hypothèse correspondant
° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative
H0: le pourcentage des populations désirant s'inscrire à un
cours
de statistiques est le même dans chaque module
vs
H1: le pourcentage des populations désirant s'inscrire à un
cours
de statistiques n'est pas le même dans chaque module
Attention: il n'est pas question ici de vérifier que le pourcentage de gens
disant
«oui» est le même que le pourcentage de gens disant «non».
Il ne s'agit pas non
plus de vérifier qu'il y a le même pourcentage de gens dans chaque module.
Une autre façon, équivalente, de formuler les hypothèses, serait:
H0: le désir de s'inscrire à un cours de statistiques
est indépendant du module auquel appartient
l'étudiant/e
vs
H1: le désir de s'inscrire à un cours de statistiques
est dépendant du module auquel appartient l'étudiant/e
° Étape 2: Choisir le seuil de signification du test
Ce seuil réfère toujours à la probabilité de commettre
une erreur de type I lorsque l'hypothèse nulle est vraie.
Le seuil choisi ici est α = 0,05
° Étape 3: Prélever des échantillons et relever les
fréquences observées
(voir le tableau de la page précédente)
° Étape 4: Calculer les fréquences théoriques espérées si H0 était vraie
On remarque que, au total, 87 personnes, sur les 267 interrogées,
désirent
effectivement s'inscrire à un cours de statistiques, soit 32,58%
Par conséquent, si l'hypothèse nulle était vraie, 32,58% de 90
étudiants/es en
psychologie devraient vouloir suivre un cours de statistiques, i.e.
32,58% × 90 = (87/267) × 90 = 29,33 personnes
Ce nombre correspond à la fréquence théorique
espérée
pour la case «Oui - Psychologie» du tableau de contingence
De la même façon, on pourrait calculer cette fréquence
théorique pour
chaque cellule; par exemple, pour la case «Non - Mathématiques», on
a
(180/267) × 65 = 43,82
La formule générale pour calculer les fréquences
théoriques espérées est

qui permet de construire le tableau des fréquences théoriques suivant
| MODULE RÉPONSE |
Psychologie | Administration | Mathématiques | Total | |||
| Oui | 29,33 | 30 | 36,49 | 32 | 21,18 | 25 | 87 |
| Non | 60,67 | 60 | 75,51 | 80 | 43,82 | 40 | 180 |
| Total | 90 | 112 | 65 | 267 | |||
° Étape 5: Calculer la valeur de χ2
On complète le tableau de calcul suivant
| Case (l/c) | fo | fe | fo - fe | (fo - fe)2 | (fo - fe)2/fe |
| 1-1 | 30 | 29,33 | 0,67 | 0,45 | 0,02 |
| 1-2 | 32 | 36,49 | -4,49 | 20,16 | 0,55 |
| 1-3 | 25 | 21,18 | 3,82 | 14,59 | 0,69 |
| 2-1 | 60 | 60,67 | -0,67 | 0,45 | 0,01 |
| 2-2 | 80 | 75,51 | 4,49 | 20,16 | 0,27 |
| 2-3 | 40 | 43,82 | -3,82 | 14,59 | 0,33 |
| Σ | 267 | 267,00 | 0,00 | 1,87 |
Où, pour vérifier les calculs, on a
Σfo = Σfe et Σ (fo - fe) = 0
Finalement
° Étape 6: Comparer la valeur du χ2 calculée avec la valeur critique de la table
Pour déterminer la valeur du χ2 critique, on doit connaître α et d.l.
Pour un tableau de contingences, le nombre de d.l. est donné par la
formule
d.l. = (l - 1)(c - 1)
où l = le nombre de lignes du tableau
et c = le nombre de colonnes du tableau
Ici = 0,05 et d.l. = (2 - 1)(3 - 1) = 1 × 2 = 2
À l'annexe 6, on voit que, pour ces valeurs, le χ2 critique est 5,991
Puisque le χ2 calculé (1,87) est inférieur à la valeur critique, on doit maintenir H0
En d'autres termes, il semble que le pourcentage de gens qui désirent
suivre un cours de statistiques est le même dans chaque module
Exemple II (#9)
Pour cerner l'opinion des travailleurs sur un éventuel changement aux
règles de
régie interne de la centrale syndicale qui les représente, l'exécutif a fait
parvenir
un questionnaire à 100 membres de trois syndicats affiliés.
Les résultats du sondage apparaissent dans le tableau ci-dessous
| SYNDICAT OPINION |
x | y | z |
| Pour | 17 | 23 | 10 |
| Contre | 9 | 13 | 8 |
| Indécis | 4 | 4 | 12 |
Au seuil de 0,05, les travailleurs des trois syndicats
diffèrent-ils significativement d'opinion?
° Étape 1: Formuler l'hypothèse nulle et
l'hypothèse alternative
H0: les pourcentages d'opinion sont les mêmes pour chaque syndicat
vs
H1: les pourcentages d'opinion sont différents selon le syndicat
° Étape 2: Choisir le seuil de signification du test
Le seuil choisi ici est α = 0,05
° Étape 3: Prélever des échantillons et relever les
fréquences observées
(voir le tableau ci-dessus)
° Étape 4: Calculer les fréquences théoriques
espérées si H0 était vraie
On complète le tableau suivant
| SYNDICAT OPINION |
x | y | z | Total | |||
| Pour | 15 | 17 | 20 | 23 | 15 | 10 | 50 |
| Contre | 9 | 9 | 12 | 13 | 9 | 8 | 30 |
| Indécis | 6 | 4 | 8 | 4 | 6 | 12 | 20 |
| Total | 30 | 40 | 30 | 100 | |||
° Étape 5: Calculer la valeur de χ2
On complète le tableau de calcul suivant
| Case (l/c) | fo | fe | fo - fe | (fo - fe)2 | (fo - fe)2/fe |
| 1-1 | 17 | 15 | 2 | 4 | 0,27 |
| 1-2 | 23 | 20 | 3 | 9 | 0,45 |
| 1-3 | 10 | 15 | -5 | 25 | 1,67 |
| 2-1 | 9 | 9 | 0 | 0 | 0,00 |
| 2-2 | 13 | 12 | 1 | 1 | 0,08 |
| 2-3 | 8 | 9 | -1 | 1 | 0,11 |
| 3-1 | 4 | 6 | -2 | 4 | 0,67 |
| 3-2 | 4 | 8 | -4 | 16 | 2,00 |
| 3-3 | 12 | 6 | 6 | 36 | 6,00 |
| Σ | 100 | 100 | 0 | 11,25 |
Donc
° Étape 6: Comparer la valeur du χ2 calculée avec la valeur critique de la table
Pour α = 0,05 et d.l. = (3 - 1)(3 - 1) = 2 × 2 =
4 on a un χ2 critique de 9,488
Puisque le χ2 calculé est supérieur
à la valeur critique,
on doit rejeter H0 et accepter H1
En d'autres termes, les travailleurs des trois syndicats semblent différer d'opinion
Notes
° On pourrait analyser plus en détail cette relation, mais il faudrait faire des
tests a posteriori. On peut néanmoins noter que, par exemple, les travailleurs
du syndicat z sont particulièrement «indécis»
puisqu'on remarque que fo > fe;
en contrepartie, ils semblent moins «pour» puisque, pour cette cellule,
fo < fe
° Il est important de noter que le test de comparaison de plusieurs
pourcentages,
tel que présenté ci-dessus, n'est adéquat que si toutes les
fréquences théoriques espérées sont
supérieures ou égales à 5