TEST D'AJUSTEMENT ANALYTIQUE

Le test d'ajustement analytique est une application particulière du test de χ2
Il permet de déterminer si une population donnée suit une distribution
particulière connue (e.g. une distribution normale, de Poisson, etc.)

Pour ce type de test, l'hypothèse nulle spécifie toujours
que la distribution de la population est de la forme supposée

Les étapes du test sont identiques à celles vues précédemment

Le nombre de degrés de liberté sera toujours déterminé
par le nombre de classes moins le nombre de relations qui lient
la distribution théorique à la distribution réelle

Exemple I

Vous affirmez que le nombre de pannes de métro n'est pas identique sur
chaque ligne. Vous relevez les pannes pendant un mois. Voici les résultats:
LIGNE FRÉQUENCE
Verte 56
Orange 66
Bleue 44
Jaune 54

Au seuil de 0,05, que peut-on conclure?

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative
H0: le pourcentage de pannes est identique sur chaque ligne métro
vs
H1: le pourcentage de pannes est différent selon la ligne de métro
(la distribution présumée est donc une distribution uniforme)

° Étape 2: Choisir le seuil de signification du test
Le seuil choisi ici est α = 0,05

° Étape 3: Prélever un échantillon et relever les fréquences observées
(voir le tableau de la page précédente)

° Étape 4: Calculer les fréquences théoriques espérées si H0 était vraie
Si H0 était vraie, on devrait avoir le même nombre de pannes sur chaque ligne
Comme il y a 4 lignes et un total de 220 pannes, on a: fe = ¼(220) = 55

° Étape 5: Calculer la valeur de χ2
On complète le tableau de calcul suivant
Ligne fo fe fo - fe (fo - fe)2 (fo - fe)2/fe
Verte 56 55 1 1 0,02
Orange 66 55 11 121 2,20
Bleue 44 55 -11 121 2,20
Jaune 54 55 -1 1 0,02
Σ 220 220 0 4,44

Donc

° Étape 6: Comparer la valeur du χ2 calculée avec la valeur critique de la table
Le nombre de relations liant les deux distributions est 1
puisque seule la fréquence totale est supposée identique
Pour = 0,05 et d.l. = 4 - 1 = 3 on a un χ2 critique de 7,815
Puisque le χ2 calculé est inférieur à la valeur critique, on doit maintenir H0

En d'autres termes, les données ne permettent pas de montrer pas que
le nombre de pannes est différent sur chaque ligne de métro

Exemple II
Vous soutenez que la distribution du poids des grains
de fromage de la poutine uqamienne est une distribution normale
À partir d'un échantillon de 200 grains, vous obtenez une moyenne de 6
grammes, un écart-type de 1 gramme et le tableau de fréquences suivant:
POIDS (grammes) FRÉQUENCE
x < 4 6
4 ≤ x < 5 27
5 ≤ x < 6 70
6 ≤ x < 7 67
7 ≤ x < 8 26
8 ≤ x 4

Au seuil de 1%, peut-on affirmer que la distribution de la population est normale?

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative
H0: la distribution de la population des poids est une distribution normale
vs
H1: la distribution de la population des poids n'est pas une distribution normale

° Étape 2: Choisir le seuil de signification du test
Le seuil choisi ici est α = 0,01

° Étape 3: Prélever un échantillon et relever les fréquences observées

° Étape 4: Calculer les fréquences théoriques espérées si H0 était vraie
Si H0 était vraie, le nombre de grains dans chacune des classes du tableau
ci-dessus devrait respecter les probabilités données par la table de la distribution
normale. Ici, on pose μ = 6 et σ = 1; d'où le tableau
POIDS Valeurs Z P(Z) fe = 200 × P(Z)
x < 4 Z < -2 0,0228 4,56
4 ≤ x < 5 -2 ≤ Z < -1 0,1359 27,18
5 ≤ x < 6 -1 ≤ Z < 0 0,3413 68,26
6 ≤ x < 7 0 ≤ Z < 1 0,3413 68,26
7 ≤ x < 8 1 ≤ Z < 2 0,1359 27,18
8 ≤ x 2 ≤ Z 0,0228 4,56

° Étape 5: Calculer la valeur de χ2
On complète le tableau de calcul suivant
Poids fo fe fo - fe (fo - fe)2 (fo - fe)2/fe
x < 4 6 4,56 1,44 2,07 0,4539
4 ≤ x < 5 27 27,18 -0,18 0,03 0,0011
5 ≤ x < 6 70 68,26 1,74 3,03 0,0444
6 ≤ x < 7 67 68,26 -1,26 1,59 0,0233
7 ≤ x < 8 26 27,18 -1,18 1,39 0,0511
8 ≤ x 4 4,56 -0,56 0,31 0,0680
Σ 200 200,00 0,00 0,6418

Donc

° Étape 6: Comparer la valeur du χ2 calculée avec la valeur critique de la table
Le nombre de relations liant les deux distributions est 3 puisque
(1) la fréquence totale, (2) la moyenne et (3) l'écart type sont supposés identiques
Pour α = 0,01 et d.l. = 6 - 3 = 3 on a un χ2 critique de 11,345
Puisque le χ2 calculé est inférieur à la valeur critique, on doit maintenir H0

En d'autres termes, jusqu'à preuve du contraire, le poids
des grains de poutine semble se distribuer normalement

Suite > ANALYSE DE RÉGRESSION ET DE CORRÉLATION: RAPPELS