Le test d'ajustement analytique est une application particulière du test de χ2
Il permet de déterminer si une population donnée suit une distribution
particulière connue (e.g. une distribution normale, de Poisson, etc.)
Pour ce type de test, l'hypothèse nulle spécifie toujours
que la distribution de la population est de la forme supposée
Les étapes du test sont identiques à celles vues précédemment
Le nombre de degrés de liberté sera toujours
déterminé
par le nombre de classes moins le nombre de relations qui lient
la distribution théorique à la distribution réelle
Exemple I
Vous affirmez que le nombre de pannes de métro n'est pas identique sur
chaque ligne. Vous relevez les pannes pendant un mois. Voici les résultats:
| LIGNE | FRÉQUENCE |
| Verte | 56 |
| Orange | 66 |
| Bleue | 44 |
| Jaune | 54 |
Au seuil de 0,05, que peut-on conclure?
° Étape 1: Formuler l'hypothèse nulle et
l'hypothèse alternative
H0: le pourcentage de pannes est identique sur chaque ligne métro
vs
H1: le pourcentage de pannes est différent selon la ligne de
métro
(la distribution présumée est donc une distribution uniforme)
° Étape 2: Choisir le seuil de signification du test
Le seuil choisi ici est α = 0,05
° Étape 3: Prélever un échantillon et relever les
fréquences observées
(voir le tableau de la page précédente)
° Étape 4: Calculer les fréquences théoriques
espérées si H0 était vraie
Si H0 était vraie, on devrait avoir le même nombre de pannes sur
chaque ligne
Comme il y a 4 lignes et un total de 220 pannes, on a: fe = ¼(220) = 55
° Étape 5: Calculer la valeur de χ2
On complète le tableau de calcul suivant
| Ligne | fo | fe | fo - fe | (fo - fe)2 | (fo - fe)2/fe |
| Verte | 56 | 55 | 1 | 1 | 0,02 |
| Orange | 66 | 55 | 11 | 121 | 2,20 |
| Bleue | 44 | 55 | -11 | 121 | 2,20 |
| Jaune | 54 | 55 | -1 | 1 | 0,02 |
| Σ | 220 | 220 | 0 | 4,44 |
Donc
° Étape 6: Comparer la valeur du χ2 calculée avec la valeur critique de la table
Le nombre de relations liant les deux distributions est 1
puisque seule la fréquence totale est supposée identique
Pour = 0,05 et d.l. = 4 - 1 = 3 on a un χ2 critique de 7,815
Puisque le χ2 calculé est inférieur
à la valeur critique, on doit maintenir H0
En d'autres termes, les données ne permettent pas de montrer pas que
le nombre de pannes est différent sur chaque ligne de métro
Exemple II
Vous soutenez que la distribution du poids des grains
de fromage de la poutine uqamienne est une distribution normale
À partir d'un échantillon de 200 grains, vous obtenez une moyenne de 6
grammes, un écart-type de 1 gramme et le tableau de fréquences suivant:
| POIDS (grammes) | FRÉQUENCE |
| x < 4 | 6 |
| 4 ≤ x < 5 | 27 |
| 5 ≤ x < 6 | 70 |
| 6 ≤ x < 7 | 67 |
| 7 ≤ x < 8 | 26 |
| 8 ≤ x | 4 |
Au seuil de 1%, peut-on affirmer que la distribution de la population est normale?
° Étape 1: Formuler l'hypothèse nulle et
l'hypothèse alternative
H0: la distribution de la population des poids est une distribution normale
vs
H1: la distribution de la population des poids n'est pas une distribution normale
° Étape 2: Choisir le seuil de signification du test
Le seuil choisi ici est α = 0,01
° Étape 3: Prélever un échantillon et relever les fréquences observées
° Étape 4: Calculer les fréquences théoriques
espérées si H0 était vraie
Si H0 était vraie, le nombre de grains dans chacune des classes du
tableau
ci-dessus devrait respecter les probabilités données par la table de la
distribution
normale. Ici, on pose μ = 6 et σ = 1; d'où le
tableau
| POIDS | Valeurs Z | P(Z) | fe = 200 × P(Z) |
| x < 4 | Z < -2 | 0,0228 | 4,56 |
| 4 ≤ x < 5 | -2 ≤ Z < -1 | 0,1359 | 27,18 |
| 5 ≤ x < 6 | -1 ≤ Z < 0 | 0,3413 | 68,26 |
| 6 ≤ x < 7 | 0 ≤ Z < 1 | 0,3413 | 68,26 |
| 7 ≤ x < 8 | 1 ≤ Z < 2 | 0,1359 | 27,18 |
| 8 ≤ x | 2 ≤ Z | 0,0228 | 4,56 |
° Étape 5: Calculer la valeur de χ2
On complète le tableau de calcul suivant
| Poids | fo | fe | fo - fe | (fo - fe)2 | (fo - fe)2/fe |
| x < 4 | 6 | 4,56 | 1,44 | 2,07 | 0,4539 |
| 4 ≤ x < 5 | 27 | 27,18 | -0,18 | 0,03 | 0,0011 |
| 5 ≤ x < 6 | 70 | 68,26 | 1,74 | 3,03 | 0,0444 |
| 6 ≤ x < 7 | 67 | 68,26 | -1,26 | 1,59 | 0,0233 |
| 7 ≤ x < 8 | 26 | 27,18 | -1,18 | 1,39 | 0,0511 |
| 8 ≤ x | 4 | 4,56 | -0,56 | 0,31 | 0,0680 |
| Σ | 200 | 200,00 | 0,00 | 0,6418 |
Donc
° Étape 6: Comparer la valeur du χ2 calculée avec la valeur critique de la table
Le nombre de relations liant les deux distributions est 3 puisque
(1) la fréquence totale, (2) la moyenne et (3) l'écart type sont supposés
identiques
Pour α = 0,01 et d.l. = 6 - 3 = 3 on a un χ2 critique de 11,345
Puisque le χ2 calculé est inférieur
à la valeur critique, on doit maintenir H0
En d'autres termes, jusqu'à preuve du contraire, le poids
des grains de poutine semble se distribuer normalement