TEST D'HYPOTHÈSE SUR LA PENTE

Lorsque les données utilisées pour réaliser le test d'hypothèse
proviennent d'un échantillon, on doit s'attendre à ce que la droite
de régression calculée contienne une certaine part d'erreur d'échantillonnage.
Par conséquent, cette droite n'est pas exactement celle de la population

On verra ici comme tester une hypothèse à propos de la pente de la droite de
régression pour toute la population (on nomme cette pente: B)

Ce test est particulièrement important puisque, si B est nulle,
il faut conclure à l'absence de relation entre les deux variables.
En effet, si B = 0, la droite de régression est horizontale et,
pour n'importe quelle valeur de X, Yc =
En d'autres termes, le test dont les hypothèses sont
H0: B = 0 vs H1: B ≠ 0
permet de vérifier l'existence d'une relation linéaire entre les variables X et Y

CONDITIONS D'APPLICATION

° La relation entre les
variables X et Y est linéaire;
les paramètres A et B de la
population sont inconnus,
fixes, et estimés par les
valeurs d'échantillon a et b

° Pour chaque valeur
possible de la variable X,
les valeurs de la variable Y
suivent une distribution
normale dont la moyenne
est égale à la valeur Yc
de la droite

° Toutes ces distributions des valeurs de Y pour chacune des valeurs de X ont le
même écart type (syx). On parle alors d'homoscédasticité

° Chaque valeur de Y dans ces distributions est indépendante des autres

MÉTHODE GÉNÉRALE DU TEST D'HYPOTHÈSE

Les étapes du test d'hypothèse sur la pente sont pratiquement les mêmes
que celles des tests vus dans les parties précédentes du cours
° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative
Soit une des trois possibilités suivantes:
(1) H0: B = BHo vs H1: BBHo
(2) H0: BBHo vs H1: B > BHo
(3) H0: BBHo vs H1: B < BHo
° Étape 2: Choisir le seuil de signification du test et la taille de l'échantillon
° Étape 3: Déterminer la distribution pour effectuer le test
Il s'agit toujours de la distribution t avec d.l. = n - 2
° Étape 4: Définir la région critique
Hypothèse Zone de rejet Zone d'acceptation
(1) RC > tα/2 ou RC < -tα/2 -tα/2 ≤ RC ≤ tα/2
(2) RC > tα RC ≤ tα
(3) RC < -tα RC ≥ -tα

° Étape 5: Établir la règle de décision
Maintenir H0 si la différence standardisée
entre b et BHo se situe dans la région d'acceptation
ou
Rejeter H0 si la différence standardisée
entre b et BHo se situe dans la région de rejet
° Étape 6: Faire les calculs nécessaires
Prélever un échantillon et calculer le rapport critique

sb est l'estimé de l'erreur type de la distribution d'échantillonnage des pentes
Cette erreur type est donnée par la formule

° Étape 7: Prendre la décision
Rejeter H0 si la valeur de RC se situe dans la zone de rejet, sinon maintenir H0

Exemple

Supposons que, pour l'exemple des stations d'essence, les sept stations ne
représentent qu'un petit échantillon de toutes les stations d'une grande ville
Vous affirmez que la pente, dans la population, est supérieure à 25
i.e. que pour chaque augmentation de 1 centaine de véhicules,
la vente d'essence augmente de 25 milliers de litres
Au seuil de 5%, les données sont-elles suffisantes pour appuyer votre position?
(on suppose que les conditions d'application sont satisfaites)

° Étape 1: Formuler l'hypothèse nulle et l'hypothèse alternative
H0: B ≤ 25 vs H1: B > 25

° Étape 2: Choisir le seuil de signification du test et la taille de l'échantillon
α = 0,05 et n = 7

° Étape 3: Déterminer la distribution pour effectuer le test
Puisque l'erreur type de la pente est estimée, on utilise une distribution t

° Étape 4: Définir la région critique
On a d.l. = n - 2 = 7 - 2 = 5, donc t0,05 = 2,015
par conséquent, la région critique est RC > 2,015

° Étape 5: Établir la règle de décision
Maintenir H0 si RC ≤ 2,015 OU rejeter H0 si RC > 2,015

° Étape 6: Faire les calculs nécessaires
Prélever un échantillon de sept stations et calculer d'abord

puis

° Étape 7: Prendre la décision
Puisque RC se situe dans la zone d'acceptation, il n'y a pas d'évidence statistique
suffisante pour rejeter H0; par conséquent, on doit maintenir H0.

En d'autres termes, jusqu'à preuve du contraire, on ne peut soutenir
l'hypothèse que la pente de la population est supérieure à 25
(25 milliers de litres par centaine de voitures)

NOTE IMPORTANTE

On serait arrivé à la même conclusion en considérant un intervalle
de confiance à 90% (puisque le test est unilatéral) pour la valeur de B

En effet

b - tα/2sb < B < b + tα/2sb
28,20 - 2,015(1,9955) < B < 28,20 + 2,015(1,9955)
28,20 - 4,02 < B < 28,20 + 4,02
24,18 < B < 32,22

Puisque cet intervalle contient la valeur hypothétique BHo = 25
on aurait pu conclure au maintien de l'hypothèse nulle

De plus, puisque cet intervalle ne contient pas la valeur
hypothétique BHo = 0, on sait que le test d'hypothèse avec
H0: B = 0 vs H1: B ≠ 0
qui vise à vérifier l'existence d'une relation linéaire,
aurait amené le rejet de cette hypothèse nulle
Par conséquent, il semble bien qu'il existe une relation linéaire (dans la
population) entre le nombre de voitures et le nombre de litres d'essence vendus