LA DROITE DE RÉGRESSION

Dans les cas où le diagramme de dispersion montre l'existence d'une relation
linéaire, on désire déterminer la droite qui décrira le «mieux» cette relation

Cependant, le choix de cette droite dépend d'un critère qu'il faudra fixer.
Le critère mathématique habituel est celui des moindres carrés
Selon ce critère, on cherche à minimiser
la somme des carrés des écarts (= variance) entre
les valeurs estimées et les valeurs observées de la variable dépendante

En formule, la droite de régression (comme toute droite) sera donnée par


X = la valeur de la variable indépendante
Yc = la valeur estimée (calculée) de la variable dépendante
a = l'ordonnée à l'origine, i.e. la valeur de Yc lorsque X = 0
b = la pente, i.e. la variation de Yc pour une variation d'une unité de X


Propriétés de la droite de régression
Par définition, la somme

est minimale.
De plus

i.e. que les écarts «positifs» sont compensés par des écarts «négatifs» équivalents

Pour calculer a et b
(attention: on prend ici la notation «pour échantillon»)

où n = le nombre de paires de valeurs observées

= la moyenne de la variable X et = la moyenne de la variable Y
Emplacement X Y XY X2 Y2
Rue Barbe 3 100 300 9 10 000
Rue Brique 4 112 448 16 12 544
Rue Gueuse 5 150 750 25 22 500
Avenue Anse 7 210 1 470 49 44 100
Rue Elle 2 60 120 4 3 600
Chemin Sire 3 85 255 9 7 225
Chemin Soeur 2 77 154 4 5 929
26 794 3 497 116 105 898




Suite > PRÉDICTION À L'AIDE DE LA DROITE DE RÉGRESSION