MESURES DE DISPERSION
(DONNÉES GROUPÉES)

Rappel: comme les données sont groupées, il s'agit de faire des approximations

VARIANCE et ÉCART TYPE

La formule générale est

où f = la fréquence de la classe
m = le centre de la classe (valeur hypothétique)
N = le nombre d'observations

Évidemment, on a

et la formule «simplifiée»

(voir aussi la méthode abrégée présentée dans le livre)

Exemple


Résultat
Nombre
(f)
Centre (m)
fm
Écarts
m-μ

(m-μ)2

f(m-μ)2
40 et moins de 50 4 45 180 -21,33 454,97 1819,88
50 et moins de 60 6 55 330 -11,33 128,37 770,22
60 et moins de 70 10 65 650 -1,33 1,77 17,70
70 et moins de 80 4 75 300 8,67 75,17 300,68
80 et moins de 90 4 85 340 18,67 348,57 1394,28
90 et moins de 100 2 95 190 28,67 821,97 1643,94
Σ 30 1990 5946,70

d'où

qu'on peut comparer avec la valeur «exacte» = 14,24

INTERVALLE SEMI-INTERQUARTILE

La technique de calcul de Q1 et Q3 est similaire à celle utilisée
pour calculer la médiane lorsque les données sont groupées

Les formules sont

où les symboles s'interprètent comme pour le cas de la médiane
On a encore

Exemple
On sait déjà que Q1 correspond à la «7,5e observation»
et que Q3 correspond à la «22,5e observation»

Résultat

Fréquence
Fréquence cumulée
40 et moins de 50 4 4
Q1 > 50 et moins de 60 6 10
60 et moins de 70 10 20
Q3 > 70 et moins de 80 4 24
80 et moins de 90 4 28
90 et moins de 100 2 30



Suite > COMPARAISON DES MESURES DE DISPERSION