ESTIMATION PAR INTERVALLES:
CONCEPTS DE BASE

En pratique, on ignore la valeur du paramètre et on prélève
un (seul) échantillon afin de pouvoir calculer un estimateur de ce paramètre

Afin de réaliser cette estimation, il est nécessaire de faire des hypothèses quant à
la relation qui existe entre un paramètre et son estimateur

LA DISTRIBUTION D'ÉCHANTILLONNAGE DE LA MOYENNE (rappel)

Si la distribution d'échantillonnage est approximativement normale
(i.e. si la taille échantillonnale est grande
ou si la distribution de la population est normale)
on sait, par la règle empirique, qu'environ 95% des valeurs possibles
de se situent à moins de 2 de chaque côté de la moyenne
de la distribution d'échantillonnage

LA LONGUEUR DE L'INTERVALLE

Propriété importante

Si 95% des valeurs possibles de se situent à moins de 2 de la moyenne de la
population, alors μ ne sera pas à plus de 2 de 95% des valeurs possibles de

Cet énoncé est également vrai pour d'autres valeurs que 2. Par exemple:
Si 68% des valeurs possibles de se situent à moins de 1 de la moyenne de la
population, alors μ ne sera pas à plus de 1 de 68% des valeurs possibles de

Illustrons ce propos par l'analogie suivante:
Si, pour 100 villes quelconques, 95 sont situées à 50 km ou moins de Montréal,
il est clair que, pour ces 95 villes, Montréal est située à 50 km ou moins.
Par conséquent, si on choisit une des 100 villes au hasard, la probabilité que
Montréal y soit distante de moins de 50 km est P = 0,95

Il est important de se rappeler qu'il s'agit d'une probabilité,
c'est-à-dire d'une valeur attendue suite à un grand nombre de tirages au hasard;
pour une ville en particulier, Montréal est ou n'est pas située à 50 km ou moins

Reprenons l'analogie précédente et appliquons-la à la distribution d'échantillonnage
en remplaçant Montréal par μ et les autres villes par les

Ainsi, si on calcule un grand nombre d'intervalles de la forme ± 2
(à partir d'autant d'échantillons), la moyenne μ cherchée se situera
à l'intérieur d'environ 95% de ceux-ci

Mais pour un intervalle donné, il faut souligner que le paramètre s'y trouve ou ne
s'y trouve pas. C'est la probabilité de s'y trouver qui vaut 95%

Dans le graphique ci-dessous, l'intervalle construit autour de 1 ne contient pas μ,
alors que ceux construits autour de 2 et de 3 englobent le paramètre μ

RÈGLE GÉNÉRALE

On peut cependant vouloir calculer un intervalle
pour un autre «niveau de probabilité» (e.g. 99%)

En règle générale, si la distribution d'échantillonnage est normale,
on construit un intervalle de confiance pour μ par la formule générale

= la moyenne échantillonnale
= l'erreur type de la moyenne
Z = valeur déterminée par la probabilité associée à l'intervalle d'estimation
De plus, on note que
- = la limite inférieure de l'intervalle d'estimation
+ = la limite supérieure de l'intervalle d'estimation

LE NIVEAU DE CONFIANCE

Définition: le niveau (ou degré) de confiance est le niveau de probabilité
associé à l'intervalle d'estimation. Plus le niveau de probabilité est élevé, plus la
«confiance» est grande que l'estimation englobe la moyenne de la population

Pour un niveau de confiance donné, on obtient, via la table de la distribution
normale, la valeur du Z appropriée pour construire l'intervalle voulu
(par la formule donnée ci-dessus)

Ainsi, pour les niveaux les plus souvent utilisés, on a le tableau suivant
Niveau de confiance Valeur de Z Forme de l'intervalle de confiance
90% 1,64 - 1,64 < μ < + 1,64
95% 1,96 - 1,96 < μ < + 1,96
99% 2,58 - 2,58 < μ < + 2,58

Compromis

On doit considérer plusieurs niveaux de confiance puisque, si on veut augmenter le
niveau de confiance, il faut accepter une marge d'erreur plus élevée.
En d'autres termes:
D'un plus haut niveau de confiance résulte un intervalle d'estimation plus long,
d'où une diminution de la précision de l'estimation

Aux extrêmes:
° Il n'y a (quasiment) aucune certitude
d'associée à une estimation ponctuelle
(i.e. aucun intervalle)
Exemple: demain, à 10h, il fera 20,0345...oC
° La certitude est absolue que le paramètre
prenne une valeur quelconque
(i.e. intervalle non-borné)
Exemple: demain, à 10h, il fera entre -273oC et 1356453....oC

Généralement, le niveau de confiance est fixé avant que ne s'effectue l'estimation
Son choix dépend de la question à l'étude,
i.e de l'importance relative de la confiance et de la précision désirées

Exemple

Dans les données du cours de comptabilité, on avait obtenu,
pour des échantillons de taille n = 5, = 5,91,
et pour l'échantillon choisi: = 61,4
Par conséquent, pour un niveau de confiance de 90%,
on estimerait que μ (qu'on ignore) se situe entre 51,7 et 71,1;
par contre, pour un niveau de confiance de 99%,
on estimerait que μ se situe quelque part entre 46,2 et 76,6

Suite > PROPRIÉTÉS DES ESTIMATEURS: ABSENCE DE BIAIS ET EFFICACITÉ