Afin de réaliser cette estimation, il est nécessaire de faire des
hypothèses quant à
la relation qui existe entre un paramètre et son estimateur
Propriété importante
Si 95% des valeurs possibles de
se
situent à moins de 2
de la moyenne
de la
population, alors μ ne sera pas à plus de 2
de 95% des valeurs possibles de
Cet énoncé est également vrai pour d'autres valeurs que 2. Par
exemple:
Si 68% des valeurs possibles de
se situent
à moins de 1
de la moyenne de
la
population, alors μ ne sera pas à plus de 1
de 68% des valeurs possibles de
Illustrons ce propos par l'analogie suivante:
Si, pour 100 villes quelconques, 95 sont situées à 50 km ou moins de
Montréal,
il est clair que, pour ces 95 villes, Montréal est située à 50 km ou
moins.
Par conséquent, si on choisit une des 100 villes au hasard, la probabilité
que
Montréal y soit distante de moins de 50 km est P = 0,95
Il est important de se rappeler qu'il s'agit d'une probabilité,
c'est-à-dire d'une valeur attendue suite à un grand nombre de tirages au
hasard;
pour une ville en particulier, Montréal est ou n'est pas
située à 50 km ou moins
Reprenons l'analogie précédente et appliquons-la à la distribution
d'échantillonnage
en remplaçant Montréal par μ et les autres villes par les
Ainsi, si on calcule un grand nombre d'intervalles de la forme
± 2![]()
(à partir d'autant d'échantillons), la moyenne μ cherchée se
situera
à l'intérieur d'environ 95% de ceux-ci
Mais pour un intervalle donné, il faut souligner que le paramètre s'y trouve
ou ne
s'y trouve pas. C'est la probabilité de s'y trouver qui vaut 95%
Dans le graphique ci-dessous, l'intervalle construit autour de
1 ne contient pas μ,
alors que ceux construits autour de
2 et de
3 englobent le paramètre μ
En règle générale, si la distribution d'échantillonnage est
normale,
on construit un intervalle de confiance pour μ par la formule
générale
où
= la moyenne échantillonnale
= l'erreur type de la moyenne
Z = valeur déterminée par la probabilité associée à
l'intervalle d'estimation
De plus, on note que
-
= la limite inférieure de l'intervalle d'estimation
+
= la limite supérieure de l'intervalle d'estimation
Pour un niveau de confiance donné, on obtient, via la table de la distribution
normale, la valeur du Z appropriée pour construire l'intervalle voulu
(par la formule donnée ci-dessus)
Ainsi, pour les niveaux les plus souvent utilisés, on a le tableau suivant
| Niveau de confiance | Valeur de Z | Forme de l'intervalle de confiance |
| 90% | 1,64 | |
| 95% | 1,96 | |
| 99% | 2,58 |
Compromis
On doit considérer plusieurs niveaux de confiance puisque, si on veut augmenter
le
niveau de confiance, il faut accepter une marge d'erreur plus élevée.
En d'autres termes:
D'un plus haut niveau de confiance résulte un intervalle d'estimation plus long,
d'où une diminution de la précision de l'estimation
Aux extrêmes:
° Il n'y a (quasiment) aucune certitude
d'associée à une estimation ponctuelle
(i.e. aucun intervalle)
Exemple: demain, à 10h, il fera 20,0345...oC
° La certitude est absolue que le paramètre
prenne une valeur quelconque
(i.e. intervalle non-borné)
Exemple: demain, à 10h, il fera entre -273oC et
1356453....oC
Généralement, le niveau de confiance est fixé avant que ne
s'effectue l'estimation
Son choix dépend de la question à l'étude,
i.e de l'importance relative de la confiance et de la précision désirées
Exemple
Dans les données du cours de comptabilité, on avait obtenu,
pour des échantillons de taille n = 5,
= 5,91,
et pour l'échantillon choisi:
=
61,4
Par conséquent, pour un niveau de confiance de 90%,
on estimerait que μ (qu'on ignore) se situe entre 51,7 et 71,1;
par contre, pour un niveau de confiance de 99%,
on estimerait que μ se situe quelque part entre 46,2 et 76,6
Suite > PROPRIÉTÉS DES ESTIMATEURS: ABSENCE DE BIAIS ET EFFICACITÉ