DISTRIBUTIONS D'ÉCHANTILLONNAGE DES POURCENTAGES

Tout comme il est possible d'utiliser une moyenne échantionnale pour estimer la
moyenne d'une population, on peut utiliser le pourcentage des unités d'un
échantillon qui possèdent une caractéristique pour faire l'approximation de ce
même pourcentage, mais pour toute la population

Définition: la distribution d'échantillonnage des pourcentages
(ou des proportions) consiste en la distribution des pourcentages
(ou des proportions) de tous les échantillons possibles
de taille donnée n pouvant être formés à partir de la population

Le pourcentage échantillonnal est défini comme étant


x = le nombre d'unités de l'échantillon qui possède la caractéristique
n = la taille de l'échantillon

Exemple: Dans l'exemple du cours de comptabilité, calculons
le pourcentage d'échecs (échec = note < 60) pour les cinq personnes
choisies pour faire partie de l'échantillon. Ainsi
Observation 16 4 19 28 23
Échec Oui Oui Non Non Non

et on calcule

De même, d'autres échantillons (il y en a 142 506) de 5 individus choisis dans ce
groupe donneraient des pourcentages échantillonnaux de 0%, 20%, 40%, 60%,
80% ou 100%. C'est la distribution de tous ces pourcentages p que l'on appelle
la distribution d'échantillonnage des pourcentages

On remarque que ces pourcentages échantillonnaux varient
autour de la proportion = 10/30 = 0,33 de la population
C'est ce que représente la variation d'échantillonnage

Moyenne de la distribution d'échantillonnage des pourcentages

Propriété: La moyenne de la distribution d'échantillonnage des pourcentages,
notée μp, de tous les échantillons aléatoires simples de taille n
est égale au pourcentage de la population, i.e. μp = π

Exemple
Supposons qu'un étudiant est inscrits à 5 cours, dont 3 qu'il trouve passionnants
Cours A B C D E
Passionnant Oui Oui Non Oui Non

On a donc

Pour calculer la moyenne de la distribution d'échantillonnage des pourcentages,
on doit former tous les échantillons possibles de trois cours (5C3) et calculer
le pourcentage p pour chacun d'eux. On a donc le tableau de calcul suivant:
Échantillon Données Pourcentage p
A B C oui oui non 2/3
A B D oui oui oui 3/3
A B E oui oui non 2/3
A C D oui non oui 2/3
A C E oui non non 1/3
A D E oui oui non 2/3
B C D oui non oui 2/3
B C E oui non non 1/3
B D E oui oui non 2/3
C D E non oui non 1/3
18/3 = 6

Écart type de la distribution d'échantillonnage des pourcentages

Comme dans le cas des moyennes échantillonnales, les pourcentages
échantillonnaux varient autour de la moyenne μp

Définition: on appelle l'écart type de la distribution d'échantillonnage
des pourcentages σp, l'erreur type du pourcentage

Dans le cas d'une population finie, cette erreur type est donnée par


π = le pourcentage de la population possédant la caractéristique
100% - π = le pourcentage de la population ne possédant pas la caractéristique
N = la taille de la population
n = la taille de l'échantillon
Dans le cas d'une population infinie, on a

Exemples
Pour les données de l'exemple précédent, on a

Pour le pourcentage d'échecs dans le cours de comptabilité, on a
μp = π = 1/3 = 33,33%

Théorème limite central
(cas des pourcentages)

° La moyenne de la distribution d'échantillonnage des pourcentages
est égale au pourcentage de la population, i.e.

° L'écart type de la distribution d'échantillonnage des pourcentages
est donné par

si la population est infinie et par

si la population est finie

° Si la taille n de l'échantillon est suffisamment grande (disons n ≥ 30),
la distribution d'échantillonnage des pourcentages s'approche
d'une distribution normale

Dans ce dernier cas, on peut donc appliquer la «règle empirique»

Suite > TERMINOLOGIE DE L'ESTIMATION