Or, dans nombre de cas, on désire obtenir
une estimation d'une précision donnée a priori
Il est alors possible, moyennant certaines hypothèses de calculer
la taille échantillonnale requise pour atteindre ce degré de
précision
(ici, on suppose que la taille de la population est infinie ou très grande)
Or, puisque

on peut tout mettre au carré, i.e.

et, en isolant n, on a

où Z = la valeur du Z correspondant au niveau de confiance
désiré
σ 2 = la variance dans la population
δ = la marge d'erreur tolérée
Il est important de noter ici que, comme le montre la formule
précédente,
il est nécessaire de poser une hypothèse quant à la valeur de σ
pour être en mesure d'évaluer la taille requise pour l'échantillon
Il faut également noter que la forme de l'intervalle considéré
suppose que la
distribution d'échantillonnage est normale.
Par conséquent, sauf si σ est connu et que la distribution
de la population est
normale,
on doit considérer que si la formule donne un n < 30, on pose
n = 30
Exemples
Supposons que, pour les psychologues qui passent un test de Q.I., je puisse
affirmer que la distribution de la population possède un σ
d'à peu près 15,
quelle doit être la taille de mon échantillon si je désire avoir
une précision de ±5 points avec un niveau de confiance de 95%
° pour un niveau de confiance de 95%, on a Z = 1,96, d'où

qu'on arrondit, par le haut, à n = 35.
Si on désire obtenir une précision de ±1 point, alors

c'est donc dire qu'on aurait alors besoin de 865 personnes!
Or, puisque

on peut tout mettre au carré, i.e.

et, en isolant n, on a

où Z = la valeur du Z correspondant au niveau de confiance
désiré
π = le pourcentage dans la population
δ = la marge d'erreur tolérée
Étrangement, cette formule exige la connaissance de π,
ce qu'on cherche justement à estimer
Il s'agit donc de faire un estimé conservateur de π
Dans nombre de cas, on connaît les bornes à l'intérieur desquelles le vrai
π risque
de se situer; un intervalle conservateur peut être construit en donnant à π la valeur
de la borne située le plus près de 50%
Dans le pire des cas, on pose π = 50% puisqu'alors le produit
π(1-π) sera
maximal et le nombre d'observations requises sera surévalué
Exemples
Supposons qu'on désire estimer ±5% le pourcentage de gains à une
nouvelle
loterie pour laquelle on annonce qu'il y a jusqu'à 40% de chances de gagner
et ce, avec un niveau de confiance de 95%. Combien faut-il acheter de billets?
π peut donc prendre n'importe quelle valeur entre 0% et
40%,
l'estimé conservateur est donc 40% et,
pour ce niveau de confiance, Z = 1,96, donc

Il faut donc acheter 369 billets.
Dans l'exemple de l'élection de l'étudiant norvégien,
combien faudrait-il interroger de personnes pour estimer
le pourcentage de votes à ±10%, avec un niveau de confiance de 99%?
Puisqu'on ne sait rien de π, on pose l'estimé de π à 50%
de plus, pour ce niveau de confiance, Z = 2,58 donc

Il faut donc questionner (au moins) 167 personnes
Évidemment, en acceptant un niveau de confiance plus faible,
tel que 90%, on aurait Z = 1,64 et

i.e. que 68 personnes seraient suffisantes