ERREUR TYPE DE MESURE
L'erreur type de mesure (ETM) est une autre façon d'exprimer la fidélité des scores obtenus à un test
- Elle représente le degré de dispersion théorique (i.e. l'écart type) des scores d'un individu qui passerait le test de façon répétée
- C'est donc l'écart type de la distribution des scores observés d'un même individu, laquelle distribution est centrée sur le «score vrai»
- Elle permet de donner une meilleure interprétation aux:
- Scores individuels
- Différences entre les scores
- Avantages:
- Relativise l'importance accordée à des valeurs numériques précises
- Est insensible à l'homogénéité du groupe d'examinés
- Désavantage: ne permet pas de comparer la fidélité de tests différents
- Parce qu'elle est exprimée dans les mêmes unités que les scores au test
- Pour comparer les tests, il faut donc utiliser les coefficients de fidélité
SCORES INDIVIDUELS
Pour calculer l'erreur type de mesure associée à un certain coefficient de fidélité
- On se rappelle d'abord que le coefficient de fidélité (r) s'interprète toujours comme un pourcentage de «variance vraie»
- Par conséquent, ce qui reste, i.e. (1-r), s'interprète comme un pourcentage de «variance d'erreur», donc
- où ÉT est l'écart type de la distribution des scores au test (calculé auprès du même échantillon que le coefficient de fidélité r)
- Par simple transformation algébrique, on a la formule
- Exemple: soit un test d'intelligence dont le coefficient de fidélité est r = 0,89 et dont l'écart type des QI dérivés a été fixé à 15, alors
Pour bien comprendre la signification de l'erreur type de mesure, supposons la situation suivante:
- Un individu passe un test d'intelligence dont l'ETM est 5
- Son «score vrai» est 110
- Par conséquent, puisque l'erreur de mesure est supposée aléatoire, la distribution de scores observés (si, en théorie, la personne passait le test à répétition) serait de forme normale avec une moyenne de 110 et un écart type de 5
- Par l'application de la règle empirique, on peut conclure que
- Environ 68% des scores observés se situeraient entre 105 et 115, i.e. entre 110 moins un ETM et 110 plus un ETM
- Environ 95% des scores observés se situeraient entre 100 et 120
- Presque 100% des scores observés se situeraient entre 95 et 125
- En figure, la situation est la suivante:
![]()
Or, en pratique, on ignore la valeur du «vrai score»
- Sinon il n'y aurait pas de problème de fidélité, puisqu'on utiliserait directement ce «vrai score»
- Tout ce qui est disponible, ce sont des scores observés
Mais on peut appliquer le raisonnement (délicat) suivant: «si 95% des scores observés se situent à moins de deux ETM du «vrai score», alors, dans 95% des cas, le «vrai score» est situé à moins de deux ETM d'un score observé quelconque»
- Attention: le «vrai score» est ou n'est pas situé à moins de deux ETM du score observé, mais cela, on l'ignore
- Tout ce que l'on sait, c'est qu'on a 5% (100% - 95%) des chances de se tromper en affirmant que le «vrai score» se situe à moins de deux ETM du score observé
- Le même argument est applicable pour d'autres «niveaux de confiance» qui seraient donnés par la table de probabilités de la distribution normale
- Il s'agit de faire un compromis entre le niveau de confiance et la précision de l'intervalle qu'il est possible de se donner
- Par exemple, pour avoir moins de 0,3% de chances de se tromper, il s'agirait de prendre un intervalle plus grand, i.e. de ± 3 ETM
Dans l'exemple précédent, on ignore que le «vrai QI» de l'individu considéré est de 110
- Supposons que, passant ce test une fois, cet individu obtienne un score observé de 118 (ce qui est possible, étant donnée l'erreur de mesure)
- On peut donc affirmer que le «vrai QI» de cet individu se situe quelque part entre 108 (118 - 2 ETM) et 128 (118 + 2 ETM)
- Dans ce cas, on aurait raison, mais ce serait sans le savoir
- Cependant, il est possible, quoique moins probable, que cet individu obtienne un score observé de 122
- On affirmerait alors que, probablement (i.e. avec 5% des chances de se tromper), son «vrai QI» se situe quelque part entre 112 (122 - 2 ETM) et 132 (122 + 2 ETM)
- Dans ce cas, on aurait tort, mais ce serait toujours sans le savoir
DIFFÉRENCES ENTRE LES SCORES
L'erreur type de mesure est particulièrement importante à considérer lorsqu'il s'agit d'interpréter des différences entre des scores, que celles-ci soient:
- Des différences entre les individus pour un même test
- Des différences entre les tests pour un même individu (même échelle)
- Des différences dans le temps, pour un même individu et un même test
Pour tenir compte de cette erreur type de mesure, on peut rapporter les scores à comparer sous la forme de bandes de scores (probables)
- Le centre de chaque bande correspond au score observé
- La largeur de chaque bande correspond à l'intervalle où, pour un certain niveau de confiance donné, risque de se trouver le «vrai score»
Dans l'exemple du test d'intelligence dont l'ETM est de 5, on pourrait comparer les QI de plusieurs individus à l'aide de la figure ci-contre
- Avec un score observé de 110, le «vrai score» de A se situe probablement (i.e. avec 95% des chances) entre 100 et 120
- Avec un score observé de 122, le «vrai score» de B se situe probablement entre 112 et 132
- Comme ces deux intervalles se recoupent, on ne peut pas conclure (avec suffisamment de certitude) que l'individu A et l'individu B diffèrent vraiment quant à leur niveau intellectuel général
- Par contre, il semble justifié de conclure que D et E sont de niveaux distincts puisque leur bande respective ne se chevauchent pas
Il est aussi possible de calculer l'erreur type de la différence afin de mieux évaluer de quelle ampleur doit être une différence entre deux scores afin qu'elle soit jugée signifiante, étant donné le manque de fidélité des résultats au test