SYNTHÈSE DES TYPES DE VALIDATION
COMPARAISON DES MÉTHODES DE VALIDATION
Au début de cette partie, on a précisé que «plusieurs facteurs, théoriques et pratiques, justifient l'utilisation des tests psychologiques et chacun de ceux-ci colore différentiellement la notion de validité»
- Autrement dit, la réponse à la question «Jusqu'à quel point ce test est-il valide?» dépend de l'utilisation que l'on fera des scores au test
- I.e. du type de question posée et à laquelle le test devrait permettre de répondre
- Par conséquent, les méthodes qui seront utilisées pour établir la validité d'un test en particulier dépendront également de ce contexte d'utilisation
On a néanmoins identifié trois grandes classes de méthodes:
- La validation de contenu
- La validation critériée
- La validation de construit
Pour illustrer le fait que l'importance relative de chaque méthode dépend du type de question posée, on peut imaginer plusieurs utilisations distinctes d'un test d'«habiletés mathématiques» (pour les élèves du primaire)
- Le tableau suivant précise le type de validité à privilégier en fonction des différents contextes d'utilisation de ce test
CONTEXTE
D'UTILISATIONQUESTION
POSÉETYPE DE
VALIDITÉÉvaluation des apprentissages À quel point x maîtrise-t-il la matière présentée dans son cours de mathématiques? De contenu Prédiction de la performance ultérieure Comment x réussira-t-il, en mathématiques, au secondaire? Critériée
(prédictive)Diagnostic de difficultés d'apprentissage Quelles sont les difficultés spécifiques de x en mathématiques? Critériée
(concomitante)Mesure des «habiletés mathématiques» Quelles sont les «habiletés mathématiques» de x? De construit RÔLE CENTRAL DE LA VALIDATION DE CONSTRUIT
On distingue, classiquement, diverses méthodes de validation
- Mais, à maintes reprises, on a signalé qu'il y avait un certain recoupement entre ces méthodes
- En fait, conceptuellement, elles ne forment pas des classes parfaitement séparables et bien distinctes
- Ce qui pourrait expliquer pourquoi il est parfois difficile de déterminer si une certaine méthode contribue plus à tel ou tel type de validité
- Exemple: méthode de «corrélation entre les tests»
Mais, dans à peu près tous les cas, l'utilisation d'un test, ainsi que l'interprétation des scores qu'il fournit, impliquent un certain construit
- Par conséquent, la validité de construit est toujours impliquée
- En fait, rappelons que, même lorsqu'il existe des critères bien établis et parfaitement mesurables (ce qui est rare), on veut souvent «extrapoler», en savoir un peu plus
- On infère alors des construits pour expliquer les différences observées entre les individus quant aux critères
- Par exemple, il est fréquent d'invoquer des différences d'«aptitudes académiques» pour expliquer des différences de performance scolaire
- La validité de construit est la plus englobante, elle chapeaute même tous les autres types de validité
Pour rendre explicite cette «dominance» de la validité de construit, on suggère une révision de la terminologie habituellement utilisée
- Validité de construit -> On y réserve l'exclusivité du terme validité
- Validité de contenu:
- Appartenance des items à l'univers -> «Pertinence des contenus»
- Représentativité de l'échantillon -> «Couverture des contenus»
- Validité critériée:
- Prédictive -> «Utilité prédictive»
- Concomitante -> «Utilité diagnostique»
VALIDATION ET ÉTAPES D'ÉLABORATION D'UN TEST
Il est essentiel de noter que la validité intervient à toutes les étapes de la construction et de l'utilisation d'un test
- Elle doit donc être considérée dès le départ, i.e. qu'il ne faut pas attendre que le test soit construit et administré pour commencer à se questionner sur sa validité
La question de la validité joue un rôle clé à plusieurs étapes de la mise au point d'un test, en particulier:
- Lors de la définition précise et détaillée du construit à mesurer
- Lors de la rédaction des items
- Lors de l'analyse empirique des items (sélection des items)
- Lors de l'analyse des scores et des sous scores
- Lors de la sélection des autres variables (critères, autres tests, etc.) à mettre en corrélation avec les scores fournis par le test
- etc.
La plupart des données recueillies dans le cadre de l'élaboration ou de l'utilisation d'un test peuvent être utiles pour en établir la validité, entre autres:
- Les données concernant la fidélité
- Par exemple, la stabilité à court terme vs celle à long terme (c.f. partie 5.3 du cours)
- Les normes, surtout si elles fournissent des données normatives pour plusieurs groupes qui se distinguent selon certaines caractéristiques (e.g. l'âge, le sexe, etc.)
- Après la mise en marché:
- Accumulation d'observations cliniques
- Projets de recherche
- À noter que ce dernier point souligne le fait que la «parfaite validité» d'un test psychologique est un idéal impossible à réaliser (quoique certains auteurs de tests devraient «viser» un peu plus haut!)