SURVOL HISTORIQUE
QUELQUES RACINES
Empire chinois
- Examens de sélection des fonctionnaires
- Depuis le 12e siècle avant J.-C.
Grèce antique
- Les tests font partie du processus d'éducation
- Évaluation des fonctions physiques et «intellectuelles»
Moyen-âge
- Université: examens officiels pour les diplômes et les prix
CLASSIFICATION ET ENTRAÎNEMENT DES DÉFICIENTS MENTAUX
XIXe siècle
- Traitement plus humain des déficients
- Création d'institutions -> normes d'admission et critères de classification
Esquirol (1838)
- Discrimination entre:
- Malades mentaux: troubles émotifs accompagnés d'une détérioration des fonctions intellectuelles
- Déficients mentaux: déficience intellectuelle dès la petite enfance
- Degré de déficience: du normal à l'idiotie profonde
- En somme: différents types et différents degrés de déficience
- Recherche de critères pour établir le niveau intellectuel
- conclusion: habiletés verbales
Séguin (1866)
- Rejette l'idée que la déficience est incurable
- Pionnier de l'entraînement des déficients
- Fonde une école consacrée à l'éducation de ces enfants
- Techniques d'apprentissage d'habiletés sensorielles et motrices
- Ces techniques seront intégrées à des tests d'intelligence (Séguin form board)
Binet (débuts du XXe siècle)
- Examen des enfants non adaptés à l'enseignement régulier
- S'ils sont jugés éducables placés dans une école spéciale
- Influence sur le ministère de l'instruction publique pour la considération des déficients
LA PSYCHOLOGIE EXPÉRIMENTALE
Wundt (1879), et ses successeurs
- Objectif: élaborer des descriptions générales du comportement
- Ne s'intéressaient pas à la mesure des différences individuelles
- Elles sont ignorées ou considérées comme des erreurs
- Elles nuisent à la généralisation des observations
- Formation en physiologie ou en physique
- Intérêt pour les phénomènes sensoriels ou les tâches motrices simples
- Résultats
- Influence des consignes ou des conditions d'expérimentation
- Nécessité de contrôler les conditions de collecte des données
- Ce qui se reflète aujourd'hui dans la nécessaire standardisation des protocoles de passation des tests psychologiques
GALTON (1822-1911)
Intérêt principal: l'hérédité humaine
- Mesure de caractéristiques d'individus apparentés et non apparentés (parents, fratrie, cousins, jumeaux, etc.)
- Dans certaines écoles -> dossiers anthropométriques
- Exposition de 1884 et musée South Kensington
- Laboratoire d'anthropométrie
- Tests: acuité visuelle, force musculaire, temps de réponse, ...
- Encore aujourd'hui: barre de Galton, sifflet de Galton, ...
- Importance des différences individuelles
Influence de la théorie de Locke
- Les tests de discrimination sensorielle serviraient à évaluer l'intelligence: plus on discrimine, plus le champ de l'intelligence peut être étendu
Autres contributions
- Échelles d'appréciation et enquêtes par questionnaires
- Technique de l'association libre
- Méthodes statistiques pour l'analyse de données
- Applications «simplifiées» pour l'analyse de résultats de tests
- Un de ses étudiants sera Pearson (le fameux coefficient de corrélation)
LES PREMIERS TESTS MENTAUX (CATTELL)
Intégration de la psychologie expérimentale et du «testage»
- Cattell rédige une thèse sur les différences individuelles de temps de réaction (Leipzig)
Article de Cattell (1890)
- Première utilisation de l'expression «test mental»
- Description d'une batterie administrée à des étudiants de collèges
- force musculaire, acuité visuelle et auditive, discrimination de poids, temps de réponse, mémoire, etc.
- il s'agit alors de tests individuels
- Position proche de Galton quant aux fonctions intellectuelles
- De plus, «objectivité» et «facilité» de ce type de mesures
À cette époque: développement de plusieurs batteries du même type
Premières tentatives de «psychométrie»
- Exposition 1893: tests pour les visiteurs et comparaison à des normes
- Peu de relation entre les performances à différents tests
- Peu de relation avec les estimations indépendantes de rendement intellectuel; i.e. par les enseignants ou selon les résultats scolaires
Autres batteries (fonctions plus complexes)
- Kraepelin (psychiatrie): effet de pratique, résistance à la fatigue, etc.
- Ebbinghaus: calcul, empan de la mémoire, phrases à compléter
Critique de Binet et Henri (1895)
- Trop de mesures sensorielles et tâches trop simples
- Fonctions complexes: grandes différences individuelles
- pas nécessaire d'avoir une trop grande précision
- Proposent la mesure de toutes sortes de fonctions
- mémoire, imagination, sens esthétique, attention, etc. etc.
BINET (1857-1911), et ses collègues
Recherche de la façon adéquate de mesurer l'intelligence
- Nombreux essais: taille des parties du corps, graphologie, etc.
- Conclusion: mesure directe des fonctions intellectuelles complexes
- Occasion d'appliquer ses vues à large échelle suite à sa nomination comme membre d'une commission du ministère de l'instruction publique
Première échelle de Binet-Simon (1905)
- 30 problèmes de toutes sortes
- Accent sur le raisonnement, le jugement et la compréhension
- Quelques items sensoriels et perceptuels
- Prédominance des contenus verbaux
- Les items sont ordonnés en ordre croissant de difficulté
- Ordre établi empiriquement (50 enfants + déficients mentaux)
- Présentée comme un instrument préliminaire
Seconde échelle (1908)
- Augmentation du nombre d'épreuves et élimination des mauvais items
- À partir d'un échantillon de 300 enfants (3 à 13 ans), on fixe le niveau d'âge de chaque test
- «Test de 3 ans» = réussi par 80% à 90% des enfants normaux de 3 ans
- Définition du niveau mental: «l'âge chronologique des sujets normaux auxquels la performance du sujet était équivalente»
- - Avec le temps: «niveau mental» -> «âge mental» (interprétation risquée)
Troisième échelle (1911)
- Aucune modification majeure (quelques épreuves additionnelles)
- Prolongation jusqu'à l'âge adulte
Autres développements
- Nombreuses traductions et adaptations
- Stanford-Binet (Terman, 1916)
- Très répandu
- Introduction de la notion de quotient intellectuel (QI), qui exprime le rapport entre l'âge mental et l'âge chronologique
- Kuhlmann-Binet (1912): Prolongation, vers le bas, jusqu'à trois mois
LES TESTS COLLECTIFS
Tests de Binet (et des précédents) -> échelles individuelles
- I.e.: une seule personne est testée à la fois
- Matériel à manipuler exige une bonne formation
- Fort coûteux pour tester des grands groupes
Tests collectifs (origines)
- Contribution de l'APA à «l'effort de guerre» (États-Unis, 1917)
- Classement des recrues selon leur niveau intellectuel
- 1½ millions de personnes!
- Décisions: exemption, affectation de poste, etc.
- Sources: tous les tests disponibles
- En particulier, le test d'Otis -> questions «objectives»
- Résultats: deux tests pouvant être administrés à des grands groupes
- Test Alpha: test de routine
- Test Bêta: non-verbal (illettrés ou étrangers non anglophones)
Après la première guerre -> utilisation civile
- Intérêt de plus en plus marqué pour le QI
- Multiples révisions
- Pour tous les âges et toutes les catégories
- Nombreuses utilisations à large échelle
- Par les enseignants, dans leur classe
- Comme examen des candidats à divers niveaux d'études
- etc.
- Manque de qualités «psychométriques»
- attentes irréalistes
- hausse du scepticisme
- crainte et hostilité face à la pertinence des tests psychologiques
Critique des tests d'intelligence
- Ils sont supposés mesurer l'ensemble des «fonctions mentales»
- Or, seulement quelques «fonctions» sont considérées (non exhaustif)
- Habiletés verbales (surtout)
- Relations numériques et symboliques
- Devraient être appelés: «tests d'aptitudes scolaires»
TESTS D'APTITUDES
Développement parallèle de tests d'aptitudes spéciales
- Comme compléments aux tests d'intelligence
- Buts: Orientation professionnelle + sélection et classification du personnel
- Exemples: aptitudes musicales, mécaniques, etc.
Autre constat: importantes fluctuations d'un «sous-test» (d'intelligence) à l'autre
- Exemple: score élevé aux items verbaux et faible aux items de calcul
- Utilisation clinique de ces différences intra-individuelles
- Pour mieux comprendre la «structure psychologique»
- Pratique non justifiée parce que les tests n'ont pas été conçus à cet effet
- Trop peu d'items pour assurer une mesure fidèle de l'habileté considérée
Développement parallèle de «modèles» de la «structure des traits»
- Par l'analyse statistique de la relation (corrélation) entre les scores obtenus suite à l'administration d'un grand nombre de tests
- Résultat important: l'analyse factorielle
- Révèlent l'«indépendance» de certains facteurs (ou traits)
- Compréhension verbale, raisonnement numérique, aptitudes spatiales, ...
Batteries d'aptitudes multiples
- Ce sont les débouchés appliqués de l'analyse factorielle
- Développées pour permettre de mesurer simultanément plusieurs traits
- I.e. donne un score séparé pour chaque trait
- Ce qui est approprié pour effectuer des analyses intra-individuelles
- Construites d'abord dans le contexte militaire (seconde guerre)
- Discrimination des tâches: pilote, opérateur radio, etc.
- Utilisation civile (après 1945)
- Orientation scolaire et professionnelle
- Sélection et classification du personnel
Terminologie actuelle
- Tests d'aptitudes: mesures d'habiletés circonscrites et supposées homogènes
- Spéciales: une seule aptitude
- Multiples (batteries): plusieurs aptitudes -> profil de scores
- Tests d'intelligence: hétérogènes, mais fournissent un indice global
TESTS STANDARDISÉS DE RENDEMENT SCOLAIRE
Écoles publiques de Boston (1845)
- Remplacement des examens oraux (inspecteur) par des examens écrits
- Justifications:
- Situation uniforme pour tous
- Meilleure couverture du programme
- Choix de questions moins hasardeux
- Diminution de la possibilité de favoritisme
Premiers tests standardisés
- Début du siècle (Thorndike)
- Échelles d'appréciation (compositions...) et tests (calcul...)
- 1923: Stanford Achievement Test
- Batterie d'évaluation du rendement scolaire
- Forme et contenu proches de ceux des tests modernes
- Permet des comparaisons avec un échantillon de normalisation
Les examens «objectifs» (versus les examens à développement; 1930)
- Arguments:
- Prennent moins de temps (examinateurs et examinés)
- Sont plus fidèles
- Rédaction d'items en fonction d'objectifs éducatifs mieux spécifiés
- Apparition des machines de correction automatique
Programmes de testage à grande échelle (nationale, régionale, ...)
- Autour de 1900: College Entrance Examination Board (CEEB)
- Éviter les dédoublements pour l'admission au collège
- Fusion du CEEB avec d'autres Educational Testing Service (ETS) (1947)
- Tests pour les universités, écoles spécialisées, gouvernements, ...
- Autre organisme important: American College Testing Program (1959)
Utilisation des tests de rendement dans les industries et au gouvernement
- U.S. Office of Personnel Management (depuis 1922)
Rapprochement progressif des tests de rendement et des tests d'intelligence
- Différences de spécificité des contenus et d'apprentissages précis supposés
LES TESTS DE PERSONNALITÉ
Mesure des aspects «affectifs» ou non intellectuelsTests d'associations libres
- Présentation de stimuli sélectionnés auxquels l'examiné répond par un mot
- Kraepelin (1892): étude des effets de la fatigue, de la faim, etc.
- Sommer (1894): différenciation des formes de maladies mentales
Inventaires personnels auto-administrés
- Personal Data Sheet (pendant la première guerre)
- Dépistage des individus trop perturbés exemption du service militaire
- Liste de symptômes auxquels l'individu répond quant à lui-même
- (pas terminé à temps pour être appliqué)
- Développements ultérieurs (mesure de l'adaptation émotive)
- Version civile
- Subdivision de l'adaptation (maison, travail, etc.)
- Aspects plus spécifiques (dominance-soumission, etc.)
Tests situationnels ou de performance
- Mise en situation et réalisation d'une tâche dont la vraie nature est cachée
- Hartshorne et al. (1928-1930):
- Situations standardisées
- Scores objectifs (ce n'est pas toujours le cas)
- Comportements étudiés: vol, mensonge, persévérance, etc.
Techniques projectives
- Tâche peu structurée avec solutions très diversifiées
- Postulat: projection des modes de réaction («inconsciemment!»)
- Ne sachant pas ce qui est observé, le sujet devrait donner des réponses moins biaisées par le «désir de donner une bonne image de soi»
- Méthodes multiples: images, taches d'encre, jeu dramatique, etc.
Très nombreuses faiblesses de ces tests
- Net retard psychométrique par rapport aux tests d'aptitudes
- Sources inhérentes au domaine de la «personnalité»
- (Les problèmes sont peut-être d'ordre théorique)