• Aucun résultat trouvé

L'analyse de la structure factorielle du WISC-IV selon la classification des aptitudes cognitives de Cattell-Horn-Carroll (CHC)

N/A
N/A
Protected

Academic year: 2022

Partager "L'analyse de la structure factorielle du WISC-IV selon la classification des aptitudes cognitives de Cattell-Horn-Carroll (CHC)"

Copied!
251
0
0

Texte intégral

(1)

Thesis

Reference

L'analyse de la structure factorielle du WISC-IV selon la classification des aptitudes cognitives de Cattell-Horn-Carroll (CHC)

REVERTE, Isabelle

Abstract

Cette recherche vise à répondre à plusieurs questions sur l'analyse de la structure factorielle de l'échelle de Wechsler pour enfants et adolescent, 4ème version (WISC-IV), dont l''interprétation se fait actuellement sur la base d'un QIT et de quatre indices : Compréhension verbale, Raisonnement perceptif, Mémoire de travail et Vitesse de traitement. Cependant, selon Keith et al. (2006) et Flanagan et Kaufman (2004), en se basant sur le modèle de Cattell-Horn-Carroll (CHC), le WISC-IV ne mesurerait pas 4 mais 5 voire 6 facteurs. Cette question engendre une seconde controverse sur les construits mesurés par les scores des sous-tests. Ainsi, la structure factorielle de la version française de WISC-IV a été testée. Les résultats montrent qu'une structure basée sur CHC s'accorde mieux aux données françaises et suisses romandes. De plus, la nature exacte des construits mesurés par les sous-tests Arithmétique, Complètement d'images, Cubes et Symboles ne sont pas encore clairement définis.

REVERTE, Isabelle. L'analyse de la structure factorielle du WISC-IV selon la

classification des aptitudes cognitives de Cattell-Horn-Carroll (CHC). Thèse de doctorat : Univ. Genève, 2015, no. FPSE 575

URN : urn:nbn:ch:unige-465706

DOI : 10.13097/archive-ouverte/unige:46570

Available at:

http://archive-ouverte.unige.ch/unige:46570

Disclaimer: layout of this document may differ from the published version.

1 / 1

(2)

1 Section de psychologie Sous la direction de Thierry Lecerf

L’analyse de la structure factorielle du WISC- IV selon la classification des aptitudes cognitives de Cattell-Horn-Carroll (CHC)

THESE Présentée à la

Faculté de psychologie et des sciences de l’éducation de l’Université de Genève

pour obtenir le grade de Docteur en Psychologie par

Isabelle REVERTE de

Attalens FR Thèse No 575

GENEVE Janvier 2015

Numéro d’étudiant : 98-206-832

(3)

2

(4)

3

Remerciements

Un grand merci tout d’abord à Thierry Lecerf qui m’a accompagné tout au long de cette longue aventure qui est la thèse en dirigeant ce travail. J’ai tellement appris de choses tant au point de vue professionnel que personnel en ayant la chance de travailler dans son équipe. Je le remercie également pour sa patience, sa disponibilité et son soutien.

Je remercie également les membres de mon jury de thèse, Pr. Nicolas Favez, Pr. Paolo Ghisletta, Pr. Jérôme Rossier et Pr. Jacques Grégoire. Merci pour leurs commentaires, leurs suggestions et leurs réflexions sur ce manuscrit.

Un merci particulier à mon collègue et ami Philippe Golay qui m’a beaucoup aidé et soutenu durant ces quelques années passées à Genève. Merci pour ses conseils, son aide en statistiques et pour tous les moments de délire et de rigolade dans le bureau.

Un immense merci à mes collègues et amies attachées de recherche qui m’ont aidé à récolter toutes les données pour ce travail de thèse. Laurence, Florine, Denise, sans qui ce manuscrit n’aurait jamais existé. Je les remercie également pour leur soutien, nos discussions et nos éclats de rire.

Je tiens à remercier infiniment tous les enseignants, les parents et les enfants qui ont accepté de participer aux passations dans les différentes écoles du canton de Genève. Sans ces derniers, ce travail n’aurait pas été possible. Un merci particulier aux enfants qui se sont appliqués à répondre aux mieux aux consignes des sous-tests et toujours avec le sourire.

Un merci tout particulier à mes collègues, Laure, Delphine, Céline, Christian, Sébastien, Célia, Jessica, Sotta et Sophie pour nos excellentes discussions et les magnifiques moments que j’ai passé grâce à eux à l’Université de Genève.

Je tiens également à remercier mes parents ainsi que mon frère Jacques pour leur soutien et leurs encouragements durant toutes ces années de thèse.

Je tiens à remercier mes amies, Stéfanie et Samanta pour les moments passés ensemble à la

« banane » et à l’université de Genève à travailler nos thèses. Un grand merci à Isabelle pour la relecture de ce manuscrit. Puis merci à Delphine, Barbara, Gisèle, Catherine, Juliane, Noémie, Justine et Alex pour leurs encouragements et tous les moments qu’ils ont passés à me changer les idées et à m’amuser.

Je remercie également mes collègues de l’Unité de développement, pour leur soutien et leur flexibilité durant la fin de la rédaction de ce manuscrit.

(5)

4

Table des matières

Remerciements ... 3

Résumé ... 8

Chapitre 1 ... 12

Introduction ... 12

1.1 Introduction générale ... 12

1.2 Préambule ... 14

1.2.1 Concept d’intelligence ... 14

1.2.2 Les origines de l’évaluation de l’intelligence... 19

1.3 Structure de l’intelligence ... 22

1.3.1 Spearman et le facteur général d’intelligence ou facteur g ... 22

1.3.2 Thurstone et les aptitudes primaires ... 25

1.3.3 L’approche hiérarchique de l’intelligence ... 28

1.3.4 Cattell et le modèle bi-factoriel de l’intelligence ... 28

1.3.5 L’extension du modèle Gf-Gc ... 31

1.3.6 Le modèle hiérarchique de Carroll, Three-Stratum Theor. ... 32

1.3.7 Le modèle de Cattell-Horn-Carroll (CHC) ... 34

Le modèle CHC ... 36

Explication du modèle CHC ... 39

Diverses études sur le modèle CHC ... 42

Le facteur g ... 44

1.4 Le WISC-IV ... 46

1.5 Objectifs ... 66

1.5.1 Analyses statistiques ... 71

1.5.2 Présentations des études ... 77

Chapitre 2 ... 92

The Four-vs. Alternative Six-Factor Structure of the French WISC-IV. Comparison Using Confirmatory Factor Analyses. ... 92

2.1 Abstract ... 92

2.2 The “Standard” Factorial Structure of the WISC-IV and the CHC Model ... 93

2.3 The Present Investigation ... 95

2.4 Data, Analyses Reported in the WISC-IV Technical Manual ... 97

2.5 Method ... 97

2.5.1 Participants ... 97

2.5.2 Instrument ... 98

2.5.3 Analyses ... 98

2.6 Results ... 99

(6)

5

2.6.1 Does the WISC-IV Measure VCI, PRI, WMI, and PSI? ... 99

2.6.2 Does the WISC-IV Measure CHC Abilities? ... 101

2.6.3 Arithmetic Measures Gf and/or Gsm and/or Gc and/or Gs? ... 101

2.6.4 Word Reasoning and Similarities Measure Gc and/or Gf and/or Verbal Gf ? ... 103

2.6.5 Picture Completion Measures Gv and/or Gc? ... 104

2.6.6 Coding Measures Gs and/or Gsm? ... 104

2.6.7 Picture Concepts Measures Gf, and/or Gc, and/or Gv? ... 104

2.6.8 Matrix Reasoning Measures Gf and/or Gv? ... 104

2.6.9 Symbol Search Measures Gs and/or Gv? ... 105

2.6.10 The Final CHC Model ... 105

2.7 Discussion ... 106

2.8 Conclusion ... 110

Chapitre 3 ... 112

Structural validity of the Wechsler Intelligence Scale for Children (WISC-IV) in a French- speaking Swiss sample. ... 112

3.1 Abstract ... 112

3.2 Introduction ... 114

3.3 The CHC model ... 114

3.4 Method ... 117

3.4.1 Participants ... 117

3.4.2 Instrument ... 118

3.5 Analyses ... 118

3.6 Results ... 119

3.6.1 Does the WISC-IV measure the four-factor structure with French-speaking Swiss sample? ... 119

3.6.2 Does the WISC-IV measure the CHC factors with French-speaking Swiss sample? ... 120

3.6.3 Final CHC Model. ... 123

3.7 Discussion ... 124

3.8 Conclusion and limitations ... 128

Chapitre 4 ... 130

Further insight on the French WISC-IV factor structure through Bayesian structural equation modeling (BSEM). ... 130

4.1 Abstract ... 131

4.2 Factor analysis techniques ... 135

4.3 The Bayesian Structural Equation Modeling approach (BSEM) ... 138

4.4 Method ... 141

4.4.1 Participants ... 141

(7)

6

4.4.2 Instrument and procedure ... 142

4.4.3 Models and analyses ... 142

4.5 Posterior distribution, Markov Chain Monte Carlo and convergence... 144

4.6 Comparison of model fit ... 145

4.7 Results ... 146

4.7.1 Four-factor models ... 146

4.7.2 CHC-based models ... 147

4.8 Discussion ... 153

Chapitre 5 ... 157

Testing for multigroup invariance of the WISC-IV structure across France and Switzerland: Standard and CHC models ... 157

5.1 Abstract ... 157

5.2 Introduction ... 158

5.3 Method ... 160

5.3.1 Participants ... 160

5.3.2 Instrument ... 160

5.4 Analysis ... 161

5.5 Results ... 163

5.5.1 Multi-group invariance analysis for the four-factor structure ... 163

5.6 Baseline model: the CHC model with 5 factors. ... 167

5.7 Discussion ... 172

Conclusions ... 174

Chapitre 6 ... 175

Scores composites CHC pour le WISC-IV: normes francophones. ... 175

6.1 Résumé ... 175

Abstract ... 176

6.2 Indices CHC pour le WISC-IV : normes francophones ... 176

6.3 Étude 1 : établissement des normes pour les scores composites CHC ... 180

6.4 Étude 2 : étude de la validité des normes sur un échantillon tout venant... 185

6.4.1 Participants ... 186

6.4.2 Procédure ... 186

6.5 Résultats et discussion ... 186

6.6 Conclusion ... 188

Chapitre 7 ... 191

Discussion générale ... 191

7.1 Résumés et discussions des résultats ... 191

7.2 Analyse de la structure factorielle du WISC-IV, version française. ... 191

(8)

7

7.3 Les construits mesurés par chaque sous-tests ... 200

7.4 Applications cliniques ... 216

Chapitre 8 ... 221

Suggestions de recherches futures ... 221

Chapitre 9 ... 223

Conclusion ... 223

REFERENCES ... 225

Liste des annexes ... 234

ANNEXE I ... 235

(9)

8

Résumé

Comprendre l’intelligence et en particulier la mesure de celle-ci est depuis de nombreuses années un grand sujet de préoccupation pour les psychologues. Ce sujet a été au centre de nombreux débats, tant méthodologique que théorique (Chartier & Loarer, 2008).

Ainsi, non seulement de nombreux modèles tentent d’expliquer cette notion, mais également de nombreuses méthodes d’outils d’évaluation, ont vu le jour. Concernant les outils d’évaluations, depuis les travaux de Binet, différentes batteries d’aptitudes cognitives ont été créés afin d’évaluer, le niveau intellectuel de la personne et de remédier aux éventuelles faiblesses de celles-ci. De nos jours, les batteries d’aptitudes cognitives les plus utilisées à travers le monde sont les échelles d’intelligence de Wechsler. Pour l’évaluation des enfants et des adolescents, c’est le WISC (échelle d’intelligence pour enfants et adolescents) qui est administré. Actuellement, les résultats obtenus au WISC sont réellement pris en compte pour certaines décisions prises, sur la mise en place d’aide pour l’enfant en difficulté, mais également pour son orientation scolaire et professionnelle. Il est ainsi important que l’évaluation ainsi que l’interprétation des scores de ces tests soit les plus précises possibles.

Actuellement, selon le manuel technique, l’interprétation courante du WISC-IV distingue 4 indices : Compréhension Verbale (ICV), Raisonnement Perceptif (IRP), Mémoire de Travail (IMT) et Vitesse de Traitement (IVT). Cependant, Flanagan et Kaufman (2004) suggèrent que le WISC-IV mesure 6 facteurs, alors que Keith et al. (2006) montrent qu’il en mesure 5. C’est sur la base d’analyses factorielles confirmatoires et en accord avec la théorie des aptitudes cognitives de Cattell-Horn-Carroll (CHC) que sont issus ces résultats. Ces études indiquent que la structure factorielle du WISC-IV n’est pas encore complétement défini. Ce constat peut également questionner sur les compétences mesurées par les scores de chaque sous-test. En effet, certains sous-tests, comme Arithmétique par exemple, ne mesurent pas les mêmes construits pour tous les auteurs. Les compétences mesurées par chaque sous-test sont encore à définir.

Ainsi, le but principal de ce travail, sera de répondre à plusieurs questions sur la structure factorielle et les propriétés psychométriques du WISC-IV, et d’améliorer la validité de l’interprétation des résultats obtenus à l’aide de la version française en y appliquant le modèle théorique des aptitudes cognitives de Cattell-Horn-Carroll (CHC). Les différentes recherches qui composent ce travail, s’articulent autour de deux échantillons. Le premier échantillon est celui qui est décrit dans le manuel du WISC-IV et qui a servi pour la standardisation française. Il est composé de 1103 enfants âgés de 6 à 16 ans et 11 mois. Le

(10)

9 deuxième échantillon est composé de 249 enfants âgés de 8 à 12 ans, suisses romands, recrutés dans différentes écoles du canton de Genève. Tous les sous-tests du WISC-IV ont été administrés à chaque enfant.

Cette thèse s’articulera autour de 3 objectifs. Le premier but sera de définir si la structure du WISC-IV est mieux expliquée selon le modèle standard à 4 facteurs ou selon un modèle basé sur la théorie CHC. Pour répondre à cette question, plusieurs modèles seront testés avec des analyses factorielles confirmatoires. Certains, sur la base du modèle standard à 4 facteurs et d’autres selon la théorie CHC. Ces modèles seront comparés afin de définir celui qui s’applique le mieux à nos 2 échantillons. Sur la base de ces résultats, nous regarderons en effectuant une analyse d’invariance de mesure, si la structure du WISC-IV est semblable pour nos deux échantillons.

Le deuxième problématique sera de définir quels sont les construits mesurés par les scores des différents sous-tests du WISC-IV. Nous verrons également s’il existe des disparités entre nos deux échantillons, si les scores des différents sous-tests mesurent bien les mêmes construits dans les deux populations. Afin de vérifier si ces éventuelles différences sont significatives, une analyse multigroupe sera conduite. Nous donnerons également des conseils d’interprétation pour les cliniciens, grâce à des tables de conversions qui ont été mises au point, ils pourront convertir les scores des sous-tests du WISC sur la base de CHC. Grâce à ces tables, ils pourront bénéficier d’une double interprétation des résultats. Ce dernier point sera notre troisième problématique.

Pour répondre au mieux aux différents objectifs de cette thèse, cinq études ont été effectuées. Ces recherches s’inscrivent dans le cadre d’un projet financé par le Fonds National Suisse de la Recherche Scientifique FNRS (no. 118248), dont le requérant principal est le Dr.

Thierry Lecerf et les co-requérants sont les Professeurs, Nicolas Favez et Jérôme Rossier. Ce projet a été conduit du 1er janvier 2008 au 31 décembre 2010.

Les différents résultats des analyses factorielles confirmatoires (AFC-ML et BSEM) répondant au premier objectif (études 1, 2 et 3), qui pour rappel était de définir la structure factorielle du WISC-IV, ont montré qu’une structure basée sur la théorie CHC s’ajuste mieux aux données des deux échantillons. En effet, un modèle CHC à 6 facteurs explique mieux les données françaises, et un modèle CHC à 5 facteurs, les données suisses romandes. Cela démontre qu’en se basant sur la théorie CHC, l’interprétation des résulats du WISC-IV est plus précise et de meilleures qualités. Ces résultats sont en accord avec d’autres études conduites avec des échantillons américains et asiatiques (Flanagan & Kaufman, 2004 ; Keith et al., 2006 ; Chen et al., 2009 ; Weiss et al., 2013). Nous constatons cependant que la

(11)

10 structure est différente pour les échantillons suisses et français. En effet, un modèle CHC en six facteurs a également été testé chez les enfants suisses romands, mais celui-ci péjore le modèle. Nous avons constaté cependant que plusieurs modèles CHC à cinq facteurs améliorent la structure de l’échantillon français par rapport au modèle standard à 4 facteurs.

Afin de définir s’il existe une différence significative entre nos deux échantillons, une analyse d’invariance de la structure a été faite. En effet, actuellement il n’existe pas de version suisse de cette batterie, ainsi les psychologues suisses romands sont contraints d’administer la version du WISC-IV aux enfants. Il est donc important de voir si l’interprétation du WISC-IV avec des enfants suisses romands va dans le même sens qu’avec des enfants français.

Nous avons effectué une analyse multigroupe (étude 4) pour tester l’invariance de deux modèles, un modèle « standard » à 4 facteurs avec une saturation multiple et un modèle CHC à 5 facteurs avec 2 saturations multiples, que nous avons retenu sur la base d’analyses faites au préalable. Au niveau de leur structure et des construits mesurés, ces deux modèles sont semblables. Les résultats confirment que la structure factorielle est similaire pour les échantillons français et suisses romands et cela pour les deux modèles. Ainsi, au niveau des facteurs de groupe, les cliniciens suisses romands peuvent continuer à interpréter les scores du WISC-IV pour les enfants romands.

Concernant le deuxième objectif (études 1, 2 et 4), à savoir, identifier les construits mesurés par les scores des différents sous-tests, nous trouvons quelques différences entre les deux populations. En effet, bien que la plupart des sous-tests saturent sur les mêmes facteurs pour les deux populations, ce n’est pas le cas pour les scores d’Arithmétique, Complètement d’Images et Symboles. Nous avons également constaté que les scores de certains sous-tests ont des saturations multiples, qu’ils mesurent en réalité deux construits. Ces résultats indiquent quelques disparités entre les enfants Français et Suisses Romands. Nous nous référons à l’analyse multigroupe afin de définir si ces différences sont sigificatives et s’il faut être attentif lors de l’interprétation des résultats des enfants suisses romands pour certains sous-tests. Cette analyse relève quelques différences significatives au niveau des intercepts de certains sous-tests entre ces 2 échantillons. En effet, nous avons constaté dans le modèle standard, que les enfants suisses obtenaient une moyenne significativement meilleure pour les sous-tests, Cubes et Similitudes et que les enfants français démontraient une moyenne supérieure pour les sous-tests Arithmétique, Raisonnement verbal, Matrices et Complètment d’Images. En ce qui concerne le modèle CHC à 5 facteurs, trois sous-tests obteinnent des moyennes significativment différentes, Cubes et Similitudes où les enfants suisses obteiennent des scores meilleurs et Raisonnement Verbal pour les enfants français. Nous avons également

(12)

11 trouvé des différences au niveau des indices résiduels de certains sous-tests. Ce qui signifie que pour ces sous-tests, des facteurs autres que le construit latent interviennent d’avantage chez les enfants français. Cependant, bien que Meredith (1993) classifie les variances résiduelles comme un facteur strict d’invariance, d’autres auteurs suggèrent qu’il est très difficile à interpréter et qu’il n’est pas vraiment nécessaire lors d’une mesure d’invariance (Byrne & Stewart, 2006). Ces différences n’entravent pas l’interprétation des résultats obtenus au WISC-IV.

Ainsi, aux vues des résultats des différentes études qui composent ce travail, nous avons constaté qu’une structure basée sur la théorie CHC s’accorde mieux aux données françaises et Suisses Romandes. Nous avons également vu que les construits mesurés par chaque sous-test, ne sont pas, pour certains sous-tests clairement définis. Enfin, une analyse multigroupe, indique quelques différences au niveau de certains sous-tests entre les deux populations. Ces résultats suggèrent, que pour les sous-tests Arithmétique, Raisonnement verbal, Matrices, Complètement d’Image, Similitudes et Cubes, les résultats obtenus par les enfants suisses doivent être interprétés avec précaution. Ces résultats pourraient questionner sur la pertinence de tester, certains items sur un échantillon suisse romand lors de la validation la version française du WISC, comme c’est le cas sur une population belge.

Le troisième et dernier objectif de cette thèse est donc de donner plusieurs conseils pour interpréter les scores du WISC-IV. Ainsi, pour une interprétation complète des différents scores, des tables de conversion entre les notes standards et les notes CHC ont été mises au point (étude 5). Celles-ci devraient aider les cliniciens à interpréter les scores non seulement sur la base du modèle standard actuel à 4 facteurs mais également sur la base du modèle CHC.

(13)

12

Chapitre 1 Introduction

1.1 Introduction générale

A l’heure actuelle, les échelles d’intelligence de Wechsler, en particulier l’échelle d’intelligence de Wechsler pour enfants et adolescents (WISC), sont les batteries d’aptitudes cognitives les plus utilisées à travers le monde. En Suisse par exemple, elle est souvent administrée dans les services de consultations psychologiques et de psychologie scolaire. En effet, les résultats obtenus au WISC sont des références pour certaines décisions relatives à la prise en charge de l’enfant. Il est ainsi primordial que l’interprétation des résultats de ces tests soit la plus correct possible. Actuellement, la quatrième version, la plus récente du WISC, en abandonnant le QI verbal et le QI de performance au profit d’une structure à 4 facteurs a fait un grand pas en avant. Maintenant, selon le manuel technique, l’interprétation courante du WISC-IV distingue 4 indices : Compréhension Verbale (ICV), Raisonnement Perceptif (IRP), Mémoire de Travail (IMT) et Vitesse de Traitement (IVT). Cependant, sur la base d’analyses factorielles confirmatoires et en accord avec la théorie des aptitudes cognitives de Cattell- Horn-Carroll (CHC), Flanagan et Kaufman (2004) suggèrent que le WISC-IV mesure 6 facteurs, alors que Keith et al. (2006) montrent qu’il en mesure 5. Ces études montrent que la structure factorielle du WISC-IV n’a pas encore été clairement définie. Ce constat engendre une seconde controverse concernant les compétences mesurées par les scores de chaque sous- test. Ainsi, certains sous-tests, comme Arithmétique par exemple, sont l’objet de désaccords entre les auteurs. Les compétences mesurées par chaque sous-test ne sont donc pas clairement définies.

Ainsi, le but principal de cette thèse est de répondre à plusieurs questions sur la structure factorielle et les propriétés psychométriques de la batterie d’aptitude cognitive, le Wechsler Intelligence Scale for Children (WISC-IV) et d’améliorer la validité de l’interprétation française en y appliquant le modèle théorique des aptitudes cognitives de Cattell-Horn-Carroll (CHC).

Dans ce travail, nous nous intéresserons donc à l’échelle d’intelligence de Wechsler pour enfants et adolescents (WISC, Wechsler Intelligence Scale for Children) et plus particulièrement à sa dernière version, la quatrième (WISC-IV). Par le biais de 5 études, nous tenterons de résoudre deux problématiques concernant la structure factorielle du WISC-IV.

(14)

13 Nos analyses seront effectuées à partir des données de deux échantillons différents, des enfants français et suisses romands. Nos deux objectifs sont les suivants :

Dans un premier temps, nous vérifierons si la version française du WISC-IV est mieux expliquée en se basant sur la théorie CHC. Le premier objectif de cette thèse est donc de définir la structure factorielle (études 1, 2 et 4) qui s’adapte le mieux aux données de deux échantillons composés d’enfants français et suisses romands. Nous comparerons plusieurs modèles en effectuant deux types d’analyses factorielles confirmatoires (AFC et l’analyse bayésienne BSEM).

La deuxième problématique, qui découle de la première est : quels construits sont mesurés par les résultats des différents sous-tests ? Autrement dit, est-ce que les résultats des différents sous-tests mesurent bien ce qu’ils sont censés mesurer (études 1, 2 et 3). Nous tenterons également de démontrer dans quelle mesure la version française du WISC-IV est applicable à une population suisse romande (étude 4). En effet, en Suisse romande, le WISC- IV qui est administré provient de France, la standardisation s’est faite sur un échantillon d’enfants français. Il n’existe, à l’heure aucune version « suisse » de cette échelle. Ainsi, nous ne sommes pas certains que la structure factorielle de cette batterie soit similaire pour les deux échantillons francophones. Pour cela une analyse multi-groupe a été faite. Nous pourrons ainsi montrer s’il existe de réelles différences entre ces deux populations.

Enfin, nous donnerons des conseils d’interprétations pour les cliniciens en nous référant à des tables pour convertir les scores standards en scores CHC nous avons mis sur pieds.

Afin de répondre à ces différentes questions, ce manuscrit s’organisera ainsi : Tout d’abord un préambule sur le concept d’intelligence et son historique sera présenté. Ensuite, nous détaillerons dans le sous-chapitre suivant la structure de l’intelligence, à savoir les différents modèles créés par différents auteurs afin de définir cette notion. Puis nous parlerons des échelles de Wechsler et nous décrirons le WISC-IV. Par la suite, les objectifs de cette thèse seront exposés ainsi que différentes analyses statistiques utilisées dans ce travail. Dans les chapitres 2 à 6, les différentes études seront présentées. Puis enfin la discussion des différents résultats sera relatée suivi d’une conclusion.

Cependant, avant de décrire de manière détaillée la problématique de cette thèse et de discuter les différents résultats obtenus, il est important de définir la notion d’intelligence et de situer le modèle CHC ainsi que le WISC-IV dans son contexte historique.

(15)

14 1.2 Préambule

1.2.1 Concept d’intelligence

Avant de présenter les différents modèles de l’intelligence, il est important de définir ce concept.

Définir l’intelligence humaine, sa nature et ses propriétés demeure une grande préoccupation pour de la psychologie depuis ses origines (Chartier & Loarer, 2008). En effet, ce concept englobe pléthore de compétences et de comportements. L’intelligence est réellement une abstraction. Ainsi, dans une étude menée auprès de sujets « tout-venants » et de sujets « experts » auxquels on demandait de définir l’intelligence, Sternberg, Conway, Kreton, & Bernstein (1981) montrent un consensus autour de trois types de compétences : compétences à résoudre des problèmes, compétences verbales et compétences sociales. De leur côté, Snyderman et Rothman (1987) interrogent une centaine de psychologues et spécialistes de l’évaluation et mettent en évidence dix caractéristiques de l’intelligence : pensée et raisonnement abstrait (99.3%), aptitude à résoudre des problèmes (97.7%), capacité à acquérir des connaissances (96.0%), mémoire (80.5%), adaptation à l’environnement (77.2%), vitesse mentale (71.7%), capacité linguistique (71.0%), capacité en mathématique (67.9%), culture générale (62.4%), créativité (59.6%). Malgré la variété de définitions possible de l’intelligence, on remarque cependant que la notion adaptative de l’intelligence est souvent présente, comme l’indiquaient déjà Binet, Wechsler ou encore Piaget.

Malgré ce consensus sur la notion d’adaptation dans l’intelligence, il est important de garder à l’esprit les divergences de définitions entre les différents auteurs. Diverses explications peuvent être données à ces différences (Lautrey, 2006). Une première serait que l’intelligence est une notion trop générale, trop floue, trop abstraite pour trouver un consensus à une investigation scientifique. La seconde serait que l’intelligence est une fonction adaptative de haut niveau qui se manifeste au travers d’une multitude de mécanismes et qui peut être appréhendée sous de très nombreux angles. Comportant plusieurs facettes culturellement déterminées et socialement partagé par une communauté, l’intelligence est un construit qui ne peut se mesurer directement. Ainsi, la mesure de l’intelligence est depuis plusieurs siècles une des questions fondamentales de la psychologie.

Comme nous l’avons vu plus haut, le premier problème auquel se confronte le psychologue lors de l’évaluation de l’individu est la définition de l’intelligence. En effet, pour mesurer un construit, il faut tout d’abord le définir. Ainsi sa définition est étroitement liée à la

(16)

15 construction des tests. Il faut donc décrire quelles sont les caractéristiques propres à l’intelligence pour construire un test pouvant mesurer ce concept. Une des premières critiques des tests d’intelligence porte donc sur sa définition. Les concepteurs de tests veulent mesurer cette dimension en mesurant des traits latents. Or, ils ignorent la teneur de ces traits.

Cependant, pour construire un test d’intelligence, les concepteurs n’ont pas besoin de connaître sa définition exacte. En effet, l’intérêt de ces tests est de pouvoir faire des prédictions, un état des lieux des capacités cognitives d’un individu à un moment donné. Par exemple, par le biais des scores obtenus à un test on pourra prédire dans une certaine limite, la réussite scolaire et/ou professionnelle de la personne. Le but d’une batterie d’intelligence est que l’individu parvienne à mettre en œuvre les mêmes compétences aux tests que dans les activités scolaires. Ces compétences mises en œuvre, auraient la même dimension qui s’appellerait intelligence. Le but du test est de prédire la réussite ou les difficultés de l’enfant et de pouvoir faire une cartographie du profil cognitif de la personne à un moment donné. En effet, actuellement le QI reste le meilleur prédicteur de la réussite scolaire et professionnelle.

Ainsi Jensen (1998) mentionne que la validité prédictive de l’intelligence est marquée par une corrélation significative et prédictive de mesures d’éducation, d’économie ou d’aspects sociaux. En effet, l’intelligence, donc le facteur g (facteur général d’intelligence) prédit les performances à des degrés différents dans toutes sortes de comportements sollicités pour apprendre, décider et juger. La validité de g la plus notable est sans conteste la performance scolaire, non parce les saturations en facteur g mesurent spécialement ce qui est appris à l’école mais parce que g est intrinsèque pour apprendre un matériel nouveau, saisir des concepts, des distinctions et des pensées, Jensen (1998). Les capacités d’apprentissage et l’intelligence sont deux concepts souvent étudiés séparément, ils ont cependant une sollicitation très proche au quotidien (Jensen, 1998). Toute personne a des capacités d’apprentissage et est capable de retenir certaine chose. Cependant, les performances varient d’une personne à l’autre. Une personne qui a un QI haut aura les meilleures capacités et plus de chance de réussir scolairement et professionnellement. En effet, la corrélation entre le QI et la réussite scolaire est de .60 à .70 à l’école primaire, la corrélation baisse un peu avec le temps mais reste relativement haute. Dans une étude sur le WISC-IV, Watkins, Konold, et McDermott (2006) montre qu’il y a une corrélation de .55 avec les compétences de lecture, de .77 avec les compétences en mathématique.

Concernant, le monde du travail, le facteur g est le meilleur prédicteur de la pratique d’un travail et des performances dans celui-ci. Le degré dépend bien entendu du niveau de nouveauté et de complexité cognitive que demande le travail. De nombreuses recherches sur

(17)

16 les compétences au travail ont démontré des corrélations élevées avec le QI. Ainsi, le QI est également l’un voire le meilleure prédicteur de la réussite professionnelle.

Ainsi, l’intelligence est non seulement le meilleur prédicteur de la réussite scolaire et professionnelle mais également d’aptitudes plus spécifiques à la vie scolaire. De plus depuis les premières études sur le sujet, il a été démontré que la plupart des capacités liées au raisonnement, au jugement, aux mathématiques, à la compréhension, etc. saturent plus ou moins sur un facteur commun qui serait le facteur génral d’intelligence. Il est ainsi, important pour faire des prédictions de bien définir quels construits sont les plus à même de prédire la réussite scolaire et professionnelle d’un individu.

Il est également important de garder à l’esprit que l’intelligence est une construction sociale et culturelle. Ce qui est interprété comme un comportement intellectuel n’est vrai que dans un contexte culturel donné. On ne peut donc pas considérer que les outils qui sont utilisés dans une société s’appliquent à tous les groupes ethniques. Un test n’est pas universel, il faut éviter d’administrer les tests construits pour les sociétés occidentales à toutes les populations du monde. En effet, les items proposés en occident n’ont pas de sens chez des habitants de tribus d’Afrique par exemple. La conséquence d’administrer un test occidental à des habitants de « tribus » est que l’on obtient une interprétation trop rapide sur quel peuple est plus intelligent que l’autre. Serpell (2000) explique que l’évaluation de l’intelligence est née d’un contexte culturel, souvent situé historiquement dont les procédures et les instruments formels ne sont pas uniquement le reflet de manifestations de fonctions psychologiques mais également d’arrangements qui sont parfois conceptualisés par des motivations politiques et économiques. La première motivation pour tester l’intelligence en Europe et aux Etats-Unis date du début du vingtième siècle, dans un contexte de réformes sociales révolutionnaires où l’école devient obligatoire pour tous. Ainsi, l’alphabétisation, la scolarité et l’intelligence sont devenues intimement liées au sein de l’école publique institutionnalisée (Serpell & Hatano, 1997). Dans ce contexte, il devenait important de cerner quelles compétences de l’enfant sont attendues et à quel moment spécifique de son développement. C’est dans ce contexte, qu’est né la notion d’âge mental. Cependant, cette notion a un sens chez les enfants français, lorsque Binet (dont nous parlerons plus en détail dans le chapitre suivant), fait passer des tests à des enfants étant familliers des nombres, de l’écriture, etc., mais ne fait aucun sens en Afrique où l’alphabétisation n’est présente que chez une petite part de l’élite, comme c’était le cas en Europe avant le 20ème siècle. A l’heure actuelle, dans la société occidentale, mesurer l’intelligence dans un cadre scolaire et professionnel fait toujours sens. D’autant plus qu’aujourd’hui avec l’énorme évolution de la technologie, la demande intellectuelle est

(18)

17 d’autant plus forte. Cependant, en Afrique où, tous les enfants ne sont pas forcément scolarisés et sont ainsi moins familiarisés avec les chiffres, les lettres, les symboles, etc. et de ce fait, il serait inadéquat de leur administrer les mêmes tests d’intelligence qu’aux enfants occidentaux car les normes de ces épreuves, ne sont pas en adéquation dans ces cultures.

Notons que nous n’avons pas besoin de mentionner un exemple aussi extrême pour démontrer que les aspects culturels ont une importance énorme dans l’évaluation de l’intelligence. En effet, en Europe occidentale et aux Etats-Unis, la diversité raciale et ethnique continue de grandir. Ortiz, Ocha, et Dina (2012) expliquent qu’aux Etats-Unis, par exemple, dans certaines contrées, des enfants issus de cultures minoritaires à la base, sont majoritaires actuellement. En effet, dans certains états, dans les classes, il y a plus d’enfants originaires de nations hispaniques ou asiatiques que d’enfants natifs américains. Ce phénomène pourra encore augmenter et s’étendre dans toute l’Amérique d’ici 2023. Ainsi, le temps où un psychologue testait un enfant issu d’une culture minoritaire, seulement dans de rares occasions, est passé depuis longtemps. Il faut ainsi inévitablement s’adapter à tous les enfants vivant conjointement dans la même culture. Dans un sondage effectué chez des praticiens qui évaluent des enfants ayant des compétences limitées en anglais, Ochoa, Riccio Jimenez, Garci de Alba, et Sines (2004) mentionnent que ces psychologues cliniciens effectuent un travail d’adptation et de différentialisation chez ces sujets en administrant une variété d’instruments.

En principe, ces instruments sont composés d’une échelle d’intelligence, un test visuo-moteur, un test projectif et une batterie d’intelligence non verbale. Ces auteurs notent cependant, que ces tests ne diffèrent guère de ceux qui sont utilisés chez des enfants de langue maternelle anglaise. Ce qui peut changer est la langue dans laquelle le test est administré. En effet, lorsque qu’un psychologue est bilingue, il peut administrer le test dans la langue maternelle de l’enfant évalué. Ainsi, les conditions de passation sont plus semblables entre les deux groupes Cependant, le changement notable réside dans la version langagière du test et la langue dans laquelle il est administré. Ce constat montre que les praticiens ignorent certains facteurs majeurs qui marquent différemment la passation d’un test pour un enfant parlant pas ou peu l’anglais comparé à un enfant de langue maternelle anglaise. Ces facteurs incluent des normes qui ne sont pas représentatives des deux groupes empêchant ainsi leur comparaison. En effet, des enfants parlant une autre langue ont des apprentissages et des connaissances culturelles différentes. Cette problématique n’existe pas uniquement aux Etats-Unis. En effet, en Suisse, nous sommes également confrontés à plusieurs cas similaires. Dans les écoles de Suisse romande par exemple, il y a de plus en plus d’enfants qui proviennent de nationalités différentes. Ces derniers deviennent aussi majoritaires dans plusieurs villes de Suisse. Ainsi,

(19)

18 comme aux Etats-Unis, nous devons tenir compte de cette problématique lors de nos bilans. Il est ainsi primordial d’adapter l’évaluation en fonction de l’enfant qui passera les épreuves.

Ainsi, pour des enfants parlant peu ou pas la langue dans laquelle le test est administré, il serait important de favoriser des batteries d’intelligence non-verbales. Celles-ci pourront nous donner une idée des capacités de l’enfant sans qu’il soit biaisé par des aspects langagiers et de connaissances culturelles générales.

Cependant, même chez des enfants de cultures proches et parlant la même langue (par exemple, USA-Canada, Suisse Romande-France, Suisse Allemande-Allemagne), l’administration d’une batterie de tests d’intelligence pourrait avoir des limites. En effet, rappelons que les apprentissages et les aquisitions se font dans un contexte bien défini. Ces aspects culturels et de connaissances pourraient biaiser les scores aux tests, en particulier dans les sous-tests faisant appel à des connaissances et de la compréhension. C’est d’ailleurs pour cette raison que les tests qui sont construits en anglais, ne sont pas simplement traduits en français, par exemple, mais validés et standardisés auprès de la population dans laquelle il sera administré. Ainsi, même dans des populations parlant le même langage, certaines petites différences peuvent subsister. De ce fait, la version française du WISC-IV a également été standardisée avec des enfants belges. En effet, bien que ces pays soient culturellement proches, le système scolaire est différent et peut engendrer des acquis dissemblables. Cela pourrait également être le cas entre les enfants suisses romands et français. Il est ainsi nécessaire de démontrer dans quelle mesure l’administration d’un test standardisé dans un autre pays est cohérente. Nous verrons cela plus en détail au fil de ce travail.

Dans ce travail, nous ne parlerons que de la notion de l’intelligence et des prédictions que l’on peut faire avec une batterie d’aptitude cognitive dans des cultures occidentales.

Sur la base des définitions de l’intelligence, plusieurs approches vont émerger. Notons que pour ces différentes approches, bien que la grille de lecture soit différente le but est le même, à savoir, comprendre le fonctionnement intellectuel d’un individu, pour faire des prédictions. Dans le chapitre prochain, les origines de l’évaluation de l’intelligence et l’approche globaliste de l’intelligence seront exposées.

(20)

19 1.2.2 Les origines de l’évaluation de l’intelligence

Comme nous l’avons vu dans le chapitre précédent, la construction d’un test cognitif se fait sur la base de la définition que les concepteurs ont de l’intelligence. Dans ce chapitre nous verrons, par le biais de différents auteurs, à partir de quels principes, les mesures de l’intelligence peuvent être faites. Depuis la deuxième moitié du 19ème siècle, plusieurs auteurs tentent d’expliquer l’organisation des différence individuelles (Flanagan & Kaufman, 2004).

Francis Galton, est le premier à s’intéresser aux différences entre individus. Cousin de Charles Darwin, il est convaincu de la théorie sur la sélection naturelle, il estime qu’elle est transposable à l’espèce humaine et qu’elle expliquerait les différences de compétences intellectuelles entre individus. Il tente ainsi de démontrer que la sélection naturelle est vraie pour les êtres humains. Selon lui, dans la société, certaines personnes ont une place plus importante que d’autres. A l’aide de la théorie de Darwin, il veut prouver que les gens influents, le sont, car ils ont un meilleur patrimoine génétique. Au contraire, les personnes subalternes sont dans cette condition, car leur patrimoine génétique est moins bon. Il veut ainsi montrer que par la sélection naturelle, les personnes dont le patrimoine génétique est bon, se trouvent à la tête du gouvernement et que c’est le patrimoine génétique qui détermine l’organisation de la société anglaise. C’est de cette vision, que la théorie de l’eugénisme émerge. Le but de l’eugénisme est d’améliorer l’espèce humaine en passant par un tri au travers de la reproduction des individus. D’autres auteurs vont adhérer à l’eugénisme. Ainsi, dans certains pays, des mesures ont été prises préconisant qu’il faut favoriser la reproduction de personnes ayant un bon patrimoine génétique et empêcher l’empêcher chez des personnes ayant une place peu importante dans la hiérarchie.

Pour prouver la véracité de cette théorie, Galton va développer des tests et d’autres procédures. Ces instruments serviront à mesurer les différences interindividuelles afin d’expliquer la hiérarchie sociale. En 1884, il profite de l’Exposition universelle de Londres pour administrer ses épreuves à de nombreuses personnes. Durant cette manifestation, il va prendre des mesures physiques et psychologiques des gens. D’un point de vue statistique, il a un rôle important car c’est, avec Pearson, l’inventeur du coefficient de corrélation. En effet, grâce aux corrélations, il démontre l’origine génétique des différences individuelles. C’est également un des premiers auteurs à comparer ses résultats sur la base de la loi normale. En effet, il constate une distribution normale des mesures physiques (taille, poids) et va donc partir du principe qu’il en va de même pour les différences de compétences intellectuelles.

D’un point de vue psychologique, Galton se base sur les processus sensoriels. Selon lui, la

(21)

20 perception des informations se fait à travers les sens. Les gens les plus « intelligents » doivent avoir les sens les plus développés. Ainsi, c’est par le traitement de l’information que se créent les différences individuelles et les différences de compétences intellectuelles plus générales. Il va ainsi mesurer des temps de réaction sur des stimuli auditifs et visuels afin de démontrer que ce sont les premières étapes du traitement de l’information et qu’elles sont à l’origine des différences intellectuelles. Tout au long de ses études, Galton ne trouvera aucune relation entre les temps de réaction simples (processus sensoriels) et les processus intellectuels plus globaux. Ainsi, l’idée que les compétences cognitives sont liées aux étapes du traitement de l’information va être abandonnée pour un temps. Notons cependant, que des recherches plus contemporaines vont donner raison à Galton. En effet, à la fin du 19ème siècle, les outils utilisés pour mesurer les temps de réactions étaient beaucoup moins précis qu’à l’heure actuelle. Actuellement il est possible d’effectuer des mesures en termes de microsecondes.

Ainsi, en mesurant des temps de réactions précisément, des différences entre individus ainsi que des liens avec des compétences cognitives plus générales ont pu être démontrées.

Ainsi, au début du XXème siècle, suite à l’échec des travaux de Galton, la problématique de la différenciation des individus sur la base de leurs compétences cognitives n’est toujours pas résolue. C’est Alfred Binet qui va trouver une solution adéquate (Wasserman, 2012). Il est ainsi considéré comme le père des tests d’intelligence (Wasserman, 2012). C’est suite à une demande institutionnelle que Binet va développer ses tests d’intelligence. En effet, l’école étant devenue obligatoire pour tous les enfants, il s’avère que certains d’entre eux n’ont pas les compétences cognitives nécessaires pour suivre une scolarité normale. Ainsi, Binet est mandaté afin de développer un outil permettant d’identifier les enfants « débiles », donc ayant un retard mental. Ces tests ont ainsi les mêmes objectifs qu’aujourd’hui, à savoir, identifier si un enfant qui a des difficultés scolaires est en échec par faute de compétences intellectuelles ou pour une autre raison. Pour répondre à ces besoins institutionnels, Binet (1886), propose une alternative aux tâches sensorielles et motrices de Galton. En effet, il estime que la mesure des sensations est inutile et trouve plus pertinent d’évaluer des facultés supérieures, plus importantes pour la psychologie individuelle. Binet avec l’aide de Simon, médecin dans un centre pour enfants « retardés », devient ainsi le premier à construire des tâches mesurant le langage, la force de jugement, la mémoire, la compréhension et le raisonnement (Flanagan & Kaufman, 2004). En 1908, il travaille avec des enfants normaux, dans le but de trouver des différences en fonction des âges de l’enfant.

Par le biais de ces épreuves, les enfants peuvent être caractérisés par leur âge réel mais aussi par un niveau intellectuel qui correspond à leur niveau de réussite à différentes épreuves

(22)

21 (Chartier & Loarer, 2008). En effet, il construit 30 petites épreuves qui sont réussies à des âges différents. Une question correspond à un âge si elle est réussie par plus de 50% ou 75%

des enfants. Binet crée ainsi la notion de niveau intellectuel. Il peut définir à quel âge mental, à quel niveau intellectuel se situe un enfant. Son test a d’abord été développé pour des enfants de 3 à 13 ans puis a rapidement été étendu à une version allant jusqu’à 15 ans. Les échelles d’intelligence pour évaluer les enfants et les adolescents de Binet et Simon, puis de Stanford- Binet, ont été, pendant près de 40 ans, les plus populaires aux Etats-Unis. C’est suite au succès que ces épreuves ont connus aux Etats-Unis, qu’elles sont devenues populaires en Europe. C’est sur la base de ces échelles d’intelligence que sont nés les tests qui sont utilisés aujourd’hui dans la pratique clinique. Cependant, une critique des tests de Binet tient dans le fait que le niveau intellectuel ne tient pas compte de l’âge chronologique. Ainsi, en 1912, Stern s’inspire de l’âge mental de Binet, invente un nouvel indice nommé quotient mental (QM). C’est le rapport entre l’âge mental et l’âge chronologique (Chartier & Loarer, 2008).

En 1916, Terman calcul un Quotient Intellectuel développemental (QID) en effectuant l’âge mental/l’âge chronologique x 100. La moyenne sera établie à 100, car si un enfant a un âge chronologique de 76 mois (l’âge est calculé en mois) et qu’il a un âge mental également de 76 mois, 76/76 x 100 est égal à 100. Durant de nombreuses années le QID sera utilisé.

Cependant, ce dernier s’avère problématique. En effet, la vitesse de développement d’un enfant est stable mais ce n’est pas le cas du QID. Prenons par exemple un enfant de 4 ans qui a un retard de 7 points, cela lui fera un QID de 85. Or en grandissant, si l’enfant a toujours un retard de 7 points, un problème arithmétique survient ; plus il grandit plus il est proche de la moyenne. Ainsi, son QID passera de 85 à 95. De par son instabilité, le QID ne peut pas être pris en compte. De plus, le calcul du QID s’interprète mal chez l’adulte. Le QID sera abandonné en 1939. David Wechsler trouvera une alternative au QID. Ce dernier a beaucoup influencé la conception des tests d’intelligence.

Il est le créateur des échelles de Wechsler (WPPSI, WAIS et WISC) qui sont encore à l’heure actuelle les batteries de tests les plus utilisées dans le monde. Ses différents travaux seront exposés en détail dans le sous-chapitre 1.4, consacré au WISC-IV. Notons cependant, que Binet et Wechsler appréhende l’individu dans sa globalité. En effet, ils tentent par le biais de leurs tests d’obtenir un score décrivant les performances de l’individu de manière global.

Ce qui n’est pas le cas des auteurs qui seront présentés dans le sous-chapitre suivant.

(23)

22 1.3 Structure de l’intelligence

Dans ce chapitre, différents modèles de l’intelligence ainsi que l’évolution de la structure de ceux-ci seront expliqués. Rappelons que Binet et Wechsler s’intéressent à la personne dans sa globalité. Alfred Binet a conçu son test, en ne tenant pas compte de la définition de l’intelligence. Pour lui, l’intelligence est mesurée à partir des processus supérieurs comme le jugement, la compréhension, la mémoire, etc. Les auteurs qui vont être présentés dans ce chapitre, eux, par contre tentent de définir l’intelligence pour essayer de préciser ce que recouvre cette notion. Ces recherches vont s’inscrire dans l’approche factorialiste, ce terme s’explique par le fait que les auteurs vont utiliser des méthodes statistiques particulières en effectuant des analyses factorielles. C’est ces dernières qui vont leur permettre de préciser ce qu’est l’intelligence voire ce que sont les intelligences. De plus, rappelons que ce travail a pour sujet le modèle de Cattell-Horn-Carroll qui est le modèle factoriel le plus référent actuellement. Ainsi, il est important de présenter les travaux antérieurs qui ont inspiré ces propositions.

1.3.1 Spearman et le facteur général d’intelligence ou facteur g

En 1904, Charles E. Spearman produit une avancée spectaculaire sur la compréhension du concept d’intelligence. Il travaille alors sur l’île de Guernesey comme psychologue où il fera passer une série de tests aux enfants. Dans un premier temps, il construit des épreuves permettant de mesurer différentes capacités. Les mesures sont la lecture, le raisonnement arithmétique, l’aptitude mécanique, les connaissances électriques, les connaissances mécaniques et la classification générale. Il fait passer toutes ces tâches aux mêmes enfants. A partir des différents résultats obtenus, il calcule des corrélations afin d’évaluer les liens entre les différentes épreuves. Si les tâches corrèlent entre elles c’est qu’il existe une même dimension psychologique. Cependant, afin de comprendre l’organisation de l’intelligence, il doit raisonner sur toutes les corrélations en même temps. Mais vu le nombre important de celles-ci, cela s’avère impossible. Ainsi, afin de tenter de regrouper toutes les corrélations et de pouvoir les traiter simultanément, il invente une méthode statistique qui est l’analyse factorielle (Chartier et Loarer, 2008). Grâce à cette méthode, il parvient à tenir compte de toutes les relations entre toutes les épreuves deux à deux simultanément. Spearman constate que toutes les tâches corrèlent entre elles. Il existe donc un lien entre toutes les performances, démontrant l’existence d’une dimension commune à toutes les épreuves. Il

(24)

23 constate alors que l’enfant qui a obtenu les meilleurs résultats dans une épreuve a tendance à être le meilleur dans toutes les autres tâches. Et au contraire, le sujet qui a le plus de difficultés dans un test a des difficultés dans toutes les autres épreuves. Ce qui explique ce constat, c’est que derrière tous ces tests, il existe une même caractéristique qu’il va nommer dans un premier temps l’intelligence générale. Ce terme va se transformer en facteur d’intelligence générale puis en facteur g (Brody, 2000; Grégoire, 2009).

Ainsi, toutes les épreuves nécessitant des capacités cognitives sollicitent une même dimension appelée facteur d’intelligence générale ou g. Dans la figure 1, on voit que la partie centrale G, est commune à tous les tests. Derrière chaque épreuve, il y a la contribution du facteur général d’intelligence. Pour Spearman, c’est le facteur le plus important. C’est celui qui explique les différences entre individus. Cependant, le facteur g est présent sur toutes les épreuves mais avec des poids relatifs différents. En effet, comme on le voit sur la figure 1, le test 1 a un recouvrement sur G plus faible que le test 3. Cela démontre que le test 1 sollicite g de manière relativement faible alors que le test 3 a une plus forte demande en facteur g.

Cela démontre qu’il y a une différence entre les épreuves, quant à la contribution de g dans la résolution de celles-ci. Comme nous le voyons sur la figure 1, il y a pour chaque test une partie qui ne recouvre pas G. Selon Spearman, il s’agit d’une dimension spécifique au test même. Il va nommer cette dimension, facteur spécifique. Tout comme pour le facteur g, l’impact du facteur spécifique varie d’une épreuve à l’autre. Ainsi, la réussite à un test dépend toujours de la contribution du facteur g et du facteur spécifique (Grégoire, 2006). Cela explique pourquoi les corrélations entre les épreuves ne sont jamais de 1 et qu’une personne qui obtient les meilleurs résultats à un test, n’obtiendra pas forcément les meilleurs résultats à un autre. Le score obtenu à toute tâche cognitive peut donc être expliqué comme étant le reflet des capacités en facteur g ainsi que par un facteur spécifique au test considéré. Plusieurs hypothèses ont été avancées pour expliquer la nature de l’intelligence générale. Spearman se questionne sur l’implication biologique des compétences cognitives. Comme les moyens techniques de l’époque ne permettaient pas de vérifier l’activation cérébrale, Spearman va faire des hypothèses. Il va avancer que ce qui explique les différences individuelles en facteur g est la quantité d’énergie mentale disponible chez les individus. Si la personne a une grande quantité d’énergie mentale, elle aura de bonnes capacités en facteur g, car elle permet d’activer différentes parties cérébrales. Plus les parties activées sont nombreuses, mieux les tâches seront résolues. La deuxième hypothèse est que les facteurs spécifiques impliquent des neurones spécialisés. Ainsi, la réussite aux épreuves dépendrait de l’énergie potentielle issue du cortex tout entier et, en partie, du rendement du groupe de neurones en jeu. La très forte

(25)

24 corrélation entre g et les tâches de raisonnement a ensuite permis d’émettre l’hypothèse que l’intelligence générale serait caractérisée par la capacité d’éduction, définie ici comme l’appréhension des relations et la capacité à raisonner sur du matériel nouveau.

Cependant, on ne doit pas faire oublier que Spearman a reconnu, très tôt, que les facteurs spécifiques ne se rapportent pas forcément à un seul test mais peuvent influencer un groupe de tests (Spearman, 1927). Ainsi selon lui, en plus de l’importance du facteur g, l’intelligence peut être considérée comme multidimensionnelle. En effet, des aptitudes spécifiques peuvent, dans certains cas, être plus importantes que le facteur g (Spearman, 1927, 1931).

Figure 1. Modèle de Spearman (Grégoire, 2009)

C’est sur des aprioris stipulant que Spearman considère l’intelligence comme unidimentionnelle que ces théories sont rapidement critiquées. En 1909, Thorndike et collaborateurs, ne parviennent pas à mettre en évidence un facteur général même en utilisant des tâches similaires à celles de Spearman. L’impossibilité de trouver un facteur général vient du fait que plusieurs épreuves utilisées mesurent les mêmes capacités cognitives. Il mettent en évidences des facteurs clairement séparés (nommés facteurs de groupe), qui saturent sur un groupe d’épreuves (Grégoire, 2009). De ce fait, Thorndike rejette le facteur “g” et promeut l’idée d’intelligence multiple. Thurstone (1934) pense également que la conception de l’intelligence selon Spearman se résume à une vision purement unidimensionnel. Il postule ainsi que l’intelligence ne possède pas un caractère unitaire et global, mais est multidimensionnelle Dans la tradition des analyses factorielles inventées par Spearman et

Facteur g

test 2

test 1

test 3

(26)

25 perfectionnées par ses soins, Thurstone mettra en évidence sept facultés cognitives indépendantes les unes des autres, les Primary Mental Abilities (PMA).

1.3.2 Thurstone et les aptitudes primaires

Le deuxième grand modèle présenté ici est celui de Louis Leon Thurstone (1887- 1955). Sur la base d’appriori sur les recherches de Spearman, il aboutit à un modèle à la base différent de celui de Spearman car il montre que l’intelligence n’est pas unifactorielle, mais multidimensionnelle. En 1934, il obtient les résultats de 56 tests administrés à 240 étudiants de l’université (15 heures de passation). Il perfectionne l’analyse factorielle de Spearman afin de permettre l’extraction de multiples facteurs. L’analyse factorielle multiple qu’il effectue permet d’extraire 13 facteurs parmi lesquelles 7 sont choisis et interprétés en tant que

« Primary Mental Abilities » (PMA) ou aptitudes mentales primaires. Les différentes PMA sont: Compréhension verbale (V), Visualisation spatiale (S), le Aptitude numérique (N), Fluidité verbale (W), Raisonnement inférentiel (R), Mémorisation (M) et Vitesse perceptive (P) (cf. figure 2). Il développe ainsi une batterie factorielle qu’il nomme (PMA) permettant de mesurer ces 7 aptitudes. Cette batterie de tests ne permet pas la mesure d’un facteur général d’intelligence qui selon lui n’existe pas. Selon Thurstone l’intelligence est mesurée au travers des aptitudes mentales primaires.

Les chercheurs vont mettre des années pour trouver une explication plausible aux différences qui existe entre les modèles Spearman et Thurstone. Les données initiales qu’ont utilisées ces deux auteurs sont très proches et rendent ainsi l’explication des différences entre ces deux modèles difficile. Après de nombreuses années de questionnement, les différences s’expliquent en 3 points qui vont être décrits dans les prochains paragraphes.

Le premier point est expliqué par le fait que les 2 auteurs ont utilisé des méthodes statistiques différentes. En effet, comme nous l’avons dit précédemment, Spearman est l’inventeur des analyses factorielles. Thurstone perfectionne les analyses factorielles de Spearman en inventant les rotations orthogonales. Ainsi, les analyses sont semblables au départ car elles se font sur la base d’une matrice de corrélation mais, Thurstone, change l’organisation des épreuves. En effet, il change l’axe et prend une autre ligne de référence que Spearman sur la matrice de corrélation. Ce changement d’axe, qui au début est uniquement statistique a de grandes conséquences théoriques. En effet, en effectuant ce changement d’axe, Thurstone démontre qu’il y a plusieurs formes d’intelligence. Pour prouver l’existence de

(27)

26 différentes formes d’intelligence, Thurstone administre beaucoup plus d’épreuves que Spearman. Spearman faisait passer 10 à 15 tests, alors que Thurstone 56 à tous les participants, ce qui équivaut à environ 15h de passation. Rappelons que Spearman travaille avec des enfants tout venants de l’île de Guernesey, alors que Thurstone avec un échantillon de 240 étudiants de Chicago. Le choix de l’échantillon est le deuxième point qui explique les différences entre les 2 modèles. En effet, l’échantillon de Spearman est composé d’enfants tout-venants alors que celui de Thurstone d’étudiants. Vu que la population est différente, l’organisation de la différence interindividuelle l’est également. En effet, le QI des étudiants se situe théoriquement entre 90 et 150, donc dans cet échantillon, personne ne se situe en dessous de la moyenne. Ainsi, dans la population étudiante, les différences entre les gens ne s’expliquent pas par le niveau intellectuel général mais par l’intérêt et/ou les connaissances dans une épreuve. En travaillant sur des étudiants qui ont un niveau cognitif homogène, un facteur d’intelligence général ne peut pas être mis en évidence. A l’inverse, Spearman qui travaille avec des enfants scolarisés, ceux-ci vont avoir des QI qui se situent entre 50 et 150.

En comparant des enfants ayant 50 de QI avec d’autres ayant 150, on s’aperçoit que ces derniers réussiront mieux les épreuves. Donc dans ce cas de figure les différences sont expliquées par le niveau d’intelligence général. Ce qui permet de mettre en évidence le facteur g. Avec les analyses factorielles, la rotation orthogonale et une population particulière, Thurstone conclut qu’il existe 7 formes d’intelligence qui sont pour rappel, Compréhension verbale (V), Visualisation spatiale (S), le Aptitude numérique (N), Fluidité verbale (W), Raisonnement inférentiel (R), Mémorisation (M) et Vitesse perceptive (P). Dans la figure 2, les 7 PMA sont représentés par un grand carré. Comme chez Spearman, on peut voir l’aptitude mentale et la contribution de l’épreuve (petits rectangles) qui est plus ou moins grande sur le facteur. Par exemple, pour le facteur numérique (N), 2 épreuves ont des dimensions qui sont impliqués dans cette dimension mais avec une importance différente.

Ainsi, le recouvrement sur le facteur indique l’importance de l’implication.

Selon Thurstone, les différences interindividuelles dans le domaine de la cognition s’expliquent par les compétences des individus sur ces 7 aptitudes mentales primaires. Cette conclusion va avoir des conséquences pratiques, en effet, en suivant la perspective de Spearman, un seul test (les matrices de Raven par exemple) est nécessaire pour obtenir un score unique d’intelligence générale. Par contre, en suivant la vision de Thurstone, les cliniciens doivent, pour obtenir une fidélité suffisante, administrer au moins deux épreuves par aptitude intellectuelles. Ainsi, pour mesurer les 7 aptitudes mentales primaires de Thurstone, 14 tests au minimum sont nécessaires impliquant un long temps de passation.

(28)

27 Ainsi, le 3ème point expliquant les différences entre Spearman et Thurstone est le choix des épreuves.

En effet, pour prouver l’existence de 7 formes d’intelligence, Thurstone fournit, avec Guilford, un travail énorme dans la construction de tests psychologiques. Ces deux auteurs sont, d’ailleurs, les concepteurs de tests qui sont en partie encore utilisés aujourd’hui. Pour mesurer leur modèle et ainsi mesurer les 7 aptitudes mentales, 5 tests par facteur étaient nécessaires. Thurstone va utiliser des épreuves diverses. Il élimine certaines épreuves et ne garde que celles qui corrèlent entre elles. Cependant, en utilisant beaucoup d’épreuves qui mesurent la même dimension, la chance de trouver des facteurs de groupe est plus grande.

Thurstone passe beaucoup de temps à prouver l’existence de plusieurs formes d’intelligence mais aussi à démontrer que le facteur g de Spearman n’existe pas. Pour ce faire, il va utiliser 3 épreuves appartenant à 3 aptitudes mentales. Il choisit un nombre différent de tests pour évaluer ces 3 aptitudes. Il va ainsi inférer le facteur « g » en prenant une première situation dans laquelle se trouve 5 tests mesurant une même aptitude mentale, 2 tests mesurant une autre aptitude et deux encore une autre. Ces 9 tests sont administrés à tous les sujets en sachant qu’ils se répartissent différemment (5-2-2). Thurstone va ainsi obtenir un facteur général de l’aptitude mentale la plus représentée (celle qui est mesurée par 5 tests). Thurstone révoque ainsi le facteur « g » car s’il existait, il serait plus stable et pas variable en fonction des épreuves. Selon lui, le facteur « g » dépendrait trop des épreuves administrées. Cependant si on mettait 5 épreuves de chaque aptitude mentale, le facteur « g » serait plus stable.

Suite aux controverses entre ces auteurs, deux écoles (penchants) se sont constituées, l’école anglaise (pro Spearman) et l’école américaine (pro Thurstone) qui vont tenter de défendre les idées des deux auteurs. Cependant, les deux auteurs ont raison. A l’heure actuelle, l’évaluation des capacités intellectuelles repose en même temps sur les modèles de Thurstone et de Spearman. En effet, on peut ordonner les individus sur un seul score. Le QIT va être utilisé comme l’indicateur du facteur « g ». Cependant, dans une perspective diagnostique, le QIT ne va pas apporter suffisamment d’information donc il faut se référer à des facteurs d’aptitudes mentales. Ainsi, le WISC-IV qui est utilisé aujourd’hui s’appuie sur un QIT et d’autres aptitudes. Un facteur général d’intelligence peut être restitué (QIT) mais également des facteurs de groupe (ICV, IRP, IMT et IVT). Actuellement, l’évaluation se fait dans une perspective uni et multidimensionnelle. Mais pour arriver à cette perspective, différents auteurs ont travaillé dans le but de comprendre et de synthétiser les conceptions de Spearman et Thurstone. Ils vont ainsi aboutir aux modèles hiérarchiques de l’intelligence dont plusieurs vont être exposés dans le chapitre suivant.

Références

Documents relatifs

Compte tenu des résultats des différentes études, nous posons comme hypothèses sur la stabilité intra-individuelle absolue à long terme des scores du WISC- IV que le QIT

In the technical and interpretative manual of the French WISC-IV (Wechsler, 2005b), short-term stability of the scores was evaluated with a sample of 93 non-clinical children,

Nous avons considéré que les variables initiales étaient centrées; cette transformation conserve le centrage, par contre les nouvelles variables ne sont pas réduites

Comme mentionné précédemment, la classification des sub- tests du WISC-IV en référence à la théorie CHC per- met d’interpréter les résultats en termes de 5 aptitudes

Cette question est d’autant plus importante que la conception même du QIT est équivoque : certains auteurs considèrent qu’il s’agit d’un score composite (Grégoire, 2006

Contrary to Keith and colleagues (2006), Arithmetic should not be considered with Matrix Reasoning and Pictures Concepts, because Arithmetic does not measure Gf in the

Pour aller plus loin dans notre réflexion, nous pensions (à travers notre seconde hypothèse relative aux profils de variations de la performance en vitesse de

Variabilité intra-indice: différence entre la note standard du sous- test le plus haut et la note standard du sous-test le plus bas au sein de chaque indice. Comparaison