• Aucun résultat trouvé

3. Fidélité des scores d’un test

3.4. Fidélité – stabilité des scores

3.4.3. Stabilité à court terme du WISC-IV

Dans le Tableau 4 sont présentés les coefficients test-retest de différentes études sur la stabilité à court terme du WISC-IV. La première étude est menée sur 243 enfants issus de l’échantillon de standardisation de la version américaine du WISC-IV (Williams, Weiss, & Rolfhus, 2003). Les 243 enfants tout-venant ont été testés à deux reprises après un intervalle moyen de 32 jours. Les performances moyennes des indices varient de 99.8 (IMT) à 102.4 (IVT) lors de la première passation, et de 102.1 (ICV) à 109.5 (IVT) lors de la seconde passation. Les différences de moyennes entre les deux

passations montrent une augmentation des performances moyennes pour tous les scores. Les tailles de la différence (ou taille d’effet)20 varient de 0.08 (Compréhension) à 0.60 (Complètement d’images) pour les subtests, et de 0.18 (ICV) à 0.51 (IVT) pour les indices. Les coefficients de corrélation corrigés révèlent une stabilité à court terme de .86 à .93 pour l’ensemble des indices. Quant aux scores des subtests, leurs coefficients de stabilité varient entre .76 et .92. Globalement, les coefficients de fidélité des subtests sont moins élevés que ceux des indices auxquels ils contribuent. Nous l’avons expliqué, toute chose étant égale par ailleurs, plus l’étendue des scores possibles est large, et plus élevé est le coefficient de corrélation. Pour la population américaine, les indices présentent une stabilité différentielle à court terme qui permet des prédictions au niveau groupal. En revanche, un effet d’apprentissage apparaît, et de façon non négligeable pour les indices de Raisonnement Perceptif et de Vitesse de Traitement.

Pour la version française du WISC-IV, un petit échantillon de 93 enfants tout-venant âgés de 6 à 15 ans est vu à deux reprises avec un intervalle de temps variant de 16 à 50 jours (moyenne = 27 jours) ; (Wechsler, 2005b). Les performances moyennes des indices varient de 100.1 (IMT) à 102.0 (IRP) lors de la première passation, et de 102.8 (ICV) à 113.6 (IVT) lors de la seconde passation. Conformément aux résultats américains, on relève également une augmentation de performances moyennes pour tous les scores (à l’exception de Compréhension) ; (voir Tableau 4, p. 158). Les tailles de la différence varient de -0.01 (Compréhension) à 0.73 (Complètement d’images) pour les subtests, et de 0.14 (ICV) à 0.81 (IVT) pour les indices. Les coefficients de fidélité corrigés de cette étude varient de .78 (IMT) à .91 (QIT). De même que, pour l’échantillon américain, la stabilité des subtests est également moins élevée que celle des indices (de .64 à .83). Notons que les coefficients de stabilité sur la version française sont

Dans une école privée du Midwest, Ryan, Glass et Bartels (2010) testent un petit échantillon de 43 enfants tout-venant âgés de 6 à 10 ans avec un intervalle d’environ 11 mois entre les deux passations. Soulignons d’abord que les performances moyennes des indices varient de 106.67 (IMT) à 112.56 (IRP) lors de la première passation, et de

20 Selon Cohen (1977), la taille d’effet est considérée comme négligeable pour une valeur de d < 0.2, petite pour un d entre ≥ 0.2 et < 0.5, modérée pour un d entre ≥ 0.5 et < 0.8 et grande pour un d ≥ 0.8.

108.09 (ICV) à 113.26 (QIT) lors de la seconde passation. Dans l’échantillon de cette étude, les performances moyennes des enfants sont donc à un niveau plus élevé que celles des enfants de l’échantillon de standardisation. Les auteurs réalisent des t-tests pour échantillons appariés qui ne montrent pas de différences significatives entre la performance moyenne de la première et de la seconde passation, et cela pour l’ensemble des scores. Les moyennes entre les deux passations sont donc équivalentes.

À l’exception de l’IRP et de l’IVT, les coefficients de corrélation corrigés sont supérieurs à .70 pour la plupart des indices (voir Tableau 4, p. 158). De nouveau, les coefficients de stabilité des subtests sont moins élevés que ceux des notes composites (de .26 à .84).

Au niveau individuel, Ryan et al. observent pour le QI Total, que 25.6 % des enfants augmentent leurs performances de plus de cinq points, tandis que 16.3 % des enfants diminuent de plus de cinq points. Légèrement plus de la moitié des enfants (58.1 %) présentent donc des scores compris entre ±5 points entre le test et le retest (voir Tableau 6, p. 164). Le choix d’un intervalle de ±5 points équivaut à un intervalle de

±2ETM sur les données américaines. Théoriquement, 95 % des enfants devraient avoir des performances entre les deux passations comprises à l’intérieur de cet intervalle.

Avec pertinence, Ryan et al. relèvent que « the FSIQ is less stable than one might infer from examination of the large stability coefficient (i.e., .88) and the small mean practice effect (i.e., 1.63 points) » (2010, p. 72). Néanmoins, ils concluent que « only the FSIQ has sufficient stability for interpretation in individual cases » (2010, p. 71).

Dans toutes ces études dans lesquelles l’intervalle de temps entre les deux passations est inférieur à une année, on remarque une augmentation des notes composites due principalement à un effet d’apprentissage (Ryan et al., 2010; Wechsler, 2005b; Williams et al., 2003). L’augmentation des performances entre deux passations est plus marquée pour l’IRP et l’IVT que pour l’IMT et l’ICV (Ryan et al., 2010; Wechsler, 2005b). Analysant le sous-échantillon des 243 enfants issus de l’échantillon d’étalonnage américain à qui le WISC-IV est administré à environ un mois d’intervalle, Flanagan et Kaufman (2009) observent que les gains dus à l’effet d’apprentissage sont plus importants pour les enfants de 6-7 ans, mais qu’ensuite l’importance des gains diminue avec l’âge. Pour le QIT par exemple, les gains moyens sont de +8.3 points pour les 6-7 ans, +5.8 points pour les 8-11 ans et de +4.3 points pour les 12-16 ans. De son côté, Ryan et al. (2010) décrivent que les enfants ayant les meilleures performances à la première passation bénéficient davantage d’une seconde passation du WISC-IV, indépendamment de leur âge ou de leur grade scolaire au moment de la passation initiale.

Tableau 4

Coefficients test-retest, différences de moyennes et d de Cohen pour trois études sur la stabilité à court terme du WISC-IV IVT = Indice de Vitesse de Traitement ; QIT= QI Total.