Taille d'échantillon et rejet erroné du modèle en analyse factorielle confirmatoire : une étude Monte-Carlo

(1)

Poster

Reference

Taille d'échantillon et rejet erroné du modèle en analyse factorielle confirmatoire : une étude Monte-Carlo

GOLAY, Philippe, LECERF, Thierry

GOLAY, Philippe, LECERF, Thierry. Taille d'échantillon et rejet erroné du modèle en analyse factorielle confirmatoire : une étude Monte-Carlo. In:

XXème Journées Internationales de Psychologie Différentielle

, Rennes, France, 27-29 juin 2012, 2012

Available at:

http://archive-ouverte.unige.ch/unige:25994

Disclaimer: layout of this document may differ from the published version.

1 / 1

(2)

INTRODUCTION

METHODE : l’approche MONTE-CARLO CONCLUSION

Contact: Philippe.Golay@unige.ch

XX ^e Journées internationales de Psychologie Différentielle, Rennes – 26-29 juin 2012

Taille d’échantillon et risque de rejet erroné du modèle en analyse factorielle confirmatoire : une étude Monte-Carlo

Philippe Golay **^,# & Thierry Lecerf ^,#**

* Faculté de Psychologie et des Sciences de l’éducation, Université de Genève, ^# Formation Universitaire à Distance, Suisse

• L’analyse factorielle confirmatoire (AFC) est un outil relativement puissant pour évaluer la validité interne d’un instrument ou les relations entre diverses variables manifestes et latentes.

• L’AFC permet de tester l’adéquation entre un modèle théorique défini a priori et des données recueillies empiriquement.

• Sur la base de divers indices, on détermine si le modèle postulé s’ajuste bien aux données. Lorsque le modèle ne présente pas un ajustement suffisant, les indices dépassent une valeur seuil, suggérant ainsi le rejet du modèle testé.

1. Les résultats indiquent qu’il existe plusieurs situations pour lesquelles les indices RMSEA et SRMR peuvent conduire à rejeter à tort un modèle adéquat.

2. L’indice SRMR est moins sensible aux effectifs réduits que l’indice RMSEA, et doit donc être privilégié dans ces situations.

3. La corrélation entre facteurs n’a quasiment aucune influence sur les effectifs minimum nécessaires.

4. Paradoxalement, les effectifs les plus importants sont nécessaires à la fois avec les modèles les plus simples et les modèles les plus complexes : A. La variance (erreur d’échantillonnage) des indices est très forte avec

les modèles simples et les petits échantillons. Le χ ² pourrait se révéler plus adéquat dans ces configurations.

B. Des effectifs plus importants sont nécessaires avec les modèles les plus complexes même si cette tendance est peu marquée.

5. Globalement, ces résultats démontrent qu’il est difficile de formuler des critères de décision simples pour déterminer la taille d’échantillon nécessaire. L’emploi de tables comme établies ici ou de simulations Monte-Carlo se révèlent utiles pour vérifier si le modèle n’est pas rejeté à tord.

RESULTATS

PROBLEMATIQUE

INDICES RMSEA & SRMR

• Les données de la littérature indiquent que les indices RMSEA et SRMR sont parmi les plus pertinents pour juger de la qualité de l’ajustement.

• RMSEA (Root Mean Square Error of Approximation) : Indice d’ajustement absolu, basé sur le paramètre de non centralité. Inclus une pénalité pour la complexité basée sur le ratio entre la valeur du χ ² et le nombre de degrés de liberté. Une valeur inférieure à 0.05 ou 0.06 est généralement considérée comme traduisant un bon ajustement aux données.

• SRMR (Standardized Root Mean Square Residual) : Indice d’ajustement absolu, défini comme la différence standardisée entre la matrice de covariance observée et celle prédite par le modèle. N’inclus pas de pénalité pour la complexité. Une valeur inférieur à 0.08 est généralement considérée comme traduisant un bon ajustement aux données. (Hu &

Bentler, 1999).

• Les indices RMSEA et SRMR peuvent être influencés par la taille de l’échantillon : lorsque les effectifs sont faibles, on prend le risque de rejeter à tort des modèles pourtant adéquats.

• La littérature ne fournit que peu d’informations sur l’influence de la taille de l’échantillon sur les indices RMSEA et SRMR.

Identifier, pour plusieurs configurations fréquemment rencontrées, la taille minimale de l’échantillon permettant d’éviter le rejet à tort du

modèle.

OBJECTIFS

• Nombre de variables latentes (facteurs) par modèle : 1/2/3/4/5 variables

• Nombre d’indicateurs (items) par variable latente : 3/4/5/10/15/20 items

• Corrélation des facteurs : structure orthogonale /oblique (corrélation 0.6)

• Saturations fixées à 0.6 ( λ )

• Pour chaque modèle, 1000 réplications (échantillons) ont été générées à partir d’une population dont la structure et les valeurs des paramètres étaient connus.

• Ces données ont ensuite été analysées à l’aide d’un modèle confirmatoire correctement spécifié. Toutes les analyses ont été réalisées avec Mplus 6.11.

Population Structure et

valeurs des paramètres

connus

Échantillon

#1

Échantillon

#...

Échantillon

#1000

Échantillon

#1

Échantillon

#...

Échantillon

#1000

AFC

Population Inférence

sur la structure et la valeurs des

paramètres

RMSEA

SRMR

RMSEA RMSEA RMSEA

SRMR SRMR SRMR

La valeur de l’indice suggère-t-elle le rejet du modèle ?

Population Inférence

sur la structure et la valeurs des

paramètres Population

Inférence

sur la structure et la valeurs des

paramètres Population

Inférence

sur la structure et les valeurs des

paramètres

Effectif variable des échantillons :

N = 50 N = 100 N = 150

• Les valeurs moyennes des indices RMSEA et SRMR ont été calculées pour des échantillons comportant 50, 100 et 150 participants.

N minimum pour

RMSEA <.05 3 items 4 items 5 items 10 items 15 items 20 items

1 facteur juste identifié 775 526 184 135 115

2 facteurs 381 245 184 118 109 111

3 facteurs 219 162 137 109 114 126

4 facteurs 162 130 113 112 125 141

5 facteurs 137 115 111 117 137 158

• Les valeurs moyennes du RMSEA croissent linéairement avec le nombre de facteurs et d’items

• Aucune influence de la corrélation entre facteurs

• Aucun modèle rejeté avec 150 participants

• Les valeurs moyennes du SRMR croissent linéairement avec le nombre de facteurs et d’items

• Influence de la corrélation entre facteurs minime

• Rejet à tort survient

davantage avec l’indice

RMSEA qu’avec l’indice SRMR

• L’effectif minimum évolue de manière non linéaire. Il reste inférieur à 150 dans la plupart des cas.

• Les modèles simples avec peu de degrés de liberté (peu d’items et peu de facteurs) ont des valeurs d’indices RMSEA/SRMR faibles. Toutefois lorsque les effectifs sont réduits, la variance des indices est très importante. De larges échantillons (>300) sont donc nécessaires pour exclure tout risque de rejet abusif.

• Les modèles plus complexes nécessitent également de plus larges effectifs (>150).

RMSEA

moyen 3 items 4 items 5 items

structure orthogonale structure oblique structure orthogonale structure oblique structure orthogonale structure oblique N = 50 N = 100 N = 150 N = 50 N = 100 N = 150 N = 50 N = 100 N = 150 N = 50 N = 100 N = 150 N = 50 N = 100 N = 150 N = 50 N = 100 N = 150

1 facteur

juste identifié 0.047 0.032 0.027 N/A N/A N/A 0.044 0.031 0.023 N/A N/A N/A

2 facteurs

0.042 0.028 0.022 0.043 0.030 0.023 0.042 0.028 0.021 0.043 0.028 0.021 0.044 0.023 0.019 0.044 0.023 0.019

3 facteurs

0.037 0.024 0.020 0.041 0.025 0.020 0.045 0.024 0.018 0.046 0.025 0.018 0.053 0.026 0.018 0.054 0.026 0.018

4 facteurs

0.036 0.022 0.017 0.041 0.024 0.017 0.055 0.025 0.018 0.056 0.026 0.018 0.064 0.028 0.018 0.065 0.028 0.018

5 facteurs

0.043 0.023 0.017 0.052 0.026 0.018 0.063 0.027 0.018 0.064 0.027 0.018 0.077 0.033 0.021 0.077 0.033 0.021

RMSEA

moyen 10 items 15 items 20 items

1 facteur

0.045 0.024 0.019 N/A N/A N/A 0.054 0.026 0.018 N/A N/A N/A 0.065 0.028 0.018 N/A N/A N/A

2 facteurs

0.065 0.028 0.018 0.065 0.027 0.018 0.087 0.037 0.022 0.087 0.037 0.023 0.111 0.045 0.028 0.111 0.045 0.028

3 facteurs

0.087 0.037 0.023 0.087 0.037 0.023 0.128 0.048 0.030 0.128 0.048 0.030 0.267 0.058 0.035 0.267 0.058 0.035

4 facteurs

0.111 0.045 0.028 0.111 0.045 0.028 0.268 0.058 0.035 0.268 0.058 0.035 0.308 0.074 0.043 0.307 0.074 0.043

5 facteurs

0.173 0.051 0.032 0.173 0.051 0.032 0.305 0.070 0.041 0.305 0.070 0.041 0.306 0.112 0.050 0.305 0.112 0.050

SRMR

moyen 3 items 4 items 5 items

1 facteur

juste identifié 0.032 0.022 0.018 N/A N/A N/A 0.044 0.031 0.025 N/A N/A N/A

2 facteurs

0.064 0.045 0.037 0.057 0.040 0.032 0.077 0.055 0.044 0.070 0.049 0.04 0.084 0.059 0.048 0.077 0.053 0.044

3 facteurs

0.079 0.057 0.047 0.072 0.050 0.041 0.091 0.064 0.053 0.082 0.057 0.047 0.098 0.069 0.056 0.088 0.062 0.050

4 facteurs

0.088 0.063 0.051 0.08 0.055 0.045 0.099 0.070 0.057 0.089 0.062 0.050 0.104 0.073 0.060 0.093 0.065 0.053

5 facteurs

0.094 0.067 0.055 0.086 0.059 0.048 0.103 0.072 0.059 0.092 0.064 0.052 0.108 0.076 0.062 0.097 0.067 0.055

SRMR

moyen 10 items 15 items 20 items

1 facteur

0.068 0.047 0.038 N/A N/A N/A 0.075 0.053 0.043 N/A N/A N/A 0.079 0.055 0.045 N/A N/A N/A

2 facteurs

0.099 0.07 0.057 0.091 0.064 0.052 0.104 0.073 0.059 0.096 0.068 0.055 0.107 0.075 0.061 0.099 0.069 0.057

3 facteurs

0.109 0.076 0.062 0.099 0.069 0.057 0.113 0.079 0.065 0.103 0.072 0.059 0.115 0.081 0.066 0.105 0.074 0.06

4 facteurs

0.114 0.08 0.065 0.103 0.072 0.059 0.117 0.083 0.067 0.106 0.075 0.061 0.119 0.084 0.068 0.108 0.076 0.062

5 facteurs

0.117 0.082 0.067 0.105 0.074 0.06 0.120 0.084 0.069 0.109 0.076 0.062 0.121 0.085 0.070 0.110 0.077 0.063

Taille minimum de l’échantillon pour que le risque de rejeter à tort le modèle sur

la base du RMSEA soit inférieur à 5% ( effectifs nécessaires avec SRMR sont

systématiquement plus faibles) :

Taille d&#039;échantillon et rejet erroné du modèle en analyse factorielle confirmatoire : une étude Monte-Carlo

Poster

Reference