Poster
Reference
Taille d'échantillon et rejet erroné du modèle en analyse factorielle confirmatoire : une étude Monte-Carlo
GOLAY, Philippe, LECERF, Thierry
GOLAY, Philippe, LECERF, Thierry. Taille d'échantillon et rejet erroné du modèle en analyse factorielle confirmatoire : une étude Monte-Carlo. In:
XXème Journées Internationales de Psychologie Différentielle, Rennes, France, 27-29 juin 2012, 2012
Available at:
http://archive-ouverte.unige.ch/unige:25994
Disclaimer: layout of this document may differ from the published version.
1 / 1
INTRODUCTION
METHODE : l’approche MONTE-CARLO CONCLUSION
Contact: Philippe.Golay@unige.ch
XX e Journées internationales de Psychologie Différentielle, Rennes – 26-29 juin 2012
Taille d’échantillon et risque de rejet erroné du modèle en analyse factorielle confirmatoire : une étude Monte-Carlo
Philippe Golay *,# & Thierry Lecerf *,#
* Faculté de Psychologie et des Sciences de l’éducation, Université de Genève, # Formation Universitaire à Distance, Suisse
• L’analyse factorielle confirmatoire (AFC) est un outil relativement puissant pour évaluer la validité interne d’un instrument ou les relations entre diverses variables manifestes et latentes.
• L’AFC permet de tester l’adéquation entre un modèle théorique défini a priori et des données recueillies empiriquement.
• Sur la base de divers indices, on détermine si le modèle postulé s’ajuste bien aux données. Lorsque le modèle ne présente pas un ajustement suffisant, les indices dépassent une valeur seuil, suggérant ainsi le rejet du modèle testé.
1. Les résultats indiquent qu’il existe plusieurs situations pour lesquelles les indices RMSEA et SRMR peuvent conduire à rejeter à tort un modèle adéquat.
2. L’indice SRMR est moins sensible aux effectifs réduits que l’indice RMSEA, et doit donc être privilégié dans ces situations.
3. La corrélation entre facteurs n’a quasiment aucune influence sur les effectifs minimum nécessaires.
4. Paradoxalement, les effectifs les plus importants sont nécessaires à la fois avec les modèles les plus simples et les modèles les plus complexes : A. La variance (erreur d’échantillonnage) des indices est très forte avec
les modèles simples et les petits échantillons. Le χ 2 pourrait se révéler plus adéquat dans ces configurations.
B. Des effectifs plus importants sont nécessaires avec les modèles les plus complexes même si cette tendance est peu marquée.
5. Globalement, ces résultats démontrent qu’il est difficile de formuler des critères de décision simples pour déterminer la taille d’échantillon nécessaire. L’emploi de tables comme établies ici ou de simulations Monte-Carlo se révèlent utiles pour vérifier si le modèle n’est pas rejeté à tord.
RESULTATS
PROBLEMATIQUE
INDICES RMSEA & SRMR
• Les données de la littérature indiquent que les indices RMSEA et SRMR sont parmi les plus pertinents pour juger de la qualité de l’ajustement.
• RMSEA (Root Mean Square Error of Approximation) : Indice d’ajustement absolu, basé sur le paramètre de non centralité. Inclus une pénalité pour la complexité basée sur le ratio entre la valeur du χ 2 et le nombre de degrés de liberté. Une valeur inférieure à 0.05 ou 0.06 est généralement considérée comme traduisant un bon ajustement aux données.
• SRMR (Standardized Root Mean Square Residual) : Indice d’ajustement absolu, défini comme la différence standardisée entre la matrice de covariance observée et celle prédite par le modèle. N’inclus pas de pénalité pour la complexité. Une valeur inférieur à 0.08 est généralement considérée comme traduisant un bon ajustement aux données. (Hu &
Bentler, 1999).
• Les indices RMSEA et SRMR peuvent être influencés par la taille de l’échantillon : lorsque les effectifs sont faibles, on prend le risque de rejeter à tort des modèles pourtant adéquats.
• La littérature ne fournit que peu d’informations sur l’influence de la taille de l’échantillon sur les indices RMSEA et SRMR.
Identifier, pour plusieurs configurations fréquemment rencontrées, la taille minimale de l’échantillon permettant d’éviter le rejet à tort du
modèle.
OBJECTIFS
• Nombre de variables latentes (facteurs) par modèle : 1/2/3/4/5 variables
• Nombre d’indicateurs (items) par variable latente : 3/4/5/10/15/20 items
• Corrélation des facteurs : structure orthogonale /oblique (corrélation 0.6)
• Saturations fixées à 0.6 ( λ )
• Pour chaque modèle, 1000 réplications (échantillons) ont été générées à partir d’une population dont la structure et les valeurs des paramètres étaient connus.
• Ces données ont ensuite été analysées à l’aide d’un modèle confirmatoire correctement spécifié. Toutes les analyses ont été réalisées avec Mplus 6.11.
Population Structure et
valeurs des paramètres
connus
Échantillon
#1
Échantillon
#...
Échantillon
#1000
Échantillon
#1
Échantillon
#...
Échantillon
#1000
AFC
Population Inférence
sur la structure et la valeurs des
paramètres
RMSEA
SRMR
RMSEA RMSEA RMSEA
SRMR SRMR SRMR
La valeur de l’indice suggère-t-elle le rejet du modèle ?
Population Inférence
sur la structure et la valeurs des
paramètres Population
Inférence
sur la structure et la valeurs des
paramètres Population
Inférence
sur la structure et les valeurs des
paramètres
Effectif variable des échantillons :
N = 50 N = 100 N = 150
• Les valeurs moyennes des indices RMSEA et SRMR ont été calculées pour des échantillons comportant 50, 100 et 150 participants.
N minimum pour
RMSEA <.05 3 items 4 items 5 items 10 items 15 items 20 items
1 facteur juste identifié 775 526 184 135 115
2 facteurs 381 245 184 118 109 111
3 facteurs 219 162 137 109 114 126
4 facteurs 162 130 113 112 125 141
5 facteurs 137 115 111 117 137 158
• Les valeurs moyennes du RMSEA croissent linéairement avec le nombre de facteurs et d’items
• Aucune influence de la corrélation entre facteurs
• Aucun modèle rejeté avec 150 participants
• Les valeurs moyennes du SRMR croissent linéairement avec le nombre de facteurs et d’items
• Influence de la corrélation entre facteurs minime
• Rejet à tort survient
davantage avec l’indice
RMSEA qu’avec l’indice SRMR
• L’effectif minimum évolue de manière non linéaire. Il reste inférieur à 150 dans la plupart des cas.
• Les modèles simples avec peu de degrés de liberté (peu d’items et peu de facteurs) ont des valeurs d’indices RMSEA/SRMR faibles. Toutefois lorsque les effectifs sont réduits, la variance des indices est très importante. De larges échantillons (>300) sont donc nécessaires pour exclure tout risque de rejet abusif.
• Les modèles plus complexes nécessitent également de plus larges effectifs (>150).
RMSEA
moyen 3 items 4 items 5 items
structure orthogonale structure oblique structure orthogonale structure oblique structure orthogonale structure oblique N = 50 N = 100 N = 150 N = 50 N = 100 N = 150 N = 50 N = 100 N = 150 N = 50 N = 100 N = 150 N = 50 N = 100 N = 150 N = 50 N = 100 N = 150
1 facteur
juste identifié 0.047 0.032 0.027 N/A N/A N/A 0.044 0.031 0.023 N/A N/A N/A2 facteurs
0.042 0.028 0.022 0.043 0.030 0.023 0.042 0.028 0.021 0.043 0.028 0.021 0.044 0.023 0.019 0.044 0.023 0.0193 facteurs
0.037 0.024 0.020 0.041 0.025 0.020 0.045 0.024 0.018 0.046 0.025 0.018 0.053 0.026 0.018 0.054 0.026 0.0184 facteurs
0.036 0.022 0.017 0.041 0.024 0.017 0.055 0.025 0.018 0.056 0.026 0.018 0.064 0.028 0.018 0.065 0.028 0.0185 facteurs
0.043 0.023 0.017 0.052 0.026 0.018 0.063 0.027 0.018 0.064 0.027 0.018 0.077 0.033 0.021 0.077 0.033 0.021RMSEA
moyen 10 items 15 items 20 items
structure orthogonale structure oblique structure orthogonale structure oblique structure orthogonale structure oblique N = 50 N = 100 N = 150 N = 50 N = 100 N = 150 N = 50 N = 100 N = 150 N = 50 N = 100 N = 150 N = 50 N = 100 N = 150 N = 50 N = 100 N = 150
1 facteur
0.045 0.024 0.019 N/A N/A N/A 0.054 0.026 0.018 N/A N/A N/A 0.065 0.028 0.018 N/A N/A N/A2 facteurs
0.065 0.028 0.018 0.065 0.027 0.018 0.087 0.037 0.022 0.087 0.037 0.023 0.111 0.045 0.028 0.111 0.045 0.0283 facteurs
0.087 0.037 0.023 0.087 0.037 0.023 0.128 0.048 0.030 0.128 0.048 0.030 0.267 0.058 0.035 0.267 0.058 0.0354 facteurs
0.111 0.045 0.028 0.111 0.045 0.028 0.268 0.058 0.035 0.268 0.058 0.035 0.308 0.074 0.043 0.307 0.074 0.0435 facteurs
0.173 0.051 0.032 0.173 0.051 0.032 0.305 0.070 0.041 0.305 0.070 0.041 0.306 0.112 0.050 0.305 0.112 0.050SRMR
moyen 3 items 4 items 5 items
structure orthogonale structure oblique structure orthogonale structure oblique structure orthogonale structure oblique N = 50 N = 100 N = 150 N = 50 N = 100 N = 150 N = 50 N = 100 N = 150 N = 50 N = 100 N = 150 N = 50 N = 100 N = 150 N = 50 N = 100 N = 150
1 facteur
juste identifié 0.032 0.022 0.018 N/A N/A N/A 0.044 0.031 0.025 N/A N/A N/A2 facteurs
0.064 0.045 0.037 0.057 0.040 0.032 0.077 0.055 0.044 0.070 0.049 0.04 0.084 0.059 0.048 0.077 0.053 0.0443 facteurs
0.079 0.057 0.047 0.072 0.050 0.041 0.091 0.064 0.053 0.082 0.057 0.047 0.098 0.069 0.056 0.088 0.062 0.0504 facteurs
0.088 0.063 0.051 0.08 0.055 0.045 0.099 0.070 0.057 0.089 0.062 0.050 0.104 0.073 0.060 0.093 0.065 0.0535 facteurs
0.094 0.067 0.055 0.086 0.059 0.048 0.103 0.072 0.059 0.092 0.064 0.052 0.108 0.076 0.062 0.097 0.067 0.055SRMR
moyen 10 items 15 items 20 items
structure orthogonale structure oblique structure orthogonale structure oblique structure orthogonale structure oblique N = 50 N = 100 N = 150 N = 50 N = 100 N = 150 N = 50 N = 100 N = 150 N = 50 N = 100 N = 150 N = 50 N = 100 N = 150 N = 50 N = 100 N = 150