• Aucun résultat trouvé

9

Nous avons vu que la probabilité de l’erreur de type I pour les modèles croisés décroissaient rapidement avec l’augmentation du nombre d’item pour atteindre le seuil de 5% attendu autour des 30 items. Pour quelle raison l’inférence n’est pas correcte pour un petit nombre d’item ? Ceci s’explique par le fait que l’inférence sur les paramètres d’un modèle à effets mixtes linéaires se fonde sur l’approximation asymptotique de la distribution de l’estimation du maximum de vraisemblance (MV) (Pinheiro & Bates, 2000) et de celle de la valeur du rapport de vraisemblance (RV). Pour cela, nous avons besoin que certaines conditions soient satisfaites. La violation de ces conditions aurait pour conséquence de fausser la précision des tests. Une des conditions nécessaires énoncées par Pinheiro (1994, p. 29) pour la distribution de l’estimation du MV, mais également valable pour la distribution de la valeur du RV, est que le nombre d’éléments par niveaux d’effets aléatoires soit assez grand (la

9. cette partie ne fait pas partie de l’article

théorie est développée pour une taille tendant vers l’infini). Nous pouvons alors nous demander si cette condition est habituellement satisfaite dans les études sur la satisfaction au travail.

En psychologie du travail, le nombre de sujets présents dans les enquêtes est souvent assez élevé (bien que cela soit relatif compte tenu du nombre particulièrement élevé de variables à tester). Mais Pinheiro stipule que les éléments de CHAQUE niveau aléatoire doit être assez grand. Ainsi, dans le cas simple d’un MMN, si nous avons effectué plusieurs mesures par sujet, il faut non seulement que le nombre de sujet soit assez grand mais aussi que le nombre de mesures par sujet soit également assez grand, ce qui est rarement le cas.

Dans le cas de l’analyse de la satisfaction au travail, nous avons besoin que le nombre de sujets et que le nombre d’items soient suffisamment grands pour approcher la distribution asymptotique. Si nous nous intéressons à une échelle de satisfaction générale au travail telle que le Job Descriptive Index (Smith et al., 1969) qui contient 72 items ou le Minnesota Satisfaction Questionnaire (D. J. Weiss et al., 1967) qui contient 100 items, il ne devrait pas avoir de problème de convergence asymptotique des distributions. Mais bien souvent, pour une question de coût et de temps, il n’est pas possible d’introduire 100 questions pour mesurer une seule dimension. Ainsi, avoir 5 items comme c’est le cas pour l’échelle ESGT de Blais et al. est beaucoup plus usuel, mais qui, malheureusement, aura un impact sur la précision des tests statistiques, ce qui peut engendrer une augmentation du nombre d’erreur du type I, ce que nous avons pu voir avec la recherche de Baayen et al. (2008), ainsi qu’à travers nos simulations.

Vu qu’il n’est pas toujours possible d’avoir un assez grand nombre d’éléments par niveau aléatoire, nous avons besoin de connaître, soit la distribution des estimations du MV, soit celle du RV pour pouvoir faire de l’inférence de manière plus précise. Ceci est probablement possible grâce à la technique de rééchantillonnage dite du bootstrap (Davison & Hinkley, 1997). Pour trouver la bonne distribution, il faut dans un premier temps définir/trouver la manière correcte de rééchantillonner et dans un deuxième temps choisir la statistique (estimation du MV, estimation du MV standardisé, RMV, etc.) qui sera la moins sensible aux paramètres de nuisances à estimer.

Il existe déjà des recherches sur le sujet, dont celle de Field et Welsh (2007) qui ont identifié dans un cas simple une demi-douzaine de façon de rééchantillonner des données en cluster. C’est une rechercher très importante pour les données de type questionnaires. Maintenant se pose la question de rééchantillonner des données avec des effets aléatoires croisés et du choix de la statistique. Pour répondre à ces questions, il faudrait dans un premier temps revoir les différentes techniques de ré-échantillonnage du bootstrap, et en particulier celles utilisées pour les données emboîtées identifiées par Field et Welsh (2007). Et dans un deuxième temps, il faudrait définir leur applicabilité sur des modèles avec des effets aléatoires croisés.

Figure8.3 – Real Type I Error Rate when Target is alpha=5% for Hierarchical and Crossed Models with two Types of DV, when Data Satisfy the Assumptions of the Models.

% o

L1L2suL2itL1L2suL2itL1L2suL2itL1L2suL2itL1L2suL2itL1L2suL2it 20su40su20su40su20su40su 6 it10 it15 it

10

100 Hierarchical Model: y continuous Crossed Model: y continuous Hierarchical Model: y ordinal Crossed Model: y ordinal

Figure 8.4 – Real Type I Error Rate for 20 Subjects, 6 Items, and Item to Residual Variance Ratio of 1, when Target is alpha=5% for Hierarchical and Crossed Models with two Types of DV.

% o

100

H ie ra rc h ic a l M o d e l, y c o n ti n u o u s C ro s s e d M o d e l, y c o n ti n u o u s H ie ra rc h ic a l M o d e l, y o rd in a l C ro s s e d M o d e l, y o rd in a l

Figure8.5 – Power and Real Type I Error Rate for Level 2 Subject IV when Target is alpha=5% for

20 subjects40 subjects20 subjects40 subjects20 subjects40 subjects 6 items10 items15 items

10

100 Hierarchical Model: real type I error Crossed Model: real type I error Hierarchical Model: power Crossed Model: power

Figure 8.6 – Real Type I Error Rate for 20 Subjects, Item to Residual Variance Ratio of 1 when Target is alpha=5% for Hierarchical and Crossed Models with two Types of DV, when Data Satisfy the Assumptions of the Models.

% o

L1 balancedL1 unbal.L2suL2it balancedL2it unbal.L1 balancedL1 unbal.L2suL2it balancedL2it unbal.L1 balancedL1 unbal.L2suL2it balancedL2it unbal. 4 items8 items12 items

10

100 Hierarchical Model, y continuous Crossed Model, y continuous Hierarchical Model, y ordinal Crossed Model, y ordinal

Modèles à effets mixtes et modèles à équations structurelles

9.1 Introduction

“Have multilevel models been structural equation models all allong ?” titre l’article de Curran (2003). Provocation ou vérité ? Pour tenter de répondre en partie à cette question, nous allons, dans ce chapitre, commencer par présenter les utilisations “standards” des modèles multi-niveaux ou mo-dèles à effets mixtes1 et des modèles à équations structurelles (SEM). Puis les liens et les différences entre certains modèles de ces familles de modélisation et finalement, nous présenterons une série de simulation comparant les modèles à effets mixtes avec effets aléatoires croisés à différents SEM per-mettant d’aborder un complément d’information à l’hypothèse numéro 1 :L’utilisation de modèles à effets mixtes avec effets aléatoires croisés (sujet et item) est plus adaptée à l’analyse de données de type questionnaire avec un niveau d’erreur de type I plus correct par rapport aux autres techniques statistiques usuellement utilisées et induit une puissance supérieure.